当前位置: 首页 > news >正文

开发一整个网站要多久apache 配置网站地址

开发一整个网站要多久,apache 配置网站地址,免费网站软件制作,装修案例介绍文案页面是随时升级的#xff0c;所以现在的链接不代表以后的链接#xff0c;但是万变不离其宗#xff0c;只要学会解析页面#xff0c;那么就能走的更远。 码云链接#xff1a;https://gitee.com/ALADL/baike_spider.git from baike_spider import url_manager,html_download…页面是随时升级的所以现在的链接不代表以后的链接但是万变不离其宗只要学会解析页面那么就能走的更远。 码云链接https://gitee.com/ALADL/baike_spider.git from baike_spider import url_manager,html_downloader, html_parser, html_outputerclass SpiderMain(object):def __init__(self):# 初始化各个对象self.urls url_manager.UrlManager()# url管理器self.downloader html_downloader.HtmlDownloader()# 下载器self.parser html_parser.HtmlParser()# 解析器self.outputer html_outputer.HtmlOutputer()# 输出器def craw(self, root_url):count 1# 将入口rooturl添加进管理器self.urls.add_new_url(root_url)# 当管理器中有了url之后我们就可以启动循环while self.urls.has_new_url():# 为了防止无效的url这里异常处理try:# 获取一个带爬取的urlnew_url self.urls.get_new_url()# 辅助打印一下当前print(craw %d:%s%(count,new_url))# 启用下载器下载页面html_cont self.downloader.download(new_url)# 调用解析器解析页面得到新的url和新的数据new_urls,new_data self.parser.paser(new_url,html_cont)# 分别处理新的url添加进url管理器self.urls.add_new_urls(new_urls)# 同时收集数据self.outputer.collect_data(new_data)# 先爬取1000个urlif count 1000:breakcount 1except:print(craw failed)# 调用outputer来处理数据self.outputer.output_html()if __name__ __main__:root_url https://baike.baidu.com/item/%E8%8B%8F%E8%BD%BC/53906#hotspotmining# main函数中复制要爬取的页面obj_spider SpiderMain()obj_spider.craw(root_url)  转载于:https://www.cnblogs.com/ALADL/p/9671690.html
http://www.yutouwan.com/news/298767/

相关文章:

  • 戴尔网站建设目标会员制网站建设教程
  • 长治网站制作厂家君哥摄影设计
  • 单位网站等级保护必须做吗上海恒鑫网站建设
  • 购物商城网站的制作网站注册地址
  • dedecms 安防监控行业网站模板濮阳新闻综合频道回看
  • 成都网站建设哪家唐山哪里有建设网站的
  • 世纪购网站开发招聘国家重大项目建设库网站打不开
  • 亚马逊建站服务前端前景怎么样
  • 企业网站托管费用适合推广的网站有哪些
  • 网站建设专题页面wordpress 多层分类
  • 深圳网站建设怎样做网站注册理由
  • 哪个网站用户体验较好建设企业网站的原因
  • 柯林wap建站程序个人版c 可以做网站吗
  • 中山市建设信息网站网站推广的策略方法
  • 佛山找企业的网站wordpress is ssl
  • 屏蔽阿里云网站网上书城网站开发背景
  • 武安市网站建设百度搜图片功能
  • 网站建设一般分为几个步骤微网站开发协议
  • 安福网站制作苏州知名网站建设开发
  • 网站建设技术公司排名wordpress做文学网
  • 龙华网站建设全包瑞安网站设计
  • 大港建站公司手机自己制作表白网站
  • 佛山医疗网站建设中山市网站制作
  • 东莞网络营销外包杭州网站优化体验
  • 网站建设开发的条件博客网站首页设计
  • 网站模板样式修改app软件开发公司哪家好
  • 茂名网站建设公司科学小制作小发明
  • 建设企业网站登录901wordpress 站内搜索 慢
  • 济宁网站建设那家好网站开发好就业吗
  • 淘宝客网站开源it运维需要具备哪些能力