当前位置: 首页 > news >正文

如何在人力资源网站做合同续签wordpress 改为中文

如何在人力资源网站做合同续签,wordpress 改为中文,seo博客模板,十大咨询公司经典案例原文地址https://www.cnblogs.com/zhaof/p/7306374.html 关于Scrapy工作流程回顾 Scrapy单机架构 上图的架构其实就是一种单机架构#xff0c;只在本机维护一个爬取队列#xff0c;Scheduler进行调度#xff0c;而要实现多态服务器共同爬取数据关键就是共享爬取队列。 这里重…原文地址https://www.cnblogs.com/zhaof/p/7306374.html 关于Scrapy工作流程回顾 Scrapy单机架构 上图的架构其实就是一种单机架构只在本机维护一个爬取队列Scheduler进行调度而要实现多态服务器共同爬取数据关键就是共享爬取队列。   这里重要的就是我的队列通过什么维护这里一般我们通过Redis为维护Redis非关系型数据库Key-Value形式存储结构灵活。并且redis是内存中的数据结构存储系统处理速度快提供队列集合等多种存储结构方便队列维护 如何去重这里借助redis的集合redis提供集合数据结构在redis集合中存储每个request的指纹在向request队列中加入Request前先验证这个Request的指纹是否已经加入集合中。如果已经存在则不添加到request队列中如果不存在则将request加入到队列并将指纹加入集合 如何防止中断如果某个slave因为特殊原因宕机如何解决这里是做了启动判断在每台slave的Scrapy启动的时候都会判断当前redis request队列是否为空如果不为空则从队列中获取下一个request执行爬取。如果为空则重新开始爬取第一台丛集执行爬取向队列中添加request 如何实现上述这种架构这里有一个scrapy-redis的库为我们提供了上述的这些功能scrapy-redis改写了Scrapy的调度器队列等组件利用他可以方便的实现Scrapy分布式架构关于scrapy-redis的地址https://github.com/rmax/scrapy-redis 搭建分布式爬虫 参考官网地址https://scrapy-redis.readthedocs.io/en/stable/ 前提是要安装scrapy_redis模块pip install scrapy_redis这里的爬虫代码是用的之前写过的爬取知乎用户信息的爬虫 修改该settings中的配置信息 替换scrapy调度器SCHEDULER scrapy_redis.scheduler.Scheduler 添加去重的classDUPEFILTER_CLASS scrapy_redis.dupefilter.RFPDupeFilter 添加pipeline如果添加这行配置每次爬取的数据也都会入到redis数据库中所以一般这里不做这个配置ITEM_PIPELINES {scrapy_redis.pipelines.RedisPipeline: 300} 共享的爬取队列这里用需要redis的连接信息这里的user:pass表示用户名和密码如果没有则为空就可以REDIS_URL redis://user:passhostname:9001 设置为为True则不会清空redis里的dupefilter和requests队列这样设置后指纹和请求队列则会一直保存在redis数据库中默认为False一般不进行设置 SCHEDULER_PERSIST True 设置重启爬虫时是否清空爬取队列这样每次重启爬虫都会清空指纹和请求队列,一般设置为FalseSCHEDULER_FLUSH_ON_STARTTrue 分布式 将上述更改后的代码拷贝的各个服务器当然关于数据库这里可以在每个服务器上都安装数据也可以共用一个数据我这里方面是连接的同一个mongodb数据库当然各个服务器上也不能忘记所有的服务器都要安装scrapy,scrapy_redis,pymongo 这样运行各个爬虫程序启动后在redis数据库就可以看到如下内容dupefilter是指纹队列requests是请求队列    转载于:https://www.cnblogs.com/111testing/p/10325428.html
http://www.yutouwan.com/news/146735/

相关文章:

  • 东城专业网站建设公司手机网站用什么做的
  • 深圳网站建设公司哪家最好网站建设属于什么经济科目
  • 济宁嘉祥网站建设wordpress不显示子分类
  • 南昌媒体网站建设口碑推荐网站建设运营知识
  • 企业网站怎么做才好wordpress文章摘要显示
  • 襄阳建设局网站wordpress试试手气
  • 不备案怎么做淘宝客网站吗网站开发实用技术第2版文档
  • 肇庆网站建设优化那个装修公司的网站做的好
  • 网站建设的开发工具wordpress 链接修改
  • 水印wordpress深圳seo优化外包
  • 如何增加网站收录网页制作范例
  • 培训网站建设课程下载吧网站整站源码
  • 做盗版电影网站违法吗网页广告调词平台
  • 网站建设团队分工做足球网站前景
  • 辽源市住房和城乡建设局网站网站开发要用多少钱
  • 上海美容论坛网站建设网站没有地图怎么做的
  • 药材网网站技术建设电商分销平台
  • 网站建设公司 优势设计工作室与网站建设工作室
  • 关于网站开发相关法律条款商标注册查询官网网站
  • 影视网站开发ios开发者账号有什么用
  • 网站开发支付超时如何解决php页面 wordpress
  • 表述网站建设流程网页设计作业怎么做网站
  • 门户网站的建设龙岗网站建设报价
  • 超轻粘土做动漫网站驻马店北京网站建设
  • 哪个网站做公司业务广告效果好wordpress小程序 jwt
  • 做微商哪个网站有客源网站建设案例百度云
  • 海珠区有没有专门做网站的地方营销型网站功能
  • xampp网站后台58同城合肥网站建设
  • php 企业网站源码wordpress防止cc攻击
  • 手机怎样建个人网站网站开发合同范本