当前位置: 首页 > news >正文

舟山 网站制作阿里网站怎样做seo

舟山 网站制作,阿里网站怎样做seo,简单电商网站模板,商会网站模板创建爬虫项目 srcapy startproject scrapy_dangdang进入到spider文件里创建爬虫文件#xff08;这里爬取的是青春文学#xff0c;仙侠玄幻分类#xff09; srcapy genspider dang http://category.dangdang.com/cp01.01.07.00.00.00.html获取图片、名字和价格 # 所有的se…创建爬虫项目 srcapy startproject scrapy_dangdang进入到spider文件里创建爬虫文件这里爬取的是青春文学仙侠玄幻分类 srcapy genspider dang http://category.dangdang.com/cp01.01.07.00.00.00.html获取图片、名字和价格 # 所有的seletor的对象都可以再次调用xpath方法 li_list response.xpath(//div[idsearch_nature_rg]//li)for li in li_list:# 获取图片src li.xpath(.//img/data-original).extract_first()# 第一张图片和其他图片的标签的属性不一样# 第一张图片的src是可以使用的其他图片的地址在data-original里if src:src srcelse:src li.xpath(.//img/src).extract_first()# 获取名字name li.xpath(.//img/alt).extract_first()# 获取价格price li.xpath(.//p[classprice]/span[1]/text()).extract_first()print(src, name, price)在items里定义要下载的数据 import scrapyclass ScrapyDangdang39Item(scrapy.Item):# 要下载的数据都有什么# 图片src scrapy.Field()# 名字name scrapy.Field()# 价格price scrapy.Field()在dang.py里导入items from ..items import ScrapyDangdang39Item在parse方法里定义一个对象book然后把获取到的值传递到pipelines book ScrapyDangdang39Item(srcsrc, namename, priceprice)# 获取一个book就将book传递给pipelines yield book开启管道 在settings中把这几行代码取消注释 管道可以有很多个但是管道是有优先级的优先级的范围是1到1000 值越小优先级越高下载数据 打开piplines.py class ScrapyDangdang39Pipeline:# 方法1# 在爬虫文件执行前执行的一个方法def open_spider(self, spider):self.fp open(book.json, w, encodingutf-8)def process_item(self, item, spider):# item就是yield后面的book对象# 1.write方法必须要写一个字符串而不是其他的对象# 2.w模式每一个对象都会打开一次文件然后覆盖之前的内容所以使用a模式with open(book.json, a, encodingutf-8)as fp:fp.write(str(item))return item但是这种模式不推荐因为每传递过来一个数据就要打开一次文件对文件的操作太过频繁 换一种方法 class ScrapyDangdang39Pipeline:# 在爬虫文件执行前执行的一个方法def open_spider(self, spider):self.fp open(book.json, w, encodingutf-8)def process_item(self, item, spider):# item就是yield后面的book对象self.fp.write(str(item))return item# 在爬虫文件执行完后执行的一个方法def close_spider(self, spider):self.fp.close()运行dang.py文件就可以把数据保存到本地了 完整代码 dang.py import scrapy from ..items import ScrapyDangdang39Itemclass DangSpider(scrapy.Spider):name dangallowed_domains [category.dangdang.com]start_urls [http://category.dangdang.com/cp01.01.07.00.00.00.html]def parse(self, response):# 所有的seletor的对象都可以再次调用xpath方法li_list response.xpath(//div[idsearch_nature_rg]//li)for li in li_list:# 获取图片src li.xpath(.//img/data-original).extract_first()# 第一张图片和其他图片的标签的属性不一样# 第一张图片的src是可以使用的其他图片的地址在data-original里if src:src srcelse:src li.xpath(.//img/src).extract_first()# 获取名字name li.xpath(.//img/alt).extract_first()# 获取价格price li.xpath(.//p[classprice]/span[1]/text()).extract_first()book ScrapyDangdang39Item(srcsrc, namename, priceprice)# 获取一个book就将book传递给pipelinesyield bookitems.py # Define here the models for your scraped items # # See documentation in: # https://docs.scrapy.org/en/latest/topics/items.htmlimport scrapyclass ScrapyDangdang39Item(scrapy.Item):# define the fields for your item here like:# name scrapy.Field()# 要下载的数据都有什么# 图片src scrapy.Field()# 名字name scrapy.Field()# 价格price scrapy.Field()pipelines.py # Define your item pipelines here # # Dont forget to add your pipeline to the ITEM_PIPELINES setting # See: https://docs.scrapy.org/en/latest/topics/item-pipeline.html# useful for handling different item types with a single interface from itemadapter import ItemAdapter# 如果想使用管道就必须在settings中开启管道 class ScrapyDangdang39Pipeline:# 方法1# 在爬虫文件执行前执行的一个方法def open_spider(self, spider):self.fp open(book.json, w, encodingutf-8)def process_item(self, item, spider):# item就是yield后面的book对象# 这种模式不推荐# with open(book.json, a, encodingutf-8)as fp:# fp.write(str(item))self.fp.write(str(item))return item# 在爬虫文件执行完后执行的一个方法def close_spider(self, spider):self.fp.close()
http://www.huolong8.cn/news/128561/

相关文章:

  • 免费网站大全推荐泰安网络推广培训
  • 网站宣传推广策划做公司网站找谁
  • 网站百度地图标记代码给别人做网站需要增值电信
  • html网站登陆注册怎么做网站建设落地页
  • 网站维护正常要多久如何免费建设网站com
  • 网站策划ppt企业培训课程安排表
  • 青岛网站搜索排名霸气的网络公司名字
  • 为什么要做网站首页设计电子项目外包网站
  • 制作网站需要哪些工具做视频网站采集需要多大的空间
  • dede网站logo怎么改网站建设crm
  • 佛山网站推广 优帮云凡科网 小程序
  • 青岛的网站建设微信小程序商城源代码
  • 营销网站制作费用网站内链优化的角度
  • 如何备份网站程序网站开发网上宠物店管理系统
  • 北京高端网站建设规划网站如何创建
  • 怎样做 云知梦 网站 付费网站网站建设公司品牌
  • 企业网站推广阶段网站推广临沂
  • 做片视频在线观看网站摄影网站投稿
  • jsp做网站案例深圳公司团建去哪里好
  • 为什么要学电商网站建设寿光建设银行网站
  • 杨凌做网站邢台163官网
  • 网站建设计入哪个明细科目怎样做化妆品公司网站
  • 建设银行佛山分行网站seo方法图片
  • 网站建设需要准备什么实时热点新闻事件2021
  • 肇庆住房建设部网站住建局官网查询系统
  • 鹿泉区城乡建设局网站上杭网站建设公司
  • 石家庄做网站排名公司哪家好seo优化方案书
  • 购买域名网站怎么建立简单网站
  • 品牌网站设计制作价格wordpress代码块插件
  • 蚌埠网站建设网站企业网站首页图片