当前位置: 首页 > news >正文

网站描述代码怎么写购物网站 建设

网站描述代码怎么写,购物网站 建设,软件开发公司app,送菜上门网站app如何做本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤#xff1a; 1.提示用户输入爬取的内容及页码。 2.根据用户输入#xff0c;获取网址列表。 3.模拟浏览器向服务器发送请求#xff0c;获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码…本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤 1.提示用户输入爬取的内容及页码。 2.根据用户输入获取网址列表。 3.模拟浏览器向服务器发送请求获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码用面向过程的形式编写的。 关键字requests库xpath,面向过程 现在就来讲解代码书写的过程 1.导入模块 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests # 爬虫主要的包 from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 每个模块的作用都已经备注了。 2.提示用户输入内容和页数 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) 3.准备好url和header header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 user-agent是服务器识别浏览器的重要参数我们就用这个来蒙骗服务器user-agent在浏览器里可以找到那么现在我们就关注右边这样header就找到了注意要以字典的形式 4.发送请求、 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons) # 解析数据 -- parsel 转化为Selector对象Selector对象具有xpath的方法能够对转化的数据进行处理pic_url html.xpath(//div[classmbpho]/a/img/src).extract() 一切准备就绪后就可以发送请求了。request.get.text返回的是网页的源代码然后将源代码转换为Selector对象再通过xpath的方法找到图片的网址。5.保存数据 获取图片的图片的链接后我们就可以保存了。 for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 注意这里的for循环是在上面的循环里嵌套的。 最后来看看全部的代码吧 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons)pic_url html.xpath(//div[classmbpho]/a/img/src).extract() # print(pic_url) for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 来看看运行的结果以搜索王一博搜索5页为例。然后你就发信多了一个王一博的文件夹了点开就可以看见王一博的帅照了。到此这篇关于python根据用户需求输入想爬取的内容及页数爬取图片方法详解的文章就介绍到这了,更多相关python爬取图片方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家
http://www.yutouwan.com/news/246723/

相关文章:

  • 商务网站开发设计燕郊个人做网站
  • 设计微信网站建设自己怎么建立微网站后台
  • 如何制作课程网站模板单位logo设计
  • 微信高端网站建设成都网站开发公司
  • 深圳地产网站建设网站建设详细工作汇报
  • 绍兴做网站价格游戏搭建教程
  • 阿里巴巴国际站跨境电商平台wordpress新闻快讯插件
  • 怎么做轮胎网站高职两学一做专题网站
  • php 金融网站源码新手网站
  • 怎么注销自己做的网站网站开发团队成员介绍
  • 佛山手机网站建设优化杭州网站 建设
  • 网站如何做cc防护做哪个行业的网站好
  • 优秀作文网站都有哪些网络推广工作能长久吗
  • 制作一个网站的基本步骤网站优化工作安排
  • 网站制作推广建设电商网站的个人心得
  • 哪里有南宁网站建设数字营销公司排行榜
  • 网站建设服务费入建筑模板分为哪几类
  • 展示形网站开发提供app开发公司报价
  • wordpress建站教程书籍河北网站建设seo优化
  • 东莞凌峰建设公司seo引流赚钱吗
  • 食品网站建设风格seo网站推广 沈阳
  • 帝国cms如何做网站地图如何在工商局网站做企业年报
  • 商丘网站建设公司义乌水务建设集团官方网站
  • 福州云建站模版网站如何吸引用户
  • 公司网站有哪些重要性临沂seo网站推广
  • 怎么做网站 知乎化妆品网站建设平台的分析
  • 网站都需要续费微信小程序怎么做表格
  • 淘宝客做网站怎样推广京东网上商城会员注册步骤
  • 替朋友做网站怎么做企业管理软件定制
  • 长沙 网站建设公司深圳网站建设公司jm3q