当前位置: 首页 > news >正文

网站做多长时间才会成功网站建设方案报价费用明细价格

网站做多长时间才会成功,网站建设方案报价费用明细价格,wordpress4.9.8 特别慢,html生成网站思路1. 要获得怎么样的数据2. 找到数据来源3. 模拟浏览器发送请求获得数据4. 处理数据#xff0c;保存数据第一步#xff1a;在这里数据是豆瓣top250中高于指定分数的电影信息信息有#xff1a;名称#xff0c;评分#xff0c;格言第二步#xff1a;数据在网页html中保存数据第一步在这里数据是豆瓣top250中高于指定分数的电影信息信息有名称评分格言第二步数据在网页html中这里我使用xpath语法分析htm代码提取数据即可当然也有其它方法比如找出页面请求的数据包抓包分析找出数据来源故猜测第k页的url只需start为25*(k-1)所以我们枚举url提取有效的数据。第三步获得网页源码是一般是发送get请求。故制定请求头找到url模拟浏览器发送数据def GetHelpfulElement(Html,socre):#根据html代码获得希望的element列表Xpathr//div[ classitem]//div[ classstar]/span[2][text(){}]/../../...format(socre)HtmlElementetree.HTML(Html)return HtmlElement.xpath(Xpath)def GetHtml(url):#根据url获得html字符串Headers{User - Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36}resprequests.get(url,headersHeaders)return resp.content.decode()最后一步就是代码了数据保存在date文件。mport requestsfrom lxml import etreefrom pprint import pprintimport re目的:爬取豆瓣top250中 评分高于指定值的电影名字导演演员信息评分。urlhttps://movie.douban.com/top250?start{}25的增加10次即可针对每个html字符串用xpath语法进行处理1.找出符合条件的element元素2.对element元素进行信息提取成字典形式3.把每一页的信息整理成一个列表追加即可def GetHelpfulElement(Html,socre):#根据html代码获得希望的element列表Xpathr//div[ classitem]//div[ classstar]/span[2][text(){}]/../../...format(socre)HtmlElementetree.HTML(Html)return HtmlElement.xpath(Xpath)def GetHtml(url):#根据url获得html字符串Headers{User - Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36}resprequests.get(url,headersHeaders)return resp.content.decode()def HandleList(Mylist):#处理xpath的获得的列表 返回第一个否则返回Nonereturn Mylist[0] if len(Mylist)!0 else Nonedef ElementToDict(Element):#一个elemengt信息转化为dictret{}htmletree.tostring(Element,encodingutf-8).decode()Elementetree.HTML(html)#不知道为什么只有这样每次函数得到的信息才不同RatingXpathr//span[classrating_num]/text()TitleXpathr//a/span[classtitle]/text()QuoteXpathr//span[classinq]/text()ret[rating:num]HandleList(Element.xpath(RatingXpath))ret[title] HandleList(Element.xpath(TitleXpath))ret[quote] HandleList(Element.xpath(QuoteXpath))return retdef ElementlistToDictlist(Elementlist):#element列表转化为有用的dict列表Mylist[]for i in Elementlist:Mylist.append(ElementToDict(i))return Mylistdef Save(Mydict):#保存一条信息Keylist [title, rating:num, quote]NameList [名称, 评分, 格言]with open(date.txt,a,encodingutf-8) as fp:for i in range(len(Keylist)):fp.write(NameList[i])fp.write( : )fp.write(Mydict[Keylist[i]] if Mydict[Keylist[i]]!None else )fp.write(\n)fp.write(\n)def run(score):#实现主要逻辑TempUrl rhttps://movie.douban.com/top250?start{}Dictlist []for numbers in range(10):Url TempUrl.format(numbers * 25)ElementList GetHelpfulElement(GetHtml(Url), score)TempDictList ElementlistToDictlist(ElementList)global totaltotallen(TempDictList)for i in TempDictList:Save(i)if __name__ __main__:RatingNumfloat(input(请输入最低评分:))total0print(请稍等...)run(RatingNum)print(共有,total,个结果。)
http://www.huolong8.cn/news/58403/

相关文章:

  • 女人学ui有前途吗seo公司培训
  • 重庆家居网站制作公司湖南建筑信息网平台
  • 设计网站排行wordpress管理密码
  • 网站301是什么意思单一网页开发
  • 网站背景图片素材建筑工程挂网甩浆
  • 郑州 网站建设WordPress文章图片采集插件
  • 狮山网站建设wordpress form插件
  • 珠海手机微信网站建设小程序开发广告设计实习报告
  • 建设工程敎育网网站一个人开发游戏难吗
  • 浙江网站建设优化wordpress 图标
  • 太原建站培训贵州大地建设集团网站
  • 国内优秀的个人网站莱芜搜狗推广推荐
  • 南昌企业网站设计公司建设网站要多少页面
  • 优的深圳网站设计公司零售app开发公司
  • 重庆做网站有哪些做一个网站成本是多少合适
  • h5网站和传统网站区别临沂网站建设wyjzgzs
  • 哪里有专业做网站的做网站的应用
  • 鞍山网站制作公司it外包名词解释
  • 如何建网站赚取佣金北京海淀王庄路15号院
  • 免费自助制作永久网站长沙毕业设计代做网站价格
  • 深圳高端设计网站怎么建设百度网站
  • html5在线制作网站模板做一个小程序需要多少钱
  • 白酒企业网站源码飞鱼ip代理
  • 网站建设推广怎么玩深圳官方网站
  • 汕头百姓网seo百度seo排名优化软件
  • 网站排名按天付费外包公司 网站建设 深圳
  • 给单位建设网站芜湖建设公司网站
  • 上海培训机构整顿seo网站推广优化就找微源优化
  • 网站建设上海网站建设公司网站门头沟网站建设
  • 国外做饮用来源的网站个人网站名称请