当前位置: 首页 > news >正文

用视频做背景的网站石景山郑州阳网站建设

用视频做背景的网站,石景山郑州阳网站建设,南昌百度推广优化排名,win7网站开发教程Python3 实现游戏主播人气排行榜 from urllib import request import re# 爬取某个游戏主播的人气#xff08;每个游戏主播的观看人数#xff09;排行榜 爬虫前奏#xff1a;明确爬虫目的找到数据对应的网页分析网页的结构找到数据所在的标签位置模拟HTTP请求#xff0c;向…Python3 实现游戏主播人气排行榜 from urllib import request import re# 爬取某个游戏主播的人气每个游戏主播的观看人数排行榜 爬虫前奏明确爬虫目的找到数据对应的网页分析网页的结构找到数据所在的标签位置模拟HTTP请求向服务器发送这个请求获取到服务器返回给我们的HTML利用正则表达式提取我们要的数据主播名字人气 概括字符集\d \D\w 单词字符 \W\s 空白字符 \S. 匹配除换行符\n之外的所有字符 爬虫框架ScrapyBeautifulSoup 进阶爬虫大数据的存储数据的分析 常见问题反爬虫反反爬虫IP被封代理IP库 class Spider():url https://www.panda.tv/cate/lolroot_pattern div classvideo-info([\s\S]*?)/divname_pattern /i([\s\S]*?)/spannumber_pattern span classvideo-number([\s\S]*?)/spandef __fetch_content(self):r request.urlopen(Spider.url)# byteshtmls r.read()htmls str(htmls, encodingutf-8)return htmlsdef __analysis(self, htmls):root_html re.findall(Spider.root_pattern, htmls)anchors []for html in root_html:name re.findall(Spider.name_pattern, html)number re.findall(Spider.number_pattern, html)anchor {name: name, number: number}anchors.append(anchor)print(anchors[0])return anchorsdef __refine(self, anchors):jl lambda anchors: {name: anchors[name][0].strip(),number: anchors[number][0].strip()}return map(jl, anchors)def __sort(self, anchors):# filteranchors sorted(anchors, keyself.__sort_seed, reverseTrue)return anchorsdef __sort_seed(self, anchor):r re.findall(\d*\.\d*, anchor[number])number float(r[0])if 万 in anchor[number]:number * 10000return numberdef __show(self, anchors):for rank in range(0, len(anchors)):print(rank str(rank 1) : anchors[rank][name] anchors[rank][number])def go(self):htmls self.__fetch_content()anchors self.__analysis(htmls)anchors list(self.__refine(anchors))anchors self.__sort(anchors)self.__show(anchors)spider Spider() spider.go()    转载于:https://www.cnblogs.com/RHadoop-Hive/p/9513314.html
http://www.huolong8.cn/news/24562/

相关文章:

  • 大学学风建设专题网站wordpress输出友情链接
  • 企业网站本身应该就是企业( )的一部分ico项目网站建设
  • 网站建设与管理常用网站建设海之睿
  • 织梦网站如何生成伪静态企业定制
  • 视频网站调用ie域名
  • 上海工商查询网官方网站卡一卡二卡四卡视频免费观看
  • 自己做项目的网站登录域名管理网站
  • 南阳网站制作价格网站开发形成收入怎么做帐
  • 大连网站开发费多少钱昌平沙河网站建设
  • 东单网站建设网页设计网站开发需要哪些知识
  • 追星做网站网站的成本
  • led网站建设哪家专业福步外贸网站
  • 网站建设预算策划悬赏做logo的网站
  • 北京移动网站建设公司价格资源丰富免费的网站推荐排名
  • 建设工程敎育网网站seo网络营销工程师
  • 网站建设开发全包网站加ico图标
  • 网上的网站模板怎么用十进十建 网站建设工作总结
  • 做公众号商城原型的网站贵州建设厅考试网站二建成绩查询
  • 福州交通建设集团官方网站全国十大装修公司最有名的是
  • 电商网站建设服务网站备案要求企业 个人
  • 淘宝券商城网站制作wordpress百科
  • 北京专业企业营销网站建设做外贸网站多久更新
  • 婚纱影楼网站怎么做网页小猪佩奇
  • 电商网站建设运城网站建设的总体目标考核指标
  • 东莞市网站建设公司企业网站推广宣传方案
  • php企业网站源码推荐网页游戏开服表时间表
  • 临清网站建设服务2万一3万电动汽车
  • 芜湖seo网站优化wordpress静态
  • intitle:郑州网站建设外贸网站建站h
  • 做网站原型的简单工具个人建站系统