西安给大学做网站公司,北京做公司网站公司,网站开发需要经费么,安徽工建设信息网站统计了下廖老师的python教程各个小节的阅读量#xff08;毫无卵用#xff09;#xff0c;廖老师网站反爬做的比我们教务系统可是好多了#xff0c;一定时间内访问次数多会禁止#xff0c;反正数据量也不多#xff0c;就慢慢来#xff0c;基本上也不会对网站造成什么影响…统计了下廖老师的python教程各个小节的阅读量毫无卵用廖老师网站反爬做的比我们教务系统可是好多了一定时间内访问次数多会禁止反正数据量也不多就慢慢来基本上也不会对网站造成什么影响。
刚学python 代码写的是真的丑冲着能实现基本功能来所以也没什么美感。
首先是获取各个小节的url
def get_url_list():
index_urlhttps://www.liaoxuefeng.com/wiki/\
0014316089557264a6b348958f449949df42a6d3a2e542c000
try:
index_rrequests.get(index_url,headersget_user_agent(),timeout1)
bs_objBeautifulSoup(index_r.text,html.parser)
return list(map(lambda x:https://www.liaoxuefeng.comx[href],bs_obj.find_all(a,{class:x-wiki-index-item})))
except:
return []
获取各个小节阅读量因为数据量小所以直接存储到文本文件中了
def get_count_of_reading():
url_listget_url_list()
result{}
for url in url_list:
try:
rrequests.get(url,headersget_user_agent(),timeout1)
bs_objBeautifulSoup(r.text,html.parser)
titlebs_obj.h4.string
countint(str(bs_obj.find_all(div,{class:x-wiki-info})[0].span.string).split()[1])
result[url_list.index(url)][title,count]
print(successly)
sleep(3)
except:
error_log(url)
print(error)
sleep(3)
with open(result.txt,w) as f:
f.write(str(result))
return result
得到数据后绘制了折线图和柱状图这个真的是现学现卖。折线图
柱状图可以看到刚开始的阅读量和后边章节阅读量更是百倍的差距中间小的凸起大部分是新的一个章节的开篇。善始善终很重要啊。
自己刚开始看也是很困难后边的许多章节很难理解但是时不时去看下每次都能有新的理解新的收获。
另外注意到有几个章节阅读量都是个位数以为是数据错误去网站确认了下发现应该是廖神刚更新了几个章节所以阅读量很低。
感谢廖老师 廖雪峰 能为我们提供这么好的经典教程对于python初学者来说廖老师的python教程可以说是必选了。