当前位置：首页 > news >正文

深圳龙华做网站的陕西省建设网企业信息

news 2025/12/9 16:23:29

深圳龙华做网站的,陕西省建设网企业信息,企业定位是网站建设的,网页版梦幻西游下载前言本文主要的知识点是使用Python的BeautifulSoup进行多层的遍历。如图所示。只是一个简单的哈#xff0c;不是爬取里面的隐藏的东西。示例代码from bs4 import BeautifulSoup as bsimport requestsheaders {host: www.jd.com,User-Agent不是爬取里面的隐藏的东西。示例代码from bs4 import BeautifulSoup as bsimport requestsheaders {host: www.jd.com,User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36 Core/1.47.933.400 QQBrowser/9.4.8699.400,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,*/*;q0.8}session requests.session()def get_url():renspned bs(session.get(http://www.jd.com/,headers headers).text,html.parser)for i in renspned.find(div, {class: dd-inner}).find_all(a,{target:_blank}):print(i.get_text(),:,i.get(href))get_url()运行这段代码以及达到了我们的目的。我们来解读一下这段代码。首先我们要访问到京东的首页。然后通过BeautifulSoup对访问到的首页进行解析。这个时候我们就要定位元素来获取我们需要的东西了。在浏览器中通过F12我们可以看到下图所示的东西我们来看看下面这句代码for i in renspned.find(div, {class: dd-inner}).find_all(a,{target:_blank})这一行代码完全满足我们的需求首先用find方法定位到了class“dd-inner”的div然后使用find_all对该标签下所有的a标签。最后我想打印出所有的商品分类以及对应的链接于是我使用了i.get_text()和i.get(href)的方法终于获取到了商品分类和对应的链接。总结其实不是很难主要是要用对方法。笔者因为是初学方法没有用对。花了差不多两天时间才搞定。这里也是告诉大家可以使用find().find_all()的方法进行多层的遍历。以上就是我利用Python爬取京东的商品分类与链接的一些经验希望对大家学习python能有所帮助。

查看全文

http://www.huolong8.cn/news/225569/