当前位置: 首页 > news >正文

网站设计配色北京代理网站备案电话

网站设计配色,北京代理网站备案电话,淄博市网站建设,沈阳网站推广我想写一个查询话费和流量的爬虫#xff0c;关键是实现模拟登陆的这个部分。在登陆过程中#xff0c;点击登陆之后#xff0c;登陆表单会 post 到一个地址(这一步浏览器不显示)#xff0c;然后会 302 跳转到登陆成功的页面。我现在想得到登陆成功的 cookies #xff0c;不…我想写一个查询话费和流量的爬虫关键是实现模拟登陆的这个部分。在登陆过程中点击登陆之后登陆表单会 post 到一个地址(这一步浏览器不显示)然后会 302 跳转到登陆成功的页面。我现在想得到登陆成功的 cookies 不知道该怎么提取requests.session()并没有得到登陆成功的 cookies.得不到登陆成功的 cookies 代码就不能爬取登陆之后的查询信息。我有三个问题1.post 表单这个过程也就是图一中的 cookies 是怎么生成的因为我发现 post 表单过程中的 cookies 比在进入登陆页面中的多。2.登陆过程中有两次 302 最后再 200 到登陆成功页面我该怎么得到 200 的这个 cookie 。3.request.sission()是会自动管理登陆过程中的 cookies 吗用不用单独提取登陆之后的 cookies 。代码如下谢谢大家#codingutf-8import requestsimport re# request headersHead {Accept-Language: zh-CN,zh;q0.8, Accept-Encoding: gzip, deflate, sdch, Host: ah.189.cn,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,*/*;q0.8, Upgrade-Insecure-Requests: 1, Connection: keep-alive, Cache-Control: max-age0,User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36}# Chrome 打开登陆页面提取的 cookiesCook {Hm_lvt_333c7327dca1d300fd7235c159b7da04: 1469964315,lid: , _gscu_1758414200: 69964315ee6pb621, v_lasttime: 1469964315502,_gscs_1758414200: 69964315tq317521|pv:1, Hm_lvt_c7c8eed8670bd7fffefc8b202fe0904d: 1469964315,v_url_code: http%3A//ah.189.cn/sso/login%3FreturnUrl%3D%252Fbiz%252Fservice%252Faccount%252Finit.action,JSESSIONID_SSO: Jh1GXdgDZJqdZqpLvRQvZzdlvT7y6BxHhCny9MhbKh1Kw1hSLNt2Q1c6231LrHQWrpDL4m115pz0YTLJN7jx2fmpTfPBx1JwlYvvkLBRySmy18tnW1c2Q7qPvQqK9kJP!463350529,v_trackId: 1BD7B46E79FE234CE9C67E49D95245FB, Hm_lpvt_333c7327dca1d300fd7235c159b7da04: 1469964315,_gscbrs_1758414200: 1, Hm_lpvt_c7c8eed8670bd7fffefc8b202fe0904d: 1469964315,JSESSIONID_PERSONWEB: p2MyXdgGd8f5phjTTv2CJMr6J8QYhSyLX0kkZHlSwpppjhYGf3qm!1538637772}#登陆提交的表单postdata {remPwd: 0,loginName: ,returnUrl: /biz/service/account/init.action,validCode: ,loginType: 4, sysId: 1003, passType: 0,csrftoken: ,accountType: 9, ssoAuth: 0,passWord: ,latnId: 551}#登陆页面baseurl http://ah.189.cn/sso/login?returnUrl%2Fbiz%2Fservice%2Faccount%2Finit.action#登陆表单 post 的地址posturl http://ah.189.cn/sso/LoginServletsess requests.session()sess.headers.update(Head)def getP(url,cookies):带 session()requests 的 get 方法pre sess.get(url,cookies cookies)return predef getVerifyURL(url):从主页提取验证码地址reg r/sso/VImage.servlet\?random0\.[0-9] #正则表达式匹配验证码图片链接img re.search(reg,getP(url,cookies Cook).content).group()imge http://ah.189.cn img #得到验证码图片链接return imgedef getCodePic():下载验证码图片verifyURL getVerifyURL(baseurl)codePic getP(verifyURL,cookies Cook).contentprint verifyURLwith open(x.jpeg,wb) as jpg:jpg.write(codePic)def postData():post 表单信息更新username raw_input(输入手机号)code raw_input(输入密码)passwd raw_input(输入验证码)postdata[loginName] str(username)postdata[validCode] str(code)postdata[passWord] str(passwd)getCodePic()postData()postover sess.post(posturl,postdata) #post 表单cookLogin postover.cookies #查看 post 表单之后的 cookiesprint cookLogincon sess.get(http://ah.189.cn/biz/service/account/init.action)#登陆成功的页面print 登陆成功,con
http://www.huolong8.cn/news/228577/

相关文章:

  • 文具用品网站设计规划书网站规划步骤有哪些
  • 网站正在建设中 html可信赖的手机网站建设
  • 蜘蛛网是个什么网站辽宁城市建设职业技术学院教育网站
  • 做微信网站的公司无代码开发平台全免费
  • 任何做网站国外产品设计网
  • 网站做线上销售湖北做网站平台哪家好
  • 织梦的手机端网站模板下载地址长沙手机网站设计公司
  • dw做网站需要数据库么留言 wordpress
  • 为您打造高端品牌网站门户网站的含义
  • 河北省建设厅办事大厅网站学校语言文字网站建设
  • 搜索引擎是软件还是网站哪里可以做购物网站
  • 网站开发分哪几个步骤大健康品牌策划公司
  • 天助网的网站哈尔滨建工建设有限公司
  • 汕头网站建设推荐h5制作工具免费版
  • 东莞网站建设 旅游网页游戏魔域永恒魔石
  • 微网站模板标签wordpress建站网页无法运作
  • 和佳网站建设网站开发人员是做什么的
  • php网站建设教程济南咨询行业网站开发
  • 江苏住房和城乡建设信息网站嵌入式软件开发要求
  • 自己做的网站跳转到购彩大厅wordpress 技术文档
  • 北京市建设监理协会网站php 手机网站 模板
  • 如何做网站的关键词网站建设小公司生存
  • 网站开发前景咋样设计图片用什么软件好
  • 连云港seo网站推广手机浏览器
  • 支付网站怎么做网站开发的项目需求
  • 福州市工程建设质量管理协会网站wordpress 设置首页
  • 动易学校网站帕兰映像 wordpress
  • 网站上面的水印怎么做贵南县wap网站建设公司
  • 福州建设人才网站南京网站建设开发
  • 建设网站需要给钱吗品牌建设有哪些方面