最新公告
  • 欢迎您光临起源地模板网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入钻石VIP
  • python3爬虫实战:使用浏览器cookie

    正文概述 宋宋大人   2020-12-15   561

    python3爬虫实战:使用浏览器cookie

    在日常生活中,我们会发现当我们登录的淘宝时,只要我们注册好并成功登录后,下次访问该网站时,淘宝就会记住我们的登录信息,而无需重新登录,在这个过程中使用的就是cookie的技术。cookie是指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据。通过浏览器登录一次,登录的信息就会被浏览器cookie保存下来,这对于经常忘记账号密码的小伙伴们真的是很友好啊,那你知道浏览器cookie是怎么使用的吗?下面来看看吧。


    网页提取标题为例

    >>> import re
    
    >>> get_title = lambda html: re.findall('<title>(.*?)</title>', html, flags=re.DOTALL)[0].strip()

    未登录情况下下载得到的标题:

    >>> import urllib2
    
    >>> url = 'https://bitbucket.org/'
    
    >>> public_html = urllib2.urlopen(url).read()
    
    >>> get_title(public_html)
    
    'Git and Mercurial code management for teams'

    使用第三方库browsercookie,获取cookie再下载:

    >>> import urllib.request
    
    >>> public_html = urllib.request.urlopen(url).read()
    
    >>> opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))


    其实呀,browsercookie模块就是这样一个从浏览器提取保存的cookies的工具。它是一个很有用的爬虫工具,让你轻松使用浏览器cookie,这么方便的方式要快点学起来哦~更多python学习推荐:python学习网。


    起源地下载网 » python3爬虫实战:使用浏览器cookie

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    模板不会安装或需要功能定制以及二次开发?
    请QQ联系我们

    发表评论

    还没有评论,快来抢沙发吧!

    如需帝国cms功能定制以及二次开发请联系我们

    联系作者

    请选择支付方式

    ×
    迅虎支付宝
    迅虎微信
    支付宝当面付
    余额支付
    ×
    微信扫码支付 0 元