最新公告

欢迎您光临起源地模板网，本站秉承服务宗旨履行“站长”责任，销售只是起点服务永无止境！立即加入钻石VIP

当前位置：站长学院 > python教程 > Python爬虫如何获取Ajax方式加载的数据

Python爬虫如何获取Ajax方式加载的数据

正文概述 2020-09-13 462

获取Ajax方式加载的数据

爬虫最需要关注的不是页面信息，而是页面信息的数据来源。

Ajax方式加载的页面，数据来源一定是JSON，直接对AJAX地址进行post或get，拿到JSON，就是拿到了网页数据。

（1）先通过浏览器访问豆瓣电影排行榜

https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=

Python爬虫如何获取Ajax方式加载的数据

相关推荐：《Python视频教程》

（2）浏览器访问后，通过抓包工具就可以获取我们想要的一些信息。

Python爬虫如何获取Ajax方式加载的数据

Python爬虫如何获取Ajax方式加载的数据

只要response里面有 JSON数据，我们就可以找到服务器的数据来源。

分析发现变动的是start value和limit value, type,interval_id,action，固定不变，这三个url中已经包含了，所以formdata只用传start和limit。

import urllib
import urllib2
url = 'https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action='
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
 Chrome/60.0.3112.101 Safari/537.36'}
# start和limit可以自己随便设置
formdata = {'start':'20','limit':'100'}
data = urllib.urlencode(formdata)
request = urllib2.Request(url,data = data,headers=headers)
response = urllib2.urlopen(request)
print response.read()

相关推荐：

Python爬虫如何爬取贴吧内容

Python技术 Python爬虫

起源地下载网 » Python爬虫如何获取Ajax方式加载的数据

常见问题FAQ

免费下载或者VIP会员专享资源能否直接商用？: 本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考 VIP介绍。

提示下载完但解压或打开不了？: 最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量，若小于网盘提示的容量则是这个原因。这是浏览器下载的bug，建议用百度网盘软件或迅雷下载。若排除这种情况，可在对应资源底部留言，或联络我们.。

找不到素材资源介绍文章里的示例图片？: 对于PPT，KEY，Mockups，APP，网页模版等类型的素材，文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买，且本站不负责(也没有办法)找到出处。同样地一些字体文件也是这种情况，但部分素材会在素材包内有一份字体下载链接清单。

模板不会安装或需要功能定制以及二次开发？: 请QQ联系我们

SVIP

分享到：

发表评论

还没有评论，快来抢沙发吧！

如需帝国cms功能定制以及二次开发请联系我们

SVIP

升级SVIP会员

限时钜惠
终身SVIP仅需299元

立即开通