requests是python的一个HTTP客户端库,跟urllib,urllib2类似。它比 urllib 更加方便,可以节约我们大量的工作,它比 urllib 更加 Pythoner。
安装 Requests
通过pip安装
1
|
$ pip install requests |
或者,下载代码后安装:
1
2
3
4
5
|
$ wget https: //github .com /requests/requests/tarball/master $ mv master requests.tgz $ tar xzf requests.tgz $ cd requests-requests-3dc84cd $ python setup.py install |
发送请求
使用Requests发送网络请求非常简单。
1
2
3
4
5
6
7
8
9
|
>>> import requests #导入Requests模块 >>> result = requests.get( 'http://www.pythontab.com' ) # 生成Response 对象 >>> result.status_code # 返回码 200 >>> result.headers[ 'content-type' ] # 返回头部信息 'text/html; charset=utf8' >>> result.encoding # 编码信息 'utf-8' >>> result.content #内容部分 |
为URL传递参数
你也许经常想为URL的查询字符串(query string)传递某种数据。如果你是手工构建URL,那么数据会以键/值 对的形式置于URL中,跟在一个问号的后面。例如,www.pythontab.com?version=python3 。 Requests允许你使用 params 关键字参数,以一个字典来提供这些参数。举例来说,如果你想传递 version=python3 和 keywords=pythontab 到 www.pythontab.com ,那么你可以使用如下代码:
1
2
3
4
|
>>> data = { 'version' : 'python3' , 'keywords' : 'pythontab' } >>> result = requests.get( "http://www.pythontab.com" , params = data) >>> print result.status_code 200 |
原始响应内容
在罕见的情况下你可能想获取来自服务器的原始套接字响应,那么你可以访问 r.raw 。 如果你确实想这么干,那请你确保在初始请求中设置了 stream=True 。具体的你可以这么做:
1
2
3
4
5
|
>>> result = requests.get( 'http://www.pythontab.com' , stream = True ) >>> result.raw <requests.packages.urllib3.response.HTTPResponse object at 0x101194810 > >>> result.raw.read( 10 ) '\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03' |
定制请求头
如果你想为请求添加HTTP头部,只要简单地传递一个 dict 给 headers 参数就可以了。
例如,在前一个示例中我们没有指定content-type:
1
2
3
4
5
|
>>> import requests >>> url = 'http://www.pythontab.com' >>> data = { 'version' : 'python3' , 'keywords' : 'pythontab' } >>> headers = { 'content-type' : 'application/json' } >>> result = requests.post(url, data = json.dumps(data), headers = headers) |
错误与异常
遇到网络问题(如:DNS查询失败、拒绝连接等)时,Requests会抛出一个ConnectionError 异常。
遇到罕见的无效HTTP响应时,Requests则会抛出一个 HTTPError 异常。
若请求超时,则抛出一个 Timeout 异常。
若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。
所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。
其他常用方法
result.content #获取二进制响应内容
result.json() #JSON响应内容
result.headers #响应头内容
result.cookies #cookie内容
result.history #请求历史
暂无评论内容