用python下载网页，超级简单！

深水

版主

Rank: 7 Rank: 7 Rank: 7

1^#
大中
小发表于 2007-7-10 15:15 只看该作者

用python下载网页，超级简单！

view plain copy to clipboard print ?

from urllib import urlopen
webdata = urlopen("http://www.pythonid.com").read()
print webdata



from urllib import urlopen



webdata = urlopen("http://www.pythonid.com").read()

print webdata

够简单吧，哈哈。

UID: 6
帖子: 1047
精华: 27
积分: 1098
阅读权限: 100
在线时间: 322 小时
注册时间: 2007-7-8
最后登录: 2009-2-13

查看详细资料

TOP

zhaoweikid

版主

Rank: 7 Rank: 7 Rank: 7

2^#
大中
小发表于 2007-7-10 15:25 只看该作者

python最适合干这种事情了！

UID: 2
帖子: 1111
精华: 16
积分: 875
阅读权限: 100
在线时间: 478 小时
注册时间: 2007-6-28
最后登录: 2008-11-15

查看详细资料

TOP

hongfu

新手上路

Rank: 1

3^#
大中
小发表于 2007-7-10 16:10 只看该作者

我来补充点,你那只能说是查看网页,怎能说是下载呢,总得如存吧

import urllib

webfile = urllib.urlopen("http://www.insenz.com").read()

fp = file('rhf.html', 'a+')

#fp = open('rhf.html', 'a+')

fp.write(webfile)

fp.close()

UID: 17
帖子: 217
精华: 3
积分: 45
阅读权限: 10
在线时间: 29 小时
注册时间: 2007-7-9
最后登录: 2008-8-6

查看详细资料

TOP

寒冰炫

版主

Rank: 7 Rank: 7 Rank: 7

4^#
大中
小发表于 2007-7-10 17:42 只看该作者

回复 #3 hongfu 的帖子

运行后得到这个

错误

您所请求的网址（URL）无法获取

--------------------------------------------------------------------------------

当尝试进行以下请求时：

GET HTTP/1.0

Host: www.insenz.com

User-Agent: Python-urllib/1.17

发生了下列的错误：

Invalid Request

无效的请求

Some aspect of the HTTP Request is invalid. Possible problems:

HTTP 请求的某些方面是无效的。可能是下列问题：

Missing or unknown request method

缺少请求方式或未知的请求方式

Missing URL

缺少网址

Missing HTTP Identifier (HTTP/1.0)

缺少 HTTP 标识（HTTP/1.0）

Request is too large

请求命令过长

Content-Length missing for POST or PUT requests

POST 或 PUT 请求缺少内容长度

Illegal character in hostname; underscores are not allowed

主机名称中包含不合法的字符；下划线是不允许的。

本缓存服务器管理员：cacheadmin@discuz.com.

--------------------------------------------------------------------------------

Generated Tue, 10 Jul 2007 09:40:24 GMT by cache.discuz.net (squid/2.5.STABLE14)

UID: 7
帖子: 146
精华: 2
积分: 18
阅读权限: 100
来自: 北京&重庆
在线时间: 12 小时
注册时间: 2007-7-8
最后登录: 2008-6-23