Python写网络爬虫-Urllib库

2024-11-03 22:43:39

1、 首先,需要导入对应模块,所以,需要输入以下代码导入urllib.request:>>>import urllib.request

2、 导入模块之后,需要使用urllib.request.urlopen打开并爬取一个网页,以百度首页(http://www.baidu.com)为例,将爬取到的网页赋给变量file:>>>file = urllib.request.urlopen("http://www.baidu.com")

3、 此时,需要使用file.read()方法读取全部内容:>>>data = file.read()>>>data

Python写网络爬虫-Urllib库
猜你喜欢