Python3爬虫--BeautifulSoup

2026-02-14 23:34:56

1、    首先,安装bs4模块,该模块包含BeautifulSoup库。Windows下进入dos中,敲入以下命令:

>>>pip install bs4

本机已经安装成功,因此图片可能有些区别。

如果没有安装pip,可以先去安装,具体自己查询。

Python3爬虫--BeautifulSoup

Python3爬虫--BeautifulSoup

2、>>>python

敲入命令回车进入Python交互模式,敲入以下命令

>>>from bs4 import BeautifulSoup

导入BeautifulSoup库,回车倒入成功。

Python3爬虫--BeautifulSoup

3、>>>from urllib.request import urlopen

>>>html = urlopen("https://baike.baidu.com/")

>>>bsObj = BeautifulSoup(html.read())

图中表示网页的内容已经转化为了BeautifulSoup对象。

Python3爬虫--BeautifulSoup

4、>>>bsObj.div.a

从网页中提取第一个div中的<a>标签成功

>>>bsObj

显示网页内容。

Python3爬虫--BeautifulSoup

Python3爬虫--BeautifulSoup

猜你喜欢