scrapy框架解读

2026-03-29 15:19:30

1、如图中所示的article_zhihu就是使用scrapy startproject XXX 命令生成的项目文件

scrapy框架解读

2、之后使用scrapy genspider XXX XXXX则是生成了图片中的划线文件，并默认产生爬虫的名称和链接地址，XXX 作为爬虫名，XXXX作为链接地址。

scrapy框架解读

scrapy框架解读

3、 items.py是用于存放页面爬取的词类，如标题，发布时间，链接地址等。存放之后可以用于进行数据处理

scrapy框架解读

4、 middlewares.py和pipelines.py主要存放的是对爬取后数据进行处理的方法与控制的方法。

scrapy框架解读

5、 settings.py内的文件是scrapy程序的具体配置，每一个scrapy都会因为自己爬取不同而与不同的配置。

scrapy框架解读

相关推荐

Excel如何一秒输入两万个序号

阅读量：23

Excel表格如何隐藏和取消隐藏工作表？

阅读量：20

WPS表格中如何快速得到当前时间的分钟数？

阅读量：27

EXCEL中如何更改单元格中时间的显示格式

阅读量：160

在Excel表格中如何快速的输入评语

阅读量：76

猜你喜欢

猜你喜欢