python 3 如何获取pdf中的文字

2024-10-14 21:17:55

1、首先,使用命令pip install pdfminer安装pdfminer(注意pip要是python3的,如果系统中还有python2,建议创建venv环境再用python和pip)。

python 3 如何获取pdf中的文字

3、如图命令将test.pdf文件的文字抽取并输出到test.txt文件中。

python 3 如何获取pdf中的文字

5、我们也可以直接查看pdf2txt.py的代码,观察其实现方式。

python 3 如何获取pdf中的文字

7、最终提取出来的代码如图所示,pdf_gettext即根据文件名,获取文件,并打印到stdout。

python 3 如何获取pdf中的文字
猜你喜欢