python 3 如何获取pdf中的文字
1、首先,使用命令pip install pdfminer安装pdfminer(注意pip要是python3的,如果系统中还有python2,建议创建venv环境再用python和pip)。

3、如图命令将test.pdf文件的文字抽取并输出到test.txt文件中。

5、我们也可以直接查看pdf2txt.py的代码,观察其实现方式。

7、最终提取出来的代码如图所示,pdf_gettext即根据文件名,获取文件,并打印到stdout。

1、首先,使用命令pip install pdfminer安装pdfminer(注意pip要是python3的,如果系统中还有python2,建议创建venv环境再用python和pip)。
3、如图命令将test.pdf文件的文字抽取并输出到test.txt文件中。
5、我们也可以直接查看pdf2txt.py的代码,观察其实现方式。
7、最终提取出来的代码如图所示,pdf_gettext即根据文件名,获取文件,并打印到stdout。