如何用Python从PDF文件中导出数据

2024-10-15 21:37:57

1、打开pycharm工具,点击File--->Settings,打开可利用的包,安装pdfminer2

如何用Python从PDF文件中导出数据

2、新建一个Python文件,依次导入io和pdfminer(模块中的类)

如何用Python从PDF文件中导出数据

3、定义函数show_data,传入参数文件路径;循环遍历pdf文档,获取内部文字内容

如何用Python从PDF文件中导出数据

4、再定义一个函数et,参数还是文档路径;调用show_data,使用for...in语句遍历循环,打印内容

如何用Python从PDF文件中导出数据

5、使用if语句判断__name__是否等于__main__,打印并调用et,传入pdf文件路径

如何用Python从PDF文件中导出数据

6、保存代码并使用Python应用运行,结果控制台出现了报错,文件找不到

如何用Python从PDF文件中导出数据

7、拷贝一个user.pdf文件到Python文件同级目录,然后运行Python文件

如何用Python从PDF文件中导出数据

8、可以在控制台查看到打印结果,和pdf文件内容进行对比,一致

如何用Python从PDF文件中导出数据
猜你喜欢