如何用Python从PDF文件中导出数据
1、打开pycharm工具,点击File--->Settings,打开可利用的包,安装pdfminer2

2、新建一个Python文件,依次导入io和pdfminer(模块中的类)

3、定义函数show_data,传入参数文件路径;循环遍历pdf文档,获取内部文字内容

4、再定义一个函数et,参数还是文档路径;调用show_data,使用for...in语句遍历循环,打印内容

5、使用if语句判断__name__是否等于__main__,打印并调用et,传入pdf文件路径

6、保存代码并使用Python应用运行,结果控制台出现了报错,文件找不到

7、拷贝一个user.pdf文件到Python文件同级目录,然后运行Python文件

8、可以在控制台查看到打印结果,和pdf文件内容进行对比,一致
