json-如何使用python或JavaScript提取文本并另存为excel文件
发布时间:2022-06-24 23:32:50 304
相关标签: # mongodb
如何从PDF文件中提取文本,其中一些数据是表格形式的,而另一些是基于键值的数据
这就是我所尝试的:
import PyPDF2
import openpyxl
from openpyxl import Workbook
pdfFileObj = open('sample.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pageObj = pdfReader.getPage(0)
mytext = pageObj.extractText()
wb = Workbook()
sheet = wb.active
sheet.title = 'MyPDF'
sheet['A1'] = mytext
wb.save('sample.xlsx')
print('Save')
但是,我希望数据以以下格式存储。
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报