最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

【整理】用Python从PDF中提取数据

Python crifan 3574浏览 0评论

1.搜到的一些参考资料,有空可以去试试:

http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/
https://github.com/dpapathanasiou/pdfminer-layout-scanner/blob/master/layout_scanner.py

http://denis.papathanasiou.org/2010/08/04/extracting-text-images-from-pdf-files/

 

2.后来才发现,原先已有类似帖子:

【记录】用Python从pdf文件中提取文字数据信息

 

3.另外有空可以参考:

使用iText,精确提取PDF页面内容(估计完胜pdfbox吧)

转载请注明:在路上 » 【整理】用Python从PDF中提取数据

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
85 queries in 0.424 seconds, using 22.02MB memory