最新消息:VPS服务器又从fzhost.net换回linode了,主题仍用朋友推荐的大前端D8

【整理】用Python从PDF中提取数据

Python crifan 156浏览 0评论

1.搜到的一些参考资料,有空可以去试试:

http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/
https://github.com/dpapathanasiou/pdfminer-layout-scanner/blob/master/layout_scanner.py

http://denis.papathanasiou.org/2010/08/04/extracting-text-images-from-pdf-files/

 

2.后来才发现,原先已有类似帖子:

【记录】用Python从pdf文件中提取文字数据信息

 

3.另外有空可以参考:

使用iText,精确提取PDF页面内容(估计完胜pdfbox吧)

转载请注明:在路上 » 【整理】用Python从PDF中提取数据

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
15 queries in 0.196 seconds, using 9.70MB memory