最新消息:服务器现已从linode换到fzhost.net,且主题已从retina 0.2换为大前端D8

【整理】用Python从PDF中提取数据

Python crifan 77浏览 0评论

1.搜到的一些参考资料,有空可以去试试:

http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/
https://github.com/dpapathanasiou/pdfminer-layout-scanner/blob/master/layout_scanner.py

http://denis.papathanasiou.org/2010/08/04/extracting-text-images-from-pdf-files/

 

2.后来才发现,原先已有类似帖子:

【记录】用Python从pdf文件中提取文字数据信息

 

3.另外有空可以参考:

使用iText,精确提取PDF页面内容(估计完胜pdfbox吧)

转载请注明:在路上 » 【整理】用Python从PDF中提取数据

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
51 queries in 0.554 seconds, using 12.86MB memory