【已解决】Windows系统中从PDF中OCR图片转文字的好用软件
crifan 7年前 (2018-10-17) 5014浏览
之前已经折腾了Mac中的pdf转文字的工具 iText: 【已解决】Mac中如何把图片中的文字识别转换出来 和 【记录】用PDFelement的OCR提取PDF文件中的图片中的英文文字 现在是同事有个Windows电脑,需要找win中的ocr好用的工...
在路上on the way - 走别人没走过的路,让别人有路可走
crifan 7年前 (2018-10-17) 5014浏览
之前已经折腾了Mac中的pdf转文字的工具 iText: 【已解决】Mac中如何把图片中的文字识别转换出来 和 【记录】用PDFelement的OCR提取PDF文件中的图片中的英文文字 现在是同事有个Windows电脑,需要找win中的ocr好用的工...
crifan 7年前 (2018-10-17) 1839浏览
折腾: 【未解决】把某Mac中已爬取部分数据的PySpider项目移动到另一Mac电脑中继续爬取 期间,需要再去mac中安装phantomjs。 Mac phantomjs 在mac上安装PhantomJS – 简书 xxxdeMacB...
crifan 7年前 (2018-10-16) 3025浏览
折腾: 【已解决】Mac中用ffmpeg调整mp4默认字幕为中文 期间,发现软字幕的话, TunesKit Video Cutter还是不显示字幕 所以尝试去直接burned in字幕。 再去试试: ➜ ffmpeg_edit_subtitle ...
crifan 7年前 (2018-10-16) 2067浏览
折腾: 【已解决】Mac中用ffmpeg调整mp4默认字幕为中文 期间,尝试去试试是可以用ffmpeg集成字幕文件到mp4视频中,实现软字幕 ➜ ffmpeg_edit_subtitle ffmpeg -i CTT_Folge_01_CH_Sub...
crifan 7年前 (2018-10-16) 13324浏览
折腾: 【已解决】Mac中编译安装pycurl失败:error: command ‘gcc’ failed with exit status 1 期间,出错: <code>(xx) bash-3.2$ xcode-...
crifan 7年前 (2018-10-16) 2718浏览
现有一个excel: 里面有几列单词。 希望做到: 去重:去重一些重复的单词 把单词和词组分开: 比如单词在上面 词组在下面 excel 去重 筛选唯一值或删除重复值 – Excel https://support.office...
crifan 7年前 (2018-10-16) 1515浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,去真正Run批量爬取,结果看到输出的log中出错: [I 181016 09:10:38 result_worker:33] result ScholasticStor...
crifan 7年前 (2018-10-15) 1499浏览
折腾: 【未解决】PySpider中把结果保存到MongoDB数据库中 期间,在PySpider中保存数据到MongoDB之前,需要先去本地调试,写好可以用于保存数据的代码。 Mac本地先去运行Mongod: mongod 然后打开图形工具便于...
crifan 7年前 (2018-10-15) 1818浏览
折腾: 【未解决】PySpider中把结果保存到MongoDB数据库中 期间,涉及到本地开发测试和在线生产等不同环境,传递不同参数给pymongo的MongoClient,去打开和连接MongoDB。 而关于mongodb的uri,此处希望可以根据参...
crifan 7年前 (2018-10-15) 1392浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,已经写好代码,爬取出来要的数据了: 但是需要去保存到MongoDB中。 Working with Results – pyspider 结果 –...