最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

标签:音视频文件

【记录】爬取CHILDES中的字幕和音视频文件
Scrapy

【记录】爬取CHILDES中的字幕和音视频文件

crifan 8年前 (2018-03-22) 2335浏览

根据需求,需要去爬取: Eng-NA Corpora Bilingual Corpora 中,对应的内容的: 字幕,去掉各种标注的 音频,如果有 视频,如果有 参考之前自己的: 【记录】用Python的Scrapy去爬取Youtube中Humf的字幕...

65 queries in 0.893 seconds, using 18.87MB memory