【已解决】PySpider中把一段html的字符串去除entity和unicode escape转义
7年前 (2018-10-11) 1449浏览
折腾: 【已解决】PySpider用json.loads字符串出错:json.decoder.JSONDecodeError: Invalid \escape: line 5 column 179 (char 269) 期间,需要把字符串: Chry...
7年前 (2018-10-11) 1449浏览
折腾: 【已解决】PySpider用json.loads字符串出错:json.decoder.JSONDecodeError: Invalid \escape: line 5 column 179 (char 269) 期间,需要把字符串: Chry...
7年前 (2018-10-11) 1904浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,代码: productMatch = re.search("^\s*product:\s*(?P<productJson>\{.+...
7年前 (2018-10-11) 1232浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,突然发现需要爬取的页面中,其实js的代码中包含了更多我想要的信息: var DumbleData = {}; DumbleData.data = { omn...
7年前 (2018-10-11) 3171浏览
折腾: 【未解决】PySpider中PyQuery中把得到的html的text转换为纯文本字符串 期间,用代码: import xml def htmlToString(htmlText): return ''.join...
7年前 (2018-10-11) 1779浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,现在对于: Riff Raff Sails the High Cheese by Susan Schade | Scholastic 已经用代码: (注意 html...
7年前 (2018-10-11) 1393浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,遇到一个稍微特殊一点的内容的提取: https://www.scholastic.com/teachers/books/lord-of-the-fleas-by-dav...
7年前 (2018-10-10) 1552浏览
折腾: 【暂时解决】给PySpider中用科学上网的代理打开需要翻墙的页面 期间,调试PySpider发现打开页面,出现很多错误,其中有304: console: AT: [getOffer()] request failed [object Obj...
7年前 (2018-10-10) 1594浏览
折腾: 【记录】用PySpider去爬取scholastic的绘本书籍数据 期间,加载页面偶尔异常不返回数据: [I 181010 15:45:25 scheduler:586] in 5m: new:0,success:0,retry:0,fail...
7年前 (2018-10-10) 2546浏览
【Lexile 兰斯 官网】 【兰斯代码 Lexile Code 含义】 兰斯官网解释: AD (Adult Directed) 家长指导书籍。这类读物一般都是带有文字的绘本,适合家长陪同学龄前儿童一起阅读 GN (Graphic N...
7年前 (2018-10-09) 15429浏览
背景: 某个Mac的OS版本是: OS X Yosemite 10.10.5 去安装ss,结果报错: -》 去试了试Mac的更新,结果也找不到OS的更新。 注:当前最新macOS是10.13.6 macOS High Sierra 然后需要...