最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

Crawl_EmulateLogin

【记录】模拟登陆google

【记录】模拟登陆google

crifan 11年前 (2013-03-18) 12647浏览 8评论

1.用IE9打开 https://www.google.com.hk/ 后,点击右上角的Sign In后,然后输入用户名和密码: 点击Sign in去登陆。 然后就可以看到已经登陆了:   2.很明显,其中的: https://a...

【整理】网页抓取,模拟登陆,抓取动态网页内容等过程中,所涉及的Headers信息,Cookie信息,POST数据的处理逻辑

【整理】网页抓取,模拟登陆,抓取动态网页内容等过程中,所涉及的Headers信息,Cookie信息,POST数据的处理逻辑

crifan 12年前 (2012-12-04) 6219浏览 2评论

背景 我们在,网页抓取,模拟登陆,抓取动态网页等等,过程中,往往要先通过工具去分析,如何访问一个url,然后获得对应的数据,然后搞懂逻辑了,再用代码实现出来。 而此时,就涉及到,访问对应的url是GET是,要发送,一堆的Header, 而如果是POS...

【教程】如何抓取动态网页内容

【教程】如何抓取动态网页内容

crifan 12年前 (2012-12-04) 9706浏览 4评论

背景 很多时候,很多人,需要去抓取网页中某些特定内容。 但是,除了之前介绍过的,想要提取某些,静态网页,中的特定内容,比如: 【教程】抓取网并提取网页中所需要的信息 之 Python版 和 【教程】抓取网并提取网页中所需要的信息 之 C#版 之外,有...

64 queries in 0.163 seconds, using 22.05MB memory