最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

Crawl_EmulateLogin

【整理】关于用正则表达式处理html代码方面的建议

【整理】关于用正则表达式处理html代码方面的建议

crifan 11年前 (2013-10-17) 5158浏览 0评论

之前见过不止一个人,比如: 用正则表达式得到某个div标签内部的div标签中的内容 之前某人写sina搬家到wordpress,也是全部用的是正则表达式实现的 -> 如果其遇到足够复杂的html代码,估计就会发现,正则基本上就没法使用了...

【教程】模拟登陆之如何分析并用代码模拟上传文件

【教程】模拟登陆之如何分析并用代码模拟上传文件

crifan 11年前 (2013-10-06) 4120浏览 0评论

【背景】 关于模拟登陆,之前大多都是模拟用户名和密码登陆的: 如何模拟登陆网站 中的: 先去用工具分析逻辑: 【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 再去用代码实现,此处,目前已经实现...

【教程】以抓取网易博客帖子中的最近读者信息为例,手把手教你如何抓取动态网页中的内容

【教程】以抓取网易博客帖子中的最近读者信息为例,手把手教你如何抓取动态网页中的内容

crifan 11年前 (2013-09-22) 9207浏览 9评论

背景 前面已经通过: 【教程】如何抓取动态网页内容 介绍了,关于抓取动态网页中的内容的逻辑过程。 下面通过具体的例子,来说明是如何实现此过程的。 前提知识 1.了解网页抓取等的基本背景知识 不了解的去参考: 【整理】关于抓取网页,分析网页内容,模拟登...

【教程】模拟登陆百度之Java代码版

【教程】模拟登陆百度之Java代码版

crifan 11年前 (2013-09-17) 10703浏览 18评论

【背景】 之前已经写了教程,分析模拟登陆百度的逻辑: 【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 然后又去用不同的语言: Python的: 【教程】模拟登陆网站 之 Python版(内含两种版本的完整...

【记录】研究模拟登陆百度的C#代码为何在.NET 4.0中不工作

【记录】研究模拟登陆百度的C#代码为何在.NET 4.0中不工作

crifan 11年前 (2013-09-11) 5228浏览 6评论

【背景】 对于模拟登陆百度,之前已经写了帖子了,包括C#版本的教程和代码: 【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程 中的 【教程】模拟登陆网站 之 C#版(内含两种版本的完整的可运行的代码) 我代...

63 queries in 0.221 seconds, using 22.06MB memory