【教程】以抓取新浪财经的创业板的信息为例,解释如何分析并模拟动态网页抓取
crifan 11年前 (2013-04-30) 5071浏览 1评论
【背景】 之前写过很多网页抓取方面的教程了。全都整理到这里了: 详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 现遇到别人问的问题: python 抓取动态网页的问题 即,如何分析和抓取: http://vip.stock....
crifan 11年前 (2013-04-30) 5071浏览 1评论
【背景】 之前写过很多网页抓取方面的教程了。全都整理到这里了: 详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 现遇到别人问的问题: python 抓取动态网页的问题 即,如何分析和抓取: http://vip.stock....
crifan 11年前 (2013-04-29) 13318浏览 4评论
【问】 Hi Crifan, 我在http://bbs.csdn.net/topics/390361293 里看到抓取网易公开课的脚本,我看了下,感觉还比较简单,但是有一处不是很理解 它在 获取课程名称的时候用到以下代码, fileNa...
crifan 11年前 (2013-04-29) 6221浏览 0评论
【问题】 python中,使用正则期间,用如下代码: #http://autoexplosion.com/cars/buy/150594.php foundMainType = re.search("http://autoexplosion...
crifan 11年前 (2013-04-29) 3126浏览 0评论
【问题】 C语言中, 关于如何获得一个,当做参数传递到函数内的一个数组的大小。 之前以为是可以通过类似于: sizeof(b) / sizeof(b[0]) 的,去获得参数中的数组的大小而定。 【解决过程】 1后来经过实际测试,说明自...
crifan 11年前 (2013-04-27) 2754浏览 0评论
已经有了对应的java代码去访问网络了: /** Get response from url, headerDict, postDict */ public HttpResponse getUrlResponse(String url...
crifan 11年前 (2013-04-26) 3948浏览 2评论
【背景】 之前用google搜一点技术贴,都经常被禁,搞得很烦,想问候党的八代祖宗。 后来发现,之前就知道的那个goagent,同事正使用中,效果还是很好的。 可以很正常的浏览google,youtube等网站。 所以,打算花点时间,自己也去弄个。 ...
crifan 11年前 (2013-04-26) 4031浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,已经申请好了gae了: 【记录】申请并创建GAE(Google App Engine) 且已经: 【记录】上传app(goagent)到gae上 然后接着就是去配置本地的浏览器中的代理设置了。 ...
crifan 11年前 (2013-04-26) 2853浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,已经申请好了gae了: 【记录】申请并创建GAE(Google App Engine) 接下来,就是参考: https://code.google.com/p/goagent/wiki/Inst...
crifan 11年前 (2013-04-26) 3100浏览 0评论
【背景】 折腾: 【记录】折腾goagent代理 期间,需要参考: https://code.google.com/p/goagent/wiki/InstallGuide 去创建GAE. [折腾过程] 1.进入: https://appengine....
crifan 11年前 (2013-04-25) 1889浏览 0评论
A TCP/IP Server written in C# Simple HTTP Server in C# COM Interop 第二部分:C# 服务器教程 C#编写高性能网络服务器(源码)...