Python专题教程:抓取网站,模拟登陆,抓取动态网页

版本:v1.0

Crifan Li

摘要

本文是针对Python的中级开发人员,介绍如何用Python语言去实现抓取网站,模拟登陆,抓取动态网页。其中主要涉及到,网络处理方面的模块(urllib,urllib2等),以及HTML解析相关的模块(BeautifulSoup,json等)。

[提示]本文提供多种格式供:

HTML版本的在线地址为:

http://www.crifan.com/files/doc/docbook/python_topic_web_scrape/release/html/python_topic_web_scrape.html

有任何意见,建议,提交bug等,都欢迎去讨论组发帖讨论:

http://www.crifan.com/bbs/categories/python_topic_web_scrape/

2013-02-06

修订历史
修订 1.02013-02-06crl
  1. 把之前教程的地址整理过来