最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

标签:python

【解答】为什么bash可以写脚本 还要用python
Python

【解答】为什么bash可以写脚本 还要用python

crifan 11年前 (2013-06-03) 2214浏览 0评论

【背景】 别人的问题: 菜鸟弱弱的问下 为什么bash可以写脚本 还要用python   【解答】 这个问题,就像在问: 既然有了自行车可以骑了,为何还需要汽车? 答: 因为汽车,有自行车具体的基本功能之外的,N多种功能和好处。 ...

【已解决】Python中lxml中InnerHtml的等价物
Python

【已解决】Python中lxml中InnerHtml的等价物

crifan 11年前 (2013-05-27) 5554浏览 1评论

【背景】 折腾: 【记录】Python中尝试用lxml去解析html 中,想要搞懂对于一个ElementTree的节点,如何获得该节点的完整的html,即类似于常见的InnerHtml的效果。 【解决过程】 1.参考: Equivalent to I...

【记录】Python中尝试用lxml去解析html
Python

【记录】Python中尝试用lxml去解析html

crifan 11年前 (2013-05-27) 11633浏览 0评论

【背景】 Python中,之前一直用BeautifulSoup去解析html的: 【教程】Python中第三方的用于解析HTML的库:BeautifulSoup 后来听说BeautifulSoup很慢,而lxml解析html速度很快,所以打算去试试...

【记录】用Scrapy抓取manta.com
Python

【记录】用Scrapy抓取manta.com

crifan 11年前 (2013-05-24) 3804浏览 0评论

【问题】 手上有个Scrapy的项目,是要抓取和 http://www.manta.com/ 相关的站点的内容。 已有源码为:   bs.py: import requests from bs4 import BeautifulSoup ...

【详解】python中的文件操作模式
Python

【详解】python中的文件操作模式

crifan 11年前 (2013-05-08) 3872浏览 0评论

待完成,最新更新:2013-05-08   把之前的: 【详解】Python中的文件操作,readline读取单行,readlines读取全部行,文件打开模式 中的部分内容整理过来,再加上更多的解释。   关于文件的基本知识 &...

64 queries in 0.156 seconds, using 21.94MB memory