详解crifan的Python库:crifanLib.py

版本:v1.1

Crifan Li

摘要

本文主要介绍了我自己crifan的Python函数库crifanLib.py,包括解释crifanLib.py由来,以及其中各种函数的功能和用法示例。

[提示] 本文提供多种格式供:
在线阅读 HTML HTMLs PDF CHM TXT RTF WEBHELP
下载(7zip压缩包) HTML HTMLs PDF CHM TXT RTF WEBHELP

HTML版本的在线地址为:

http://www.crifan.com/files/doc/docbook/crifanlib_python/release/html/crifanlib_python.html

有任何意见,建议,提交bug等,都欢迎去讨论组发帖讨论:

http://www.crifan.com/bbs/categories/crifanlib_python/

2013-09-29

修订历史
修订 1.1 2013-09-29 crl
  1. 把crifanLib.py从Python语言总结中整理出来单独成此book
  2. 更新xml:id

目录

1. crifanLib.py简介
1.1. 什么是crifanLib.py
1.2. 到哪里可以下载到crifanLib.py
2. crifanLib.py函数及用法详解
2.1. 与时间(time,datetime等)有关的函数
2.1.1. 当前时间转换为时间戳:getCurTimestamp
2.1.2. 将时间戳转换为时间变量:timestampToDatetime
2.1.3. 计算某段代码执行所消耗的时间:calcTimeStart,calcTimeEnd
2.1.4. 将本地GMT8时间转换为GMT标准时间:convertLocalToGmt
2.2. 和字符串(str,unicode等)处理有关的函数
2.2.1. 从绝对路径中提取出文件名:extractFilename
2.2.2. 将实体定义替换为字符:repUniNumEntToChar
2.2.3. 生成全路径的URL地址:genFullUrl
2.2.4. 判断两个URL地址是否相似:urlIsSimilar
2.2.5. 判断一个Url地址是否和一个Url地址列表中的某个Url地址相似:findSimilarUrl
2.2.6. 去除非单词(non-word)的字符:removeNonWordChar
2.2.7. 去除控制字符:removeCtlChr
2.2.8. 将字符实体替换为Unicode数字实体:replaceStrEntToNumEnt
2.2.9. 将xxx=yyy转换为元祖(tuple)变量:convertToTupleVal
2.2.10. 去除列表(List)中的空值:removeEmptyInList
2.2.11. 列表去重(去除重复的值):uniqueList
2.2.12. 过滤列表(去除在b中出现的a中的某值):filterList
2.2.13. 生成随机数的字符串:randDigitsStr
2.2.14. 将元组列表转换为字典变量:tupleListToDict
2.3. 文件(file等)方面的函数
2.3.1. 将二进制数据存为文件:saveBinDataToFile
2.4. 网络方面的函数
2.4.1. 检查/判断/校验网络上某个文件是否有效:isFileValid
2.4.2. 下载网络上某个文件:downloadFile
2.4.3. (不用urlretrieve)手动从网络上下载单个文件:manuallyDownloadFile
2.4.4. 获得Url地址的响应:getUrlResponse
2.4.5. 获得Url返回的HTML网页(源码)内容:getUrlRespHtml
2.4.6. 检查(所返回的)cookieJar中,是否所有的cookie都存在:checkAllCookiesExist
2.5. 字符编码相关的函数
2.5.1. 判断字符串是否只包含ASCII字符:strIsAscii
2.5.2. 获得(最有可能的)字符串的字符编码类型:getStrPossibleCharset
2.6. 语言翻译方面的函数
2.6.1. 翻译(中文)字符串(为英文字符串):translateString
2.6.2. 将中文字符串翻译为英文字符串:transZhcnToEn
2.7. Beautifulsoup相关的函数
2.7.1. 从soup的Contents中移除某个(带某种属性的)标签: removeSoupContentsTagAttr
2.7.2. 查找contents中第一个NavigableString: findFirstNavigableString
2.7.3. 将soup的contents转换为Unicode字符串: soupContentsToUnicode
参考书目

范例清单

2.1. getCurTimestamp使用范例
2.2. timestampToDatetime使用范例
2.3. calcTimeStart和calcTimeEnd的使用范例
2.4. convertLocalToGmt的使用范例
2.5. extractFilename的使用范例
2.6. repUniNumEntToChar的使用范例
2.7. genFullUrl的使用范例
2.8. urlIsSimilar的使用范例
2.9. findSimilarUrl的使用范例
2.10. removeNonWordChar的使用范例
2.11. removeCtlChr的使用范例
2.12. replaceStrEntToNumEnt的使用范例
2.13. convertToTupleVal的使用范例
2.14. removeEmptyInList的使用范例
2.15. uniqueList的使用范例
2.16. filterList的使用范例
2.17. randDigitsStr 的使用范例
2.18. tupleListToDict 的使用范例
2.19. saveBinDataToFile的使用范例
2.20. isFileValid的使用范例
2.21. downloadFile的使用范例
2.22. manuallyDownloadFile的使用范例
2.23. getUrlResponse的使用范例
2.24. getUrlRespHtml的使用范例:不带额外参数
2.25. getUrlRespHtml的使用范例:带额外参数
2.26. checkAllCookiesExist的使用范例
2.27. strIsAscii的使用范例
2.28. getStrPossibleCharset的使用范例
2.29. translateString的使用范例
2.30. transZhcnToEn的使用范例
2.31. removeSoupContentsTagAttr 的使用范例
2.32. soupContentsToUnicode 的使用范例