yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理
上一页 1 ··· 138 139 140 141 142 143 144 145 146 ··· 367 下一页

2016年7月1日 #

摘要: tesseract-ocr图片识别开源工具 今天看同事的ppt,提到了图片识别,又tesseract-ocr,觉得不错,试一下,如果效果好可以用来做验证码的识别 http://code.google.com/p/tesseract-ocr/ tesseract是一款开源工具,我安装了Windows版 阅读全文
posted @ 2016-07-01 02:45 xxxxxxxx1x2xxxxxxx 阅读(378) 评论(0) 推荐(0)

摘要: http://www.ruby-doc.org/http://rubyonrails.org/https://www.ruby-lang.org/zh_cn/downloads/http://ruby-china.org/ 阅读全文
posted @ 2016-07-01 02:45 xxxxxxxx1x2xxxxxxx 阅读(146) 评论(0) 推荐(0)

摘要: 中文分词库 阅读全文
posted @ 2016-07-01 02:43 xxxxxxxx1x2xxxxxxx 阅读(200) 评论(0) 推荐(0)

摘要: 更新:感谢评论中朋友的提醒,百度贴吧现在已经改成utf-8编码了吧,需要把代码中的decode('gbk')改成decode('utf-8')。 百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同,都是通过查看源码扣出关键数据,然后将其存储到本地txt文件。 源码下载: http://download. 阅读全文
posted @ 2016-07-01 02:43 xxxxxxxx1x2xxxxxxx 阅读(232) 评论(0) 推荐(0)

摘要: Python读写文件 Python读写文件1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。 file_object = open('thefile.txt')try: all_the_text = file_ob 阅读全文
posted @ 2016-07-01 02:43 xxxxxxxx1x2xxxxxxx 阅读(164) 评论(0) 推荐(0)

摘要: 脚本编程语言 阅读全文
posted @ 2016-07-01 02:42 xxxxxxxx1x2xxxxxxx 阅读(128) 评论(0) 推荐(0)

摘要: 地图相关 阅读全文
posted @ 2016-07-01 02:42 xxxxxxxx1x2xxxxxxx 阅读(114) 评论(0) 推荐(0)

摘要: 高性能网络开发库 阅读全文
posted @ 2016-07-01 02:42 xxxxxxxx1x2xxxxxxx 阅读(136) 评论(0) 推荐(0)

摘要: python 调用 shell get_line_num="wc -l as_uniq_info | awk '{print $1}'" ###get the lines of "as_uniq_info" line_num = os.popen(get_line_num).read().strip 阅读全文
posted @ 2016-07-01 02:41 xxxxxxxx1x2xxxxxxx 阅读(183) 评论(0) 推荐(0)

摘要: 并发/并行处理框架 阅读全文
posted @ 2016-07-01 02:41 xxxxxxxx1x2xxxxxxx 阅读(174) 评论(0) 推荐(0)

上一页 1 ··· 138 139 140 141 142 143 144 145 146 ··· 367 下一页