随笔分类 -  Python学习

摘要:转载自:http://lovebeyond.iteye.com/blog/1770476 CentOS下的Python版本一般都比较低,很多应用都需要升级python来完成。我装的centOS的默认的python版本是V2.4.3,但运行node.js需要的版本是2.5以上。 1。下载python3 阅读全文
posted @ 2016-09-04 09:29 lvmememe 阅读(201) 评论(0) 推荐(0)
摘要:当我可以爬到别人高票的知乎答案,我是否还会独立思考。 当我可以爬到别人豆瓣的读书笔记,我是否还能静心读书。 源于最近看到的很多爬知乎的思考: https://zhuanlan.zhihu.com/p/19866934 http://lab.grapeot.me/zhihu/autoface 我的想法 阅读全文
posted @ 2016-08-27 15:20 lvmememe 阅读(255) 评论(0) 推荐(0)
摘要:用PHP写了一个网页,可以获取百度百科词条。 那么通过Python来爬取,只需要不断向这个网页POST数据,获取返回值就可以了。由于是我自己的网页,保存返回值我也让PHP在服务器端来完成了,所以Python的任务只需要不断向服务器POST数据。 那么POST什么数据呢?暂时找到了一个名词大全的网页。 阅读全文
posted @ 2016-08-17 11:12 lvmememe 阅读(784) 评论(0) 推荐(0)
摘要:还是以我的网页iciba为例 POST数据到www.selflink.cn/iciba/get0.php获取返回的查询结果 阅读全文
posted @ 2016-08-15 12:00 lvmememe 阅读(1867) 评论(0) 推荐(0)
摘要:本以为Python3的中文兼容性无比友好,结果还是会有一点问题的。 解决方案如下,就以爬取我自己的一个网页极简翻译为例 阅读全文
posted @ 2016-08-14 10:20 lvmememe 阅读(839) 评论(0) 推荐(0)
摘要:所谓爬取其实就是获取链接的内容保存到本地。所以爬之前需要先知道要爬的链接是什么。 要爬取的页面是这个:http://findicons.com/pack/2787/beautiful_flat_icons 里面有很多不错的图标,目标就是把这些文件图片爬下来,保存成本地图片。 用python3怎么做呢 阅读全文
posted @ 2016-08-13 01:05 lvmememe 阅读(27481) 评论(9) 推荐(5)
摘要:学了几天python3,发现目前学到的与爬虫还是关系不大,所以现在准备爬虫和语言同步学习。 2016.8.9晚 先从最简单的开始,爬取指定url的所有内容: 编码不同,一个是utf-8,一个是gbk 另外,输出写入文件到的时候如果写入了一个html文件,打开可能会产生乱码,这个时候不要怀疑pytho 阅读全文
posted @ 2016-08-09 23:14 lvmememe 阅读(782) 评论(0) 推荐(0)
摘要:要做一个儿童搜索引擎的项目(www.kidsearch.cn),所以开始接触各种新的语言,初步学了PHP爬虫,觉得要做大点的项目用PHP确实不太方便,中文兼容性就是一个比较棘手的问题。python的爬虫确实很厉害,确实有必要学习。 学习网站:廖雪峰的python3教程http://www.liaox 阅读全文
posted @ 2016-08-07 00:41 lvmememe 阅读(377) 评论(0) 推荐(0)