随笔分类 - Python学习
摘要:转载自:http://lovebeyond.iteye.com/blog/1770476 CentOS下的Python版本一般都比较低,很多应用都需要升级python来完成。我装的centOS的默认的python版本是V2.4.3,但运行node.js需要的版本是2.5以上。 1。下载python3
阅读全文
摘要:当我可以爬到别人高票的知乎答案,我是否还会独立思考。 当我可以爬到别人豆瓣的读书笔记,我是否还能静心读书。 源于最近看到的很多爬知乎的思考: https://zhuanlan.zhihu.com/p/19866934 http://lab.grapeot.me/zhihu/autoface 我的想法
阅读全文
摘要:用PHP写了一个网页,可以获取百度百科词条。 那么通过Python来爬取,只需要不断向这个网页POST数据,获取返回值就可以了。由于是我自己的网页,保存返回值我也让PHP在服务器端来完成了,所以Python的任务只需要不断向服务器POST数据。 那么POST什么数据呢?暂时找到了一个名词大全的网页。
阅读全文
摘要:还是以我的网页iciba为例 POST数据到www.selflink.cn/iciba/get0.php获取返回的查询结果
阅读全文
摘要:本以为Python3的中文兼容性无比友好,结果还是会有一点问题的。 解决方案如下,就以爬取我自己的一个网页极简翻译为例
阅读全文
摘要:所谓爬取其实就是获取链接的内容保存到本地。所以爬之前需要先知道要爬的链接是什么。 要爬取的页面是这个:http://findicons.com/pack/2787/beautiful_flat_icons 里面有很多不错的图标,目标就是把这些文件图片爬下来,保存成本地图片。 用python3怎么做呢
阅读全文
摘要:学了几天python3,发现目前学到的与爬虫还是关系不大,所以现在准备爬虫和语言同步学习。 2016.8.9晚 先从最简单的开始,爬取指定url的所有内容: 编码不同,一个是utf-8,一个是gbk 另外,输出写入文件到的时候如果写入了一个html文件,打开可能会产生乱码,这个时候不要怀疑pytho
阅读全文
摘要:要做一个儿童搜索引擎的项目(www.kidsearch.cn),所以开始接触各种新的语言,初步学了PHP爬虫,觉得要做大点的项目用PHP确实不太方便,中文兼容性就是一个比较棘手的问题。python的爬虫确实很厉害,确实有必要学习。 学习网站:廖雪峰的python3教程http://www.liaox
阅读全文

浙公网安备 33010602011771号