邮箱图标 wotula.com

随笔分类 -  Python那些事

自学python
摘要:记得之前应同学之情,帮忙爬取人人贷网的借贷人信息,综合网上各种相关资料,改善一下别人代码,并能实现数据代码爬取,具体请看我之前的博客:http://www.cnblogs.com/Yiutto/p/5890906.html。但过了一段时间,发现之前的代码运行不能爬取到数据,而且数据爬取过多也会出现一 阅读全文
posted @ 2016-12-31 11:41 编程浪子Yiutto 阅读(4284) 评论(2) 推荐(0)
摘要:转载地址:https://zhuanlan.zhihu.com/p/20436642word_cloud/examples at master · amueller/word_cloud · GitHub 上面是官方样例。这一篇里的大部分尝试都基于这些样例进行修改。前提是你已经完成了安装,依照上一篇 阅读全文
posted @ 2016-10-25 21:51 编程浪子Yiutto 阅读(6414) 评论(1) 推荐(0)
摘要:转载地址:https://zhuanlan.zhihu.com/p/20436581上文末尾提到 Python 下还有一款词云生成器。amueller/word_cloud · GitHub 可以直接使用命令 pip install wordcloud 安装,自行补充完整依赖。 网上搜不到有关的中文 阅读全文
posted @ 2016-10-25 21:19 编程浪子Yiutto 阅读(4010) 评论(0) 推荐(0)
摘要:转载地址:https://zhuanlan.zhihu.com/p/20432734工具 Python 2.7 (前几天试了试 Scrapy 所以用的 py2 。血泪的教训告诉我们能用 py3 千万别用 py2 ,编码问题累死人) jieba 结巴分词 fxsjy/jieba · GitHub py 阅读全文
posted @ 2016-10-25 21:10 编程浪子Yiutto 阅读(7952) 评论(0) 推荐(0)
摘要:数据库版本:MySQL Python版本:3.5 之前用想用MySQLdb来着,后来发现py3.5版本不支持,现选择pymysql 现在想将数据库adidas中的表jd_comment读取至python中的DataFrame,方便数据分析处理 大众代码如下: charset必须和之前数据库保存一致, 阅读全文
posted @ 2016-10-25 11:06 编程浪子Yiutto 阅读(6099) 评论(0) 推荐(0)
摘要:之前看到过网上有一篇有关爬取P2P网站上散标投资数据和借贷人的信息数据的博文,后应他人请求,帮忙实现。发现存在不少问题,先整合前人资料(http://sanwen8.cn/p/156w57U.html),说一下爬取中遇到的问题: (一)首先分析"散标投资"这一个模块,共有51个页面 (页面总共51个 阅读全文
posted @ 2016-09-20 22:51 编程浪子Yiutto 阅读(10294) 评论(4) 推荐(0)
摘要:1,对于list列表来说 a.用自定义函数来统计技术 或者利用python标准库 b.利用python标准库的collections.Counter类 2,对于DataFrame来说 对于DataFrame对象中的一列所返回的对象Series,例如frame['属性名'],有一个value_coun 阅读全文
posted @ 2016-07-19 16:28 编程浪子Yiutto 阅读(939) 评论(0) 推荐(0)
摘要:目录1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期 1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='this is string';print str; b、使用双引号(")双引号中的字符串与单引号中的字 阅读全文
posted @ 2016-07-19 10:17 编程浪子Yiutto 阅读(333) 评论(0) 推荐(0)
摘要:摘要 本文给出主Python版本标准库的编码约定。CPython的C代码风格参见​PEP7。本文和​PEP 257 文档字符串标准改编自Guido最初的《Python Style Guide》, 并增加了Barry的​GNU Mailman Coding Style Guide的部分内容。本文会随着 阅读全文
posted @ 2016-07-02 22:33 编程浪子Yiutto 阅读(1664) 评论(0) 推荐(0)
摘要:Anaconda多环境多版本python配置指导 字数3696 阅读644 评论0 喜欢0 最近学python,读完了语法后在GitHub找了一些练习来做,由于学的是python3.x语法,而GitHub上的好多数练习源码都是基于2.x的,而有些有些module在python3.x上没有,因此为装这 阅读全文
posted @ 2016-07-01 09:30 编程浪子Yiutto 阅读(7785) 评论(0) 推荐(0)
摘要:Anaconda Python 是 Python 科学技术包的合集,功能和 Python(x,y) 类似。它是新起之秀,已更新多次了。包管理使用 conda,GUI基于 PySide,所有的包基本上都是最新版,没有PyQt和wxpython等,容量适中,但该有的科学计算包都有:numpy,sicpy 阅读全文
posted @ 2016-06-02 20:47 编程浪子Yiutto 阅读(4523) 评论(0) 推荐(0)
摘要:用于科学计算Python语言真的是amazing! 方法一:直接安装集成好的软件 刚开始使用numpy、scipy这些模块的时候,图个方便直接使用了一个叫做Enthought的软件。Enthought是一家位于美国得克萨斯州首府奥斯汀的软件公司,主要使用Python从事科学计算工具的开发。Entho 阅读全文
posted @ 2016-06-02 20:39 编程浪子Yiutto 阅读(1347) 评论(0) 推荐(0)
摘要:Python下大多数工具包的安装都很简单,只需要执行 “python setup.py install”命令即可。然而,由于SciPy和numpy这两个科学计算包的依赖关系较多,安装过程较为复杂。网上教程较为混乱,而且照着做基本都不能用。在仔细研读各个包里的README和INSTALL之后,终于安装 阅读全文
posted @ 2016-04-27 14:16 编程浪子Yiutto 阅读(2234) 评论(2) 推荐(0)
摘要:虽然python解析xml的库很多,但是,由于lxml在底层是用C语言实现的,所以lxml在速度上有明显优势。除了速度上的优势,lxml在使用方面,易用性也非常好。这里将以下面的xml数据为例,介绍lxml的简单使用。 1、将xml解析为树结构,并得到该树的根。 为了将xml解析为树结构,并得到该树 阅读全文
posted @ 2016-04-13 14:25 编程浪子Yiutto 阅读(13769) 评论(0) 推荐(0)