摘要: 近期,在安装结巴分词的时候遇到一些问题,纠结了好一阵,跟大家分享下,希望能有所帮助。先说下安装环境: windows7, 64位系统 python3.6,python3.5在结巴分词的官方github上,描述了关于结巴分词(jieba)的安装步骤 全自动安装:easy_install jieba 或 阅读全文
posted @ 2017-05-16 23:04 lemonbit 阅读(6724) 评论(0) 推荐(0) 编辑
摘要: 前言 真心讲,长这么大,还没有见过UFO长啥样,偶然看到美国UFO报告中心有关于UFO时间记录的详细信息,突然想分析下这些记录里都包含了那些有趣的信息,于是有了这次的分析过程。 当然,原始数据包含的记录信息比较多,我只是进了了比较简单的分析,有兴趣的童鞋可以一起来分析,别忘了也给大家分享下您的分析情 阅读全文
posted @ 2017-05-14 06:24 lemonbit 阅读(1094) 评论(0) 推荐(0) 编辑
摘要: Table of Contents 1 官方Demo 2 将实际数据应用于官方Demo 3 一些改善措施 3.1 重新设置字体大小 3.2 设置显示颜色,Method 1: 3.3 设置显示颜色, Method 2: 3.4 设置图例(legend) 3.5 重新设置图例(legend) 3.6 将 阅读全文
posted @ 2017-05-10 07:22 lemonbit 阅读(2696) 评论(0) 推荐(0) 编辑
摘要: python3下安装aiohttp遇到过的那些坑 最近需要用到aiohttp这个库,在安装过程中遇到很多坑。google、baidu后,依然没有找到合适的解决方案。 后来通过去python官方的PyPI查看aiohttp库,才发现一些问题,几经折腾,最后终于成功的在python3下安装’aiohtt 阅读全文
posted @ 2017-05-07 10:56 lemonbit 阅读(10886) 评论(0) 推荐(0) 编辑
摘要: Pandas分组运算(groupby)修炼 Pandas的groupby()功能很强大,用好了可以方便的解决很多问题,在数据处理以及日常工作中经常能施展拳脚。 今天,我们一起来领略下groupby()的魅力吧。 首先,引入相关package: import pandas as pd import n 阅读全文
posted @ 2017-05-05 07:16 lemonbit 阅读(119123) 评论(1) 推荐(1) 编辑
摘要: 用Pandas获取商品期货价格并可视化 摘 要 1、用pandas从excel中读取数据; 2、用pandas进行数据清洗、整理; 3、用bokeh进行简单的可视化。 1、数据读取 本文主要是将获取到的商品期货价格进行整理,获取报价当日对应的当年度年底期货价格,并进行简单的可视化。最终,我们要获取的 阅读全文
posted @ 2017-05-02 23:02 lemonbit 阅读(1084) 评论(0) 推荐(0) 编辑
摘要: 本次抓取的是智联招聘网站搜索“数据分析师”之后的信息。 python版本: python3.5。 我用的主要package是 Beautifulsoup + Requests+csv 另外,我将招聘内容的简单描述也抓取下来了。 文件输出到csv文件后,发现用excel打开时有些乱码,但用文件软件打开 阅读全文
posted @ 2017-03-17 23:33 lemonbit 阅读(2657) 评论(0) 推荐(1) 编辑
摘要: XPath语法 XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。 节点关系 (1)父(Parent) 每个元素以及 阅读全文
posted @ 2017-02-14 17:08 lemonbit 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 结合个人需求,从某个网站获取一些数据,发现网页链接是隐藏的,需要通过浏览器看后面的代码来获取真实的链接。 下面这个案例,直接是从真实的链接中爬去数据。 此外,发现用pandas的read_html不能直接解析“lxml”的表格,有待后续研究。 另外,爬去的数据发现有很多空格符号,主要是 "\r"、" 阅读全文
posted @ 2017-01-17 00:13 lemonbit 阅读(1323) 评论(4) 推荐(0) 编辑
摘要: 先说下环境 Anaconda 对应Python3.5的版本 win7,64位系统。 step1:下载whl文件 step2:打开‘Anaconda Command Prompt‘, 如下图: step3:命令行窗口pip安装,代码如下: pip install 路径+whl文件名 具体如下: Ste 阅读全文
posted @ 2017-01-14 22:54 lemonbit 阅读(39754) 评论(0) 推荐(0) 编辑
摘要: Win7系统下,Python3.5环境下安装wxPtyhon, 已成功安装并运行。 1、先从下面网站下载对应的whl版本。 https://wxpython.org/Phoenix/snapshot-builds/ win7,64位的版本是:wxPython_Phoenix-3.0.3.dev270 阅读全文
posted @ 2017-01-13 22:56 lemonbit 阅读(2091) 评论(0) 推荐(0) 编辑
摘要: 官方文档: https://docs.scipy.org/doc/scipy/reference/cluster.vq.html 阅读全文
posted @ 2017-01-09 22:36 lemonbit 阅读(939) 评论(0) 推荐(0) 编辑
摘要: 自己边看边实践一些简单的实际应用,下面的程序是从某个网站上获取需要的数据。 在编写的过程中,通过学习陆续了解到一些方法,发现Python真的是很便捷。 尤其是用pandas获取网页中的表格数据,真的是太方便了!!! 程序写的可能并不好,但基本上实现了自己的需求。 希望有高手来指点下~~ Versio 阅读全文
posted @ 2017-01-08 22:29 lemonbit 阅读(4602) 评论(0) 推荐(1) 编辑
该文被密码保护。 阅读全文
posted @ 2017-01-07 10:30 lemonbit 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 主要参考: http://www.jianshu.com/p/5f81ee00c84b 其他参考: http://www.cnblogs.com/hhh5460/p/5814275.html 阅读全文
posted @ 2017-01-05 23:52 lemonbit 阅读(331) 评论(0) 推荐(0) 编辑