摘要: 前言 Numpy是一个开源的Python科学计算库,它是python科学计算库的基础库,许多其他著名的科学计算库如Pandas,Scikit-learn等都要用到Numpy库的一些功能。 本文主要内容如下: Numpy数组对象 创建ndarray数组 Numpy的数值类型 ndarray数组的属性 阅读全文
posted @ 2017-06-18 11:59 lemonbit 阅读(205) 评论(2) 编辑
摘要: 本文首发于微信公众号“Python数据之道” 前言 本文主要摘录自 pycon 2017大会的一个演讲,同时结合自己的一些理解。 pycon 2017的相关演讲主题是“The Python Visualization Landscape”。 先来一张全景图镇楼~~ 看完这张图是不是有点懵? 别着急,阅读全文
posted @ 2017-06-11 17:01 lemonbit 阅读(350) 评论(2) 编辑
摘要: 前言 从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。 本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。 一、主要阅读全文
posted @ 2017-05-23 07:21 lemonbit 阅读(966) 评论(0) 编辑
摘要: 1 曾经的困扰 有段时间,想使用基于不同python版本的anaconda,就直接从官网下载了两个不同的anaconda版本进行安装。刚开始的时候,还觉得也没啥问题。用了一小段时间,在安装其他的第三方库时,经常发现安装失败,并且经常出现下面的问题:这个问题,我google、百度等查了好久,也没有解决阅读全文
posted @ 2017-06-23 06:37 lemonbit 阅读(167) 评论(0) 编辑
摘要: 作为coder,大家当然关心自己所使用语言的应用趋势。要是几年后所用语言变得默默无闻,那岂不是之前的知识储备与经验积累都会大打折扣。TIOBE排行榜是根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、Yo阅读全文
posted @ 2017-06-21 07:22 lemonbit 阅读(983) 评论(8) 编辑
摘要: 前言 Numpy是一个开源的Python科学计算库,它是python科学计算库的基础库,许多其他著名的科学计算库如Pandas,Scikit-learn等都要用到Numpy库的一些功能。 本文主要内容如下: Numpy数组对象 创建ndarray数组 Numpy的数值类型 ndarray数组的属性 阅读全文
posted @ 2017-06-18 11:59 lemonbit 阅读(205) 评论(2) 编辑
摘要: 本文首发于微信公众号“Python数据之道”(ID:PyDataRoad) 前言 写这篇文章的起由是有一天微信上一位朋友问到一个问题,问题大体意思概述如下: 现在有一个pandas的Series和一个python的list,想让Series按指定的list进行排序,如何实现? 这个问题的需求用流程图阅读全文
posted @ 2017-06-14 00:10 lemonbit 阅读(195) 评论(0) 编辑
摘要: 本文首发于微信公众号“Python数据之道” 前言 本文主要摘录自 pycon 2017大会的一个演讲,同时结合自己的一些理解。 pycon 2017的相关演讲主题是“The Python Visualization Landscape”。 先来一张全景图镇楼~~ 看完这张图是不是有点懵? 别着急,阅读全文
posted @ 2017-06-11 17:01 lemonbit 阅读(350) 评论(2) 编辑
摘要: 本文首发于微信公众号“Python数据之道” 首先,我觉得这本书是一本类似鸡汤类的书。其实,平常我看这种类型的书相对较少,读这本书也是因为我们家领导(LP)推荐的缘故。虽然是鸡汤,但书中有些话语还是值得看看的。 理性做人 理性,是目前中国舆论场上最缺乏的东西,有理性,常识就不会缺席,但现在,理性还是阅读全文
posted @ 2017-06-10 08:59 lemonbit 阅读(23) 评论(0) 编辑
摘要: 前言 今天在办公室里笑着问同事,过几天要高考了,你紧张么?同事淡定的说,你又不高考,紧张啥。是啊,高考已经过去好多年了。但当年的情况还仿佛历历在目,每年高考,多少莘莘学子憧憬着美好的未来。每年的高考作文题,都是考试后社会或者新闻媒体追踪的热点,尤其是满分作文或者是零分作文。 50年高考作文题目 从1阅读全文
posted @ 2017-06-05 23:49 lemonbit 阅读(65) 评论(0) 编辑
摘要: 1 前言 2017年6月1日,美国特朗普总统正式宣布美国退出《巴黎协定》。宣布退出《巴黎协定》后,特朗普似乎成了“全球公敌”。 特斯拉总裁马斯克宣布退出总统顾问团队 迪士尼董事长离开总统委员会 谷歌等25家大公司联名刊发整版广告:美国不应退出巴黎协定 法国总统马克龙:特朗普宣布退出《巴黎协定》是“错阅读全文
posted @ 2017-06-03 00:17 lemonbit 阅读(572) 评论(0) 编辑
摘要: 前言 在日常工作中,经常可以见到各种各种精美的热力图,热力图的应用非常广泛,下面一起来学习下Python的Seaborn库中热力图(heatmap)如何来进行使用。 本次运行的环境为: windows 64位系统 python 3.5 jupyter notebook ​ 1 构造数据 import阅读全文
posted @ 2017-06-02 07:07 lemonbit 阅读(97) 评论(0) 编辑
摘要: 前言 pandas有着强大的日期数据处理功能,本期我们来了解下pandas处理日期数据的一些基本功能,主要包括以下三个方面: 按日期筛选数据 按日期显示数据 按日期统计数据 运行环境为 windows系统,64位,python3.5。 1 读取并整理数据 首先引入pandas库 import pan阅读全文
posted @ 2017-05-25 06:20 lemonbit 阅读(89) 评论(0) 编辑
摘要: 前言 从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。 本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。 一、主要阅读全文
posted @ 2017-05-23 07:21 lemonbit 阅读(966) 评论(0) 编辑
摘要: 前言 本次主题分两篇文章来介绍: 一、数据采集 二、数据分析 第一篇先来介绍数据采集,即用python爬取网站数据。 1 运行环境和python库 先说下运行环境: python3.5 windows 7, 64位系统 python库 本次智联招聘的网站爬取,主要涉及以下一些python库: req阅读全文
posted @ 2017-05-22 07:16 lemonbit 阅读(57) 评论(0) 编辑
摘要: 前言 最近几日关注度最高的新闻莫过于一带一路峰会相关的消息,会议结束后,一带一路峰会联合公告已经公布出来了。本文通过词云分析,了解本次公告以及习大大在峰会开幕式上主要都讲了哪些关键内容。 1 一带一路峰会联合公告词云图 5月17日公布的一带一路峰会联合公告的词云分析结果图,如下: 词云图上,字体越大阅读全文
posted @ 2017-05-19 23:04 lemonbit 阅读(104) 评论(0) 编辑
摘要: 为什么你用不好Numpy的random函数? 在python数据分析的学习和应用过程中,经常需要用到numpy的随机函数,由于随机函数random的功能比较多,经常会混淆或记不住,下面我们一起来汇总学习下。 import numpy as np 1 numpy.random.rand() numpy阅读全文
posted @ 2017-05-17 07:27 lemonbit 阅读(73) 评论(0) 编辑
摘要: 近期,在安装结巴分词的时候遇到一些问题,纠结了好一阵,跟大家分享下,希望能有所帮助。先说下安装环境: windows7, 64位系统 python3.6,python3.5在结巴分词的官方github上,描述了关于结巴分词(jieba)的安装步骤 全自动安装:easy_install jieba 或阅读全文
posted @ 2017-05-16 23:04 lemonbit 阅读(21) 评论(0) 编辑