2019年4月19日

Python 处理Excel内的数据(案例介绍*2)

摘要: (一)案例一介绍 现在有一匹电商产品跟当日销量的数据,如下,总共有上万笔的数据,现在需要统计每个品牌当日的销售量,比如美宝莲今天总共卖出了多少的商品,另外需要统计每个品牌下面的每个子品类当日销售量(品类可分为口红、睫毛膏、粉底等),比如卡姿兰口红卖了多少、眉笔卖了多少 首先是要做出关键字码表,如下, 阅读全文

posted @ 2019-04-19 15:14 彦柏 阅读(1824) 评论(1) 推荐(0) 编辑

2019年3月9日

微博数据抓取练习

摘要: 由于最近工作的关系接触到了微博数据分析这一块,觉得挺有意思的,想先练习将微博的数据抓取下来练习看看。 目标是将微博的内容和作者这两个数据储存在数据库内,由于数据量不是很大,先暂时用MySQL,如果以后要大量储存再考虑使用Hive或是HBASE。 然后代码使用Python3,因为写起来比较方便。下面就 阅读全文

posted @ 2019-03-09 23:09 彦柏 阅读(411) 评论(0) 推荐(0) 编辑

2019年1月31日

微信小程序开发笔记(二)

摘要: 一、前言 继承上一篇所说的,有了对微信小程序的基础概念后,这边将会示范动手做一个小程序,在动手的过程中我们可以更快的熟悉小程序里面的架构和开发流程。 二、小程序的设计 这次要做的是一个猜数字的程序,程序会自动产生一组4个不重复的数字,例如1835,玩家看不到数字,但每次玩家输入一个数字,系统会自动给 阅读全文

posted @ 2019-01-31 12:18 彦柏 阅读(464) 评论(0) 推荐(0) 编辑

2019年1月29日

微信小程序开发笔记(一)

摘要: 一、为什么要学习微信小程序开发 微信小程序是一个可以在微信上打开的轻应用,他是由多个页面组成的程序,跟传统APP比较如下: 优点 1、不需要在应用商店下载,不占用内存空间,即开即用 2、可以在微信内直接打开使用,方便透过微信传播分享,有许多API可以很方便的调用(例如微信支付) 3、开发成本低,微信 阅读全文

posted @ 2019-01-29 19:42 彦柏 阅读(635) 评论(0) 推荐(0) 编辑

2019年1月27日

UCI 人口收入数据分析(python)

摘要: 一、项目介绍 UCI上有许多免费的数据集可以拿来练习,可以在下面的网站找寻 http://archive.ics.uci.edu/ml/datasets.html 这次我使用的是人口收入调查,里面会有每个人的教育程度、每周工时、职业、性别等数据,并以50K为界线,分为收入大于50K和收入小于50K的 阅读全文

posted @ 2019-01-27 14:54 彦柏 阅读(1710) 评论(1) 推荐(0) 编辑

2019年1月22日

OpenStack介绍

摘要: 一、背景 OpenStack是一个开源的云计算项目,里面包含了许多的组件,可以提供免费下载,对一些想要搭建公有云和私有云的公司或个人提供了非常好的帮助。 国内OpenStack最大的用户是华为云,由于华为本身发展云服务比较慢,软件方面又没有BAT有经验,OpenStack提供了一个非常好的捷径,让华 阅读全文

posted @ 2019-01-22 13:24 彦柏 阅读(258) 评论(0) 推荐(0) 编辑

2019年1月5日

Hadoop以及组件介绍

摘要: 一、背景介绍 在接触过大数据相关项目的时候常常都会听到Hadoop这个东西,简单来说,他是一个用分布式计算来处理大数据的开源软件,下面包含了许多的组件和子项目,这篇文章将会介绍Hadoop的原理以及一些组件的应用。 二、准备工作 1、确认储存规模 有很多的大数据项目其实数据量跟本没这么大,跟本不需要 阅读全文

posted @ 2019-01-05 18:04 彦柏 阅读(2776) 评论(0) 推荐(0) 编辑

2018年12月18日

Python for Data Analysis 学习心得(四) - 数据清洗、接合

摘要: 一、文字处理 之前在练习爬虫时,常常爬了一堆乱七八糟的字符下来,当时就有找网络上一些清洗数据的方式,这边pandas也有提供一些,可以参考使用看看。下面为两个比较常见的指令,往往会搭配使用。 split(“,”)可以将文字串分割,冒号里的为分割依据,左边的代码就是把两个冒号中间的文字串视为一个单元。 阅读全文

posted @ 2018-12-18 15:04 彦柏 阅读(550) 评论(0) 推荐(0) 编辑

项目经理四年的感想心得

摘要: 当年从技术转到项目经理只是姻缘巧合,没想到接下来一做就是四年的时间,想把这段时间的一些感想与心得与大家分享一下 1、管理项目需不需要有技术背景? 这个是关于项目管理最常见的问题之一,我的回答是“要”。虽然网上很多人说没技术背景也可以做的好,但我认为了解技术对于这份工作有非常大的帮助。 首先是在沟通上 阅读全文

posted @ 2018-12-18 10:17 彦柏 阅读(375) 评论(0) 推荐(0) 编辑

2018年12月17日

Python for Data Analysis 学习心得(三) - 文件读写和数据预处理

摘要: 一、Pandas文件读写 pandas很核心的一个功能就是数据读取、导入,pandas支援大部分主流的数据储存格式,并在导入的时候可以做筛选、预处理。在读取数据时的选项有超过50个参数,可见pandas对于各式各样的数据都能有非常好的应对能力。下面先介绍基本的读取指令。 前面两个read_csv和r 阅读全文

posted @ 2018-12-17 17:18 彦柏 阅读(795) 评论(0) 推荐(0) 编辑

导航