摘要: 1.环境变量配置,pip路径别忘记加入,否则pip不好使。 2.如果改名python.exe为其他名字,复制一份保留,否则pip容易无法启动进程 参见爆栈: http://stackoverflow.com/questions/17373265/pip-easy-install-failure-fa 阅读全文
posted @ 2016-05-24 19:39 迈克儿 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 一般是因为my.ini的“secure-file-priv”的设置导致loaddata失败,网上查了许多资料,大部分都是要求注释掉my.ini的: mysql5.7没有my.ini,只有mydefault.ini,复制改一个就ok了。 注释完不起效果,于是stack-over-flow上查看到这样一 阅读全文
posted @ 2016-05-22 10:52 迈克儿 阅读(7075) 评论(0) 推荐(0) 编辑
摘要: 将以上代码运行一下注册一下现有的路径即可安装PIL了 PIL下载地址:http://pythonware.com/products/pil/ 阅读全文
posted @ 2016-05-16 15:37 迈克儿 阅读(541) 评论(0) 推荐(0) 编辑
摘要: Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。 Time- Series:以时间为索引的Se 阅读全文
posted @ 2016-05-14 18:10 迈克儿 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 之前搜pandas资料,发现互联网上并没有成体系的pandas教程,于是乎突然有个爱迪页儿,打算自己把官网的文档加上自己用pandas的理解,写成一个系列的教程, 巩固自己,方便他人 接下来就干这件事吧~~~ 是为序 阅读全文
posted @ 2016-05-14 16:16 迈克儿 阅读(961) 评论(0) 推荐(0) 编辑
摘要: 几经摸索,各种转码都不好使,解决方案就是把以上代码放进源码或者import进去即可。 阅读全文
posted @ 2016-04-30 08:24 迈克儿 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 1 抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。 2 获取数据数据决定了机器学习结 阅读全文
posted @ 2016-04-25 22:07 迈克儿 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用 数据分析来发现现有的不足,以作改进,让顾客有更好的购物体验;利用CRM系统来管理会员的生命周期,提高会员的忠诚度,避免会员流失;利用会员的购买数 据,挖掘 阅读全文
posted @ 2016-04-07 23:47 迈克儿 阅读(359) 评论(0) 推荐(0) 编辑
摘要: 批量将CSV导入access alt+f11 打开access的vbe环境 直接运行此函数即可 1.根据日期返回星期:=TEXT(A2,"aaaa") A2中为日期 2.提取文本超链接放到后一列,以下代码的作用就是把文本下的链接提取,并放在后面1列。 3.检测单元格变动(变动后着色) 4.操作其它e 阅读全文
posted @ 2016-03-28 15:34 迈克儿 阅读(1495) 评论(0) 推荐(0) 编辑
摘要: 昨天下午碰到一个需求,一个大约30万行的表,其中有很多重复行,在这些行中某些字段值是不重复的。 比如有ID,NAME,CONTRACT_id,SALES,PRODUCT等,除了PRODUCT字段,其余字段均是一样的,需要去重并合并PRODUCT字段。 下午头脑发昏,直接写了个O(nm)的vba代码, 阅读全文
posted @ 2016-03-24 23:58 迈克儿 阅读(789) 评论(0) 推荐(0) 编辑