摘要: 数据清洗-缺失值处理(drop, fill) 阅读全文
posted @ 2019-11-20 22:20 致于数据科学家的小陈 阅读(598) 评论(0) 推荐(0)
摘要: 初步认识求解LP用单纯形算法 阅读全文
posted @ 2019-11-20 21:48 致于数据科学家的小陈 阅读(1197) 评论(0) 推荐(0)
摘要: 需求 最近在看工作机会, 然后做了一道华为外包的笔试题. 我咋眼一看, 这种送分题, 能难住我? 构造一个字典, 统计词频 sorted() 按值排序即可 求解 用内置函数sorted() 正准备提交, 才发现, 不能用内置, 要自己写排序 , 这一下, 难度立马升级了 短时间内要写出排序算法 数据 阅读全文
posted @ 2019-11-19 23:46 致于数据科学家的小陈 阅读(217) 评论(0) 推荐(0)
摘要: ![](https://img2018.cnblogs.com/blog/1325660/201911/1325660-20191119230314019-587683946.jpg) 阅读全文
posted @ 2019-11-19 23:05 致于数据科学家的小陈 阅读(300) 评论(0) 推荐(0)
摘要: 认识LP 线性规划(Linear Programming) 特指目标函数和约束条件皆为线性的最优化问题. 目标函数: 多个 变量 形成的函数 约束条件: 由多个 等式/不等式 形成的约束条件 线性规划: 在 线性约束条件下,目标函数求极值的问题 可行解: 满足线性约束条件下的解 可行域: 所有可行解 阅读全文
posted @ 2019-11-18 14:14 致于数据科学家的小陈 阅读(893) 评论(0) 推荐(0)
摘要: 认识 jupyter地址: pandas objects are equipped(配备的) with a set of common mathematical and statistical methods. Most of these fall into the categrory of red 阅读全文
posted @ 2019-11-17 23:25 致于数据科学家的小陈 阅读(1709) 评论(0) 推荐(0)
摘要: This section will walk you(引导你) through the fundamental(基本的) mechanics(方法) of interacting(交互) with the data contained in a Series or DataFrame. (引导你去了 阅读全文
posted @ 2019-11-16 23:27 致于数据科学家的小陈 阅读(2614) 评论(0) 推荐(0)
摘要: Pandas will be a major tool of interest throughout(贯穿) much of the rest of the book. It contains data structures and manipulation tools designed to ma 阅读全文
posted @ 2019-11-15 20:35 致于数据科学家的小陈 阅读(513) 评论(0) 推荐(0)
摘要: The numpy.random module supplements(补充) the built in Python random with functions for efficiently generating whole arrays of sample values from many k 阅读全文
posted @ 2019-11-14 23:26 致于数据科学家的小陈 阅读(1752) 评论(0) 推荐(0)
摘要: File Input and Output NumPy is able to save and load data to and from disk either in text or binary format. In this section I only discuss NumPy's bui 阅读全文
posted @ 2019-11-13 21:06 致于数据科学家的小陈 阅读(362) 评论(0) 推荐(0)
摘要: Using NumPy arrays enables you to express many kinds of data processing tasks as concise(简明的) array expressions(不用写循环就能用数组表达很多数据过程) that might otherwi 阅读全文
posted @ 2019-11-13 20:59 致于数据科学家的小陈 阅读(377) 评论(0) 推荐(0)
摘要: why 回顾我的数据分析入门, 最开始时SPSS+EXCEL,正好 15年初是上大一下的时候, 因为统计学的还蛮好的, SPSS傻瓜式操作,上手挺方便,可渐渐地发现, 使用软件的最不好的地方是不够灵活, 不能为所欲为 , 编程语言才是最灵活的, 最还是用R, 命令式的, 也是感觉不太好是, 于是开始 阅读全文
posted @ 2019-11-12 01:13 致于数据科学家的小陈 阅读(590) 评论(0) 推荐(0)
摘要: Mysql Join 连接查询(中) 认识 就我平时的数据接触来看, 连接查询也没有很复杂,不够是非常需要耐心和逻辑的, 一点点将数据查出来, 拼接等. 没有什么技巧, 多练习就会了. 无非就是 表之间根据共同key来连接, 查询时结合union, where, 子查询这些... , 真的不难的, 阅读全文
posted @ 2019-11-10 01:11 致于数据科学家的小陈 阅读(497) 评论(0) 推荐(0)
摘要: 其实,我的业务流程是, 先读取excel/csv -> pandas 数据清洗 -> 导入Mysql, 一般是做一个表append 或者是 if exist -> replace的操作 逐行来添加数据其实更加灵活和方便. 这里用的驱动是pymysql的一个包, 其实本质就是一个客户端, 服务端已经和 阅读全文
posted @ 2019-11-07 15:13 致于数据科学家的小陈 阅读(1346) 评论(0) 推荐(0)
摘要: 之前弄数据库的时候, 测试excel导mysql, 中间用pandas 处理后再入库. 直接上代码, 此种有真意, 尽在不言中. 1 #!/usr/bin/env python 2 # coding: utf-8 3 # author: chenjie131@ke.com 4 5 ''' 6 应用场 阅读全文
posted @ 2019-11-07 14:16 致于数据科学家的小陈 阅读(4095) 评论(0) 推荐(0)