随笔分类 -  【机器学习】 科学计算与可视化

摘要:量度两类量度:(1) 集中趋势的量度—>平均值,中位数,众数(2) 分散性与变异性的亮度—>全距(极值),四分位数(扩展:箱型图),方差与标准差,标准分获取数据import pandas as pdimport numpy as npimport matplotlib... 阅读全文
posted @ 2018-06-07 13:37 FontTian 阅读(337) 评论(0) 推荐(0)
摘要:之前在比赛的时候需要用Python实现灰色关联分析,从网上搜了下只有实现两个列之间的,于是我把它改写成了直接想Pandas中的计算工具直接计算person系数那样的形式,可以对整个矩阵进行运算,并给出了可视化效果,效果请见实现灰色关联分析法对于两个系统之间的因素,其随... 阅读全文
posted @ 2018-06-07 13:22 FontTian 阅读(14437) 评论(1) 推荐(0)
摘要:序言在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例—>饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图—>频数,非等距直方图—>频数密度) 4. 截止到某时间点的累计总量—>累积频数图... 阅读全文
posted @ 2018-06-04 21:38 FontTian 阅读(854) 评论(0) 推荐(0)
摘要:简介对于数据科学而言,我们要做的第一件事情,必然是了解我们的数据.而在数据探索期间,pandas和matplotlib 则是我们进行数据探索的利器.本文主要分为三个部分,第一部分是利用pandas进行一些基础的数据分析,第二部分是利用pandas自身功能进行一些有用的... 阅读全文
posted @ 2017-10-10 07:42 FontTian 阅读(217) 评论(0) 推荐(0)
摘要:问题出现与解决Pandas进行数据处理之后,假如想将其转化为json,会出现一个bug,就是中文文字是以乱码存储的,也就是\uXXXXXX的形式,翻了翻官网文档,查了源码的参数,(多谢网友提醒)需要设置js001 = df1.to_json(force_ascii=F... 阅读全文
posted @ 2017-07-16 22:44 FontTian 阅读(1279) 评论(0) 推荐(0)
摘要:如何快速入门pandas是python的一个出色的统计类库,同时也是python的科学计算与可视化生态系统中不可或缺的一环,但是如此出色的pandas却十分的简单易上手而且拥有出色的官方文档,假如你想快速的掌握pandas的使用的话,那么官方文档必是首选.建议直接访问... 阅读全文
posted @ 2017-07-14 21:27 FontTian 阅读(512) 评论(0) 推荐(0)
摘要:Pandas 无法显示中文问题 解决方案Pandas在绘图时,会显示中文为方块,主要原因有二:matplotlib 字体问题seaborn 字体问题只需要在文件开始动态设置字体配置就可以了,但是要注意,字体设置可能需要尝试多次,比如我一开始设置的win10中的’Sam... 阅读全文
posted @ 2017-07-13 00:41 FontTian 阅读(461) 评论(0) 推荐(0)