随笔分类 -  数据科学

numpy/pandas/matlibplot.pyplot
摘要:需求:比如我有一个数据集,然后其中两个初始维度都是类别变量。我希望以可视化的方式呈现这两个变量对于最终分类结果的影响。1. 利用`pandas`获取`DataFrame`2. 利用`pandas.crosstab`来构建一个只关于这2个类别变量的新的`DataFrame`3. 使用`pandas`的画图函数#### 代码```pythontrain_df = pd.read_csv('train.... 阅读全文
posted @ 2019-07-25 14:34 小王点点 阅读(880) 评论(0) 推荐(0)
摘要:今天看了林轩田老师的感知机算法,心血来潮想要做个可视化过程,以便观察更新的过程。 现将学习成果做个记录,下面是画出来的图,这是初始的状态,后面会通过算法找到一条经过原点的直线将两堆数据分割开来。 直线以及两堆数据是随机生成的,下面介绍画出这个图的步骤主要有哪些: 1. 导入需要的工具包,这个没得说, 阅读全文
posted @ 2019-02-19 10:32 小王点点 阅读(4466) 评论(0) 推荐(0)