摘要: 获取所需数据集: 快速查看数据结构(属性、特征信息): 纯随机抽样,产生测试数据集,占完整数据集的20%: 纯随机抽样获取测试集会产生偏差。因为纯随机抽样过程没有考虑不同特征值的分布情况。此例中,要预测的房价平均值与数据集中的收入中位数这一特征值有很大的关系,所以,抽样应符合收入中位数的分布情况,即 阅读全文
posted @ 2019-06-30 20:54 我的下铺刚田武 阅读(1486) 评论(0) 推荐(2) 编辑
摘要: 改成: 参考: pandas.plotting 阅读全文
posted @ 2019-06-30 20:19 我的下铺刚田武 阅读(6038) 评论(0) 推荐(2) 编辑
摘要: 使用jupyter编程时,中英文逗号极其相似,不易检查出来,可以根据逗号所占的宽度辨别,中文逗号间隔大,英文逗号间隔小,例如: 上面一行代码中,alpha=0.4后面的那个逗号是中文逗号,间隔比其他逗号宽一些。 阅读全文
posted @ 2019-06-30 19:56 我的下铺刚田武 阅读(1368) 评论(0) 推荐(0) 编辑
摘要: Replace values where the condition is False. 替换数据集中不满足条件的值,默认替换为NaN,且不保存到数据集中。 输出的第一列是索引值。 变量a没有改变: 添加第二个参数,表示把不符合条件的值改为此参数值。 添加第三个参数,把更改保存到变量。 不添加inp 阅读全文
posted @ 2019-06-30 16:23 我的下铺刚田武 阅读(1259) 评论(0) 推荐(0) 编辑