2019年7月9日

摘要: 我的报错原因是,我读取的文件是中文名称如图: 既然是中文名称,直接读取CSV文件会报错。 那么怎样处理呢? 在读取时,增加个参数 如图: 调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就 阅读全文
posted @ 2019-07-09 15:21 喝瓶可乐 阅读(198) 评论(0) 推荐(0) 编辑

2019年6月27日

摘要: 之前我也是在调试的过程当中 进入了死循环 然后一直F7 F7 F7 来回重复代码。 大家看一下这个图片 这个图片中的 AIt+F9是调试到光标所在的那一行。 我也是刚刚才发现,哈哈。 所以大家就这样操作。 因为K值比较大 所以想要跳出循环 执行这一步 -> 大家把光标移动到这一行,然后按AIt+F9 阅读全文
posted @ 2019-06-27 14:28 喝瓶可乐 阅读(2651) 评论(0) 推荐(0) 编辑

2019年6月23日

摘要: merge()函数主要参数 注:(一定要看下面的图!) merge()的默认参数: 我这里就解释两个参数 一个是on :他就相当于sql表中的外键 另一个是how:他就相当于两个表是左外连接、右外连接、内连接、全连接 送大家一个图 秒懂 阅读全文
posted @ 2019-06-23 12:40 喝瓶可乐 阅读(3559) 评论(0) 推荐(0) 编辑

2019年6月21日

摘要: 我这里有个两阶段营销的小项目 样本数量:9686 特征数量:25 标签:1 标签数据 具有缺失值NAN 这样怎样进行处理? 我利用有缺失值的标签和处理后的样本进行建模后的模型数据 解决后会补充博客!! ————————————————————————————————————————————————— 阅读全文
posted @ 2019-06-21 11:18 喝瓶可乐 阅读(564) 评论(0) 推荐(0) 编辑

2019年6月14日

摘要: 问题未解决!! 首先 先启动hadoop集群,然后在bin目录下运行命令 ./hadoop jar /opt/hadoop-2.6.5/share/hadoop/tools/lib/hadoop-streaming-2.6.5.jar -mapper 'python mapper.py' -redu 阅读全文
posted @ 2019-06-14 16:35 喝瓶可乐 阅读(310) 评论(0) 推荐(0) 编辑

2019年6月13日

摘要: 这是第一个博客: 写博客的原因呢,就是适当的记录一下我做程序时所报的错误和bug,以便有缘日后还能遇到相似错误,返回来能看一看。 马上就开始写我的第一个error! 阅读全文
posted @ 2019-06-13 14:54 喝瓶可乐 阅读(120) 评论(0) 推荐(0) 编辑