摘要:
我的报错原因是,我读取的文件是中文名称如图: 既然是中文名称,直接读取CSV文件会报错。 那么怎样处理呢? 在读取时,增加个参数 如图: 调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就 阅读全文
2019年7月9日
2019年6月27日
摘要:
之前我也是在调试的过程当中 进入了死循环 然后一直F7 F7 F7 来回重复代码。 大家看一下这个图片 这个图片中的 AIt+F9是调试到光标所在的那一行。 我也是刚刚才发现,哈哈。 所以大家就这样操作。 因为K值比较大 所以想要跳出循环 执行这一步 -> 大家把光标移动到这一行,然后按AIt+F9 阅读全文
2019年6月23日
摘要:
merge()函数主要参数 注:(一定要看下面的图!) merge()的默认参数: 我这里就解释两个参数 一个是on :他就相当于sql表中的外键 另一个是how:他就相当于两个表是左外连接、右外连接、内连接、全连接 送大家一个图 秒懂 阅读全文
2019年6月21日
摘要:
我这里有个两阶段营销的小项目 样本数量:9686 特征数量:25 标签:1 标签数据 具有缺失值NAN 这样怎样进行处理? 我利用有缺失值的标签和处理后的样本进行建模后的模型数据 解决后会补充博客!! ————————————————————————————————————————————————— 阅读全文
2019年6月14日
摘要:
问题未解决!! 首先 先启动hadoop集群,然后在bin目录下运行命令 ./hadoop jar /opt/hadoop-2.6.5/share/hadoop/tools/lib/hadoop-streaming-2.6.5.jar -mapper 'python mapper.py' -redu 阅读全文