08 2020 档案

摘要:手写数字数据集是个非常有名的用于图像识别的数据集。数字识别的过程就是将这些图片与分类结果0-9一一对应起来。我们可以直接从sklearn中加载自带的手写数字数据集: from sklearn.model_selection import train_test_split from sklearn i 阅读全文
posted @ 2020-08-31 20:40 夏日的向日葵 阅读(578) 评论(0) 推荐(0)
摘要:一、CART算法的实现 #encoding:utf-8 from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from sklearn.tree import D 阅读全文
posted @ 2020-08-16 17:28 夏日的向日葵 阅读(268) 评论(0) 推荐(0)
摘要:对于给定的样例数据: 对其进行缺失值填补、名字切分、删除重复值操作: import pandas as pd from pandas import DataFrame,Series df = DataFrame(pd.read_excel("F:\\python入门\\数据1\\food.xlsx" 阅读全文
posted @ 2020-08-07 11:05 夏日的向日葵 阅读(650) 评论(0) 推荐(0)
摘要:假设属性income的最小值和最大值分别是5000元和58000元。利用Min-Max规范化的方法将属性的值映射到0至1的范围内,那么属性income的16000元将被转化为多少? # coding:utf-8 from sklearn import preprocessing import num 阅读全文
posted @ 2020-08-06 16:21 夏日的向日葵 阅读(3412) 评论(0) 推荐(0)
摘要:对于给定的数据集,进行适当的数据清洗 import pandas as pd data = {'Chinese': [66, 95, 93, 90, 80, 80], 'English': [65, 85, 92, 88, 90, 90], 'Math': [None, 98, 96, 77, 90 阅读全文
posted @ 2020-08-05 15:37 夏日的向日葵 阅读(848) 评论(0) 推荐(0)
摘要:按照给出的学生成绩,统计各科成绩的平均成绩、最小成绩、最大成绩、方差、标准差、并按总成绩排序,最后进行成绩输出。 代码: import numpy as np score_type = np.dtype({'names':["name","chinese","english","math"],'fo 阅读全文
posted @ 2020-08-04 19:14 夏日的向日葵 阅读(5410) 评论(0) 推荐(0)