08 2020 档案
摘要:手写数字数据集是个非常有名的用于图像识别的数据集。数字识别的过程就是将这些图片与分类结果0-9一一对应起来。我们可以直接从sklearn中加载自带的手写数字数据集: from sklearn.model_selection import train_test_split from sklearn i
阅读全文
摘要:一、CART算法的实现 #encoding:utf-8 from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score from sklearn.tree import D
阅读全文
摘要:对于给定的样例数据: 对其进行缺失值填补、名字切分、删除重复值操作: import pandas as pd from pandas import DataFrame,Series df = DataFrame(pd.read_excel("F:\\python入门\\数据1\\food.xlsx"
阅读全文
摘要:假设属性income的最小值和最大值分别是5000元和58000元。利用Min-Max规范化的方法将属性的值映射到0至1的范围内,那么属性income的16000元将被转化为多少? # coding:utf-8 from sklearn import preprocessing import num
阅读全文
摘要:对于给定的数据集,进行适当的数据清洗 import pandas as pd data = {'Chinese': [66, 95, 93, 90, 80, 80], 'English': [65, 85, 92, 88, 90, 90], 'Math': [None, 98, 96, 77, 90
阅读全文
摘要:按照给出的学生成绩,统计各科成绩的平均成绩、最小成绩、最大成绩、方差、标准差、并按总成绩排序,最后进行成绩输出。 代码: import numpy as np score_type = np.dtype({'names':["name","chinese","english","math"],'fo
阅读全文