摘要: 按老师给的代码第一次提交得分 下面进行改进 一, 首先进行数据的清洗 先观察数据,首选'Pclass','Sex','Age'作为是否生还(Survived)的 考虑条件来建模 “Sex”的数值是字符型,于是用特征编码将性别用0,1表示 随后发现”Age”中有缺少值,由于age是数值量,可以直接使用 阅读全文
posted @ 2020-02-13 18:04 Y000 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 任务7 深挖K近邻 一, 缺失值的处理 处理缺失值的方法:需要理解数据,察觉到哪些数据是必要的哪些不必要 1, 删除法: (1) 删整个列 (2) 删整行(丢弃此记录) 2, 填补法 (1) 用平均值来填补缺失值 (2) 均值,中位数填补 二,特征编码 ——机器学习的核心是建模,基础是数据,且输入一 阅读全文
posted @ 2020-01-09 19:42 Y000 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 在该任务中,我们要做的是基于KNN算法的图像识别 首先,我在下载cifar-10数据集的时候遇到一些麻烦,第一次出现错误是说找不到load_data,通过发现找到了jupyter notebook新建的文件都是放在了D盘下Python3的Lib文件下,然后发现是我没把老师给的文件放在根目录下,我选择 阅读全文
posted @ 2020-01-06 20:54 Y000 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 第七章学习小结 查找 查找是根据给定的某个值,在查找表中确定一个其关键字等于给定值的记录或数据元素,若存在,则查找成功,查找结果可以给出整个记录的信息,或指示该记录在查找表中的位置。若查找不成功,则查找结果可以给出一个空记录或空指针 7.2 线性表的查找 (一) 顺序查找:依次比较 可设定哨兵:数组 阅读全文
posted @ 2019-06-02 18:29 Y000 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 第六章知识点总结 图是由一个顶点集V和一个边集E构成的数据结构。 图的基于邻接矩阵的结构定义 1 //用两个数组分别存储顶点表和邻接矩阵 2 const int MVNum = 100; //最大顶点数 3 typedef char VerTexType; /假设顶点的数据类型为字符型 4 type 阅读全文
posted @ 2019-05-19 23:35 Y000 阅读(121) 评论(1) 推荐(0) 编辑
摘要: 这周学习了树和二叉树。 主要就是递归,之前一直不明白递归是什么,通过这几次课我了解的更详细,也体会到了递归的神奇之处。 来记录一些我从课堂上学到了知识吧 二叉树的课堂笔记 1, 返回值,先看函数要干嘛,如果是对内容进行操作类,无需结果回传 2,原型声明,直接copy函数定义那里,只不过形参括号内不用 阅读全文
posted @ 2019-05-04 23:51 Y000 阅读(141) 评论(1) 推荐(0) 编辑
摘要: 一,本章学习内容有: 1,串的类型定义,存储结构及其运算 记录的一些知识点: (1)C语言,求串的长度 char a[100]; strlen(); (头文件为<string.h> 而C++中 string a; a.length(); (2)串的模式匹配算法 对比 BF算法和KMP算法 难点:KM 阅读全文
posted @ 2019-04-14 20:31 Y000 阅读(350) 评论(1) 推荐(0) 编辑
摘要: (1)先说说这两个星期的收获 学了栈和队列的相关内容,但是对栈比较熟,队列还需要多熟悉一下,学了发现和前面的顺序表的结构还是很像的。 (2)上次的目标: 全部没有达到,对时间的安排不合理,作业堆在一个星期完成,大大降低效率,希望下个星期不要再这样了,要留多点时间研究透题目和自己代码的错因。 (3)这 阅读全文
posted @ 2019-03-31 23:26 Y000 阅读(458) 评论(2) 推荐(0) 编辑
摘要: 第二章学习小结 1, 学习内容: 线性表分为顺序表和链表 顺序表:优点:随机存取。 缺点:插入删除难;需要一段连续的存储空间 链表: 优点:插入删除容易,存储空间可以不连续。缺点:按下标查找效率低 顺序表 线性表的顺序表示和实现 ——顺序表的存储结构: #define MAXSIZE 100 typ 阅读全文
posted @ 2019-03-17 21:37 Y000 阅读(101) 评论(0) 推荐(0) 编辑