摘要: 如何找自己的探索点 大方向一般是老师给的 阅读大量论文,记笔记(论文上划的笔记,有简化和详细的不同版本的笔记) 梳理文献是核心,根据笔记理清现有研究的层次、进展、方向,发现其中的不足,如果能发现整个体系中的GAP,那将会是一个好的工作,这里的GAP可以是由新数据、新方法带来的新发现(新角度)与更高效 阅读全文
posted @ 2021-09-14 15:21 Trouvaille_fighting 阅读(607) 评论(0) 推荐(0)
摘要: 1 笔记方法 在文献上进行标记,建立适合于自己的一套统一的标记符号 使用自己的语言梳理文献,形成清晰易读的文档 阅读全文
posted @ 2021-09-14 15:11 Trouvaille_fighting 阅读(476) 评论(0) 推荐(0)
摘要: 1 科研过程 2 过程实现 2.1 第一阶段 不是直接读paper,需要了解领域的基本概念 选择行业大佬写的综述(中英文),或是优秀的博士论文, 通过这些资料对该领域的一些主要问题和方法有一定的了解 不懂的地方记录下来,从其中最感兴趣的方面深入了解 从综述的参考文献去看(自底向上,追根溯源),逐渐清 阅读全文
posted @ 2021-09-14 15:00 Trouvaille_fighting 阅读(105) 评论(0) 推荐(0)
摘要: 1 什么是交叉验证(cross validation) 交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。 1.1 分析 为了让从训练得到模型结 阅读全文
posted @ 2021-09-13 19:30 Trouvaille_fighting 阅读(288) 评论(0) 推荐(0)
摘要: 1 数据集 2 方法 sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') algorithm(auto,ball_tree, kd_tree, brute) -- 选择什么样的算法进行计算 3 案例实现 导入模 阅读全文
posted @ 2021-09-13 19:10 Trouvaille_fighting 阅读(174) 评论(0) 推荐(0)
摘要: 1 什么是特征预处理 1.1 特征预处理定义 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程 **为什么:**特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征 **目标:**用到一些方法进行无量纲化 阅读全文
posted @ 2021-09-13 19:03 Trouvaille_fighting 阅读(77) 评论(0) 推荐(0)
摘要: 1 案例:鸢尾花种类预测 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。 2 scikit-learn中数据集介绍 获取数据集的方式 sklearn.datasets.load_*() 加载小规模数据集 sklearn.datasets.fetch_*(data_home=None,sub 阅读全文
posted @ 2021-09-13 18:38 Trouvaille_fighting 阅读(196) 评论(0) 推荐(0)
摘要: 1 kd树的构建过程【知道】 构造根节点 通过递归的方法,不断地对k维空间进行切分,生成子节点 重复第二步骤,直到子区域中没有示例时终止 需要关注细节:a.选择向量的哪一维进行划分;b.如何划分数据 2 kd树的搜索过程【知道】 二叉树搜索比较待查询节点和分裂节点的分裂维的值,(小于等于就进入左子树 阅读全文
posted @ 2021-09-13 17:35 Trouvaille_fighting 阅读(343) 评论(0) 推荐(0)
摘要: #KNN中K值大小选择对模型的影响【知道】 K值过小: 容易受到异常点的影响 容易过拟合 k值过大: 受到样本均衡的问题 容易欠拟合 阅读全文
posted @ 2021-09-13 17:31 Trouvaille_fighting 阅读(169) 评论(0) 推荐(0)
摘要: 1 欧式距离(Euclidean Distance): 两个点在空间中的距离一般都是指欧氏距离。 举例: X=[[1,1],[2,2],[3,3],[4,4]]; 经计算得: d = 1.4142 2.8284 4.2426 1.4142 2.8284 1.4142 2 曼哈顿距离(Manhatta 阅读全文
posted @ 2021-09-13 17:26 Trouvaille_fighting 阅读(189) 评论(0) 推荐(0)