随笔分类 - 算法
摘要:递归实现: 自己写的递归:多一个赋值操作,虽然可以得到正确的结果。但是比较难以理解。 问题:没有深刻理解递归返回值。return会在递归调用到最后,在递归结束的地方,会将返回值一层一层返回给方法,直到返回最后一层也就是方法不进行递归演算的动作时。 总结:首先要记住递归有递归头和递归体,递归头可能有多
阅读全文
摘要://提供的int排序的统一方法 val intSort = msort((x:Int,y:Int)=>x<y) _ //逆序 val reverseIntSort = msort((x:Int,y:Int)=>x>y) _
阅读全文
摘要:package com.sxt; import java.util.Arrays; public class BubbleSort { public static void main(String[] args) { int[] arr={83,3,70,33,2,-99}; for(int i=0;iarr[j+1]){ swap(arr[j],arr[j+1]]); ...
阅读全文
摘要:package com.sxt; import java.util.Arrays; public class QuickSort { public static void main(String[] args) { int[] arr ={ -50, 50, 17, 25, 11, 45, 54, 1, 65, 77, 63, 85 }; quickSort(arr, 0, arr...
阅读全文
摘要:拉普拉斯校准是给频率表中每个计数加上一个较小的数,保证每个特征发生概率不为0的情况。 拉普拉斯平滑是给频率表中每个计数加上一个较小的数,保证每个特征发生概率不为0的情况。第一封只有w1,2只有w2,3只有w3,4只有w4,垃圾邮件总数+4。正常邮件总数=正常+倍数(正常÷垃圾)*4总似然:只求分子,
阅读全文
摘要:信息增益=信息熵-条件熵 条件熵越小,意味着在此条件下,数据越纯粹。 如果将记录id考虑到条件熵里的话,计算的信息增益是最大的。按规则应该选择记录id来分类。但是这样,对后来的新记录就预测不准确。这就是过拟合问题。此时就应选择信息增益率这个概念。 信息增益率=信息增益/信息熵 gr(D,A)=g(D
阅读全文
摘要:决策树:非线性有监督分类模型 随机森林:非线性有监督分类模型 决策树:根节点:顶层分类条件。中间节点:中间分类条件。叶子节点:分类号。分支:每个条件输出。二叉树:节点有2个分支。多叉树:节点至少2分支 决策树:根据样本的纯粹度来分类。 将纯粹度进行量化,计算机才能读懂。 信息熵:量化信息量,由香农提
阅读全文

浙公网安备 33010602011771号