随笔分类 - 概率论
摘要:speech recognition (连续的) 微信和QQ里面那个语音转文字 information extraction(离散的)信息抽取 举例:点微博,选某个标签 触摸屏 自动选出一个词(专有名词) 文字流特定类型的信息放到结构化/半结构化数据方便查找 自然语言处理比较成功的应用 y1,y2,
阅读全文
摘要:误差平方均值,越小越好 从大家直观的感受,这三个模型哪个更好?左上?右上?还是左下? 右上,因为左下有可能过拟合。最下面的模型过于强调特定点的误差了。噪声点也被拟合了。 我们用什么样的手段,来帮助我们发现过拟合? 拟合曲线的参数过多。分训练集和测试集,设置测试数据用于判断拟合的情况。泛化误差(模型在
阅读全文
摘要:C语言支持的数据类型 原子数据类型:int (char, short, int, long, longlong), char, float (float, double) 复合数据类型:array (m x n, ...), enumerate, union, structure pointer C
阅读全文
摘要:若随机变量Y符合函数 且绝对收敛 则有: 该定理的意义在于:我们求E(Y)时不需要算出Y的分布律或者概率分布,只要利用X的分布律或概率密度即可。 上述定理还可以推广到两个或以上随机变量的函数情况。 设Z是随机变量X、Y的函数 (g是连续函数) Z是一个一维随机变量,二维随机变量(X,Y)的概率密度为
阅读全文
摘要:重期望法则 条件期望 期望是对全体的加权平均 条件期望是局限在条件内部的加权平均 对于这个随机变量E(X|Y),当Y=y时它的取值为E(X|Y=y),称随机变量E(X|Y)为随机变量X关于随机变量Y的条件数学期望。 由于E(X|Y=y)是一种依赖于Y的分割的局部平均,而EX是全体的平均。把E(X|Y
阅读全文
摘要:概率密度函数是概率分布函数的导数。 右图的面积表示分布在这块区域的概率。 概率分布函数是累积概率函数。
阅读全文
摘要:Querying and Minig Data Stream Data stream Reservoir Sampling 水库抽样 Counting Samples[GM98] 如果我们用<value, count>来表示取样的样本,用concise sampling取样,对于什么样的<value
阅读全文

浙公网安备 33010602011771号