随笔分类 -  概率论

摘要:speech recognition (连续的) 微信和QQ里面那个语音转文字 information extraction(离散的)信息抽取 举例:点微博,选某个标签 触摸屏 自动选出一个词(专有名词) 文字流特定类型的信息放到结构化/半结构化数据方便查找 自然语言处理比较成功的应用 y1,y2, 阅读全文
posted @ 2020-06-24 08:53 柠檬味呀 阅读(171) 评论(0) 推荐(0)
摘要:误差平方均值,越小越好 从大家直观的感受,这三个模型哪个更好?左上?右上?还是左下? 右上,因为左下有可能过拟合。最下面的模型过于强调特定点的误差了。噪声点也被拟合了。 我们用什么样的手段,来帮助我们发现过拟合? 拟合曲线的参数过多。分训练集和测试集,设置测试数据用于判断拟合的情况。泛化误差(模型在 阅读全文
posted @ 2020-06-03 08:35 柠檬味呀 阅读(255) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-05-20 10:31 柠檬味呀 阅读(310) 评论(0) 推荐(0)
摘要:C语言支持的数据类型 原子数据类型:int (char, short, int, long, longlong), char, float (float, double) 复合数据类型:array (m x n, ...), enumerate, union, structure pointer C 阅读全文
posted @ 2020-05-20 09:30 柠檬味呀 阅读(343) 评论(0) 推荐(0)
摘要:若随机变量Y符合函数 且绝对收敛 则有: 该定理的意义在于:我们求E(Y)时不需要算出Y的分布律或者概率分布,只要利用X的分布律或概率密度即可。 上述定理还可以推广到两个或以上随机变量的函数情况。 设Z是随机变量X、Y的函数 (g是连续函数) Z是一个一维随机变量,二维随机变量(X,Y)的概率密度为 阅读全文
posted @ 2020-05-17 20:04 柠檬味呀 阅读(295) 评论(0) 推荐(0)
摘要:重期望法则 条件期望 期望是对全体的加权平均 条件期望是局限在条件内部的加权平均 对于这个随机变量E(X|Y),当Y=y时它的取值为E(X|Y=y),称随机变量E(X|Y)为随机变量X关于随机变量Y的条件数学期望。 由于E(X|Y=y)是一种依赖于Y的分割的局部平均,而EX是全体的平均。把E(X|Y 阅读全文
posted @ 2020-05-13 22:46 柠檬味呀 阅读(5562) 评论(0) 推荐(0)
摘要:概率密度函数是概率分布函数的导数。 右图的面积表示分布在这块区域的概率。 概率分布函数是累积概率函数。 阅读全文
posted @ 2020-05-13 22:29 柠檬味呀 阅读(2027) 评论(0) 推荐(0)
摘要:Querying and Minig Data Stream Data stream Reservoir Sampling 水库抽样 Counting Samples[GM98] 如果我们用<value, count>来表示取样的样本,用concise sampling取样,对于什么样的<value 阅读全文
posted @ 2020-05-13 09:44 柠檬味呀 阅读(175) 评论(0) 推荐(0)