随笔分类 - 建模
数据比赛实现的细节
摘要:workflow & pipeline 的设计;0. 数据预处理降维: PCA;图像预处理 去均值,归一化(缩放在 (0, 1) 之间),imresize;1. 机器学习方法尤其是图像问题,对特征提取方法提取特征的质量依赖较高; 也即特征工程,这里给出一些先验的特征提...
阅读全文
语言模型(Language Modeling)与统计语言模型
摘要:1. n-grams统计语言模型研究的是一个单词序列出现的概率分布(probability distribution)。例如对于英语,全体英文单词构成整个状态空间(state space)。边缘概率分布 p(Xt=k) 称为 unigram;使用一阶马尔科夫模型(Ma...
阅读全文
chain rule 到 Markov chain
摘要:1. 联合概率(joint distribution)的链式法则基于链式法则的 explicit formula:p(x1:n)===p(x)p(x1)∏i=2np(xi|x1,…,xi−1)∏i=1np(xi|x1,…,xi−1)等式左端表示联合概率分布,joint...
阅读全文
用编程解决生活中的问题
摘要:最终队列呀、栈呀、二叉树呀,它们的实际意义是通过创建一个用于存放实际相关的对象元素的容器对象;1. 自然语言抽象为程序语言 用(局部)变量记录其他一些简单信息;灯、通道的状态(开、关;空闲、占用):0/1,布尔代数;可能需要排队:队列;
阅读全文