03 2018 档案
摘要:引子 隐马尔科夫模型仍然是以马尔科夫链为基础的,特点是马尔科夫链是不可见的,链条中的每个状态通过一定概率模型表现出来。 距离来说,按照一定概率间或的一个正常的骰子和一个灌了铅的骰子投点数。如果局外人只能看到点数,那么这就可以看做一个马尔科夫模型。由此而衍生出三类问题: 1. 评估问题:观察到一段投骰
阅读全文
摘要:硬间隔部分 假定在输入数据集构成的高维空间中,存在一个超平面能够将所有标记的样本分为两类。我们想做的就是求得一个超平面,使得它到最近的数据点的集合距离最大化。即有 鉴于几何距离直接受w向量的二阶范数影响,问题进行等价归一化后有 这便是一个原始的凸优化问题。解出了w和b,也就得到了超平面,进而训练好的
阅读全文
摘要:利用SVM算法进行文本分类 数据集 两位不同作家的作品(金庸&刘慈欣)切分出来的小样本。根据自己构建的词汇表,将样本转化为一个1000维的0-1向量(仅统计词汇是否出现)。再加上一个0-1标记作家 模型 SVM linearKernel 损失函数 优化方法
阅读全文
摘要:python中子线程如何向父线程回传参数呢? 答:最基础的方法是在单文件的开头定义一个全局变量,再加一个锁,就可以父进程、子进程共享一个变量了。 在一个单核CPU上,要同时跑多个任务,比如在写文档的同时听歌,就可以使用多进程的技术。每个任务就是一个进程(Pocess)。多进程就是交替的使用CPU的一
阅读全文

浙公网安备 33010602011771号