摘要:五个输出文件:---* model-final.towords每个topic下面的words和words分布,并按分布排序:```1Topic 0th: bill 0.005843543826578699 lai 0.003958529688972668 seventh 0.002073515551...
阅读全文
随笔分类 - Gibbs LDA
摘要:五个输出文件:---* model-final.towords每个topic下面的words和words分布,并按分布排序:```1Topic 0th: bill 0.005843543826578699 lai 0.003958529688972668 seventh 0.002073515551...
阅读全文
摘要:### 1.偏文、偏理的故事---某学校高一年级有6个班级,每个班级各有一定数量的学生,3班有几个同学数学成绩很好,拿过省奥赛奖。现在教育局要来该校听数学课,学校应该安排听课老师听哪个班的课?显然是3班,因为3班有几个数学特别厉害的同学,所以3班数学强一点,至少看起来数学强一点.这里,我们把...
阅读全文
摘要:##Introduce ---PolyLDA is the shorthand of Polylingual LDA . PolyLDA assumes that a single document has words in multiple languages , but each documen...
阅读全文
摘要:* 1.参数形式:Gibbs Sampling最终要求的是π(π1,π2)和theta向量的值。显然参数的格式现在已经找到了,两个数,和一组向量。* 2.采样:找出来具有代表性的样本。* 3.参数估计对第二步找出来的样本进行计算,估计参数。 -- 估计量是样本的函数-- 点估计的方法是区间估计和最大...
阅读全文
|