摘要: 拖了一个月,终于想起还有一笔欠账, 中文文本分类的流程如下: 1.预处理(去除噪声、例如html标签、文本格式转化、检测句子边界)2.中文分词(使用中文分词器为文本分词,并去除停用词)3.构建词向量空间(统计文本词频,生成文本的词向量空间)4.权重策略-TF-IDF方法(使用TF-IDF发现特征词, 阅读全文
posted @ 2018-12-24 21:56 谷子弟 阅读(345) 评论(0) 推荐(0)
摘要: 复习了一下线性代数,在B站上竟然点出了清华大学李永乐老师的考研冲刺班教程 好吧,就以题代练,重新感受了一下当年线代的熟悉操作。 翻来覆去,就是什么行列式,秩,极大无关组,齐次方程组,特征值和特征向量,对角阵,相似矩阵。。 解方程->矩阵相乘->特征值和特征向量 行列式就是矩阵的列向量在空间的构成的点 阅读全文
posted @ 2018-12-24 17:13 谷子弟 阅读(6044) 评论(0) 推荐(0)