04 2019 档案
摘要:1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如在文本挖掘预处理之向量化与Hash Trick这篇文章中,我们将下面4个短文本做了词频统计: corpus=["I come to China to travel", "This is a c
阅读全文
摘要:1.线性回归原理 2.损失函数,目标函数,代价函数 3.线性回归的评估指标 4. 优化方法(梯度下降法、牛顿法、拟牛顿法等) 参考: https://www.jianshu.com/p/80984b205c84 https://blog.csdn.net/absent1353/article/det
阅读全文
摘要:下载安装snappy库 If you didn't install snappy under /usr or /usr/local, you need to specify the location by --with-snappy as follows. Step2 : 下载安装snzip命令 Y
阅读全文
摘要:Hregion.doMiniBatchMutation 内部实现 1.获取相关的锁,由于HBase要确保行一级的原子性,所以获取锁的时候获取的是整个rowkey的锁而不是单个cell的锁;也只有当至少获取一个锁的时候,这个方法才会继续,否则直接返回。 2.更新cell中的时间戳(timestamp)
阅读全文

浙公网安备 33010602011771号