文章分类 - 大数据
大数据
摘要:gensim是一个python的自然语言处理库,能够将文档根据TF-IDF, LDA, LSI 等模型转化成向量模式,以便进行进一步的处理。此外,gensim还实现了word2vec功能,能够将单词转化为词向量。关于词向量的知识可以看我之前的文章 关于gensim的使用方法,我是根据官网的资料来看的
阅读全文
posted @ 2016-09-27 09:46
王天泽博客
摘要:Redis protected-mode 是3.2 之后加入的新特性,在Redis.conf的注释中,我们可以了解到,他的具体作用和启用条件 可以看到 Protected-mode 是为了禁止公网访问redis cache,加强redis安全的。 它启用的条件,有两个:1) 没有bind IP2)
阅读全文
posted @ 2016-06-11 15:43
王天泽博客
摘要:vim /etc/profile#java enviroment configJAVA_HOME=/opt/jdk1.8.0_45JAVA_JRE=${JAVA_HOME}/jreCLASS_PATH=${JAVA_HOME}/lib:${JAVA_JRE}/libPATH=$PATH:${JAVA...
阅读全文
posted @ 2015-10-20 10:32
王天泽博客
摘要:第一,数据容量大(Volume)。从TB级别,跃升到PB级别;第二,数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。第三,商业价值高(Value)。价值密...
阅读全文
posted @ 2015-07-29 16:49
王天泽博客

浙公网安备 33010602011771号