| 算法 (11) | mapreduce (2) | KMeans (1) | 推荐算法 (1) |
| hive (8) | java (2) | jvm (1) | 探索性分析 (1) |
| 大数据 (8) | crawler (2) | java锁 (1) | 锁 (1) |
| 搜索引擎 (6) | 遗传算法 (2) | hue (1) | 数据 (1) |
| hive存储 (5) | 深度学习 (2) | hdfs数据导入 (1) | 书籍 (1) |
| PSO (4) | 爬虫 (2) | geohash (1) | 身份证校验 (1) |
| hive的文件格式 (4) | zookeeper (1) | GA (1) | 身份证 (1) |
| 粒子算法 (4) | torch (1) | flume (1) | 内存模型 (1) |
| 机器学习 (4) | Tensorflow (1) | EDA (1) | 距离公式 (1) |
| hive的安装配置 (3) | solr (1) | dbinputformat (1) | 距离 (1) |
| hadoop (3) | shuffle (1) | dataset (1) | 谷歌 (1) |
| 引擎手记 (3) | scrapy (1) | CDH安装 (1) | 负载均衡 (1) |
| 日志监控 (3) | R (1) | 组卷算法 (1) | 分词 (1) |
| SGA (2) | mssql数据导入 (1) | 信息熵 (1) | 背包问题 (1) |
| SequenceFile (2) | mahout (1) | 系统设计 (1) | |
| rcfile (2) | lock (1) | 洗牌算法 (1) | |
| orcfile (2) | LBS (1) | 网页去重 (1) |