摘要:1:学习吴恩达的视频,作总结 2:学习电脑的MATLAB神经网络课程视频 6:人脸识别与检测视频 3:学习splib书和对应的视频 4:准备天池竞赛 5:准备HDFS论文 关注teashou开源项目 学习caffe视频,weka图书,rapidmine视频 学习spark,Scala,视频和图书 学
阅读全文
摘要:项目:1:基于Hadoop的手机日志查询分析 已完结2:基于Mahout的线下推荐系统设计与实现 已完结3:基于MATLAB的神经网络原型设计与实现 进行中4:基于神经网络的人脸识别检测与分析 进行中 5:基于Spark的splib平台大数据整合分析与实现 进行中6:基于SILT的NoSql键值对存
阅读全文
摘要:可能的问题和分析一:数据量有多大?rating.csv:行为数据user.csv:属性数据-3列数据:用户ID,图书ID, 用户对图书的评分-图书数: 1000个-用户数: 200个-记录数: 4000次的图书评分-3列数据:用户ID,用户性别,用户年龄–用户数: 200个–用户性别: M为男性,F
阅读全文
摘要:前言 本文是Mahout实现推荐系统的又一案例,用Mahout构建图书推荐系统。与之前的两篇文章,思路上面类似,侧重点在于图书的属性如何利用。本文的数据在自于Amazon网站,由爬虫抓取获得。 目录 1. 项目背景 Amazon是最早的电子商务网站之一,以网上图书起家,最后发展成为音像,电子消费品,
阅读全文
摘要:今天从东九回来的路上,突然想到一个新的创业计划,就是“快照”计划 因为最近在搞spark,storm,老是搭建集群,虚拟机的配置真是一个大问题, 虚拟机的快照还原功能,是一个big ideal ,我尽然忘记了 由此我想到一个主意,关于照片的快照复原功能,再联想之前的关于图片社交的APP,乐图和创业公
阅读全文
摘要:项目简述:基于开源Hadoop2.0架构的集群网络,进行海量数据的分布式计算。由于Hadoop集群规模不断扩大,而搭建一个同等规模的测试集群需要一笔昂贵的开销。目前有100台左右物料,期望预测计算节点1500+的集群网络性能,目前考虑通过模拟仿真或数学建模的方法来预测大规模集群极限性能,以及对大规模
阅读全文