08 2016 档案

摘要:算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架 阅读全文
posted @ 2016-08-31 11:30 rocky_24 阅读(1182) 评论(0) 推荐(0)
摘要:我们可以使用Apache Mahout来快速创建高效扩展性又好的机器学习应用。Mahout结合了诸如H2O算法、Scala、Spark和Hadoop MapReduce等模块,为开发人员提供了一个构建可扩展算法的环境。现在最新的版本是去年11月6日发布的0.11.1版本。 Apache Mahout 阅读全文
posted @ 2016-08-29 11:16 rocky_24 阅读(477) 评论(0) 推荐(0)
摘要:———————————————————— 调配 Hadoop ———————————————————— 1 将 编译好的 TEZ .tar.gz 文件上传到 HDFS 中。 hdfs fs -put complete-tez-0.7.0.tar.gz /tez 2 创建 tez-site.xml 需 阅读全文
posted @ 2016-08-25 09:37 rocky_24 阅读(1713) 评论(0) 推荐(0)
摘要:用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出该用户的立体“画像”了。 具体来讲,当为 用户画像 时,需要以下四个阶段: 1.战略解读:企业选择构建用户画像平台,可以实现不同的战略目的, 阅读全文
posted @ 2016-08-10 14:26 rocky_24 阅读(1012) 评论(0) 推荐(0)

希望祖国繁荣,富强! God has given me a gift. Only one. I am the most complete fighter in the world. My whole life, I have trained. I must prove I am worthy of someting. rocky_24