代码改变世界

[置顶]疯人疯语

2011-12-02 19:51 by Aga.J, 508 阅读, 0 推荐, 收藏, 编辑
摘要:[1] 时代应该往Web App和Web Os发展,但是乔布斯的出现,带着消费者回到了本地app时代,更加可笑的是应用商店死灰复燃,而消费者只是一群羊羔,乔布斯带着它们吃草。[2011-12-02 aga][2] 从上大学开始懂得思考的时候起(以前上高中初中都是读好书就行),我就一直渴望有一个可以被我尊称为老师的人,他欣赏我,挖掘我的才能,教会我很多东西,影响我的人生观价值观,影响我的一生,但是这个人并不好找. [2011-12-06 aga][3] 为什么现在亚马逊也不整点类似团购的东西出来,从亚马逊领导人一贯的作风可以看出. [2011-12-10 aga][置顶]我还是忍不住想赞下自己的 阅读全文

机器学习的11个开源项目

2014-12-27 20:44 by Aga.J, 1312 阅读, 0 推荐, 收藏, 编辑
摘要:转自InfoQ,作者张天雷机器学习是目前数据分析领域的一个热点内容,在平时的学习和生活中经常会用到各种各样的机器学习算法。实际上,基于Python、Java等的很多机器学习算法基本都被前人实现过很多次了。这些算法在网上可以找到很多,然而往往存在很多“脏”或者“乱”的开源代码。在这样的背景下,Info... 阅读全文

推荐系统随便谈(一)

2014-11-29 15:03 by Aga.J, 730 阅读, 0 推荐, 收藏, 编辑
摘要:从对推荐一无所知到做过几个推荐系统,再到完成一个推荐系统生态框架的设计,觉得是时候沉淀下来一些知识,然后继续找好吃的。《推荐系统随便谈》系列将从最简单的推荐系统说起,并随着业务需求增多和认识深入来复杂化系统设计,中间偶尔分享一些其他人的设计思路。 推荐,大家最熟悉的就是亚马逊的“看了这件商品的... 阅读全文

Machine Learning 第四课

2012-12-15 23:34 by Aga.J, 479 阅读, 0 推荐, 收藏, 编辑
摘要:本节课的主题 (1) Logistic regression – Newton’s Method (2) Exponential Family (3) Generalized Linear Model l Logistic Regression 上一节讲到逻辑... 阅读全文

Machine Learning 第三课(下)

2012-11-18 17:38 by Aga.J, 363 阅读, 0 推荐, 收藏, 编辑
摘要:继Machine Learning 第三课(上) 阅读全文

Machine Learning 第三课(上)

2012-11-18 14:15 by Aga.J, 471 阅读, 0 推荐, 收藏, 编辑
摘要:因公式无法很好的在页面展示,所以将文章转换为图片贴图。 阅读全文

Machine Learning第二课

2012-10-28 16:14 by Aga.J, 905 阅读, 0 推荐, 收藏, 编辑
摘要:本节课的主题(1)Linear Regression(2)Gradient Descent(3)Normal Equationl Linear Regression这节课用一个房价预测的例子来完整的过一遍有监督机器学习中预测模型的数学基础和数学理论支持。首先先约定公式中的Notation:m训练集合中的样本个数x输入变量或特征y输出变量或目标结果(x,y)表示一个样本()表示第i个样本 然后我们来看房价预测的例子,假设我们已知房子的大小以及其对应的价格,那么我们可以在二维空间上做出下面的图示。 问题是给出某个size预测对应的price,对于这个问题,根据上节课学到的知识,我们知道这是一个有监 阅读全文

Stanford公开课Machine learning第一课

2012-10-27 16:45 by Aga.J, 1483 阅读, 0 推荐, 收藏, 编辑
摘要:什么是机器学习,看维基百科的定义:Machine learning, a branch of artificial intelligence, is a scientific discipline concerned with the design and development of algorithms that take as input empirical data, such as that from sensors or databases, and yield patterns or predictions thought to be features of the under. 阅读全文

20120215 今天是我在公司实习的最后一天

2012-02-15 19:52 by Aga.J, 1430 阅读, 0 推荐, 收藏, 编辑
摘要:今天办完了所有手续离职,明天就可以回学校了,在这里的7个月我确实学习到了很多东西,也发现自己很多不足的地方。 很高兴在这里能认识到那么多同事,真的很好!不知道以后大家还能不能有机会再见面或者联系或者做技术交流,哈哈。 在离开的最后一刻,我在组内做了一个Presentation,实际上,我是刻意做这样一个PRE的,这个PRE意义重大,它不仅仅是一个简单的技术分享,不知道组员们能不能看出来。我总喜欢做这种一个行为带有好多层含义的事。这个PRE有好多层含义,最明显最容易发现的那层是我对技术和行业的预见性。还有很多层含义我不想说。 最后希望大家可以在我这个PRE后有所思考有所改变,或许会改变了那些懂. 阅读全文

Twitter Storm 实时数据处理框架分析总结

2012-02-03 18:03 by Aga.J, 6392 阅读, 2 推荐, 收藏, 编辑
摘要:Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架(原来是由BackType开发,后BackType被Twitter收购,将Storm作为Twitter的实时数据分析)。实时数据处理的应用场景很广泛,如上篇文章介绍S4时所说的个性化搜索广告的会话特征分析。而Yahoo当初创建S4项目的直接业务需求就是为了在搜索引擎的‘cost-per-click’广告中,能根据当前情景上下文(用户偏好,地理位置,已发生的查询和点击等)来估计用户点击的可能性并实时做出调整。 这种高可拓展性,能处理高频数据和大规模数据的实时流计算解决方案将被应用于实时搜索,高频交易和社交网络上。而流计算并. 阅读全文

Yahoo!S4分布式流处理引擎分析总结

2012-02-03 15:21 by Aga.J, 5456 阅读, 1 推荐, 收藏, 编辑
摘要:S4(Simple Scalable Streaming System)是一个分布式流处理引擎,开发者可以在这个引擎基础上开发面向无界的,不间断的流数据处理应用。 什么是流数据处理应用?例如,为了个性化搜索广告,系统需要实时处理来自几百万唯一用户每秒成千上万次的查询,并即时分析用户的会话特征来提高广告相关性预测模型的准确度。流数据处理应用要求我们的系统可以接受大量的,不间断的数据(称为流式数据),并可以迅速做出数据处理,S4正是完成这样一个需求。 S4的设计思想 S4将一个流抽象为由(K,A)形式的元素组成的序列,这里K和A分别是键和属性。在这种抽象的基础上S4设计了能够消费和发出这些(K,. 阅读全文