摘要:Comprehensive learning path – Data Science in PythonJourney from a Python noob to a Kaggler on PythonSo, you want to become a data scientist or may be... 阅读全文
posted @ 2015-05-05 20:12 爱67 阅读(304) 评论(0) 推荐(0) 编辑
摘要:By Pamela Ronald Pamela Ronald studies the genes that make plants more resistant to disease and stress. In an eye-opening(adj. 令人瞠目的;使人开眼界的) talk, she describes her decade-long(长达10年的) quest(寻求、探索... 阅读全文
posted @ 2015-05-05 20:10 爱67 阅读(1530) 评论(0) 推荐(0) 编辑
摘要:自定义函数(UDF)UDF全称User Defined Function,即用户自定义函数。ODPS提供了很多内建函数来满足用户的计算需求,同时用户还可以通过创建自定义函数来满足不同的计算需求。UDF在使用上与普通的 SQL内建函数 类似。在ODPS中,用户可以扩展的UDF有三种,分别是:UDF 分... 阅读全文
posted @ 2015-05-05 09:07 爱67 阅读(3175) 评论(0) 推荐(0) 编辑
摘要:Alice Goffman In the United States, two institutions guide teenagers on the journey to adulthood: college and prison. Sociologist Alice Goffman spent six years in a troubled Philadelphia neighborh... 阅读全文
posted @ 2015-05-04 10:28 爱67 阅读(1809) 评论(0) 推荐(0) 编辑
摘要:By Greg Gage (Neuroscientist)Greg Gage is on a mission to make brain science accessible to all. In this fun, kind of creepy(令人毛骨悚然的,恐怖的) demo, the neu... 阅读全文
posted @ 2015-04-30 12:24 爱67 阅读(645) 评论(0) 推荐(0) 编辑
摘要:Introduction to Random forest(Simplified)With increase in computational power, we can now choose algorithms which perform very intensive calculations.... 阅读全文
posted @ 2015-04-28 16:10 爱67 阅读(4689) 评论(1) 推荐(1) 编辑
摘要:基本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几个部分:1) 多元数据可视化(Visualising multivariate data):绘图方法:基本画图函数(如:pairs()、coplot())和lattice包里的... 阅读全文
posted @ 2015-04-28 10:55 爱67 阅读(2656) 评论(0) 推荐(0) 编辑
摘要:机器学习是计算机科学和统计学的边缘交叉领域,R关于机器学习的包主要包括以下几个方面: 1)神经网络(Neural Networks): nnet、AMORE以及neuralnet,nnet提供了最常见的前馈反向传播神经网络算法。AMORE包则更进一步提供了更为丰富的控制参数,并可以增加多个隐... 阅读全文
posted @ 2015-04-28 10:50 爱67 阅读(1007) 评论(0) 推荐(0) 编辑
摘要:By Nizar Ibrahim A 50-foot-long carnivore who hunted its prey in rivers 97 million years ago, the spinosaurus is a "dragon from deep time." Paleontologist Nizar Ibrahim and his c... 阅读全文
posted @ 2015-04-27 13:13 爱67 阅读(423) 评论(0) 推荐(0) 编辑
摘要:数据结构一、数据管理vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 s... 阅读全文
posted @ 2015-04-26 19:31 爱67 阅读(1198) 评论(0) 推荐(0) 编辑