08 2017 档案

摘要:主成分分析方法从统计学上讲对子特征提取,典型特征,相似性有重要的作用。简而言之,就是在导致结果的所有因素中发现哪些少数因素是概括了数据集整个特征空间中所包含的信息,因而称为主成分分析。常用的方法有 : PCA (principle component analysis) LDA(latent dis 阅读全文
posted @ 2017-08-24 19:14 ywliao 阅读(6801) 评论(0) 推荐(0)
摘要:因为在写论文的时候用到,所以和大家分享。原地址为 http://rstudio-pubs-static.s3.amazonaws.com/1876_df0bf890dd54461f98719b461d987c3d.html 考虑到原地址可能失效,这里做简单的翻译和备份,有关聚类的R包可以参考clus 阅读全文
posted @ 2017-08-22 15:30 ywliao 阅读(1927) 评论(0) 推荐(0)
摘要:转自:http://www.sohu.com/a/129333346_465975 选自Analytics Vidhya 作者:Upasana Mukherjee 机器之心编译 参与:马亚雄、微胖、黄小天、吴攀 如果你研究过一点机器学习和数据科学,你肯定遇到过不平衡的类分布(imbalanced c 阅读全文
posted @ 2017-08-20 16:09 ywliao 阅读(1282) 评论(0) 推荐(0)
摘要:还是先获取随机DNA序列和其他序列对象: 一、获取序列基本信息 包括获取名称(names)、长度(length)、字符个数(nchar)和对象头/尾(head/tail)等信息的函数。 函数的用法简单,但需注意XString类对象的返回结果和其他类型有些差别: 二、序列转换 1、获取反向、互补、反向 阅读全文
posted @ 2017-08-19 17:13 ywliao 阅读(2794) 评论(0) 推荐(0)
摘要:一、foreach包简介与主要函数解读 foreach包是revolutionanalytics公司贡献给R开源社区的一个包,它能使R中的并行计算更为方便。大多数并行计算都主要完成三件事情:将问题分割小块、对小块问题进行并行计算、合并计算结果。foreach包中,迭代器完成分割工作,”%dopar% 阅读全文
posted @ 2017-08-10 15:21 ywliao 阅读(473) 评论(0) 推荐(0)