上一页 1 ··· 72 73 74 75 76 77 78 79 80 ··· 95 下一页
摘要: 1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法。基于OLC的组装方法适合长序列组装,运行依赖的数据结构需要消耗大量的内存,且运行速度比较慢,错误率高,而DBG组装方法内存消耗相对较低,运算 阅读全文
posted @ 2020-09-01 16:47 生物信息与育种 阅读(8943) 评论(0) 推荐(1)
摘要: 1.理解朴素贝叶斯 1)基本概念 依据概率原则进行分类。如天气预测概率。 朴素贝叶斯(Naive Bayes, NB)适合场景:为估计一个结果的概率,从众多属性中提取的信息应该被同时考虑。 很多算法忽略了弱影响的特征(若有大量弱影响的特征,它们组合在一起的影响可能会很大),但NB算法利用了所有可以获 阅读全文
posted @ 2020-08-31 22:37 生物信息与育种 阅读(1960) 评论(0) 推荐(0)
摘要: 1.理解使用KNN进行分类 KNN特点 近邻分类器:一种懒惰学习器,即把未标记的案例归类为与它们最相似的带有标记的案例所在的类。当一个概念很难定义,但你看到它时知道它是什么,就适合用KNN分类。 KNN优点:简单有效;数据分布无要求;训练快 KNN缺点:不产生模型(发现特征间关系能力有限);分类慢; 阅读全文
posted @ 2020-08-30 20:36 生物信息与育种 阅读(1881) 评论(0) 推荐(1)
摘要: 1.基本概念 机器学习:发明算法将数据转化为智能行为 数据挖掘 VS 机器学习:前者侧重寻找有价值的信息,后者侧重执行已知的任务。后者是前者的先期准备 过程:数据——>抽象化——>一般化。或者:收集数据——推理数据——归纳数据——发现规律 抽象化: 训练:用一个特定模型来拟合数据集的过程 用方程来拟 阅读全文
posted @ 2020-08-29 15:49 生物信息与育种 阅读(1901) 评论(0) 推荐(2)
摘要: 2015年的综述文章,marker一下,供以后比较试用。蛋白质基因组学研究中的质谱仪与生物信息学方法。 针对蛋白质基因组学的分析研究,总结了质谱仪和蛋白质基因组学流程分析软件的选择,重点评述了常用的生物信息学计算工具,如PepLine 、Proteogenomic Mapping Tool InsP 阅读全文
posted @ 2020-08-28 23:58 生物信息与育种 阅读(397) 评论(0) 推荐(0)
摘要: 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸 阅读全文
posted @ 2020-08-28 23:48 生物信息与育种 阅读(18102) 评论(1) 推荐(0)
摘要: 1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲。而且主要也是针对他们家的obitrap产出数据。但在业内用得比较多,尤其是在学术界(因为大部分科研人员只会鼠标点点框)。蛋疼的是你就算买了软件还得配个Wi 阅读全文
posted @ 2020-08-28 21:33 生物信息与育种 阅读(7005) 评论(0) 推荐(0)
摘要: 1.简介 MSGF+也是近年来应用得比较多的蛋白鉴定软件。java写的,2008年初次发表JPR,2014年升级发表NC,免费开源,持续更新维护,良心软件。而且,有研究者对不同蛋白质组学鉴定软件进行比较分析,MSGF+的表现也是非常不错的(一下子找不到文献出处~~)。 Github源码:https: 阅读全文
posted @ 2020-08-28 17:53 生物信息与育种 阅读(2362) 评论(0) 推荐(0)
摘要: 1.简介 Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图 阅读全文
posted @ 2020-08-28 16:39 生物信息与育种 阅读(5173) 评论(1) 推荐(0)
摘要: 1.简介 官网:http://comet-ms.sourceforge.net/ 1993年开发,持续更新,免费开源 适用Windows/Linux 多线程,支持多种输入输出格式:输入谱图文件(mzXML, mzML, mgf, or ms2/cms2),输出.pep.xml/.pin.xml/.s 阅读全文
posted @ 2020-08-28 15:10 生物信息与育种 阅读(2253) 评论(0) 推荐(0)
上一页 1 ··· 72 73 74 75 76 77 78 79 80 ··· 95 下一页