随笔分类 - 【05】Bio-Software
摘要:表:R与SAS、SPSS之比较主题SAS产品线SPSS产品线R语言相关包高级模块SAS/STAT®SPSS Advanced Models™stat, MASS及众多扩展包基础模块SAS®SPSS Base™R联合分析SAS/STAT®: TransregSPSS Conjoint™homals, psychoR , bayesm对应分析SAS/STAT®: CorrespSPSS Categories™homals, MASS, FactoMineRade4, PTAk, cocorresp, vegan, made4, PsychoR自定义表格SAS
阅读全文
摘要:Ka/Ks与分子进化常用软件Ka/Ks 在遗传学中,Ka/Ks或者dN/dS表示的是异意替换(Ka)和同意替换(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。 不导致氨基酸改变的核苷酸变异我们称为同义突变,反之则称为非同义突变。一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。在进化分析中,了解同义突变和非同义突变发生的速率是很有意义的。常用的参数有以下几种:同义突变频率(Ks)、非同义突变频率(Ka)、非同义突变率与同义突变率的比值(Ka/Ks)。如果Ka/Ks>1,则认为有正选择效应。如果Ka/Ks=1,则认为存在中性选择。如果Ka/Ks&l
阅读全文
摘要:PAML:用最大似然法分析系统发育目录1.简介 PAML能做什么 PAML不能做什么 如何运行PAML中的程序2.数据文件格式 序列文件格式 树文件格式3.Baseml 核酸替代模型 控制文件4.Basemlg5.Codeml 密码子替代模型 氨基酸替代模型 控制文件 密码子序列(seqtype =1) 氨基酸序列(seqtype = 2)6.Evolver7.Yn008.Mcmctree 简 介 化石校准 控制文件MCMCtree 和 Multidivtime 的差异 近似似然计算9.其他注释 分析大数据集和迭代算法 树形检索算法 生成引导数据集 迭代过程中的磨损记录 指定初始值 微调迭代算
阅读全文
摘要:构建进化树构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-J Tree构建的相关软件和操作步骤。1、用Clustal X构建N-J系统树的过程(1) 打开Clustal X程序,载入源文件.File-Load sequences- C: empjc.txt.(2) 序列比对Alignment - Output format options - √ Clustal format; CLUSTALW sequence numbers: ONAlignment - Do complete alignment(Ou
阅读全文
摘要:PAML 4: Phylogenetic Analysis by Maximum Likelihood【摘要】 PAML, currently in version 4, is a package of programs for phylogenetic analyses of DNA and protein sequences using maximum likelihood (ML). The programs may be used to compare and test phylogenetic trees, but their main strengths lie in the ri
阅读全文
摘要:PAML软件的一些简单的具体的使用操作1. 首先用Clustal X进行序列比对:要保证:保证核苷酸序列是三的倍数,没有终止密码子,核苷酸序列的第一位是密码子的第一位。假设序列名为cox1.fas2. 使用DAMBE软件进行转换成PML格式。 打开要换换的文件,然后“file” “save and convert sequence format”,在保存类型中选择“Yang’s PAML”。那么此时的序列名为“cox1.PML”, 这样就可以得到文件“*.PML”,然后就直接把后缀改成“*.nuc”。那么此时的序列名为“cox1.nuc” 这样就完成了文件格式的转换。3. 打开PAML软件的文
阅读全文
摘要:gff格式是Sanger研究所定义,是一种简单的、方便的对于DNA、RNA以及蛋白质序列的特征进行描述的一种数据格式,比如序列的那里到那里是基因,已经成为序列注释的通用格式,比如基因组的基因预测,许多软件都支持输入或者输出gff格式。目前格式定义的最新版本是版本3。原始定义见SONG websitegff是存文本文件,由tab键隔开的9列组成,以下是各列的说明:Column 1: “seqid”序列的编号,编号的有效字符[a-zA-Z0-9.:^*$@!+_?-|]Column 2: “source”注释信息的来源,比如”Genescan”、”Genbank” 等,可以为空,为空用”.”点号代
阅读全文
摘要:RECON: a package for automated de novo identification of repeat families from genomic sequences DescriptionProper identification of repetitive sequences is an essential step in genome analysis. The RECON package performs de novo identification and classification of repeat sequence families from geno
阅读全文
摘要:结果12列Query id,Subject id,% identity,alignment length,mismatches,gap openings,q. start,q. end,s. start,s. end,e-value,bit scoreBlast,全称Basic Local Alignment Search Tool,即"基于局部比对算法的搜索工具",由Altschul等人于1990年发布。Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。Blast的运行方式是先用目标
阅读全文
摘要:Apart from bug fixes, the most outward differences in usage and appearance of AB-BLAST and WU-BLAST include:The default scoring system for AB-BLASTN is match/mismatch scores M=+1 N=−3 with gap penalties Q=7 R=2; whereas WU-BLASTN uses M=+5 N=−4 with gap penalties Q=10 R=10 by default. In all search
阅读全文

浙公网安备 33010602011771号