随笔分类 -  bioinformation_practice

摘要:转载:http://www.plob.org/2012/12/02/4927.html 一、序列文本的准备 构树之前先将目标基因序列都分别保存为txt文本文件中(或者把所有序列保存在同一个txt文本中,可以用“>基因名称”作为第一行,然后重起一行 编辑基因序列),序列只包含序列字母(ATCG或氨基酸 阅读全文
posted @ 2016-06-06 17:46 ^-馒头-^ 阅读(23776) 评论(0) 推荐(0)
摘要:转载:http://www.omicshare.com/forum/thread-151-1-3219.html(出处: OmicShare Forum) 1. 准备工作 2. 进入NCBI的Batch Entrez 3. 检索 4. 检查 5. 下载 阅读全文
posted @ 2016-05-22 22:11 ^-馒头-^ 阅读(454) 评论(0) 推荐(0)
摘要:目的: 1. 计算自定义模序在所有蛋白质的匹配位点和次数 2. 输出超过阈值的蛋白质序列到Hit_sequences.fasta 3. Hit_sequences.fasta中序列用小写字母,匹配用大写字母 4. 返回一个数据框,内容包存储ID、注释行(anno)括——、长度(len)、匹配位置(P 阅读全文
posted @ 2016-05-13 09:09 ^-馒头-^ 阅读(1640) 评论(0) 推荐(1)
摘要:目的:读入序列文件(fasta格式),返回一个数据框,内容包括——存储ID、注释行(anno)、长度(len)、序列内容(content) 一、问题思考: 1. 如何识别注释行和序列内容行 2. 如何快速定位序列内容所在位置 二、你可能需要的知识——基本的R语言基础 1. R语言基本数据类型 2. 阅读全文
posted @ 2016-04-21 14:42 ^-馒头-^ 阅读(7236) 评论(0) 推荐(0)