10 2019 档案

R查看对象类型,写入csv
摘要:class查看第一层类别 > class(b) [1] "numeric" 写入csv write.csv(data, file = "data.csv") 参考来源: https://blog.csdn.net/niuruijun/article/details/79262330 https:// 阅读全文

posted @ 2019-10-30 10:46 BPSO_mynotes 阅读(226) 评论(0) 推荐(0)

三代基因组consensus:Minimap+miniasm组装,racon+pilon纠错
摘要:用Li Heng开发的Minimap+miniasm进行组装,然后用racon+pilon进行纠错。 三代测序拼装软件,三代测序平台 Nanopore / Pacbio 产生的数据的一个共同点就是,读长长,错误率高,在用于分析之前需要对数据进行特殊处理(consensus,纠错),再进行拼装任务,L 阅读全文

posted @ 2019-10-30 09:36 BPSO_mynotes 阅读(4084) 评论(0) 推荐(0)

使用FALCON对三代测序数据进行基因组组装
摘要:ALCON是PacBio公司开发的一款用于三代基因组De novo组装软件, 更适合于大基因组的组装。 FALCON的结果文件: 阅读全文

posted @ 2019-10-29 14:11 BPSO_mynotes 阅读(547) 评论(0) 推荐(0)

简单枚举---从一数组中任取n个元素
摘要:这个问题很明显的需要用枚举的思想来一一遍历数组元素并进行无重复组合 给出一个数组a[14]={1,2,3,4,5,6,7,8,9,10,11,12,13,14},求从中任取n个元素的所有组合 如果任取1个元素+取所有元素:15种可能 如果任取2个元素:C^2 14=91 递归组合 1 2 1 3 1 阅读全文

posted @ 2019-10-29 11:44 BPSO_mynotes 阅读(515) 评论(0) 推荐(0)

Vim单行复制和黏贴
摘要:单行复制 在命令模式下,将光标移动到将要复制的行处,按“yy”进行复制 在命令模式下,将光标移动到将要粘贴的行处,按“p”进行粘贴 参考资料: https://www.cnblogs.com/EasonJim/p/8320776.html 阅读全文

posted @ 2019-10-18 11:10 BPSO_mynotes 阅读(294) 评论(0) 推荐(0)

Linux中使用gzip来压缩文件
摘要:原文件名为file1.txt,压缩后原文件消失,压缩后文件名为file1.txt.gz gzip file1.txt 压缩两个文件到一个文件 cat file1.txt file2.txt | gzip > foo.gz 或 gzip -c file1.txt file2.txt > foo.gz 阅读全文

posted @ 2019-10-18 11:04 BPSO_mynotes 阅读(1266) 评论(0) 推荐(0)

Pacbio下机数据格式说明
摘要:RS II Sequel 在下机文件中,主要有三类文件,bam 文件,bam.pbi 文件,以及xml文件。当我们习惯性的去寻找熟悉的fastq格式文件做分析时,发现找不到了,因为在sequel平台中bam 文件成为了它的替代者,因为其更节约储存空间。这是文件格式的一个重大更新。用于后续分析的文件一 阅读全文

posted @ 2019-10-18 10:06 BPSO_mynotes 阅读(1415) 评论(0) 推荐(0)

使用wtdbg利用三代数据进行基因组de novo组装
摘要:相较于其他三代四代数据组装软件(Canu(也可用于纠错),smartdenovo,miniasm,Flye,TULIP,FALCON,FALCON-unzip等) wtdbg有如下优点: 安装运行简单 (可用run_wtdbg_assembly.sh脚本生成运行脚本),运行速度快, 运行内容:一步组 阅读全文

posted @ 2019-10-18 09:56 BPSO_mynotes 阅读(2937) 评论(0) 推荐(0)

Linux查看glibc,glib安装版本
摘要:查看glibc版本 64bit:strings /lib64/libc.so.6 |grep GLIBC 查看glib安装版本 rpm -qa | grep glib 参考来源: https://blog.csdn.net/u013992330/article/details/74011601 ht 阅读全文

posted @ 2019-10-16 15:46 BPSO_mynotes 阅读(5312) 评论(0) 推荐(0)

Linux查看版本当前操作系统发行版信息
摘要:cat /etc/issue 或 cat /etc/redhat-release 参考来源:https://www.cnblogs.com/rsty/p/10443680.html 阅读全文

posted @ 2019-10-16 15:43 BPSO_mynotes 阅读(2436) 评论(0) 推荐(0)

awk分割,paste合并列
摘要:awk -F '-' '{print $1;}' data Shell 将两个文件按列合并 需要把file2的第二列合并到file paste -d " " file1 file2 删除文件 text中第一列 awk '{$1="";print $0}' text 参考来源: https://blo 阅读全文

posted @ 2019-10-12 14:57 BPSO_mynotes 阅读(398) 评论(0) 推荐(0)

Samtools
摘要:samtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。 faidx: 对fasta文件建立索引,生成的索引文件以.fai后缀结尾。 对基因组文件建立索引 $ samtools faidx genome.fasta 生成了索引文件genome.fasta.fai,是一个文本文件, 阅读全文

posted @ 2019-10-10 12:04 BPSO_mynotes 阅读(520) 评论(0) 推荐(0)

BWA软件
摘要:bwa,即Burrows-Wheeler-Alignment Tool 用法: 在进行 reads 的比对前,需要对 fasta 文件构建 FM-index。 BWA命令中可以分别调用这三个算法,如:aln/samse/sampe for BWA-backtrack BWA-bactrack: 用于 阅读全文

posted @ 2019-10-10 11:58 BPSO_mynotes 阅读(699) 评论(0) 推荐(0)

sam格式
摘要:SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示。 aln格式,是比对视图化的展示,存储的信息不够结构化,无法方便的作为另外程序的输入。 SAM则: 非常多序列(read),mapping到多个参考基因组(refe 阅读全文

posted @ 2019-10-10 11:54 BPSO_mynotes 阅读(382) 评论(0) 推荐(0)

SSPACE:一款专门做scaffolding的软件
摘要:做基因组拼接时,有时候已经获得了contig或者scaffold, 这时如果需要利用另外的一个pair-end或者mate-pair文库进一步做scaffolding的话, 可以使用SSPACE软件,它可以利用Pair-End(PE)和Mate-Pair(MP)的二代数据将已有的contig或者sc 阅读全文

posted @ 2019-10-09 22:45 BPSO_mynotes 阅读(2199) 评论(0) 推荐(0)

为什么 BAM 文件 sort 之后体积会变小
摘要:bam文件是Sam 文件的二进制压缩格式,保留了与sam 完成相同的内容信息。 BAM 文件是压缩的二进制文件,对文件内容排序之后相似的内容排在一起,使得文件压缩比提高了,因此排序之后的 BAM 文件变小了, 相对应的 SAM 文件就是纯文本文件,对 SAM 文件进行排序就不会改变文件大小。 参考来 阅读全文

posted @ 2019-10-08 18:03 BPSO_mynotes 阅读(1011) 评论(0) 推荐(0)

cat命令合并多个txt文件
摘要:cat是concatenate的缩写,意为串联。 cat命令两个常用的用法是: cat file1.txt file2.txt file3.txt > file_total.txt 命令可以将上面三个txt文件合并为一个名字为file_total.txt的文件 参考来源: https://www.c 阅读全文

posted @ 2019-10-08 11:33 BPSO_mynotes 阅读(2328) 评论(0) 推荐(0)

导航