摘要: 链接附带的是ucsc各种格式文件的说明,以后遇到新类型的文件可以先来这里看看! https://www.genome.ucsc.edu/FAQ/FAQformat.html 阅读全文
posted @ 2017-11-24 10:25 生信老码农 阅读(523) 评论(0) 推荐(0) 编辑
摘要: sparse函数 功能:Create sparse matrix-创建稀疏矩阵 用法1:S=sparse(X)——将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩阵S。 如果X本身是稀疏的,sparse(X)返回S。 例如: A= 0 2 0 4 0 6 7 0 阅读全文
posted @ 2017-11-22 22:51 生信老码农 阅读(10834) 评论(0) 推荐(0) 编辑
摘要: 函数原型: #include “stdio.h” FILE *popen( const char* command, const char* mode ) 参数说明: command: 是一个指向以 NULL 结束的 shell 命令字符串的指针。这行命令将被传到 bin/sh 并使用 -c 标志, 阅读全文
posted @ 2017-11-16 18:07 生信老码农 阅读(2873) 评论(0) 推荐(0) 编辑
摘要: 文件 文件的基本概念 所谓“文件”是指一组相关数据的有序集合。 这个数据集有一个名称,叫做文件名。实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件 (头文件)等。文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。从不同的角度可对文件作不同的分类 阅读全文
posted @ 2017-11-16 16:42 生信老码农 阅读(15746) 评论(0) 推荐(1) 编辑
摘要: stat函数讲解表头文件: #include <sys/stat.h> #include <unistd.h>定义函数: int stat(const char *file_name, struct stat *buf);函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体 阅读全文
posted @ 2017-11-16 16:30 生信老码农 阅读(9545) 评论(0) 推荐(0) 编辑
摘要: 肿瘤大数据挖掘中经常需要处理上百亿行的文本文件,这些文件往往高达数百GB,假如文件结构简单统一,那么用sed和awk 处理是非常方便和快速的。但有时候会遇到逻辑较为复杂的处理流程,这样我一般会用JAVA来处理。但由于JAVA是单线程的,因此对于实验室多核服务器来说,能充分有效的利用起每个核会方便不少 阅读全文
posted @ 2017-10-26 11:16 生信老码农 阅读(10369) 评论(0) 推荐(1) 编辑
摘要: 生信文章里面图片很多都是基于插画性质的质量图,最近写文章苦于找不到合适的素材,今天发现一个网站还不错,这里帖网址:http://www.zcool.com.cn/ http://ibaotu.com/ 阅读全文
posted @ 2017-09-29 09:43 生信老码农 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 老板推荐了一个专门用来做基因表达定量(qPCR)的引物数据库,还蛮好用的,都是别人实验验证过的,感觉比自己设计的更靠谱一下,附上链接:https://pga.mgh.harvard.edu/primerbank/ 阅读全文
posted @ 2017-09-27 20:47 生信老码农 阅读(1276) 评论(0) 推荐(0) 编辑
摘要: ENCODE数据库用于存放基因组原件,所有的测序数据(原始数据以及每一步处理后的数据以及最终的结果)都是开放下载的。假如说去官网下载的话会比较麻烦,这里可以通过UCSC的数据库下载(真的是神器啊)!下面介绍方法: https://www.genome.ucsc.edu/ENCODE/download 阅读全文
posted @ 2017-09-21 12:03 生信老码农 阅读(1509) 评论(0) 推荐(0) 编辑
摘要: 抽象类是从多个类中抽象出来的模板,如果将这种抽象进行的更彻底,那么就是接口(interface)了。什么是接口,简单的讲,接口就是抽象类的进一步抽象,这种进一步的抽象只定义了一种规范,而不需要关心具体的数据状态和方法实现细节,它只规定了一部分必须提供的方法。下面介绍接口的具体使用细节; 1.接口里不 阅读全文
posted @ 2017-08-15 10:49 生信老码农 阅读(714) 评论(0) 推荐(0) 编辑