摘要: 文|邓凯 数据分析重要性 越来越多的管理者意识到数据分析对经济发展、企业运营的重要意义。 在古代,得琅琊阁者得天下 现在,得大数据者得天下。 我总结的数据分析五步走: 1、锁定分析目标,梳理思路,叫纸上谈兵; 2、把杂乱的数据整理出图表报表,用数据探业务,叫自问数答; 3、锁定核心抓重点,设定最终算 阅读全文
posted @ 2017-06-21 20:43 Timechancer 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 因为我们测序的时候,引物用的是hg19作为参考序列的,但是就目前来说,hg38注释信息更为丰富。因此,我们决定将call出来的hg19的snv位点转化为hg38,进而用annovar进行注释。 之前有一篇转载的博文,就如何将不同类型的参考基因组进行转换。我们用已经转化好的bed(chrom,star 阅读全文
posted @ 2017-06-21 16:34 Timechancer 阅读(2332) 评论(0) 推荐(0) 编辑
摘要: 一、计算文件的行数 最简单的办法是把文件读入一个大的列表中,然后统计列表的长度.如果文件的路径是以参数的形式filepath传递的,那么只用一行代码就可以完成我们的需求了: count = len(open(filepath,'rU').readlines()) 如果是非常大的文件,上面的方法可能很 阅读全文
posted @ 2017-06-21 16:21 Timechancer 阅读(202) 评论(0) 推荐(0) 编辑
摘要: # coding=utf-8 #append # append是list(列表)的方法,函数参数是可以是任意一个元素,作用是在列表的最后添加上这个新元素。例如a=[1,2,3]则 # a.append(4)以后a就是[1,2,3,4] a = [1,2,3] print a a.appen... 阅读全文
posted @ 2017-06-21 09:18 Timechancer 阅读(143) 评论(0) 推荐(0) 编辑