会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
橙子牛奶糖
简介:陈文燕,本科暨南大学,中科院博士。 欢迎关注微信公众号“bio生物信息”,进群与众多生信同行一起讨论学术问题。私信不回,有问题请在文章下面评论。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
42
43
44
45
46
47
48
49
50
···
53
下一页
2017年10月20日
R语言:随机抽样(sample函数)
摘要: 如果想从一堆数据集中随机抽出一个数,用sample函数就能实现,代码展示如下: 类似的,从数据集随机抽出两个数或者三个数则将1改为2或者3即可: 结果如下所示:
阅读全文
posted @ 2017-10-20 18:22 橙子牛奶糖
阅读(7929)
评论(0)
推荐(0)
2017年9月28日
SNP (Single Nucleotide Polymorphism), SNV ( single nucleotide variants ) , Indel (insertion-deletion) 的区别
摘要: SNP (Single Nucleotide Polymorphism):强调在一个群体中具有一定频率的变异,一般为二态性。比如G→C SNV ( single nucleotide variants ) :包含多种单核苷酸变异,比如该位点可能由T变C,也可能由T变A。则T→C,A。SNV并没有强调
阅读全文
posted @ 2017-09-28 23:52 橙子牛奶糖
阅读(3115)
评论(0)
推荐(0)
2017年9月20日
plink, vcftool计算等位基因频率(allele frequency,vcf)
摘要: 计算等位基因频率有两种方式,第一种用vcftool计算: 很简单的一个命令行,file.vcf指的是你要输入的vcf文件,--freq表示计算等位基因频率,--chr后面的1表示你要计算的区域在1号染色体,当然,你也可以选择你想计算的染色体区域,filefreq指的是输出的文件名。 结果如下图所示:
阅读全文
posted @ 2017-09-20 23:17 橙子牛奶糖
阅读(19353)
评论(4)
推荐(0)
2017年9月16日
Linux:打印(输出)所有的列(awk, $0)
摘要: 如果想输出所有的列的话,只需要$0这个函数,例如以下命令: rs16945916指的是打印在行中含有该字符的所有列。
阅读全文
posted @ 2017-09-16 19:37 橙子牛奶糖
阅读(8093)
评论(0)
推荐(0)
2017年9月1日
Linux:批量修改分隔符(awk、BEGIN、FS、OFS、print、tr命令)
摘要: 批量修改文件的分隔符,可以用FS和OFS命令 FS:Field Separator,字段分隔符 OFS:Out of Field Separator,输出字段分隔符 假设有这么一个文件file1.txt,其内容如下: 可以看出,file1的分隔符很长,不止一个空格符组成,因此我们需要先将分隔符统一一
阅读全文
posted @ 2017-09-01 18:33 橙子牛奶糖
阅读(17723)
评论(0)
推荐(1)
2017年8月14日
vcf格式文件转化为Excel(csv)格式文件(R语言的write.csv,write.table功能,Excel表的文件导入功能)
摘要: 最近在整理文件,准备把vcf文件转化为Excel格式,或者CSV格式,网上搜了一堆资料,还真有人专门开发出转化格式的工具:叫vcf2csv(下载地址http://vcf2csv.sourceforge.net/#links),赶紧下载安装,开始转化,结果弹出行列不一致的错误,遂放弃。 尝试了一堆无用
阅读全文
posted @ 2017-08-14 16:12 橙子牛奶糖
阅读(8607)
评论(0)
推荐(1)
2017年8月13日
Linux追加文件内容并在内容前加上该文件名(awk, FILENAME功能妙用)
摘要: 假如有三个文件file1.txt,file2.txt,file3.txt 每一个文件内容如下: 现在打算提取每一个文件字符为16的行,打印该行所有的内容、以及该文件名,并追加到file4.txt,则可以用以下命令: 则file4.txt的内容会如下:
阅读全文
posted @ 2017-08-13 16:12 橙子牛奶糖
阅读(6205)
评论(0)
推荐(0)
2017年8月7日
斯坦福大学公开课机器学习:监督学习在行人检测的应用(supervised learning for pedestrian detection)
摘要: 对于下图,左边是行人,作为阳性例子,赋值y=1,右边是景物,作为阴性例子,赋值y=0; 步长概念: 如下图所示,步长表示绿色框框移动的距离,有时候也称为滑动参数stride,如果一次移动一个像素,则称步长为1,通常步长为1时,表现最好,但是计算成本高,一般,选用4或8个步长更为常见。 通过绿色框框进
阅读全文
posted @ 2017-08-07 21:26 橙子牛奶糖
阅读(470)
评论(0)
推荐(0)
斯坦福大学公开课机器学习:梯度下降运算的学习率a(gradient descent in practice 2:learning rate alpha)
摘要: 本章节主要讲怎么确定梯度下降的工作是正确的,第二是怎么选择学习率α,如下图所示: 上图显示的是梯度下降算法迭代过程中的代价函数j(θ)的值,横轴是迭代步数,纵轴是j(θ)的值 如果梯度算法正常工作,那么每一步迭代之后,那么j(θ)值应该是每一次迭代后都会相应降低,曲线的用处在于告诉你迭代到哪一步之后
阅读全文
posted @ 2017-08-07 16:00 橙子牛奶糖
阅读(588)
评论(0)
推荐(0)
斯坦福大学公开课机器学习:梯度下降运算的特征缩放(gradient descent in practice 1:feature scaling)
摘要: 以房屋价格为例,假设有两个特征向量:X1:房子大小(1-2000 feets), X2:卧室数量(1-5) 关于这两个特征向量的代价函数如下图所示: 从上图可以看出,代价函数是一个又瘦又高的椭圆形轮廓图,如果用这个代价函数来运行梯度下降的话,得到最终的梯度值,可能需要花费很长的时间,甚至可能来回震动
阅读全文
posted @ 2017-08-07 15:00 橙子牛奶糖
阅读(1367)
评论(0)
推荐(1)
上一页
1
···
42
43
44
45
46
47
48
49
50
···
53
下一页
公告