博客园 - 萧飞IDO
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=5794
2020-03-20T02:09:46Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
feed.cnblogs.com
https://www.cnblogs.com/xiaofeiIDO/p/12529935.html
R作图-多图布局 - 萧飞IDO
mfrow 基于par布局 注意设置par时,先保存一下原始图像参数。 layout 基于矩阵布局 fig 自定义布局 主要是按照图层比例,自定义放置子图位置
2020-03-20T02:10:00Z
2020-03-20T02:10:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】mfrow 基于par布局 注意设置par时,先保存一下原始图像参数。 layout 基于矩阵布局 fig 自定义布局 主要是按照图层比例,自定义放置子图位置 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12529935.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12487279.html
R语言 函数参数的局部匹配验证(match.arg) - 萧飞IDO
Argument Verification Using Partial Matching Description match.arg matches arg against a table of candidate values as specified by choices, where NULL
2020-03-13T08:25:00Z
2020-03-13T08:25:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】Argument Verification Using Partial Matching Description match.arg matches arg against a table of candidate values as specified by choices, where NULL <a href="https://www.cnblogs.com/xiaofeiIDO/p/12487279.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12486890.html
典型关联分析(Canonical Correlation Analysis) - 萧飞IDO
典型关联分析(Canonical Correlation Analysis,以下简称CCA)是最常用的挖掘数据关联关系的算法之一。比如我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢?CCA可以帮助我们分析这个问题。 CCA的
2020-03-13T07:39:00Z
2020-03-13T07:39:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】典型关联分析(Canonical Correlation Analysis,以下简称CCA)是最常用的挖掘数据关联关系的算法之一。比如我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢?CCA可以帮助我们分析这个问题。 CCA的 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12486890.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12448684.html
用“limma”进行差异表达分析 - 萧飞IDO
1.概述 |矩阵|函数| |: :|: :| |表达矩阵|lmFit| |分组矩阵|eBayes| |差异比较矩阵|topTable| 2.读取表达矩阵: 得到表达矩阵exprSet,它的列是各个样本名称,行是各个探针ID,一个纯粹的表达矩阵,必须是数字型的! 可以简单地做一下该表达矩阵的QC检测:
2020-03-09T06:45:00Z
2020-03-09T06:45:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】1.概述 |矩阵|函数| |: :|: :| |表达矩阵|lmFit| |分组矩阵|eBayes| |差异比较矩阵|topTable| 2.读取表达矩阵: 得到表达矩阵exprSet,它的列是各个样本名称,行是各个探针ID,一个纯粹的表达矩阵,必须是数字型的! 可以简单地做一下该表达矩阵的QC检测: <a href="https://www.cnblogs.com/xiaofeiIDO/p/12448684.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12448585.html
KS检验详细介绍 - 萧飞IDO
本文参考:https://zhuanlan.zhihu.com/p/29399126(详细参考该链接,本文只是记录,以备后续查看) 6. 例子 1 对一台设备进行寿命检验,记录10次无故障工作时间,并按照从小到大的次序排列如下:(单位小时) 420 500 920 1380 1510 1650 17
2020-03-09T06:29:00Z
2020-03-09T06:29:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】本文参考:https://zhuanlan.zhihu.com/p/29399126(详细参考该链接,本文只是记录,以备后续查看) 6. 例子 1 对一台设备进行寿命检验,记录10次无故障工作时间,并按照从小到大的次序排列如下:(单位小时) 420 500 920 1380 1510 1650 17 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12448585.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12160140.html
VCF格式说明 - 萧飞IDO
VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面 号注释的的部分是对一些参数的解释(看英文能懂的话,下面的解释就不用看了),而下面没 号注释的部分则是各个参数对应的具体的值 一般先关
2020-01-07T02:33:00Z
2020-01-07T02:33:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面 号注释的的部分是对一些参数的解释(看英文能懂的话,下面的解释就不用看了),而下面没 号注释的部分则是各个参数对应的具体的值 一般先关 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12160140.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12074435.html
【R】tidyverse软件包,haven.so和readxl.so报错 - 萧飞IDO
安装错误 解决办法
2019-12-20T09:54:00Z
2019-12-20T09:54:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】安装错误 解决办法 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12074435.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/12050089.html
【Python】字符串格式化调用方法 - 萧飞IDO
一、基础知识 str.format()的使用语法 在主体字符串(string)中,花括号通过 位置 (例如,{1})或 关键字 (例如,{food})指出替换目标及将要插入的参数。 该方法创建并返回一个新的字符串对象,可以被立即打印或保存起来。 例如: 主体字符串也可以是一个临时字符串常量,并且 任
2019-12-16T13:04:00Z
2019-12-16T13:04:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】一、基础知识 str.format()的使用语法 在主体字符串(string)中,花括号通过 位置 (例如,{1})或 关键字 (例如,{food})指出替换目标及将要插入的参数。 该方法创建并返回一个新的字符串对象,可以被立即打印或保存起来。 例如: 主体字符串也可以是一个临时字符串常量,并且 任 <a href="https://www.cnblogs.com/xiaofeiIDO/p/12050089.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/11997696.html
机器学习:基于sklearn的AUC的计算原理 - 萧飞IDO
AUC原理 一、AUC起源 AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在 machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同
2019-12-06T13:00:00Z
2019-12-06T13:00:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】AUC原理 一、AUC起源 AUC是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在 machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常用的recall和precision,等等。其实,度量反应了人们对” 好”的分类结果的追求,同 <a href="https://www.cnblogs.com/xiaofeiIDO/p/11997696.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/11970205.html
机器学习:特征选择方法简介 - 萧飞IDO
特征选择是指在众多特征中选择有意义的特征,采用机器学习算法和模型进行训练。 特征选择有三个目的: 可解释性不仅让我们对模型效果的稳定性有更多把握,也能为业务运营等工作提供指引和决策支持。 特征的增多会大大提高模型的搜索空间,大多数模型需要的样本数目随着特征数量的增加而显著增加,特征的增加虽然能更好地
2019-12-02T05:50:00Z
2019-12-02T05:50:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】特征选择是指在众多特征中选择有意义的特征,采用机器学习算法和模型进行训练。 特征选择有三个目的: 可解释性不仅让我们对模型效果的稳定性有更多把握,也能为业务运营等工作提供指引和决策支持。 特征的增多会大大提高模型的搜索空间,大多数模型需要的样本数目随着特征数量的增加而显著增加,特征的增加虽然能更好地 <a href="https://www.cnblogs.com/xiaofeiIDO/p/11970205.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/11940173.html
机器学习(一):模型评估指标 - 萧飞IDO
在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标,针对不同机器学习问题如回归、分类、排序,其评估指标也会不同。 一、下面介绍常见的一些概念 表 1 常见的二分类混淆矩阵 从这个表格中可以引出一些其它的评价指标: - ACC:classification accuracy,描述分类器的分
2019-11-29T01:53:00Z
2019-11-29T01:53:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标,针对不同机器学习问题如回归、分类、排序,其评估指标也会不同。 一、下面介绍常见的一些概念 表 1 常见的二分类混淆矩阵 从这个表格中可以引出一些其它的评价指标: - ACC:classification accuracy,描述分类器的分 <a href="https://www.cnblogs.com/xiaofeiIDO/p/11940173.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/11947380.html
机器学习(二)-信息熵,条件熵,信息增益,信息增益比,基尼系数 - 萧飞IDO
一、信息熵的简介 2.1 信息的概念 信息是用来消除随机不确定性的东西。对于机器学习中的决策树而言,如果待分类的事物集合可以划分为多个类别当中,则第k类的信息可以定义如下: 2.2 信息熵概念 信息熵是用来度量不确定性,当熵越大,k的不确定性越大,反之越小。假定当前样本集合D中第k类样本所占的比例为
2019-11-28T02:39:00Z
2019-11-28T02:39:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】一、信息熵的简介 2.1 信息的概念 信息是用来消除随机不确定性的东西。对于机器学习中的决策树而言,如果待分类的事物集合可以划分为多个类别当中,则第k类的信息可以定义如下: 2.2 信息熵概念 信息熵是用来度量不确定性,当熵越大,k的不确定性越大,反之越小。假定当前样本集合D中第k类样本所占的比例为 <a href="https://www.cnblogs.com/xiaofeiIDO/p/11947380.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/11911113.html
Anaconda安装及R环境配置 - 萧飞IDO
一、Anaconda安装 本文是基于Ubuntu 16.04的Linux操作系统 Anaconda系统的下载:wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh Anaconda系统安装:sh Anacon
2019-11-22T05:51:00Z
2019-11-22T05:51:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】一、Anaconda安装 本文是基于Ubuntu 16.04的Linux操作系统 Anaconda系统的下载:wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh Anaconda系统安装:sh Anacon <a href="https://www.cnblogs.com/xiaofeiIDO/p/11911113.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/7010613.html
VCF文件-VCFv4.2示例解释 - 萧飞IDO
VCF文件示例(VCFv4.2) CHROM: 表示变异位点是在哪个contig 里call出来的,如果是人类全基因组的话那就是chr1…chr22,chrX,Y,M。 POS: 变异位点相对于参考基因组所在的位置,如果是indel,就是第一个碱基所在的位置。 ID: 如果call出来的SNP存在于
2019-11-12T13:05:00Z
2019-11-12T13:05:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】VCF文件示例(VCFv4.2) CHROM: 表示变异位点是在哪个contig 里call出来的,如果是人类全基因组的话那就是chr1…chr22,chrX,Y,M。 POS: 变异位点相对于参考基因组所在的位置,如果是indel,就是第一个碱基所在的位置。 ID: 如果call出来的SNP存在于 <a href="https://www.cnblogs.com/xiaofeiIDO/p/7010613.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/6999458.html
CPRIMER CHAP13 - 萧飞IDO
一、文件 C把文件看作一系列连续的字节,每个字节都是单独读取。 提供两种访问文件的路径:二进制模式和文本模式。 标准文件:标准输入、标准输出、标准错误输出 标准输入函数:getchar、scanf 1.1 getchar() C 库函数 int getchar(void) 从标准输入 stdin 获
2019-11-12T13:04:00Z
2019-11-12T13:04:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】一、文件 C把文件看作一系列连续的字节,每个字节都是单独读取。 提供两种访问文件的路径:二进制模式和文本模式。 标准文件:标准输入、标准输出、标准错误输出 标准输入函数:getchar、scanf 1.1 getchar() C 库函数 int getchar(void) 从标准输入 stdin 获 <a href="https://www.cnblogs.com/xiaofeiIDO/p/6999458.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/10858410.html
R语言-ggplot原点设置 - 萧飞IDO
ggplot2绘图结果往往X轴和Y轴的截距交点往往不是原点:譬如下图y轴就不是起始于0 调整坐标起始位点可以利用scale_y_continuous(expand = c(0, 0))或者scale_x_continuous(expand = c(0, 0)) expand的解释如下 A numer
2019-05-13T11:02:00Z
2019-05-13T11:02:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】ggplot2绘图结果往往X轴和Y轴的截距交点往往不是原点:譬如下图y轴就不是起始于0 调整坐标起始位点可以利用scale_y_continuous(expand = c(0, 0))或者scale_x_continuous(expand = c(0, 0)) expand的解释如下 A numer <a href="https://www.cnblogs.com/xiaofeiIDO/p/10858410.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/8974738.html
c++11 多线程简介 - 萧飞IDO
c++11 增加了的多线程的模块 头文件:#include <thread> 常用的几个函数简介 1. join() 该函数主要是运行子线程(并行运行),阻塞主线程,等待所有子线程完成时,继续执行主线程; 输出结果: 2. detach() 该函数将子线程与主线程分离,子线程不阻塞主线程,各自独立且
2018-04-30T13:20:00Z
2018-04-30T13:20:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】c++11 增加了的多线程的模块 头文件:#include <thread> 常用的几个函数简介 1. join() 该函数主要是运行子线程(并行运行),阻塞主线程,等待所有子线程完成时,继续执行主线程; 输出结果: 2. detach() 该函数将子线程与主线程分离,子线程不阻塞主线程,各自独立且 <a href="https://www.cnblogs.com/xiaofeiIDO/p/8974738.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/8865245.html
相关系数 - 萧飞IDO
https://www.zhihu.com/question/20852004/answer/134902061 1)Pearson积差相关系数:用于量度两个变量X和Y之间的线性相关。它具有+1和-1之间的值,其中1是总正线性相关性,0是非线性相关性,并且-1是总负线性相关性。Pearson相关系数
2018-04-17T05:54:00Z
2018-04-17T05:54:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】https://www.zhihu.com/question/20852004/answer/134902061 1)Pearson积差相关系数:用于量度两个变量X和Y之间的线性相关。它具有+1和-1之间的值,其中1是总正线性相关性,0是非线性相关性,并且-1是总负线性相关性。Pearson相关系数 <a href="https://www.cnblogs.com/xiaofeiIDO/p/8865245.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/8824217.html
R语言——linux离线安装R包 - 萧飞IDO
一般我们使用R都是在win环境下,安装R包非常简单,只要电脑联网了,执行命令install.packages()就可以。但是很多时候,我们的生产环境都是linux,且都无法上网,只能离线安装,下面讲述了how to install R packages offline. 方法1: 以安装clue包为
2018-04-13T13:54:00Z
2018-04-13T13:54:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】一般我们使用R都是在win环境下,安装R包非常简单,只要电脑联网了,执行命令install.packages()就可以。但是很多时候,我们的生产环境都是linux,且都无法上网,只能离线安装,下面讲述了how to install R packages offline. 方法1: 以安装clue包为 <a href="https://www.cnblogs.com/xiaofeiIDO/p/8824217.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/xiaofeiIDO/p/8796150.html
centos 之 JDK(JAVA)安装 - 萧飞IDO
0. 基本准备 在/usr/目录下创建java目录 mkdir /usr/java cd /usr/java 1. JAVA官网下载jdk http://www.oracle.com/technetwork/java/javase/downloads/jdk10-downloads-4416644.
2018-04-11T07:48:00Z
2018-04-11T07:48:00Z
萧飞IDO
https://www.cnblogs.com/xiaofeiIDO/
【摘要】0. 基本准备 在/usr/目录下创建java目录 mkdir /usr/java cd /usr/java 1. JAVA官网下载jdk http://www.oracle.com/technetwork/java/javase/downloads/jdk10-downloads-4416644. <a href="https://www.cnblogs.com/xiaofeiIDO/p/8796150.html" target="_blank">阅读全文</a>