11 2019 档案

机器学习(一):模型评估指标
摘要:在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标,针对不同机器学习问题如回归、分类、排序,其评估指标也会不同。 一、下面介绍常见的一些概念 表 1 常见的二分类混淆矩阵 从这个表格中可以引出一些其它的评价指标: - ACC:classification accuracy,描述分类器的分 阅读全文

posted @ 2019-11-29 09:53 萧飞IDO 阅读(1030) 评论(0) 推荐(0)

机器学习(二)-信息熵,条件熵,信息增益,信息增益比,基尼系数
摘要:一、信息熵的简介 2.1 信息的概念 信息是用来消除随机不确定性的东西。对于机器学习中的决策树而言,如果待分类的事物集合可以划分为多个类别当中,则第k类的信息可以定义如下: 2.2 信息熵概念 信息熵是用来度量不确定性,当熵越大,k的不确定性越大,反之越小。假定当前样本集合D中第k类样本所占的比例为 阅读全文

posted @ 2019-11-28 10:39 萧飞IDO 阅读(5538) 评论(0) 推荐(1)

Anaconda安装及R环境配置
摘要:一、Anaconda安装 本文是基于Ubuntu 16.04的Linux操作系统 Anaconda系统的下载:wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh Anaconda系统安装:sh Anacon 阅读全文

posted @ 2019-11-22 13:51 萧飞IDO 阅读(6226) 评论(0) 推荐(0)

VCF文件-VCFv4.2示例解释
摘要:VCF文件示例(VCFv4.2) CHROM: 表示变异位点是在哪个contig 里call出来的,如果是人类全基因组的话那就是chr1…chr22,chrX,Y,M。 POS: 变异位点相对于参考基因组所在的位置,如果是indel,就是第一个碱基所在的位置。 ID: 如果call出来的SNP存在于 阅读全文

posted @ 2019-11-12 21:05 萧飞IDO 阅读(1672) 评论(0) 推荐(0)

CPRIMER CHAP13
摘要:一、文件 C把文件看作一系列连续的字节,每个字节都是单独读取。 提供两种访问文件的路径:二进制模式和文本模式。 标准文件:标准输入、标准输出、标准错误输出 标准输入函数:getchar、scanf 1.1 getchar() C 库函数 int getchar(void) 从标准输入 stdin 获 阅读全文

posted @ 2019-11-12 21:04 萧飞IDO 阅读(103) 评论(0) 推荐(0)

导航