摘要: 有一个列表,求出列表中重复元素,如 list1 = [1,2,4,3,6,4] 方法一、 方法二、Counter() 阅读全文
posted @ 2018-04-23 09:54 1直在路上1 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 一、PCA:(principal component analysis) 1、为何需要PCA 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。 拿到一个样本,特征非常多,而样例特别少,这样用回归去直接拟合非常困难,容易 阅读全文
posted @ 2018-04-15 14:26 1直在路上1 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 一、DBSCAN 1.简介: DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。 该算法要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于 阅读全文
posted @ 2018-04-15 09:15 1直在路上1 阅读(573) 评论(0) 推荐(0) 编辑
摘要: 集成~依赖~单元~投票~拟合~抗噪~生长~袋外 高大并重~噪多 基~串~投~敏~同~方 一、优势互补: RF属于集成学习,集成学习通过构建并结合多个分类器来完成学习任务,常可获得比单一学习器更好的泛化性能 一个简单例子:在二分类任务中,假定三个分类器在三个测试样本上的表现如下图,其中√表示分类正确, 阅读全文
posted @ 2018-04-13 17:38 1直在路上1 阅读(2695) 评论(0) 推荐(0) 编辑
摘要: 1.二分查找也叫折半查找,它是对于一组有序(升序或降序)数列来说的,举例:猜数字游戏 ,随机给出1-100内的一个数字,请猜出这个数字 那我们不能随机没有规律的去猜,这时考虑二分查找的思想 例如38 第一次猜50,告诉你猜大了,那么此时就在1-50内折半 第二次猜25,告诉你猜小了,那么此时就在26 阅读全文
posted @ 2018-04-13 16:34 1直在路上1 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 输入N个整数,输出其中最小的k个: 例如输入1,2,3,4,5,6,7,8,则最小的4个数字为1,2,3,4 阅读全文
posted @ 2018-04-13 14:28 1直在路上1 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 1.卡方检验中的k×2表资料: 如考察肿瘤负荷分为高,中,低的患者对药物的反应关系: P<0.05,,说明突变负荷与药物反应相关 下面讲解计算过程: 我们先假设突变负荷与药物反应无关,计算出response率 = 14 / (14 + 18) = 0.4375,no response率 = 0.56 阅读全文
posted @ 2018-04-12 13:52 1直在路上1 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 一、beeswarm作为一维散点图包R包,可以生成点不重复的图,与stripchart的区别就是等值点不会重叠到一起,下图展示了stripchart与beeswarm图的区别: OrchardSprays是R自带的数据,decrease 和 treatment必须是数据的header pch:描点的 阅读全文
posted @ 2018-04-11 16:47 1直在路上1 阅读(1601) 评论(0) 推荐(0) 编辑
摘要: Paper Name:Targeted Next Generation Sequencing Identifies Markers of Response to PD-1 Blockade Adress:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3435 阅读全文
posted @ 2018-04-11 10:10 1直在路上1 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 一、去掉字符串中的非数字字符 阅读全文
posted @ 2018-04-04 17:34 1直在路上1 阅读(248) 评论(0) 推荐(0) 编辑