摘要: #今天花了半天研究,终于搞明白一些,高兴之余,借此经验,以免再忘。 #注意,此方法对xgboost包时,还需要加其他步骤,还没研究清楚,xgboost比较麻烦,此方法适合大部分 #先看完,在操作,不然会坑 首先说下我的环境:win7 64位,Python 2.7,用的PyCharm IDE。 我是在 阅读全文
posted @ 2017-02-09 20:43 隔壁老任 阅读(2280) 评论(0) 推荐(0)
摘要: Word害我重写=_=顺便重新整理下思路 背景:写论文时用到遗传算法,花了近一周时间,还算理解了算法以及能够进行基础的编程实现(保持谦虚)。 说明:具体的实现没敢细讲,主要是原理的方法上的介绍(讲解都算不上)。 先说说算法学习,个人觉得首先需要了解这个算法是拿来干嘛的,然后学习它的理论原理,多看懂几 阅读全文
posted @ 2017-02-09 20:41 隔壁老任 阅读(20371) 评论(4) 推荐(1)
摘要: #一日一词# 最优问题: 简单说,最优问题就是求一个多元函数在某个给定集合上的极值(及一个函数在一个自变量取值区间内的一个应变量极值)。集合所有类型的最优问题都可以表示为以下数学模型: 填写图片摘要(选 填写图片摘要(选 其中,K为某个给定的集合,称为可行集或可行域,f(x)为定义在集合K上的实值函 阅读全文
posted @ 2017-02-09 20:37 隔壁老任 阅读(685) 评论(0) 推荐(0)
摘要: #一日一词# 今天在学习Python的时候,遇到了递归问题,案例呢就是经典的汉诺塔游戏,表示虽然以前就接触过这游戏,解起来也很容易,不过放在编程里,几行的代码可够我手推了一个多小时。╭∩╮(︶︿︶)╭∩╮ 当然也是感受到了搞清楚一个(我认为的)难题的乐趣,心情大好,买条裤子。 (表示从晚上一直整理到 阅读全文
posted @ 2017-02-09 20:36 隔壁老任 阅读(373) 评论(0) 推荐(0)
摘要: #一日一词#(嗝屁啊( `д′)) 百度百科:随机变量(random variable)表示随机试验各种结果的实值单值函数。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例。 某博客:设E是一个随机试验,其样本空间为S,若对每一个样本点e∈S,都有唯 阅读全文
posted @ 2017-02-09 20:31 隔壁老任 阅读(950) 评论(0) 推荐(0)
摘要: #一日一词# 在前一篇变异系数中,讲到不同样本不能直接比较其统计量。 在数据标准化中,首先说下针对不同组不同量纲的数据比较:样本数据标准化。如果比较两个样本中某一数值的大小,如班级中A同学的语文成绩和B两同学的数学成绩相比,谁更好?由于不能直接比较,(不能说语文108就没有数学123好)需要将样本数 阅读全文
posted @ 2017-02-09 20:30 隔壁老任 阅读(1715) 评论(0) 推荐(0)
摘要: #一日一词# 欧几里德距离指多维空间中两点间的距离,它是在m维空间中两个点之间的真实距离,就是一种用直尺测量出来的距离。 如果两个点记为(p1,p2,p3,…)和(q1,q2,q3,…),则距离公式为: 欧氏距离看作信号的相似程度。距离越近就越相似,就越容易相互干扰,误码率就越高。具体说就是两个事物 阅读全文
posted @ 2017-02-09 20:30 隔壁老任 阅读(754) 评论(0) 推荐(0)
摘要: #一日一词# 前一周找工作去了,整天累成狗 凸(艹皿艹 ),所以也没能做到一日一更,后续慢慢补上。( `д′) 结合之前的《标准差》 方差和标准差是用来反映一组数值变异程度的绝对值,其大小受到样本的值大小、计量单位等的影响,因此不能用于不同水平、不同计量单位的样本比较,即是说,针对来自不同总体的样本 阅读全文
posted @ 2017-02-09 20:29 隔壁老任 阅读(3221) 评论(0) 推荐(0)
摘要: #一日一词# 总体和样本 总体:指在某种共性的基础上由许多个别事物结合起来的整体。简言之总体是我们要调查或统计某一现象全部数据的集合。比如调查国内教师薪水情况中全中国的所有教师,调查某一高中高三学生成绩分布中所有的该校高三学生。(也是有一定范围的) 三大特点: ①同质性(共性)②大量性 ③差异性 总 阅读全文
posted @ 2017-02-09 20:28 隔壁老任 阅读(718) 评论(0) 推荐(0)
摘要: #一日一词# 素数,又叫质数,为在大于1的自然数中,除了1和它本身以外不再有其他因数的数。比如2、5、13。 合数,就是出素数以外的数,是除1和本身外还有其他因数的数。 作用? 作用大些的是素数,因为它很难找(指足够大的素数)。所以经常用在加密解密算法里,比如RSA算法。总之找一个足够大的素数和判断 阅读全文
posted @ 2017-02-09 20:27 隔壁老任 阅读(782) 评论(0) 推荐(0)
摘要: 因数指,如果有整数a、b、c,使得a*b=c,则称a和b为c得因数,c为a和b的倍数。换个方向理解呢,相当于能将整数c整除的所有数都是c的因数。 延伸出来的,有公因数,指某一整数a同时是b和c的因数,及能同时将b和c整除。 在什么地方用呢,比如如何求最大公因数(最大公约数): 辗转相除法(欧几里得算 阅读全文
posted @ 2017-02-09 20:26 隔壁老任 阅读(454) 评论(0) 推荐(0)
摘要: 茎叶图,又叫枝叶图。主要思路是将数据分成主干和分支两部分,再按照主干进行分类,这样就能大致的看出数据的分布情况。 话不多说,直接上: 图: 这里的数据,就是十位和个位,总的数据为:2,10,15,20,23,27。得知,该样本在20-30间的数值最多。 一般多的展示两组数据,三组以上就不方便看了。 阅读全文
posted @ 2017-02-09 20:25 隔壁老任 阅读(3462) 评论(0) 推荐(0)
摘要: #一日一词# ​离差:指单项数值和平均值的差,正负可以作为方向。用来反映某一数值与平均值的偏离程度(距离)。 离差平方和,就是每个数据与平均数差的平方的和。 通常呢,离差都是用来求标准差和方差的。 标准差(sd):用来反映样本数据离散程度的指标。多用来反映样本是否“稳重”。比如一学生整个学期的数学成 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(23521) 评论(0) 推荐(0)
摘要: #一日一词# 众数是在一组数据中,出现次数最多的数据,一组数据中的众数可以不止一个。 作用呢,也是作为描述性统计的一个指标,用来描述数据的分布情况。 众数不受极端值影响,尤其是在整体数据变动较大的情况下,众数更能描述数据的“集中趋势”。 相似延伸:众数不仅在数值型数据中可以使用,在文本数据中也可以。 阅读全文
posted @ 2017-02-09 20:24 隔壁老任 阅读(475) 评论(0) 推荐(0)
摘要: #一日一词# 指​一个样本中,将整体数据按数值大小排列,能将整体划分为个数相等的两部分的书,一般取顺序排列的数组中间一个数或者中间两个数的平均值。 有啥用? 也是作为描述性统计中重要一个指标,主要是用来描述样本的分布情况,尤其是在数据的极差较大、偏斜度较高的情况下。 但是光从平均数和中位数来看样本分 阅读全文
posted @ 2017-02-09 20:23 隔壁老任 阅读(378) 评论(0) 推荐(0)
摘要: #一日一词# ​含义内容:平均数包括三种:算术平均数(最常见的),集合平均数,调和平均数。用Excel中的AVERAGE函数可以求出(Average)。 分开来说; 算术平均数(mean):又称均值。计算方法即是将n个样本相加除以n,一般用表示。公式就不写了,博客写公式只能用图片,懒。 几何平均数( 阅读全文
posted @ 2017-02-09 20:22 隔壁老任 阅读(760) 评论(0) 推荐(0)
摘要: 前两天写了几个函数,对里面收获到的一些东西做一些记录。 函数str_comb,用于输入一个字符串或数值向量,返回由向量中元素组成的不重复的长度小于向量长度的所有组合,结果用矩阵形式输出。 函数使用结果如下: 思路很简单,在R中有个函数combn函数,能产生指定向量中元素组成的指定长度的组合,这个函数 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(6297) 评论(1) 推荐(0)
摘要: 写图片摘要(选填) 写图片摘要(选填) 阅读全文
posted @ 2017-02-09 20:21 隔壁老任 阅读(194) 评论(0) 推荐(0)
摘要: #小魔仙 ​#参考:美Brett Lantz的《机器学习与R语言》,周志华老师的《机器学习》 #仅供个人学习用 #比较长和啰嗦,提醒自己:最好使用电脑看,手机看长篇大论总是不太合适 ​ 这两天学R与机器学习,真心赶脚R太简单化了,转到吴恩达老师的课时,又觉得脑子转不过来,基础没打好。关于决策树,首先 阅读全文
posted @ 2017-02-09 20:20 隔壁老任 阅读(818) 评论(0) 推荐(0)
摘要: 名词: 挖掘数据集:购物篮数据 挖掘目标:关联规则 关联规则:啤酒=>尿布(支持度0.02,置信度0.6) 支持度:所有数据中有2%的购物记录包含了啤酒和尿布 置信度:所有包含啤酒的购物记录里有60%包含尿布 最小支持度阈值和最小置信度阈值。 项集:项(商品)组成的集合 K-项集:k个项组成的集合 阅读全文
posted @ 2017-02-09 20:18 隔壁老任 阅读(4215) 评论(0) 推荐(0)
摘要: (学*笔记,来源于美Brett Lantz著,李洪成译的《机器学*与R语言》) 也应当和算法学*类似,首先搞清楚算法/方法的原理,再考虑实现问题。 1、邻*分类概念 首先已经看出来这是用于分类的一类方法,不是某一个算法,原理是先把训练数据进行训练并标记,然后将未标记的案例归类为与之最相*的已标记的案 阅读全文
posted @ 2017-02-09 20:18 隔壁老任 阅读(663) 评论(0) 推荐(0)
摘要: 1、条形图:barplot(height,[main,xlab,ylab,horiz,…]) height为一个向量或矩阵,main为标题,xlab为x轴标题,horiz为水平后垂直,有TRUE(水平)和FALSE(垂直)值。 堆砌条形图、分组条形图、均值条形图、棘状图。 ​ 2、饼图:pie(x, 阅读全文
posted @ 2017-02-09 20:17 隔壁老任 阅读(314) 评论(0) 推荐(0)
摘要: 啧啧,最初想的是以玩笑的口吻来做笔记,果然后面更多的是想赶时间,完成任务,哎,不过现在时间打紧,我还是得加把劲儿了!b( ̄▽ ̄)d Address属性 返回某个单元格的地址;如: MsgBox”当前选中的单元格地址为:”&Selection.Address Selection是对活动工作表中当前选中 阅读全文
posted @ 2017-02-09 20:16 隔壁老任 阅读(389) 评论(0) 推荐(0)
摘要: 事件是什么:事件类似于已经设定好的,能让excel自动判定和反应的动作或者过程。书说:事件就是一个能被对象识别的操作。 如,打开excel时,显示文字“忙碌的一天又开始了”。 首先,事件是在对象的基础上,这里的对象为“打开工作簿”,即Workbook。双击“ThisWorkbook”模块,在“通用” 阅读全文
posted @ 2017-02-09 20:16 隔壁老任 阅读(228) 评论(0) 推荐(0)
摘要: Range对象代表工作表中的单元格或单元格区域,包含在worksheet对象中。 引用Range: 直接写清楚哪个工作簿下的哪个表格下的哪个单元格即可。o( ̄▽ ̄)d Worksheets(“sheet1”).Range(“D3”).select 可以选中区域:Range(“A1:D3”).sele 阅读全文
posted @ 2017-02-09 20:15 隔壁老任 阅读(1651) 评论(0) 推荐(0)
摘要: WorkSheet和workSheets的关系:workSheet是单个工作表,workSheets是指定工作簿中所有工作表的集合。 对象名称与工作表名称:每个工作表都有两个名,工作表名或者标签名称即看到的工作表的名称,如“sheet1”、“工资表”,对象名称或者代码名称,一般只为“sheet1”, 阅读全文
posted @ 2017-02-09 20:14 隔壁老任 阅读(15364) 评论(0) 推荐(0)
摘要: Workbooks对象集 VBA电子文档位置:https://msdn.microsoft.com/zh-cn/library/ff835568.aspx 参考网址:http://www.360doc.com/userhome/7835172# (馆主:fzchenwl) 当前所有打开的工作簿对象的 阅读全文
posted @ 2017-02-09 20:13 隔壁老任 阅读(2007) 评论(0) 推荐(0)
摘要: 对象就是我们Excel和程序的操作对象。比如单元格、工作簿。我们对于Excel的每个操作其实都是对相应对象的操作。比如选中单元格、保存工作表。 对象存放在对象模型里,2013以上版本似乎已经没有离线文档,只有在线的:https://msdn.microsoft.com/ZH-CN/library/f 阅读全文
posted @ 2017-02-09 20:12 隔壁老任 阅读(754) 评论(0) 推荐(0)
摘要: 过程(procedure): VBA过程就是完成某个给定任务的代码的有序组合。就类似于一个有目的性的行为,一个完整的行为就是一个过程。注意“有序”二字。 VBA过程分为Subroutine(子程序)过程和Function(函数)过程,关键字为Sub和Function,都可以获取参数、执行一系列语句、 阅读全文
posted @ 2017-02-09 20:11 隔壁老任 阅读(5259) 评论(0) 推荐(0)
摘要: 几个语句 If…then语句 If A then B:如果A判断条件成立,则执行B语句; Eg:if time >0.5 then msgbox”下午好” “time>0.5”:time函数返回当前时间,大于0.5指现在是12点后,即显示下午好。 也有if A then B else C:如果判断条 阅读全文
posted @ 2017-02-09 20:09 隔壁老任 阅读(3530) 评论(0) 推荐(0)
摘要: 最近懒得很,。。。反正我自己看(~ ̄▽ ̄)~ 对象:一对儿大象!——用代码操作和控制的东西即为对象,如工作簿、图片等。对象是相对的,比如B是A的对儿象,A也可能是C的对儿象,一个对儿象可以包含多个对象。 集合:多个同类型的对象。参考数组。同时集合也是对象的一种。如一个工作簿可以包含255张工作表,这 阅读全文
posted @ 2017-02-09 20:07 隔壁老任 阅读(1721) 评论(0) 推荐(0)
摘要: 不同的数据类型有不同的使用范围,这对这些数据类型,VBA也有不同的运算符供使用。主要分为算术运算符、比较xxx、连接xxx和逻辑运算符。 (在Excel中,运算符包括算术运算符、比较xxx、文本连接运算符和引用运算符,这里别搞混了。) 算术运算符:用于算术运算, 返回值为数值型的运算符。 比较运算符 阅读全文
posted @ 2017-02-09 20:07 隔壁老任 阅读(428) 评论(0) 推荐(0)
摘要: 数组是变量的一种,是同一类型变量的集合,与C语言啊里面的数组相似。 注意几点:数组名,数组长度,数据类型,索引,变量 声明数组和赋值 数组声明中要写清楚数组的长度(大小), Public(Dim)数组名 (a to b) As 数据类型; :Public和Dim针对不同的作用域,“a to b”指定 阅读全文
posted @ 2017-02-09 20:06 隔壁老任 阅读(583) 评论(0) 推荐(0)
摘要: 1.几种不同的声明:公共变量:Public 变量名 As 数据类型 私有变量:Private 变量名 As 数据类型 静态变量:Static 变量名 As 数据类型 Dim的声明是最常见的声明,包括以上三种,都是针对变量不同的作用域来选择如何声明的,和咱们学的编程语言一样一样的,全局变量和局部变量。 阅读全文
posted @ 2017-02-09 20:05 隔壁老任 阅读(37702) 评论(0) 推荐(0)
摘要: 了解VBA以及简单的开头基础(让我想起了各种语言( ̄_, ̄ ) (说明,此经验参考Excel Home编写的《别怕,Excel VBA其实很简单》,只作个人学习用) 1、几个概念: 代码:构成VBA程序的部件 过程:用VBA代码吧完成一个任务的所有操作保存起来就是过程。 模块:保存过程的地方,一个模 阅读全文
posted @ 2017-02-09 20:04 隔壁老任 阅读(838) 评论(0) 推荐(0)
摘要: 对于规划求解,前一个是我熟悉常用的,然而在很久以前,接触excel,还有另一种写法。(当然,最好的方法是你熟悉的方法,没有美女的请情况下不要随便装13.) 我们上次在编写约束条件时,用的是如下:​ 三个约束条件,不过当约束条件多得够呛的时候,你就会嫌烦了。所以来了解下另一种写法。依旧是这个例子: 上 阅读全文
posted @ 2017-02-09 20:03 隔壁老任 阅读(649) 评论(0) 推荐(0)
摘要: 本人记性不好,这些经验主要给自己看。 excel规划求解,我使用的是excel365,功能界面和excel2010相差不大。 ​首先关于如何加载规划求解工具不多说。 规划求解加载项,打钩 规划求解加载项,打钩 加载完成后,在“数据”选项卡(还是叫工具栏)最右侧会有“规划求解”的选项。 首先进行数据的 阅读全文
posted @ 2017-02-09 20:01 隔壁老任 阅读(1918) 评论(0) 推荐(0)
摘要: 前期我会把我以前在新浪博客(@任虹屏)的经验搬过来,并不是copy他人成果。以此说明。 没想到还有150字的要求,那这里在进一步说明,这里的博文主要用于个人经验积累,以便日后复习和查询,也希望能对他人有所帮助。 涉及的内容主要有R语言,office的VBA,机器学习,算法,后期应该会有Python相 阅读全文
posted @ 2017-02-09 18:43 隔壁老任 阅读(139) 评论(0) 推荐(0)