摘要: TSS: Total Sum of Squares(总离差平方和) 因变量的方差 RSS: Residual Sum of Squares (残差平方和) 由误差导致的真实值和估计值之间的偏差平方和(Sum Of Squares Due To Error) ESS: Explained Sum of 阅读全文
posted @ 2019-03-29 16:31 HuZihu 阅读(39398) 评论(0) 推荐(1)
摘要: 众所周知,对于线性回归,我们把目标方程式写成:。 (其中,f(x)是自变量x和因变量y之间的关系方程式,表示由噪音造成的误差项,这个误差是无法消除的) 对y的估计写成:。 就是对自变量和因变量之间的关系进行的估计。一般来说,我们无从得之自变量和因变量之间的真实关系f(x)。假设为了模拟的缘故,我们设 阅读全文
posted @ 2019-03-28 09:32 HuZihu 阅读(5784) 评论(0) 推荐(1)
摘要: 统计学中最常见的几种概率分布分别是正态分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribution, chi-square distribution),其中后三种属于抽样分布。 为什么要研究概 阅读全文
posted @ 2019-02-15 14:50 HuZihu 阅读(42515) 评论(0) 推荐(1)
摘要: 在之前的文章《机器学习 线性回归(Machine Learning Linear Regression)》中说到,使用最小二乘回归模型需要满足一些假设条件。但是这些假设条件却往往是人们容易忽略的地方。如果不考虑模型的适用情况,就只会得到错误的模型。下面来看一下,使用最小二乘回归模型需要满足哪些假设, 阅读全文
posted @ 2019-02-11 21:40 HuZihu 阅读(17283) 评论(0) 推荐(0)
摘要: 在《机器学习 文本特征提取之词袋模型(Machine Learning Text Feature Extraction Bag of Words)》一文中,我们通过计算文本特征向量之间的欧氏距离,了解到各个文本之间的相似程度。当然,还有其他很多相似度度量方式,比如说余弦相似度。 在《皮尔逊相关系数与 阅读全文
posted @ 2019-01-10 14:54 HuZihu 阅读(10365) 评论(0) 推荐(2)
摘要: MongoDB简介(摘自:http://www.runoob.com/mongodb/mongodb-intro.html) MongoDB 由C++语言编写,是一个基于分布式文件存储的开源数据库系统。 MongoDB 将数据存储为一个文档,数据结构由键值对(key=>value)组成,类似于 JS 阅读全文
posted @ 2019-01-09 17:12 HuZihu 阅读(2073) 评论(0) 推荐(0)
摘要: 在网上有很多教程,教我们如何把MongoDB安装成一个服务。事实上,从4.0版本开始,MongoDB就可以自行安装成一个服务了(Install MongoDB as a service),同时自动建立文件储存目录(Data Directory)和日志目录(Log Directory)。具体步骤可见官 阅读全文
posted @ 2019-01-09 16:24 HuZihu 阅读(311) 评论(0) 推荐(0)
摘要: 简介 关系型数据库管理系统(RDBMS)用来操作建立在关系模型基础上的数据库,主要代表有:Microsoft SQL Server,Oracle,MySQL(开源)。 非关系型数据库(NoSQL),主要代表有:MongoDB,Redis。 ACID vs BASE ACIDBASE 原子性(Atom 阅读全文
posted @ 2019-01-08 15:47 HuZihu 阅读(4097) 评论(0) 推荐(0)
摘要: 以下摘录了爬虫经常用的正则表达式,如需更详细的信息,请查看崔庆才的个人网页: https://cuiqingcai.com/5530.html。 使用Python的re模块: 导入re模块: re.complie(pattern) 将正则字符串编译成正则表达式对象 re.findall(patter 阅读全文
posted @ 2019-01-04 15:33 HuZihu 阅读(484) 评论(0) 推荐(0)
摘要: 之前《皮尔逊相关系数(Pearson Correlation Coefficient, Pearson's r)》一文介绍了皮尔逊相关系数。那么,皮尔逊相关系数(Pearson Correlation Coefficient)和余弦相似度(Cosine Similarity)之间有什么关联呢? 首先 阅读全文
posted @ 2019-01-03 15:35 HuZihu 阅读(10012) 评论(0) 推荐(1)