随笔分类 - 西瓜书习题
记录部分机器学习(周志华西瓜书)的解答
西瓜书习题7.1
摘要:题目描述 试用极大似然法估计西瓜数据集3.0中前3个属性的类条件概率。 解答 如果不用极大似然法,直接根据 $$ P(x_i,c)=\frac{|D_{c,x_i}|}{|D|} $$ 也可以求出条件概率,和用极大似然估计做出一样。但题目要求用极大似然估计,那还是套用一下极大似然法。 这里需要估计的
阅读全文
西瓜书习题3.5
摘要:题目描述 编程实现线性判别分析,并给出西瓜数据集3.0$\alpha$上的结果。 解答 直接根据公式计算即可,根据公式(3.39) $$ w = S_w^{ 1}(\mu_0 \mu_1) $$ 其中$\mu_0$, $\mu_1$ 分别是0类(坏瓜)和1类(好瓜)的各个属性的均值向量,其长度就是属
阅读全文
西瓜书习题3.4
摘要:问题描述 选择两个 "UCI数据集" ,比较10折交叉验证法和留一法所估计出的对率回归的错误率。 解答 选了一个 "wine" 的数据集,一共将近1600条数据,留一法快把电脑跑死机了。 Logistic 回归可以用 sklearn 库,这里用 "上一节" 写的函数,稍微修改一下学习率等。最终算的是
阅读全文
西瓜书习题3.3
摘要:题目描述: 编程实现对率回归,并给出西瓜数据集3.0$\alpha$上的结果。 编程实现 对数几率回归最小化损失函数(西瓜书公式3.27)如下: $$ l(\beta) = \sum_{i=1}^m ( y_i\beta ^T x_i + ln(1+e^{\beta^T x_i})) $$ 证明:
阅读全文
西瓜书习题3.2
摘要:题目描述 试证明,对于参数 $\omega$,对率回归的目标函数(3.18)是非凸的,但其对数似然函数(3.27)是凸的。 证明方法 凸函数的二阶条件,如果$f(x)$是凸函数的充要条件 $$ \nabla ^2 f(x) \succeq 0 $$ 对定义域内所有$x$成立,且$f(x)$ 定义域为
阅读全文
西瓜书习题2.4
摘要:题目描述: 试述真正例率(TPR)、假正例率(FPR)与查准率(P)、查全率(R)之间的联系。 解答: 定义 $$ TPR = \frac{TP}{TP+FN}=\frac{预测为正例中真的是正例的个数}{样本中的正例数} $$ $$ FPR = \frac{FP}{TP+FN}=1 TPR=\fr
阅读全文
西瓜书习题2.3
摘要:题目描述: 若学习器$A$的$F1$值比学习器$B$高,试析$A$的BEP值是否也比$B$高。 解答: BEP BEP("Break Even Point"):平衡点。它是“查全率=查准率”时查全率的值。 F1 $F1$是基于查准率$P$与查全率$R$的调和平均 $$ \frac{1}{F1} =
阅读全文
西瓜书习题2.2
摘要:题目描述: 数据集包含100个样本,其中正、反例各一半,假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别(训练样本数相同时进行随机预测),试给出用10折交叉验证法和和留一法分别对错误率进行评估所得的结果。 解答: 错误率 如果在$m$个样本中有$a$个样本分类错误,则错误率$E=a/m$
阅读全文