随笔档案「2021年9月」 - Lecoww

(笔记sklearn入门 3.3 逻辑回归、聚类

摘要：逻辑回归是解决二分类问题的利器: 广告点击率判断用户的性别预测用户是否会购买给定的商品类判断一条评论是正面的还是负面的逻辑回归公式：良／恶性乳腺癌肿瘤预测 API:sklearn.linear_model.LogisticRegression import pandas as pd imp 阅读全文

posted @ 2021-09-28 23:49 Lecoww 阅读(142) 评论(0) 推荐(0)

(笔记)sklearn入门 3.2 过拟合与欠拟合、岭回归、模型的保存与加载

摘要：过拟合与欠拟合欠拟合（欠配）：训练样本的一般特性尚未学好，通常是由于学习能力低下而造成的。过拟合（过配）：最常见的情况是由于学习能力过于强大，以至于把训练样本所包含的不太一般的特性都学习到了。一个假设在训练数据上能够获得比其他假设更好的拟合，但是在训练数据外的数据集上却不能很好地拟合数据，此阅读全文

posted @ 2021-09-27 23:00 Lecoww 阅读(195) 评论(0) 推荐(0)

(笔记)sklean入门 3.1 线性回归

摘要：开学没时间，就直接放代码了。。。线性回归器是最为简单、易用的回归模型。从某种程度上限制了使用，尽管如此，在不知道特征之间关系的前提下，我们仍然使用线性回归器作为大多数系统的首要选择。小规模数据：LinearRegression(不能解决拟合问题)以及其它大规模数据：SGDRegressor 阅读全文

posted @ 2021-09-23 21:04 Lecoww 阅读(91) 评论(0) 推荐(0)

(笔记)sklearn入门 2.3 决策树

摘要：决策树零基础入门，关于基尼系数的决策树，上课无聊刷手机刷到的（熵、信息增益、基尼系数知乎上看到的，比较好看懂下面都是看视频的截图和代码( 信息熵例子：决策树常见决策树使用的算法 ID3 信息增益最大的准则 C4.5 信息增益比最大的准则 CART 回归树: 平方误差最小分类树: 阅读全文

posted @ 2021-09-21 20:35 Lecoww 阅读(198) 评论(0) 推荐(0)

(笔记)sklearn入门 2.2 KNN和朴素贝叶斯，精确率召回率，GridSearchCV调优

摘要：k近邻算法(KNN) 定义：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。来源：KNN算法最早是由Cover和Hart提出的一种分类算法优点：简单，易于理解，易于实现，无需估计参数，无需训练缺点：懒惰算法，对测试样本分类时阅读全文

posted @ 2021-09-15 20:14 Lecoww 阅读(1452) 评论(0) 推荐(0)

3295. 星际旅行（计算几何）

摘要：题意：n维空间中存在一个超维球，求2点不通过圆（可以经过球表面）的最短距离解：两点确定一条直线，3点确定一个平面，有了球心和另外两点就可以确定出一个2维平面，直接以球心为原点，其中一个点为X轴上一点建2维坐标系（这个点的坐标为(它和球心的距离, 0)）。之后就是求线段和圆的位置关系了。 ↓直接从* 阅读全文

posted @ 2021-09-12 22:23 Lecoww 阅读(160) 评论(0) 推荐(0)

(笔记)sklearn入门 2.1 数据集的划分和流行数据集获取、转换器和估计器介绍

摘要：数据集划分机器学习一般的数据集会划分为两个部分：训练数据（训练集）：用于训练，构建模型测试数据（测试集）：在模型检验时使用，用于评估模型是否有效训练集和测试集的比一般有7:3, 4:1, 3:1 划分的api : sklearn.model_selection.train_test_spli 阅读全文

posted @ 2021-09-12 18:28 Lecoww 阅读(310) 评论(0) 推荐(0)

(笔记)sklearn入门 1.2

摘要：单纯的调库，没有原理和数学推导。。。数据降维 1、特征选择 2、主成分分析特征选择特征选择的原因：冗余：部分特征的相关度高，容易消耗计算性能噪声：部分特征对预测结果有负影响特征选择是什么？特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征，特征在选择前和选择后可以改变值、阅读全文

posted @ 2021-09-11 21:38 Lecoww 阅读(83) 评论(0) 推荐(0)

(笔记)sklearn入门 1.1

摘要：数据集的组成机器学习的数据一般从文件中读取，而不是从数据库中读取。比如说mysql：1、性能有瓶颈；2、格式不太符合机器学习数据的格式。数据的处理工具：读取工具：pandas 释放了GIL，速度非常快：numpy GIL锁（CPython多线程操作的锁限制（历史遗留问题））： In CPyth 阅读全文

posted @ 2021-09-11 16:54 Lecoww 阅读(212) 评论(0) 推荐(1)

计算几何基础（入土）知识

摘要：施工中。。。目录笔记板子向随笔暂时只有2维，有时间再去弄个三维的 1、一些基础运算函数与结构体定义（部分板子） 2、一些基础的变换公式一、一些基础运算函数与结构体定义 double pi = acos(-1); const double eps = 1e-6; inline int dcmp 阅读全文

posted @ 2021-09-10 18:49 Lecoww 阅读(161) 评论(0) 推荐(0)

（淀粉质）P2634 [国家集训队]聪聪可可 and P3806 多次离线查询树上距离为k的点对是否存在

摘要：一句话点分治：每次找到树的重心，暴力或者不暴力处理以这个重心为分界点的各个子树之间产生的贡献，然后删除这个点，产生很多树，对每棵子树重复上述操作。。。有点像dsu on tree，都是通过均摊来实现nlogn P3806 提供一种离线处理询问的做法：点分的过程中在对root的单独处理时，每阅读全文

posted @ 2021-09-08 18:02 Lecoww 阅读(46) 评论(0) 推荐(0)

lecoww disappear forever

09 2021 档案

公告