随笔档案「2021年5月」 - 纵横捭阖行

常见算法及python代码续

摘要：4.机器调度问题 m台机器，n个任务，每个任务时间可能不一致，求如何分配，在最短的时间完成任务？ def machine(time_list,m): time_list.sort(reverse=True) if len(time_list)<=m: return time_list[0] else 阅读全文

posted @ 2021-05-31 16:45 纵横捭阖行阅读(86) 评论(0) 推荐(0)

常见算法简介及python代码

摘要：1.冒泡排序 def bubblesort(nums): for i in range(len(nums)-1): for j in range(len(nums)-i-1):if nums[j]>nums[j+1]: nums[j],nums[j+1] =nums[j+1],nums[j] ret 阅读全文

posted @ 2021-05-31 14:39 纵横捭阖行阅读(152) 评论(0) 推荐(0)

机器学习之回归算法（3.0）

摘要：线性回归（正规方程求解，损失函数形式为最小二乘法）案例： from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing 阅读全文

posted @ 2021-05-26 15:21 纵横捭阖行阅读(130) 评论(0) 推荐(0)

机器学习之分类算法-决策树、随机森林（2.3）

摘要：决策树的三种算法实现当然决策树的原理不止信息增益这一种，还有其他方法。但是原理都类似，我们就不去举例计算。 ID3 信息增益最大的准则 C4.5 信息增益比最大的准则 CART 分类树: 基尼系数最小的准则在sklearn中可以选择划分的默认原则优势：划分更加细致（从后面例子的树显示来理阅读全文

posted @ 2021-05-26 13:30 纵横捭阖行阅读(128) 评论(0) 推荐(0)

机器学习之分类算法-朴素贝叶斯（2.2）

摘要：朴素？假设：特征与特征之间是相互独立贝叶斯公式（变式如下）： P(B|A)=P(A|B)*P(B)/P(A) 应用场景：文本分类单词作为特征拉普拉斯平滑系数：目的：防止计算出的分类概率为0 计算出现影院,支付宝,云计算属于娱乐的概率？(未算分母P(A）) P(娱乐|影院,支付宝,云计阅读全文

posted @ 2021-05-26 11:31 纵横捭阖行阅读(68) 评论(0) 推荐(0)

机器学习之分类算法-KNN（2.1）

摘要：KNN核心思想：你的“邻居”来推断出你的类别计算距离：欧氏距离曼哈顿距离绝对值距离明可夫斯基距离如果取的最近的电影数量不一样？会是什么结果？ k 值取得过小，容易受到异常点的影响 k 值取得过大，样本不均衡的影响（投票机制，少数服从多数，一般取奇数）结合前面数据，分析K-近邻算法需要阅读全文

posted @ 2021-05-26 10:52 纵横捭阖行阅读(133) 评论(0) 推荐(0)

机器学习之分类算法（2.0）

摘要：转换器 - 特征工程的父类 1 实例化 (实例化的是一个转换器类(Transformer)) 2 调用fit_transform(对于文档建立分类词频矩阵，不能同时调用) 标准化： (x - mean) / std fit_transform() fit() 计算每一列的平均值、标准差 trans 阅读全文

posted @ 2021-05-26 10:03 纵横捭阖行阅读(70) 评论(0) 推荐(0)

机器学习之特征工程-降维（1.2）

摘要：降维的两种方式特征选择主成分分析（可以理解一种特征提取的方式）降维：是指在某些限定条件下，降低随机变量(特征)个数，得到一组“不相关”主变量的过程特征选择：数据中包含冗余或无关变量（或称特征、属性、指标等），旨在从原有特征中找出主要特征。 Filter(过滤式)：主要探究特征本身特点、特征与阅读全文

posted @ 2021-05-25 17:38 纵横捭阖行阅读(491) 评论(0) 推荐(0)

机器学习之特征工程（1.1）

摘要：为什么我们要进行归一化/标准化？特征的单位或者大小相差较大，或者某特征的方差相比其他的特征要大出几个数量级，容易影响（支配）目标结果，使得一些算法无法学习到其它的特征我们需要用到一些方法进行无量纲化，使不同规格的数据转换到同一规格归一化： from sklearn.preprocessing 阅读全文

posted @ 2021-05-25 17:14 纵横捭阖行阅读(91) 评论(0) 推荐(0)

机器学习之特征工程（1.0）

摘要：2.1 数据集 Kaggle网址：https://www.kaggle.com/datasets UCI数据集网址： http://archive.ics.uci.edu/ml/ scikit-learn网址：http://scikit-learn.org/stable/datasets/index 阅读全文

posted @ 2021-05-25 16:58 纵横捭阖行阅读(104) 评论(0) 推荐(0)

机器学习初篇（0.2）

摘要：1.3 机器学习算法分类学习目标目标说明机器学习算法监督学习与无监督学习的区别说明监督学习中的分类、回归特点应用无分析1.2中的例子：特征值：猫/狗的图片；目标值：猫/狗-类别分类问题特征值：房屋的各个属性信息；目标值：房屋价格-连续型数据回归问题特征值：人物的各个属性信息；阅读全文

posted @ 2021-05-20 17:35 纵横捭阖行阅读(62) 评论(0) 推荐(0)

机器学习初篇（0.1）

摘要：1.2 什么是机器学习 1.2.1 定义机器学习是从数据中自动分析获得模型，并利用模型对未知数据进行预测。 1.2.2 解释我们人从大量的日常经验中归纳规律，当面临新的问题的时候，就可以利用以往总结的规律去分析现实状况，采取最佳策略。从数据（大量的猫和狗的图片）中自动分析获得模型（辨别猫和狗的阅读全文

posted @ 2021-05-20 17:08 纵横捭阖行阅读(68) 评论(0) 推荐(0)

机器学习初篇（0.0）

摘要：1.1 人工智能概述 1.1.1 机器学习与人工智能、深度学习机器学习和人工智能，深度学习的关系机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来达特茅斯会议-人工智能的起点 1956年8月，在美国汉诺斯小镇宁静的达特茅斯学院中，约翰·麦卡锡（John McCarthy）阅读全文

posted @ 2021-05-20 16:57 纵横捭阖行阅读(92) 评论(0) 推荐(0)

纵横捭阖行

05 2021 档案

公告