05 2021 档案

摘要:4.机器调度问题 m台机器,n个任务,每个任务时间可能不一致,求如何分配,在最短的时间完成任务? def machine(time_list,m): time_list.sort(reverse=True) if len(time_list)<=m: return time_list[0] else 阅读全文
posted @ 2021-05-31 16:45 纵横捭阖行 阅读(86) 评论(0) 推荐(0)
摘要:1.冒泡排序 def bubblesort(nums): for i in range(len(nums)-1): for j in range(len(nums)-i-1):if nums[j]>nums[j+1]: nums[j],nums[j+1] =nums[j+1],nums[j] ret 阅读全文
posted @ 2021-05-31 14:39 纵横捭阖行 阅读(152) 评论(0) 推荐(0)
摘要:线性回归(正规方程求解,损失函数形式为最小二乘法) 案例: from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing 阅读全文
posted @ 2021-05-26 15:21 纵横捭阖行 阅读(130) 评论(0) 推荐(0)
摘要:决策树的三种算法实现 当然决策树的原理不止信息增益这一种,还有其他方法。但是原理都类似,我们就不去举例计算。 ID3 信息增益 最大的准则 C4.5 信息增益比 最大的准则 CART 分类树: 基尼系数 最小的准则 在sklearn中可以选择划分的默认原则 优势:划分更加细致(从后面例子的树显示来理 阅读全文
posted @ 2021-05-26 13:30 纵横捭阖行 阅读(128) 评论(0) 推荐(0)
摘要:朴素? 假设:特征与特征之间是相互独立 贝叶斯公式(变式如下): P(B|A)=P(A|B)*P(B)/P(A) 应用场景: 文本分类 单词作为特征 拉普拉斯平滑系数: 目的:防止计算出的分类概率为0 计算出现 影院,支付宝,云计算 属于娱乐的概率?(未算分母P(A)) P(娱乐|影院,支付宝,云计 阅读全文
posted @ 2021-05-26 11:31 纵横捭阖行 阅读(68) 评论(0) 推荐(0)
摘要:KNN核心思想: 你的“邻居”来推断出你的类别 计算距离: 欧氏距离 曼哈顿距离 绝对值距离 明可夫斯基距离 如果取的最近的电影数量不一样?会是什么结果? k 值取得过小,容易受到异常点的影响 k 值取得过大,样本不均衡的影响(投票机制,少数服从多数,一般取奇数) 结合前面数据,分析K-近邻算法需要 阅读全文
posted @ 2021-05-26 10:52 纵横捭阖行 阅读(133) 评论(0) 推荐(0)
摘要:转换器 - 特征工程的父类 1 实例化 (实例化的是一个转换器类(Transformer)) 2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 标准化: (x - mean) / std fit_transform() fit() 计算 每一列的平均值、标准差 trans 阅读全文
posted @ 2021-05-26 10:03 纵横捭阖行 阅读(70) 评论(0) 推荐(0)
摘要:降维的两种方式 特征选择 主成分分析(可以理解一种特征提取的方式) 降维:是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 特征选择:数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。 Filter(过滤式):主要探究特征本身特点、特征与 阅读全文
posted @ 2021-05-25 17:38 纵横捭阖行 阅读(491) 评论(0) 推荐(0)
摘要:为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征 我们需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 归一化: from sklearn.preprocessing 阅读全文
posted @ 2021-05-25 17:14 纵横捭阖行 阅读(91) 评论(0) 推荐(0)
摘要:2.1 数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-learn网址:http://scikit-learn.org/stable/datasets/index 阅读全文
posted @ 2021-05-25 16:58 纵横捭阖行 阅读(104) 评论(0) 推荐(0)
摘要:1.3 机器学习算法分类 学习目标 目标 说明机器学习算法监督学习与无监督学习的区别 说明监督学习中的分类、回归特点 应用 无 分析1.2中的例子: 特征值:猫/狗的图片;目标值:猫/狗-类别 分类问题 特征值:房屋的各个属性信息;目标值:房屋价格-连续型数据 回归问题 特征值:人物的各个属性信息; 阅读全文
posted @ 2021-05-20 17:35 纵横捭阖行 阅读(62) 评论(0) 推荐(0)
摘要:1.2 什么是机器学习 1.2.1 定义 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 1.2.2 解释 我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。 从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的 阅读全文
posted @ 2021-05-20 17:08 纵横捭阖行 阅读(68) 评论(0) 推荐(0)
摘要:1.1 人工智能概述 1.1.1 机器学习与人工智能、深度学习 机器学习和人工智能,深度学习的关系 机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来 达特茅斯会议-人工智能的起点 1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中, 约翰·麦卡锡(John McCarthy) 阅读全文
posted @ 2021-05-20 16:57 纵横捭阖行 阅读(92) 评论(0) 推荐(0)