随笔分类 - 机器学习
摘要:人物头像动漫化: 源程序代码(注释已经尽可能详细): 运行结果如下: access_token的数值: 原照片: 动漫化后的照片: 人物头像动漫化(戴口罩): 源程序代码如下(注释已经尽可能详细): 运行结果如下: 有问题请留言(点个赞呗!~~~ 里面应用的是百度ai官网申请的数据。 人物头像动漫化
阅读全文
摘要:模型保存和加载 sklearn模型的保存和加载API from sklearn.externals import joblib 保存:joblib.dump(rf, 'test.pkl') 加载:estimator = joblib.load('test.pkl') 线性回归的模型保存加载案例 #4
阅读全文
摘要:逻辑回归: 逻辑回归的应用场景 广告点击率 是否为垃圾邮件 是否患病 金融诈骗 虚假账号 看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器 逻辑回归的原理 输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的
阅读全文
摘要:什么是过拟合与欠拟合: 分析 第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。 第二种情况:机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。 定义
阅读全文
摘要:线性模型 线性回归应用场景 什么是线性回归 定义与公式 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为单变量回归,大于一个自变量情况的叫做多元回归 那么怎么理解呢?我们
阅读全文
摘要:朴素贝叶斯算法 什么是朴素贝叶斯分类方法 条件概率与联合概率 联合概率:包含多个条件,且所有条件同时成立的概率 记作:P(A,B) 特性:P(A, B) = P(A)P(B) 条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率 记作:P(A|B) 特性:P(A1,A2|B) = P(A1|
阅读全文
摘要:Facebook签到位置预测K值调优 #案例facebook def facebook_demo(): data = pd.read_csv("C:/Users/26301/Desktop/train.csv") #缩小数据范围 data = data.query("x<2.5 & x>2 & y<
阅读全文
摘要:sklearn转化器和预估器 转换器: 想一下之前做的特征工程的步骤? 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式 fit_transf
阅读全文
摘要:案例:探究用户对物品类别的喜好细分降维 数据如下: order_products__prior.csv:订单与商品信息 字段:order_id, product_id, add_to_cart_order, reordered products.csv:商品信息 字段:product_id, pro
阅读全文
摘要:特征预处理: 什么是特征预处理? 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。 我们需要用到一些方法进行无量纲化,使不同规格的数据转换到同一规格 为什么我们要进行归一化/标准化? 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果
阅读全文
摘要:sklearn数据集 1 scikit-learn数据集API介绍 sklearn.datasets 加载获取流行数据集 datasets.load_*() 获取小规模数据集,数据包含在datasets里 datasets.fetch_*(data_home=None) 获取大规模数据集,需要从网络
阅读全文