随笔分类 - AI
摘要:使用kaggle比赛中的公开数据IceCreamData数据来完成温度和销售利润的线性关系。本实例使用python来仿真实现。 1. 下载数据,IceCreamData需要注册和下载到本地。大体背景是你拥有一家冰淇淋公司,你想创建一个模型,可以根据外部空气温度(度)预测每天的收入。 2. 导入数据
阅读全文
摘要:在大数据分析中,回归分析是一种预测性的建模技术,旨在通过数据统计分析,探索数据规律。回归分析主要研究因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。 1. Linear Regression线性回归 线性回归是最常见的回归分析技术。在线性
阅读全文
摘要:AI-特征工程 利用AI实现智能化自动化分类过程的前提是对数据进行特征工程。特征工程的目的是对待分类对象进行特征描述及刻画,例如刻画一种动物是猫还是狗需要在很多个维度去说明,比如狗的轮廓特征和猫的轮廓特征有差异等。特征工程就是将这些具有区分度的特征形象化或数值化出来。特征工程的方法有很多,大体分为人
阅读全文
摘要:聚类算法中聚类数量的确定方法 聚类算法是对实体进行分组归类的有效方法,也是有利于降低人力工作量的有效手段,例如先用AI聚类方法对实体数据进行聚类分组,再由人工介入指认,能有效降低工作成本,但是聚类数量的确定是个很客观的问题,到底聚多少类才算合适呢? 本文就此问题介绍几种方法: 1.手肘法 本质上是计
阅读全文
摘要:定义 sklearn中的StandardScaler()主要是去均值标准化,也就是均值为0,标准差为1的数据标准化处理。 均值公式: 标准差公式: 下面利用python实现一下: 点击查看代码 import pandas as pd from sklearn.preprocessing import
阅读全文
摘要:from sklearn.metrics import classification_report y_true = [0, 1, 2, 2, 2] y_pred = [0, 0, 2, 2, 1] target_names = ['class 0', 'class 1', 'class 2'] p
阅读全文

浙公网安备 33010602011771号