……

随笔分类 -  人工智能之机器学习

python
Python机器学习(九十八)机器学习算法原理解析 - 分类
摘要:常见分类模型与算法 距离判别法,即最近邻算法KNN; 贝叶斯分类器; 线性判别法,即逻辑回归算法; 决策树; 支持向量机; 神经网络; 1. KNN分类算法原理及应用 1.1 KNN概述 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法。 KNN算法的指导思想是 阅读全文
posted @ 2020-11-17 15:43 大码王 阅读(841) 评论(0) 推荐(0) 编辑
java从0到1之(1)基础
摘要:Java 简介 什么是Java? Java是一种流行的编程语言,创建于1995年。 Java属于Oracle公司所有,运行Java的设备超过30亿台。 Java可用于: 移动应用(特别是Android应用) 桌面应用程序 Web应用程序 Web服务器和应用程序服务器 游戏 数据库连接 更多 为什么用 阅读全文
posted @ 2020-06-22 00:25 大码王 阅读(214) 评论(0) 推荐(0) 编辑
Python机器学习(九十七)Pandas 绘图
摘要:Pandas的另一个优点是与Matplotlib的集成,可以直接绘制DataFrame和Series。 注意:如没有安装Matplotlib,需首先安装:pip install matplotlib。 import matplotlib.pyplot as plt plt.rcParams.upda 阅读全文
posted @ 2020-06-21 21:54 大码王 阅读(411) 评论(0) 推荐(0) 编辑
Python机器学习(九十六)Pandas apply函数
摘要:与Python中的列表类似,可以使用for循环遍历DataFrame或Series,但是这样做(尤其是在大型数据集上)非常慢。 Pandas中提供了一个高效的替代方案:apply()方法。 语法 DataFrame.apply(func) Series.apply(func) func – 要对数据 阅读全文
posted @ 2020-06-21 21:49 大码王 阅读(978) 评论(0) 推荐(0) 编辑
Python机器学习(九十五)Pandas 有条件访问
摘要:有时需要根据条件,访问DataFrame中的数据。例如,找出电影数据集中,某个导演的电影: # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_df.columns = ['rank', 'g 阅读全文
posted @ 2020-06-21 21:45 大码王 阅读(314) 评论(0) 推荐(1) 编辑
Python机器学习(九十四)Pandas 访问行数据
摘要:访问行数据,有两个方法: .loc – 使用索引名定位 .iloc – 使用索引序号定位 示例中的数据以电影名作为索引: # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_df.column 阅读全文
posted @ 2020-06-21 21:40 大码王 阅读(567) 评论(0) 推荐(0) 编辑
Python机器学习(九十三)Pandas 访问列数据
摘要:返回Series 访问DataFrame中的Series,可以使用DataFrame['列名']方式。 # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_df.columns = ['ran 阅读全文
posted @ 2020-06-21 21:37 大码王 阅读(473) 评论(0) 推荐(0) 编辑
Python机器学习(九十二)Pandas 统计
摘要:describe 在整个DataFrame上使用describe(),我们可以得到一个统计结果: import pandas as pd # 加载数据 movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title") movies_d 阅读全文
posted @ 2020-06-21 21:32 大码王 阅读(275) 评论(0) 推荐(0) 编辑
Python机器学习(九十一)Pandas 填充(Imputation)空值
摘要:除了删除空值,还有一种处理空值的方法是填充(Imputation)。 让我们看看在revenue_millions列中填充缺失的值。 首先,将该列提取到变量中: revenue = movies_df['revenue_millions'] 使用DataFrame['列名']可以获取1列数据,即一个 阅读全文
posted @ 2020-06-21 21:29 大码王 阅读(2936) 评论(0) 推荐(0) 编辑
Python机器学习(九十)Pandas 去除null值
摘要:数据集中通常会包含null值或空值,对于空值的处理有2种方式: 删除带有null的行或列 用非空值填充null项 检查null值 要处理数据集中的null值,首先要找出DataFrame中的哪些单元格是空的: movies_df.isnull() 输出 rank genre description 阅读全文
posted @ 2020-06-21 21:23 大码王 阅读(5133) 评论(0) 推荐(0) 编辑
Python机器学习(八十九)Pandas 整理列名
摘要:关于数据集的列名,通常建议最好使用小写字母,删除特殊字符,并用下划线替换空格。有时数据集的列名可能不是很规范,需要整理修改理列名。 获取DataFrame的列名 获取DataFrame的列名,可以使用DataFrame.columns属性。 movies_df.columns 输出 Index([' 阅读全文
posted @ 2020-06-21 21:20 大码王 阅读(832) 评论(0) 推荐(0) 编辑
Python机器学习(八十七)Pandas 去除重复
摘要:去除重复数据是一项常见操作,Pandas中,可以使用drop_duplicates方法。 电影数据集没有重复的行,我们来制造一些重复行。 temp_df = movies_df.append(movies_df) temp_df.shape 输出 (2000, 11) append()将返回一个副本 阅读全文
posted @ 2020-06-21 21:17 大码王 阅读(2085) 评论(0) 推荐(0) 编辑
Python机器学习(八十六)Pandas 数据集信息
摘要:info 使用.info方法,可以查看数据集的基本信息: movies_df.info() 输出 <class 'pandas.core.frame.DataFrame'> Index: 1000 entries, Guardians of the Galaxy to Nine Lives Data 阅读全文
posted @ 2020-06-21 21:14 大码王 阅读(803) 评论(0) 推荐(0) 编辑
Python机器学习(八十五)Pandas 用head与tail查看数据
摘要:Pandas可以对数据集进行各种有用的分析和操作。让我们先从最简单的查看数据开始。 我们将使用IMDB电影数据集来演示,数据集文件下载:IMDB-Movie-Data.csv 首先加载CSV数据集,并将电影标题Title指定为索引。 import pandas as pd movies_df = p 阅读全文
posted @ 2020-06-21 21:11 大码王 阅读(4108) 评论(0) 推荐(1) 编辑
Python机器学习(八十四)Pandas DataFrame存储到CSV, JSON,SQL
摘要:有时需要存储DataFrame到文件中,可以把DataFrame存储到CSV, JSON,SQL数据库中,如下所示: df.to_csv('new_purchases.csv') df.to_json('new_purchases.json') # 保存到SQL数据库 import sqlite3 阅读全文
posted @ 2020-06-21 21:09 大码王 阅读(1737) 评论(0) 推荐(0) 编辑
Python机器学习(八十三)Pandas 读取 SQL 数据库
摘要:要从SQL数据库中加载数据,可以使用Pandas的read_sql_query方法。 我们将使用sqlite来测演示。 首先安装python的sqlite驱动 pysqlite3: pip install pysqlite3 pysqlite3用于创建数据库连接,然后使用SELECT查询数据,加载D 阅读全文
posted @ 2020-06-21 21:07 大码王 阅读(3733) 评论(0) 推荐(0) 编辑
Python机器学习(八十三)Pandas 读取 JSON 数据
摘要:要从Json文件中读取数据,可以使用Pandas的read_json方法。 Json文件的内容: { "apples": { "June": 3, "Robert": 2, "Lily": 0, "David": 1 }, "oranges": { "June": 0, "Robert": 3, " 阅读全文
posted @ 2020-06-21 21:04 大码王 阅读(11811) 评论(0) 推荐(1) 编辑
Python机器学习(八十二)Pandas 读取 CSV 数据
摘要:将各种文件格式的数据加载到DataFrame中非常简单。 CSV文件只需要一行代码就可以加载数据。 例如,假设我们的CSV文件内容如下: ,apples,oranges June,3,0 Robert,2,3 Lily,0,7 David,1,2 在Excel中打开: Pandas加载CSV为Dat 阅读全文
posted @ 2020-06-21 21:02 大码王 阅读(1004) 评论(0) 推荐(0) 编辑
Python机器学习(八十一)Pandas Series 与 DataFrame
摘要:Pandas的两个主要数据结构是Series和DataFrame。 DataFrame可以理解为一张表,Series就是其中的一个列。 DataFrame和Series在许多操作上是相似的,通常在一个上能做的操作在另一个上也能做,如填充空值和计算平均值。 Pandas 创建 DataFrame 要创 阅读全文
posted @ 2020-06-21 20:59 大码王 阅读(351) 评论(0) 推荐(0) 编辑
Python机器学习(八十)Pandas 介绍
摘要:Pandas 是一个开放源码、BSD许可的库,为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。Pandas基于NumPy开发。 Pandas 用途 Pandas 是一个数据分析工具,可用来清理、转换和分析数据。 例如,我们有一个csv格式的数据集,我们可以把数据提取到Pandas 阅读全文
posted @ 2020-06-21 20:54 大码王 阅读(337) 评论(0) 推荐(0) 编辑

复制代码