02 2022 档案
摘要:
本教程详细讲解Hadoop的安装与环境配置方法,并配有相关软件的下载方法。需要主义的是,本教程的工作环境为Linux系统。
阅读全文
本教程详细讲解Hadoop的安装与环境配置方法,并配有相关软件的下载方法。需要主义的是,本教程的工作环境为Linux系统。
阅读全文
摘要:
对于使用Python快捷地进行数据分析可视化而言,Seaborn是一个简单易用的选择。Seaborn 核心库进行了更高阶的 API 封装,可以轻松地画出配色更加舒服、图形元素的样式更加细腻的图形。
阅读全文
对于使用Python快捷地进行数据分析可视化而言,Seaborn是一个简单易用的选择。Seaborn 核心库进行了更高阶的 API 封装,可以轻松地画出配色更加舒服、图形元素的样式更加细腻的图形。
阅读全文
摘要:
本文我们介绍pandas可视化及绘制各种图形的方法,大部分基础图像(条形图、直方图、箱型图、面积图、散点图、饼形图等)绘制只要一行代码就能实现,大大加速了我们的分析效率。
阅读全文
本文我们介绍pandas可视化及绘制各种图形的方法,大部分基础图像(条形图、直方图、箱型图、面积图、散点图、饼形图等)绘制只要一行代码就能实现,大大加速了我们的分析效率。
阅读全文
摘要:
数据可视化是以图示或图形格式表示的数据,以更直观方式理解与分析数据。本篇内容,我们给大家介绍数据分析中关于可视化的一些核心知识,包括:各类图形及特点,不同图形选择方法。
阅读全文
数据可视化是以图示或图形格式表示的数据,以更直观方式理解与分析数据。本篇内容,我们给大家介绍数据分析中关于可视化的一些核心知识,包括:各类图形及特点,不同图形选择方法。
阅读全文
摘要:
业务数据分析时,经常要对数据根据1个或多个字段分为不同的组(group)进行分析处理。Pandas中可以借助groupby操作对Dataframe分组操作,本文介绍groupby的基本原理及对应的agg、transform和apply方法与操作。
阅读全文
业务数据分析时,经常要对数据根据1个或多个字段分为不同的组(group)进行分析处理。Pandas中可以借助groupby操作对Dataframe分组操作,本文介绍groupby的基本原理及对应的agg、transform和apply方法与操作。
阅读全文
摘要:
本篇为『图解Pandas数据变换高级函数』,讲解3个函数是map、apply和applymap,更高效地完成数据处理过程中对DataFrame进行逐行、逐列和逐元素的操作。
阅读全文
本篇为『图解Pandas数据变换高级函数』,讲解3个函数是map、apply和applymap,更高效地完成数据处理过程中对DataFrame进行逐行、逐列和逐元素的操作。
阅读全文
摘要:
本篇为pandas系列的导语,对『Pandas核心操作函数』进行介绍,讲解Pandas进行数据操作和处理的核心数据结构:Series、DataFrame和Index。
阅读全文
本篇为pandas系列的导语,对『Pandas核心操作函数』进行介绍,讲解Pandas进行数据操作和处理的核心数据结构:Series、DataFrame和Index。
阅读全文
摘要:
Pandas是Python中最常用到的数据操作和分析工具包,它构建在Numpy之上,具备简洁的使用接口和高效的处理效率。数据科学、机器学习AI应用过程,涉及数据清洗和分析的操作也频繁使用到Pandas。
阅读全文
Pandas是Python中最常用到的数据操作和分析工具包,它构建在Numpy之上,具备简洁的使用接口和高效的处理效率。数据科学、机器学习AI应用过程,涉及数据清洗和分析的操作也频繁使用到Pandas。
阅读全文
摘要:
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。
阅读全文
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。
阅读全文
摘要:
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与2维数组操作。
阅读全文
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与2维数组操作。
阅读全文
摘要:
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与1维数组操作。
阅读全文
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与1维数组操作。
阅读全文
摘要:
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇为系列导入文章。
阅读全文
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇为系列导入文章。
阅读全文
摘要:
基于数据分析目前良好的发展前景,各界也出现了许多好用的功能种类丰富的数据分析工具。本文列举其中的一些常用工具:Python、R、SQL、SAS、Tableau、Excel等。
阅读全文
基于数据分析目前良好的发展前景,各界也出现了许多好用的功能种类丰富的数据分析工具。本文列举其中的一些常用工具:Python、R、SQL、SAS、Tableau、Excel等。
阅读全文
摘要:
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第三个步骤——业务认知与数据探索。
阅读全文
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第三个步骤——业务认知与数据探索。
阅读全文
摘要:
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第二个步骤——数据预处理。
阅读全文
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第二个步骤——数据预处理。
阅读全文
摘要:
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第一个步骤——业务认知与数据探索。
阅读全文
数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第一个步骤——业务认知与数据探索。
阅读全文
摘要:
数学知识对于数据分析非常重要!本文讲解数据分析中最常用到的数学知识:描述性统计、概率论、统计推断等。
阅读全文
数学知识对于数据分析非常重要!本文讲解数据分析中最常用到的数学知识:描述性统计、概率论、统计推断等。
阅读全文
摘要:
随着互联网高速发展,网络数据呈现出指数级别的快速增长,针对海量数据处理的大数据解决方案应运而生。ShowMeAI将在接下来的内容中逐步展开讲解大数据生态工具的应用,以及大数据的处理分析挖掘方法。
阅读全文
随着互联网高速发展,网络数据呈现出指数级别的快速增长,针对海量数据处理的大数据解决方案应运而生。ShowMeAI将在接下来的内容中逐步展开讲解大数据生态工具的应用,以及大数据的处理分析挖掘方法。
阅读全文
摘要:
对原始数据进行检查、清理、转换以及建模等操作,才可以洞察数据背后的规律,得出准确的结论或做出正确的决策——这也是数据分析的一个标准过程。
阅读全文
对原始数据进行检查、清理、转换以及建模等操作,才可以洞察数据背后的规律,得出准确的结论或做出正确的决策——这也是数据分析的一个标准过程。
阅读全文
摘要:
最优化方法是机器学习中非常重要的理论,也是机器学习依赖的数学知识之一。李航博士的《统计学习方法》将机器学习总结为:**机器学习 = 模型 + 策略 + 算法**。而公式中的算法指的就是优化算法。
阅读全文
最优化方法是机器学习中非常重要的理论,也是机器学习依赖的数学知识之一。李航博士的《统计学习方法》将机器学习总结为:**机器学习 = 模型 + 策略 + 算法**。而公式中的算法指的就是优化算法。
阅读全文
摘要:
信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。信息论中包含的知识和概念在机器学习中也有应用,典型的例子是其核心思想『熵』的应用。
阅读全文
信息论是运用概率论与数理统计的方法研究信息、信息熵、通信系统、数据传输、密码学、数据压缩等问题的应用数学学科。信息论中包含的知识和概念在机器学习中也有应用,典型的例子是其核心思想『熵』的应用。
阅读全文
摘要:
机器学习会更多地使用概率论处理不确定量或随机量,很多典型的机器学习算法也是基于概率的。本文将机器学习中常见的概率与统计知识做一个梳理:随机变量、随机向量、概率分布、条件概率、贝叶斯公式、期望、方差、协方差、相关系数、常见分布等。
阅读全文
机器学习会更多地使用概率论处理不确定量或随机量,很多典型的机器学习算法也是基于概率的。本文将机器学习中常见的概率与统计知识做一个梳理:随机变量、随机向量、概率分布、条件概率、贝叶斯公式、期望、方差、协方差、相关系数、常见分布等。
阅读全文
摘要:
Hadoop是最基础和场景的开源分布式计算平台,ShowMeAI在本节内容中给大家讲解Hadoop相关知识。
阅读全文
Hadoop是最基础和场景的开源分布式计算平台,ShowMeAI在本节内容中给大家讲解Hadoop相关知识。
阅读全文
摘要:
本篇内容是ShowMeAI组织的「图解大数据处理与开发」系列教程入口,本教程以大数据技术为根基,给大家讲解大数据开发与数据处理分析的相关知识与技能,并配以相关的实战案例帮助大家学习理解。
阅读全文
本篇内容是ShowMeAI组织的「图解大数据处理与开发」系列教程入口,本教程以大数据技术为根基,给大家讲解大数据开发与数据处理分析的相关知识与技能,并配以相关的实战案例帮助大家学习理解。
阅读全文
摘要:
线性代数和矩阵在ML和DL中扮演着非常重要的角色。本文将这部分的数学基础知识进行整理,加深理解,帮助大家在机器学习与深度学习这条路上走的更远,包括向量、范数、特征分解、奇异值分解、广义逆、常用距离度量等。
阅读全文
线性代数和矩阵在ML和DL中扮演着非常重要的角色。本文将这部分的数学基础知识进行整理,加深理解,帮助大家在机器学习与深度学习这条路上走的更远,包括向量、范数、特征分解、奇异值分解、广义逆、常用距离度量等。
阅读全文
摘要:
本系列教程展开讲解AI所需的数学基础知识,力求以最直观最易懂的方式给帮助大家掌握AI依赖的数学知识最小子集。本教程内容覆盖线性代数与矩阵论,概率与统计,信息论,微积分与最优化几个核心的知识板块。
阅读全文
本系列教程展开讲解AI所需的数学基础知识,力求以最直观最易懂的方式给帮助大家掌握AI依赖的数学知识最小子集。本教程内容覆盖线性代数与矩阵论,概率与统计,信息论,微积分与最优化几个核心的知识板块。
阅读全文
摘要:
数据分析是一项应用非常广泛的技能。本系列教程不同于其他文字版教程,我们以最直挂的「图示」对每个内容和关键点「可视化」,配以最精准精简的代码,让大家尽快入门。
阅读全文
数据分析是一项应用非常广泛的技能。本系列教程不同于其他文字版教程,我们以最直挂的「图示」对每个内容和关键点「可视化」,配以最精准精简的代码,让大家尽快入门。
阅读全文
摘要:
有人把数据分析的核心总结为六字,即对比、细分、溯源,也被成为数据分析的三板斧,支撑数据分析的核心应用。
阅读全文
有人把数据分析的核心总结为六字,即对比、细分、溯源,也被成为数据分析的三板斧,支撑数据分析的核心应用。
阅读全文
摘要:
在Python的开发过程中,经常要处理时间类型的数据。Python内置了 time、datetime 等标准库,帮助我们对时间型进行处理。
阅读全文
在Python的开发过程中,经常要处理时间类型的数据。Python内置了 time、datetime 等标准库,帮助我们对时间型进行处理。
阅读全文
摘要:
命名空间与作用域是程序设计中的基础概念,深入理解有助于理解变量的生命周期,减少代码中的莫名其妙bug。
阅读全文
命名空间与作用域是程序设计中的基础概念,深入理解有助于理解变量的生命周期,减少代码中的莫名其妙bug。
阅读全文
摘要:
面向对象编程是一种程序设计思想,即把对象作为程序的基本单元。一个对象包含了数据和操作数据的函数,而Python是一个纯天然面向对象的编程语言。
阅读全文
面向对象编程是一种程序设计思想,即把对象作为程序的基本单元。一个对象包含了数据和操作数据的函数,而Python是一个纯天然面向对象的编程语言。
阅读全文
摘要:
在实际编程过程中,经常会看到一些报错信息,在python中也有专门的方式去处理错误和异常,保证全局流程顺畅。
阅读全文
在实际编程过程中,经常会看到一些报错信息,在python中也有专门的方式去处理错误和异常,保证全局流程顺畅。
阅读全文
摘要:
在实际开发中,经常需要对文件夹、文件等进行创建、修改、查询、读取、删除等操作。Python 通过标准内置OS模块,能够以简洁高效的方式完成这些操作。
阅读全文
在实际开发中,经常需要对文件夹、文件等进行创建、修改、查询、读取、删除等操作。Python 通过标准内置OS模块,能够以简洁高效的方式完成这些操作。
阅读全文
摘要:
读写文件是最常见的操作之一,Python内置了open()函数,用于对文件进行读写操作。每当我们用open方法打开一个文件时,将返回一个文件对象。
阅读全文
读写文件是最常见的操作之一,Python内置了open()函数,用于对文件进行读写操作。每当我们用open方法打开一个文件时,将返回一个文件对象。
阅读全文
摘要:
在Python中,一个.py文件就称为一个模块(Module),包含很多不同功能编写成的函数。包是用来管理Python模块命名空间的形式,经常以「包.模块」的形式来导入模块。
阅读全文
在Python中,一个.py文件就称为一个模块(Module),包含很多不同功能编写成的函数。包是用来管理Python模块命名空间的形式,经常以「包.模块」的形式来导入模块。
阅读全文
摘要:
Python中有大量的数据结构与容器供编程使用,在本节内容中我们汇总前面所学的知识点,并拓展一些新知识,来介绍Python数据结构。
阅读全文
Python中有大量的数据结构与容器供编程使用,在本节内容中我们汇总前面所学的知识点,并拓展一些新知识,来介绍Python数据结构。
阅读全文
摘要:
迭代器(iterator)是一个带状态的对象,在调用next()方法时返回容器中的下一个值。生成器(generator)是使用 yield 的函数,函数被调用时会返回一个生成器对象。生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。
阅读全文
迭代器(iterator)是一个带状态的对象,在调用next()方法时返回容器中的下一个值。生成器(generator)是使用 yield 的函数,函数被调用时会返回一个生成器对象。生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。
阅读全文
摘要:
在Python中,函数(Function)是组织好的、可重复使用的、用来实现单一,或相关联功能的代码段。内建函数和用户自定义函数提高了应用的模块性和代码的重复利用率。
阅读全文
在Python中,函数(Function)是组织好的、可重复使用的、用来实现单一,或相关联功能的代码段。内建函数和用户自定义函数提高了应用的模块性和代码的重复利用率。
阅读全文
摘要:
在 Python 中,集合(Set)是一个无序的不重复元素的集,基本功能包括关系测试和消除重复元素。本文讲解集合的创建和元素的添加、移除、清空等操作。
阅读全文
在 Python 中,集合(Set)是一个无序的不重复元素的集,基本功能包括关系测试和消除重复元素。本文讲解集合的创建和元素的添加、移除、清空等操作。
阅读全文
摘要:
在 Python 中,字典(Dictionary)是另一种可变容器模型,且可存储任意类型对象。作为Python唯一的标准mapping type,字典支持增、删、查、整体更新等操作。
阅读全文
在 Python 中,字典(Dictionary)是另一种可变容器模型,且可存储任意类型对象。作为Python唯一的标准mapping type,字典支持增、删、查、整体更新等操作。
阅读全文
摘要:
在Python中,元组(Tuple)是另一个重要的序列结构,由一系列按特定顺序排序的元素组成。本文讲解元组的创建、访问、修改、删除、运算、内置函数等知识。
阅读全文
在Python中,元组(Tuple)是另一个重要的序列结构,由一系列按特定顺序排序的元素组成。本文讲解元组的创建、访问、修改、删除、运算、内置函数等知识。
阅读全文
摘要:
在Python中,列表(List)是最常用的Python数据类型之一,可以作为一个方括号内的逗号分隔值出现。本文详细讲解列表的创建、访问、更新、删除、截取和列表函数等知识。
阅读全文
在Python中,列表(List)是最常用的Python数据类型之一,可以作为一个方括号内的逗号分隔值出现。本文详细讲解列表的创建、访问、更新、删除、截取和列表函数等知识。
阅读全文
摘要:
在Python中,字符串(String)是若干个字符的集合,是最常用的数据类型。就是一个字符串。本文详细讲解字符串的创建、访问、连接、运算、格式化、Unicode字符串和内建函数等知识。
阅读全文
在Python中,字符串(String)是若干个字符的集合,是最常用的数据类型。就是一个字符串。本文详细讲解字符串的创建、访问、连接、运算、格式化、Unicode字符串和内建函数等知识。
阅读全文
摘要:
在Python中,有时候程序需要占一个位置或放一条语句,但又不希望这条语句做任何事情,此时就可以通过 pass 来优雅地实现。
阅读全文
在Python中,有时候程序需要占一个位置或放一条语句,但又不希望这条语句做任何事情,此时就可以通过 pass 来优雅地实现。
阅读全文
摘要:
在 Python中,continue 语句用来告诉Python跳过当前循环的剩余语句,然后继续进行下一轮循环(而break是跳出整个循环)。
阅读全文
在 Python中,continue 语句用来告诉Python跳过当前循环的剩余语句,然后继续进行下一轮循环(而break是跳出整个循环)。
阅读全文
摘要:
在 Python中,break语句打破了最小封闭的for或while循环,将停止执行最深层的循环,并开始执行下一行代码。
阅读全文
在 Python中,break语句打破了最小封闭的for或while循环,将停止执行最深层的循环,并开始执行下一行代码。
阅读全文
摘要:
在 python中,for 循环常用于遍历字符串、列表、元组、字典、集合等序列类型,逐个获取序列中的各个元素。
阅读全文
在 python中,for 循环常用于遍历字符串、列表、元组、字典、集合等序列类型,逐个获取序列中的各个元素。
阅读全文
摘要:
Python 编程中while 语句用于循环执行程序,即在某条件下,循环执行某段程序,以处理需要重复处理的相同任务。
阅读全文
Python 编程中while 语句用于循环执行程序,即在某条件下,循环执行某段程序,以处理需要重复处理的相同任务。
阅读全文
摘要:
程序一般情况按顺序执行,,但Python提供了各种控制结构,允许更改语句执行的顺序:for循环、while循环,以及break语句、continue语句和pass语句等。
阅读全文
程序一般情况按顺序执行,,但Python提供了各种控制结构,允许更改语句执行的顺序:for循环、while循环,以及break语句、continue语句和pass语句等。
阅读全文
摘要:
在 Python 中,可以使用 if 语句对条件进行判断,然后根据不同的结果执行不同的代码。Python 中的 if 语句可以细分为三种形式: if 语句、if else 语句和 if elif else 语句。
阅读全文
在 Python 中,可以使用 if 语句对条件进行判断,然后根据不同的结果执行不同的代码。Python 中的 if 语句可以细分为三种形式: if 语句、if else 语句和 if elif else 语句。
阅读全文
摘要:
本文讲解Python语言支持的以下类型的运算符:算术运算符、比较(关系)运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符、 运算符优先级等。
阅读全文
本文讲解Python语言支持的以下类型的运算符:算术运算符、比较(关系)运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符、 运算符优先级等。
阅读全文
摘要:
Python基本数据类型一般分为6种:数值(Numbers)、字符串(String)、列表(List)、元组(Tuple)、字典(Dictionary)、集合(Set)。本文详细讲解Python中变量赋值、数据类型以及数据类型的转换。
阅读全文
Python基本数据类型一般分为6种:数值(Numbers)、字符串(String)、列表(List)、元组(Tuple)、字典(Dictionary)、集合(Set)。本文详细讲解Python中变量赋值、数据类型以及数据类型的转换。
阅读全文
摘要:
本系列教程讲解Python编程语言,我们首先了解一些Python的基础知识:Python 编程模式、Python 标识符与关键字、Python 缩进与代码块、Python 简单输入输出、Python 基本代码结构等。
阅读全文
本系列教程讲解Python编程语言,我们首先了解一些Python的基础知识:Python 编程模式、Python 标识符与关键字、Python 缩进与代码块、Python 简单输入输出、Python 基本代码结构等。
阅读全文
摘要:
本文介绍Python的集成开发环境Anaconda的安装、配置及使用,大家在后续的Python及数据科学知识学习过程中会经常用到这套环境工具。
阅读全文
本文介绍Python的集成开发环境Anaconda的安装、配置及使用,大家在后续的Python及数据科学知识学习过程中会经常用到这套环境工具。
阅读全文
摘要:
本篇将对 Python 进行简要的介绍,通过阅读本篇内容您将了解到:Python 简要介绍、Python 发展历史、Python 特点特性、Python 应用场景。
阅读全文
本篇将对 Python 进行简要的介绍,通过阅读本篇内容您将了解到:Python 简要介绍、Python 发展历史、Python 特点特性、Python 应用场景。
阅读全文

浙公网安备 33010602011771号