摘要: 数据清洗的理论 数据分析的工作流程 1.明确需求 到底分析什么数据 2.收集数据 数据的来源主要有三种 1.公司内部直接提供 2.网络爬虫获取 3.花钱购买 3.数据清洗(不能忽略) 我们收集上来的数据很有可能存在不同的缺陷 1.缺失数据 2.重复数据 3.异常数据 ... 4.数据分析 基于数据进 阅读全文
posted @ 2021-03-31 21:11 孔夫子挂妖刀 阅读(247) 评论(0) 推荐(0)
摘要: 正则表达式 使用一些特殊符号的组合去字符串中筛选出符合条件的文本数据 # 正则表达式是一门独立的语言 前戏 # 使用python代码完成用户输入手机号的校验 1.必须是纯数字 2.只能是13 14 15 17 18 19开头 '''利用python编写''' phone = input('pleas 阅读全文
posted @ 2021-03-31 21:05 孔夫子挂妖刀 阅读(138) 评论(0) 推荐(0)
摘要: 数据可视化模块之matplotlib 是一个强大的python绘图和数据可视化工具包,数据可视化也是我们数据分析重要环节之一,可以帮助我们分析出很多价值信息,也是数据分析的最后一个可视化阶段 import matplotlib.pyplot as plt 饼图 饼图属于最传统的统计图形之一,几乎随处 阅读全文
posted @ 2021-03-31 20:33 孔夫子挂妖刀 阅读(269) 评论(0) 推荐(0)
摘要: pandas模块简介 1.基于Numpy构建 2.pandas的出现,奠定了python数据分析领域的一哥地位 pandas的主要功能 1.具备诸多功能的两大数据结构 Series、DataFrame 都是基于Numpy构建出来的 公司中使用频繁的是DataFrame,而Series是构成DataF 阅读全文
posted @ 2021-03-31 20:28 孔夫子挂妖刀 阅读(246) 评论(0) 推荐(0)
摘要: numpy模块 1.Numpy是高性能科学计算和数据分析的基础包 2.也是pandas等其他数据分析的工具的基础 3.NumPy具有多维数组功能,运算更加高效快速 下载 如果你使用的是anaconda那么无需下载直接使用即可 如果你想在纯开发环境(不借助于anaconda)中使用,那么需要自己下载 阅读全文
posted @ 2021-03-31 20:23 孔夫子挂妖刀 阅读(179) 评论(0) 推荐(0)
摘要: 数据分析之数据库MySQL 数据库的概念 什么是数据库? 简单地概括,数据库其实就是用来帮助存取数据的地方 数据库的演变 1.单机游戏 不需要网络,每台机器数据独立 会造成用户注册的数据只能在注册了的计算机上面使用 换了一台计算机相同的游戏却无法进行登录和继续游戏进度 2.联网游戏 需要网络,所有的 阅读全文
posted @ 2021-03-31 20:12 孔夫子挂妖刀 阅读(479) 评论(0) 推荐(0)
摘要: Python基础学习内容详细 编程与编程语言 什么是编程语言? 语言:中文、英文、日文、韩文... 作用:人与人之间相互沟通交流的媒介 编程语言:人与计算机之间沟通交流的媒介 作用:想让计算机按照我们的逻辑思维和想法帮我们做事情 我们学习英文的目的是为了跟外国人交流,同理我们为了能够跟计算机沟通交流 阅读全文
posted @ 2021-03-26 15:50 孔夫子挂妖刀 阅读(227) 评论(0) 推荐(0)