摘要:
数据清洗的理论 数据分析的工作流程 1.明确需求 到底分析什么数据 2.收集数据 数据的来源主要有三种 1.公司内部直接提供 2.网络爬虫获取 3.花钱购买 3.数据清洗(不能忽略) 我们收集上来的数据很有可能存在不同的缺陷 1.缺失数据 2.重复数据 3.异常数据 ... 4.数据分析 基于数据进 阅读全文
posted @ 2021-03-31 21:11
孔夫子挂妖刀
阅读(247)
评论(0)
推荐(0)
摘要:
正则表达式 使用一些特殊符号的组合去字符串中筛选出符合条件的文本数据 # 正则表达式是一门独立的语言 前戏 # 使用python代码完成用户输入手机号的校验 1.必须是纯数字 2.只能是13 14 15 17 18 19开头 '''利用python编写''' phone = input('pleas 阅读全文
posted @ 2021-03-31 21:05
孔夫子挂妖刀
阅读(138)
评论(0)
推荐(0)
摘要:
数据可视化模块之matplotlib 是一个强大的python绘图和数据可视化工具包,数据可视化也是我们数据分析重要环节之一,可以帮助我们分析出很多价值信息,也是数据分析的最后一个可视化阶段 import matplotlib.pyplot as plt 饼图 饼图属于最传统的统计图形之一,几乎随处 阅读全文
posted @ 2021-03-31 20:33
孔夫子挂妖刀
阅读(269)
评论(0)
推荐(0)
摘要:
pandas模块简介 1.基于Numpy构建 2.pandas的出现,奠定了python数据分析领域的一哥地位 pandas的主要功能 1.具备诸多功能的两大数据结构 Series、DataFrame 都是基于Numpy构建出来的 公司中使用频繁的是DataFrame,而Series是构成DataF 阅读全文
posted @ 2021-03-31 20:28
孔夫子挂妖刀
阅读(246)
评论(0)
推荐(0)
摘要:
numpy模块 1.Numpy是高性能科学计算和数据分析的基础包 2.也是pandas等其他数据分析的工具的基础 3.NumPy具有多维数组功能,运算更加高效快速 下载 如果你使用的是anaconda那么无需下载直接使用即可 如果你想在纯开发环境(不借助于anaconda)中使用,那么需要自己下载 阅读全文
posted @ 2021-03-31 20:23
孔夫子挂妖刀
阅读(179)
评论(0)
推荐(0)
摘要:
数据分析之数据库MySQL 数据库的概念 什么是数据库? 简单地概括,数据库其实就是用来帮助存取数据的地方 数据库的演变 1.单机游戏 不需要网络,每台机器数据独立 会造成用户注册的数据只能在注册了的计算机上面使用 换了一台计算机相同的游戏却无法进行登录和继续游戏进度 2.联网游戏 需要网络,所有的 阅读全文
posted @ 2021-03-31 20:12
孔夫子挂妖刀
阅读(479)
评论(0)
推荐(0)

浙公网安备 33010602011771号