摘要:
1、Numpy 对于科学计算,它是Python创建的所有更高层工具的基础。以下是它提供的一些功能: a、N维数组,一种快速、高效使用内存的多维数组,它提供矢量化数学运算 。 b、你可以不需要使用循环,就对整个数组内的数据进行标准数学运算。 c、非常便于传送数据到用低级语言(如C或C++)编写的外部库 阅读全文
posted @ 2021-07-12 15:00
夜的独白
阅读(1602)
评论(0)
推荐(0)
|
摘要:
1、Numpy 对于科学计算,它是Python创建的所有更高层工具的基础。以下是它提供的一些功能: a、N维数组,一种快速、高效使用内存的多维数组,它提供矢量化数学运算 。 b、你可以不需要使用循环,就对整个数组内的数据进行标准数学运算。 c、非常便于传送数据到用低级语言(如C或C++)编写的外部库 阅读全文
posted @ 2021-07-12 15:00
夜的独白
阅读(1602)
评论(0)
推荐(0)
摘要:
一.数据背景及问题描述 数据来源 :课题来源于天池大赛,数据来源于中国人民大学中国调查与数据中心《中国综合社会调查(CGSS)》项目,为多阶分层抽样的截面面访调查。 研究背景 :在社会科学领域,幸福感的研究占有重要的位置。这个涉及了哲学、心理学、社会学、经济学等多方学科的话题复杂而有趣;同时与大家生 阅读全文
posted @ 2021-07-12 14:57
夜的独白
阅读(1469)
评论(0)
推荐(1)
摘要:
上一章给大家介绍了如何查看数据与选取你所需要的数据,这篇给大家介绍一下选择完数据如何对数据进行处理。 往往我们拿到的数据经过查看过都会存在一些不能满足需求的问题,这时就可能需要对原数据进行一些修改与整理。比如:Python字段名修改、列名选择修改、索引重置、异常值替换、数据类型转化、数据组合等。还是 阅读全文
posted @ 2021-07-12 14:54
夜的独白
阅读(236)
评论(0)
推荐(0)
摘要:
文章目录 * * * 1、明确需求和目的 * 2、 数据收集 * 3、数据预处理 * * 3.1 数据整合 * * 3.1.1 加载相关库和数据集 * 3.1.2 主要数据集概览 * 3.2 数据清洗 * * 3.2.1 多余列的删除 * 3.2.2 数据类型转换 * 3.2.3 缺失值处理 * 3 阅读全文
posted @ 2021-07-12 14:43
夜的独白
阅读(2299)
评论(1)
推荐(0)
摘要:
电商平台零售数据分析 前面的博客中已经有使用在线零售业务数据进行数据分析,但是在这一篇,我们以不同的角度重新对这些数据进行分析。 数据来源及数据结构 国外的在线零售业务的交易数据, 数据下载地址 现在以表格的形式解释一下里面的字段: 字段 说明 InvoiceNo 订单编号,含有6个整数,退货订单编 阅读全文
posted @ 2021-07-12 14:38
夜的独白
阅读(733)
评论(0)
推荐(0)
摘要:
sklearn中神经网络API sklearn.neural_network.MLPClassifier sklearn.neural_network.MLPRegressor 使用pandas导入数据 from sklearn.neural_network import MLPRegressor 阅读全文
posted @ 2021-07-12 14:26
夜的独白
阅读(4483)
评论(0)
推荐(0)
摘要:
文章目录 合并数据集 * 索引的合并 轴向连接 合并重叠数据 重塑和轴向旋转 * 重塑层次化索引 将“长格式”旋转为“宽格式” 数据转换 * 移除重复数据 利用函数或映射进行数据转换 替换值 重命名轴索引 离散化和面元划分 合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pan 阅读全文
posted @ 2021-07-12 14:23
夜的独白
阅读(295)
评论(0)
推荐(0)
摘要:
自学数据分析与机器学习已有两月,近期房价问题引人深思,即兴做个上海市房价的数据分析小项目。上网一查上海市新楼盘价格,高的不忍直视,索性退而求其次,分析上海二手房的价格。 一、数据收集 常规做法是编写网络爬虫程序,爬取相关网站的数据信息。捷径是用八爪鱼爬虫软件爬取房天下、安居客等网站的二手房信息。 二 阅读全文
posted @ 2021-07-12 14:17
夜的独白
阅读(1828)
评论(0)
推荐(0)
摘要:
python数据分析入门项目–分析全球五百强的数据 这里我用一个简单的简单数据分析入门项目,这里我就先不讲数据数据下载、抓取的问题,我直接给出CSV文件的链接,点击就可以下载。 链接: link . 好,我们直接开始,我们把解析直接用注释的形式打在旁白。 import pandas as pd#一个 阅读全文
posted @ 2021-07-12 14:07
夜的独白
阅读(255)
评论(0)
推荐(0)
摘要:
最近接受Python数据分析的培训,准备接下来深入研究一下,正处在初涉阶段,先上一个小练习热热身。 开发工具:PyCharm 2016.2 完整练习的GitHub地址: https://github.com/xinluqishi/pythonTrainingPro 项目分析数据: https://w 阅读全文
posted @ 2021-07-12 13:52
夜的独白
阅读(210)
评论(0)
推荐(0)
摘要:
前言 第一篇中说好了这个系列要勤更,但是这一篇还是拖得有点久,毕竟是工作之余的学习,各种事情都在耽误吧。上一篇有说到《Python从入门到实战》这本书,这段时间我已经读完了,里面更多的是Python的一些使用基础,如果这一主题的文章继续围绕这本书就不太合适了,我自己也想加快一下学习的速度,做一些更有 阅读全文
posted @ 2021-07-12 13:47
夜的独白
阅读(142)
评论(0)
推荐(0)
摘要:
一般可以安装“数据获取-->数据存储与提取-->数据预处理-->数据建模与分析-->数据可视化”这样的步骤来实施一个数据分析项目。该流程需要掌握的知识点如下: 1)数据获取: 1.1.了解公开数据集的渠道 1.2.用爬虫爬取网站数据 2)数据存储、提前: 2.1.SQL实现数据存储、查询、提前 2. 阅读全文
posted @ 2021-07-12 13:38
夜的独白
阅读(902)
评论(0)
推荐(0)
摘要:

评论(0)
推荐(0)
摘要:
Python数据分析:情感分析 自然语言处理(NLP) 将自然语言(文本)转化为计算机程序更容易理解的形式 预处理得到的字符串进行向量化 经典应用: 情感分析 文本相似度 文本分类 简单情感分析: 情感字典(sentiment dictionary) 人工构造一个字典 根据关键词匹配 优点:简单实用 阅读全文
posted @ 2021-07-12 12:11
夜的独白
阅读(776)
评论(0)
推荐(0)
摘要:
简介:本案例以电信运营商客户信息为数据,通过层次聚类和K- means聚类,对用户划分成不同的群体,然后可以根据用户群体的不同特征提供个性化的策略,从而达到提高ARPU的效果。 1.商业理解 根据客户的日常消费行为,我们可以把客户划分为不同的群体,根据不同群体的消费行为特征,我们可以作出针对性的营销 阅读全文
posted @ 2021-07-12 12:07
夜的独白
阅读(857)
评论(0)
推荐(0)
摘要:
何为聚类分析 聚类分析或聚类是对一组对象进行分组的任务,使得同一组(称为聚类)中的对象(在某种意义上)与其他组(聚类)中的对象更相似(在某种意义上)。它是探索性数据挖掘的主要任务,也是统计 数据分析的常用技术,用于许多领域,包括机器学习,模式识别,图像分析,信息检索,生物信息学,数据压缩和计算机图形 阅读全文
posted @ 2021-07-12 12:03
夜的独白
阅读(1620)
评论(0)
推荐(0)
摘要:
会员数据化运营解决问题: 会员的生命周期状态是什么; 会员的核心诉求是什么; 会员的转化习惯和路径是什么; 会员的价值如何; 如何扩大市场覆盖、获得更多的新会员; 如何更好地维系老会员; 应该在什么时间、采取何种措施、针对哪些会员做哪些运营活动; 在特定运营目标下,应该如何制定会员管理策略,包括行为 阅读全文
posted @ 2021-07-12 11:49
夜的独白
阅读(492)
评论(0)
推荐(0)
摘要:
Matplotlib数据分析基础 * 概要 * matplotlib.pyplot.plot绘制折线图 matplotlib.pyplot.bar绘制条形图 matplotlib.pyplot.hist绘制直方图 matplotlib.pyplot.scatter绘制散点图 概要 本博客总结了mat 阅读全文
posted @ 2021-07-12 11:46
夜的独白
阅读(322)
评论(0)
推荐(0)
摘要:
Matplotlib数据分析基础 * 概要 * matplotlib.pyplot.plot绘制折线图 matplotlib.pyplot.bar绘制条形图 matplotlib.pyplot.hist绘制直方图 matplotlib.pyplot.scatter绘制散点图 概要 本博客总结了mat 阅读全文
posted @ 2021-07-12 11:37
夜的独白
阅读(550)
评论(0)
推荐(0)
摘要:
数据分析初始阶段,通常都要进行可视化处理。数据可视化旨在直观展示信息的分析结果和构思,令某些抽象数据具象化,这些抽象数据包括数据测量单位的性质或数量。本章用的程序库matplotlib是建立在Numpy之上的一个Python图库,它提供了一个面向对象的API和一个过程式类的MATLAB API,他们 阅读全文
posted @ 2021-07-12 11:31
夜的独白
阅读(1027)
评论(0)
推荐(0)
|