摘要: 数据科学交流群,群号:189158789 ,欢迎各位对数据科学感兴趣的小伙伴的加入! 目录 01 网络公开数据集02 数据报采集03 网络爬虫04 日志收集05 社会调查06 业务数据集07 埋点采集08 传感器采集09 数据交易平台10 个人数据收集 00 基本概念 数据集,又称为资料集、数据集合 阅读全文
posted @ 2021-01-02 22:58 PurStar 阅读(12669) 评论(0) 推荐(0) 编辑
摘要: 一、数据化管理 定义 数据化管理是指将业务工作通过完善的基础统计报表体系、数据分析体系进行明确计量、科学分析、精准定性,以数据报表的形式进行记录、查询、汇报、公示及存储的过程,是现代企业管理方法之一。数据化管理的目标在于为管理者提供真实有效的科学决策依据,宣导与时俱进的充分利用信息技术资源,促进企业 阅读全文
posted @ 2020-12-22 20:46 PurStar 阅读(1107) 评论(0) 推荐(0) 编辑
摘要: 目录 CRISP-DM方法 SEMMA方法 DMAIC方法 AOSP-SM模型 5A模型 数据挖掘与分析的“七步法” 一、CRISP-DM方法(最流行) CRISP-DM - Data Science Project Managementhttps://www.datascience-pm.com/ 阅读全文
posted @ 2020-12-22 01:36 PurStar 阅读(1628) 评论(0) 推荐(0) 编辑
摘要: 方案一、在PowerPivot中,将其中一张表复制多份,分别与另一张表做链接。 方案二、在PowerQuery中,做多次合并查询,把所有数据集中在一张表中,方便后面的数据分析。 思考:不仅仅是在PowerBI中可能会遇到问题,其他工具在处理表格数据也有可能会遇到这个问题! 数据科学交流群,群号:18 阅读全文
posted @ 2020-12-22 00:25 PurStar 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 目录 一、基础软件:Excel、SQL 二、BI软件: ①传统BI软件:SAP BO、IBM Cognos、Oracle BIEE ②敏捷BI软件:Tableau、Power BI、FineBI 三、统计分析软件:MATLAB、SPSS、Stata、SAS、EViews 四、数据分析编程语言:Pyt 阅读全文
posted @ 2020-12-21 19:06 PurStar 阅读(17926) 评论(1) 推荐(0) 编辑
摘要: 批处理 新到达的数据元素被收集到一个组中。整个组在未来的时间进行处理,批量处理一定时间段,一定数量或者一定大小的数据组。 历史上,绝大多数数据处理技术都是为批处理而设计的。传统的数据仓库和Hadoop是专注于批处理的系统的两个常见示例。 数据先保存起来,然后分析(全量数据),批处理有延迟性,响应时间 阅读全文
posted @ 2020-12-20 22:42 PurStar 阅读(495) 评论(0) 推荐(0) 编辑
摘要: 数据科学是利用科学方法、流程、算法和系统从数据中提取价值的跨学科领域。数据科学家综合利用一系列技能(包括统计学、计算机科学和业务知识)来分析从网络、智能手机、客户、传感器和其他来源收集的数据。 数据科学揭示趋势并产生见解,企业可以利用这些见解做出更好的决策并推出更多创新产品和服务。数据是创新的基石, 阅读全文
posted @ 2020-12-20 12:10 PurStar 阅读(675) 评论(0) 推荐(0) 编辑
摘要: 一、Mahout系统 Apache Mahout 官网地址http://mahout.apache.org/ Apache Mahout(TM)是一个分布式线性代数框架,具有数学表达力的Scala DSL,旨在让数学家,统计学家和数据科学家快速实现自己的算法。建议使用Apache Spark开箱即用 阅读全文
posted @ 2020-12-19 23:11 PurStar 阅读(427) 评论(0) 推荐(0) 编辑
摘要: Excel 帮助和学习 - Microsoft 支持https://support.microsoft.com/zh-cn/excel Power Query M 公式语言引用 - PowerQuery M | Microsoft Docshttps://docs.microsoft.com/zh- 阅读全文
posted @ 2020-12-19 21:45 PurStar 阅读(435) 评论(0) 推荐(0) 编辑
摘要: 目录 一、数据服务 二、OLTP与OLAP OLTP OLAP 区别 三、不同数据库技术(SQL、NoSQL、NewSQL)的对比 SQL NoSQL NewSQL 一、数据服务 数据服务(Data Serving)指的是面向各种操作型业务,提供数据的增加、删除、修改以及简单的查询功能。提供数据服务 阅读全文
posted @ 2020-12-19 21:23 PurStar 阅读(1140) 评论(0) 推荐(0) 编辑