刷新
读用数据说服:如何设计、呈现和捍卫你的数据01数据图

博主头像 1. 挑战 1.1. 多元认知的挑战 1.1.1. 注意力集中在第一个出现的念头上 1.1.1.1. 这个观察自身思维的过程叫作元认知 1.1.1.2. 它是学习掌握解码过程的一项重要技能 1.1.2. 编码是一个大脑的事,意图清晰,而解码是多个大脑的事 1.1.3. 为了实现高效沟通,你需要理解这 ...

读商战数据挖掘:你需要了解的数据科学与分析思维12总结

博主头像 1. 总结 1.1. 不能简明地解释一件事,说明你对它理解得不够 1.1.1. 爱因斯坦 1.2. 对数据科学实践最好的描述是分析工程和探索的结合 1.3. 商业中会存在我们需要解决的问题,而该问题很少能直接与基础的数据挖掘任务相对应 1.4. 缺少分析工程的结果是,数据挖掘的结论很可能无法用于解决 ...

如何从ElasticSearch迁移到OpenSearch?

博主头像 本文分享自天翼云开发者社区《如何从ElasticSearch迁移到OpenSearch?》,作者:刘****鑫 在云搜索产品的选择中,如果用户倾向于开源软件,并且更喜欢免费提供高级功能的工具,那么 OpenSearch 将更适合。下面主要介绍从ElasticSearch迁移到OpenSearch的方 ...

读商战数据挖掘:你需要了解的数据科学与分析思维11经营战略

博主头像 1. 经营战略 1.1. 仅仅拥有数据,并不能保证数据驱动决策的成功 1.2. 企业管理层必须具有数据分析思维 1.2.1. 并不意味着管理层必须是数据科学家,但要求他们必须充分理解基本原则,从而预见和/或领会数据科学所带来的机遇,为数据科学团队提供合适的资源,并乐于在数据和实验方面投入 1.2.2 ...

AWS使用提示词与RAG来减少大模型幻觉

博主头像 概览 大型语言模型(LLM)是生成内容的强大工具。这些LLM的生成能力伴随着诸多优缺点。我们经常遇到的主要问题之一是生成内容的事实准确性。这些模型具有高度的幻觉倾向,有时会生成不存在或错误的内容。生成的内容往往极具说服力,看起来像是事实正确的有效信息。作为开发者,我们有责任确保系统完美运行并生成简洁 ...

读商战数据挖掘:你需要了解的数据科学与分析思维10数据科学技术

博主头像 1. 面向分析工程 1.1. 数据科学的本质是根据原则性技术,提取数据中的信息或知识 1.2. 很难把技术与重要的商业问题完全匹配,也很难得到能直接应用于技术的数据 1.2.1. 商业人士通常比数据科学新手更容易接受这个事实,因为在统计学、机器学习和数据挖掘等领域的教学过程中,学生们面对的问题通常都 ...

Apache SeaTunnel × Hive 深度集成指南:原理、配置与实践

博主头像 在大数据处理的复杂生态中,数据的高效流转与整合是实现数据价值的关键。Apache SeaTunnel作为一款高性能、分布式、易扩展的数据集成框架,能够快速实现海量数据的实时采集、转换和加载;而Apache Hive作为经典的数据仓库工具,为结构化数据的存储、查询和分析提供了坚实的基础。 将Apach ...

读商战数据挖掘:你需要了解的数据科学与分析思维09文本的挖掘

博主头像 1. 证据和概率 1.1. 对实例的了解视作支持或反对不同目标变量值的证据 1.2. 对实例的了解则可以表示为实例的特征 1.3. 如果你知道每个特征所提供的证据的强度,那么就能应用原则性方法,从概率上合并证据,从而得到有关目标变量值的结论 1.4. 作为消费者的我们,已经对网页上貌似免费的大量信息 ...

OceanBase PoC 经验总结(二)—— AP 业务

博主头像 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 背景 前段时间,OceanBase 社区公众号转载了庆涛大佬的一篇《OceanBase PoC 经验总结(一)》,为大家介绍 ...

读商战数据挖掘:你需要了解的数据科学与分析思维08评估模型

博主头像 1. 概述 1.1. 为了让数据科学给实际应用增加价值,数据科学家和其他利益相关者必须仔细地考虑他们究竟希望通过挖掘数据实现什么 1.1.1. 将数据挖掘的结果与他们的实际目标联系起来 1.1.2. 其影响既可能表现为统计报告中缺少对统计数据正确性的明确解释,也可能表现为不能找出有意义的方法来测量性 ...

读商战数据挖掘:你需要了解的数据科学与分析思维06过拟合

博主头像 1. 概述 1.1. 数据科学中最重要的基本概念之二就是过拟合和泛化能力 1.2. 数据挖掘包含模型复杂度和过拟合概率之间的基本权衡 1.3. 如果数据所表现的现象本身就很复杂,那么就有必要构建一个复杂的模型,但复杂的模型对训练数据过拟合的风险也较高 2. 过拟合 2.1. “模式”事实上只是偶然出 ...

读商战数据挖掘:你需要了解的数据科学与分析思维05拟合数据

博主头像 1. 拟合数据 1.1. 预测建模就是根据其他描述性属性找出目标变量的模型的过程 1.2. 从数据集中提取预测模型的方法,是先确定模型的结构,而使模型的数值型参数待定 1.2.1. 然后再通过数据挖掘,根据特定的训练数据集计算出最佳参数值 1.3. 常见的情形是,模型由含有一系列数值变量的参数化的数 ...

DolphinScheduler 6 个高频 SQL 操作技巧

博主头像 摘要: Apache DolphinScheduler系列4-后台SQL经验分享 关键词: 大数据、数据质量、数据调度 整体说明 在调研了 DolphinScheduler 之后,在项目上实际使用了一段时间,有了一些后台SQL实际经验,分享如下。 进入DolphinScheduler 后台数据库,我 ...

读商战数据挖掘:你需要了解的数据科学与分析思维03数据挖掘流程

博主头像 1. 数据挖掘流程 1.1. 数据挖掘是一门手艺 1.1.1. 涉及大量科学与技术的应用,而如何恰当地应用这些科学与技术也是一门艺术 1.2. 数据挖掘也有一套易于理解的流程,可以将问题解构,并保证合理的一致性、可重复性和客观性 1.3. 循环迭代是数据挖掘流程的常态 1.3.1. 循环迭代一轮没能 ...

<1234···13>