刷新
袋鼠云春季生长大会圆满落幕,带来数实融合下的新产品、新方案、新实践!

博主头像 4月20日,以“数实融合,韧性生长”为主题的袋鼠云春季生长大会圆满落幕。 在春季生长大会中,袋鼠云带来了数实融合趋势下的最新行业沉淀、最佳实践经验和行业前瞻性的产品发布。从大数据基础软件“数栈”、到低代码数字孪生世界“易知微”,再到可观测运维专家“云掣”,为广大用户带来了一场场精彩内容,共话数字未来 ...

新起点!大数据分布式可视化的 DAG 任务调度系统 Taier 正式发布1.4版本

博主头像 我们很高兴向大家宣布,2023年4月14日,Taier 正式发布 1.4 版本。自2022年2月份 Taier 正式开源以来,收到了很多开发者和行业用户的积极评价,在诸多生产环境中已得到充分应用。Taier 1.4版本正是吸收了各类实践经验及大家的建议,进行了此次迭代优化。 本次更新不仅包含了性能优 ...

Linux操作系统网络模块

博主头像 Linux操作系统的网络模块是负责网络通信的核心部分。它通过实现各种协议和算法,使得计算机能够在网络中进行数据交换和通信。网络模块主要包括以下几个方面的功能: (1)IP协议栈:负责处理网络层的数据包,实现IP地址的分配、路由选择等功能。 IP协议栈是网络模块中最基本的部分,它负责处理网络层的数据包 ...

袋鼠云春季生长大会最新议程来啦!4月20日我们云上见

博主头像 如今,数字经济正逐步走向深化应用、规范发展、普惠共享的新阶段,数字经济与实体经济深度融合、基础软件国产化替代成为数字时代主潮流。数字工具如何让千行百业共同实现韧性生长? 「 2023 袋鼠云春季生长大会」乘风而起,带来数实融合趋势下的产品焕新升级剖析、前瞻行业视觉解读、最佳数字实践分享,助力各大产业 ...

elasticsearch升级和索引重建

博主头像 1.背景描述 es在本公司承载三个部分的业务,站内查询,订单数据统计,elk日志分析。 2020年团队决定对elasticsearch升级。es(elasticsearch缩写,下同)当前版本为1.x,升级到5.x版本。 5.x支持如下新特性: 支持lucene 6.x,磁盘空间少一半,索引时间少一 ...

如何在移动端数据可视化大屏实现分析?

博主头像 本文由葡萄城技术团队于博客园原创并首发转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 项目想做数据可视化,想同时在PC端、手机端查看数据怎么办?业务主要关心的数据包括:销售数据、业绩达成、同比、环比,各产品销售情况及潜客商机、未来收入预测等数据,最好附加人 ...

读SQL进阶教程笔记11_关系数据库基础

博主头像 1. 1969年 1.1. 关系模型的创始人E.F. Codd(1923—2003) 1.1.1. 牛津大学数学专业 1.1.2. 一己之力奠定了关系模型的基础 1.2. 论文《大型数据库中关系存储的可推导性、冗余与一致性》 2. 1970年 2.1. 权威学术杂志Communications of ...

聊聊简单又不简单的图上多跳过滤查询

博主头像 摘要:多跳查询能力也是一个衡量产品性能非常重要的指标。 本文分享自华为云社区《聊聊超级快的图上多跳过滤查询》,作者:弓乙。 在图数据库/图计算领域,多跳查询是一个非常常用的查询,通常来说以下类型的查询都可以算作是多跳过滤查询: 1.查询某个用户的朋友认识的朋友 --二跳指定点label的查询 2.查 ...

Java语言在Spark3.2.4集群中使用Spark MLlib库完成XGboost算法

博主头像 一、概述 XGBoost是一种基于决策树的集成学习算法,它在处理结构化数据方面表现优异。相比其他算法,XGBoost能够处理大量特征和样本,并且支持通过正则化控制模型的复杂度。XGBoost也可以自动进行特征选择并对缺失值进行处理。 二、代码实现步骤 1、导入相关库 import org.apach ...

Java语言在Spark3.2.4集群中使用Spark MLlib库完成朴素贝叶斯分类器

博主头像 一、贝叶斯定理 贝叶斯定理是关于随机事件A和B的条件概率,生活中,我们可能很容易知道P(A|B),但是我需要求解P(B|A),学习了贝叶斯定理,就可以解决这类问题,计算公式如下: P(A)是A的先验概率 P(B)是B的先验概率 P(A|B)是A的后验概率(已经知道B发生过了) P(B|A)是B的后验 ...

电商平台商品详情接口的应用场景

博主头像 ☞ 商品接口的定义 价格、库存量、发货地点等。此外,它还可以提供商品的详细信息,包括商品的图片、详细描述、规格参数、售后服务等。这些信息可以帮助用户更好地了解商品,从而更好地选择商品。 其次,电商平台商品详情接口的实现原理是基于RESTful API。RESTful API是一种基于HTTP协议的A ...

数据开发提效有秘诀!离线开发BatchWorks 六大典型场景拆解

博主头像 回顾大数据的发展历程,一句话概括就是海量数据的高效处理。在当今快节奏、不断变化的市场环境下,优秀的开发效率已经成为企业数字化转型的必备条件。 数栈离线开发BatchWorks 是一款专注离线数据ELT开发的产品,采用先进的大数据生态底层技术,具备高性能且功能丰富的大数据处理能力,对大数据离线计算、数 ...

大数据 + VR 全景技术重塑“二手车买车场景”

博主头像 二手车交易的核心问题在于车况信息不透明。中国二手车交易市场制度尚不完善,长期以来缺少行业公认的车辆估值标准和车况检测标准,二手车商提供的估值和车况信息不够透明。这导致用户和车商交易双方都陷入了循环困境:用户对车商信任不足,购买意愿低。二手车商缺少潜在客户线索,为招揽客户不惜采用虚假信息,使得市场环境... ...

浅析云原生时代的服务架构演进

博主头像 摘要:相比于传统的微服务架构,云原生和 serverless 技术更加灵活、高效,能够更好地满足用户的需求。 本文分享自华为云社区《《凤凰架构》学习和思考——云原生时代的服务架构演进史》,作者:breakDawn。 随着云原生的概念越来越火,服务的架构应该如何发展和演进,成为很多程序员关心的话题。大 ...

大数据面试题集锦-Hadoop面试题(一)

博主头像 你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。 1、集群的最主要瓶颈 磁盘IO 2、Hadoop运行模式 单机版、伪分布式模式、完全分布式模式 3、Hadoop生态圈的组件并做简要描述 Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服 ...

hadoop知识点总结

博主头像 Hadoop简介安装 狭义上Hadoop指的是Apache软件基金会的一款开源软件用java语言实现,开源允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理 Hadoop核心组件 Hadoop HDFS(分布式文件存储系统):解决海量数据存储 Hadoop YARN(集群资源管理和 ...

spark 流处理实例

博主头像 开发环境: 系统:win 11 java : 1.8 scala:2.13 spark : 3.3.2 一, 使用 spark 结构化流读取文件数据,并做分组统计。 功能:spark 以结构化流形式从文件夹读取 csv 后缀数据文件,并进行连表分组统计。每次触发计算后,结果表输出到console控制 ...

<1···1920