随笔分类 -  BigData

软件工程中线性回归应用
摘要:引言:连接统计学与软件开发在现代软件工程领域,行业范式正在经历一场深刻的变革,决策过程正从依赖直觉和经验转向基于数据的严谨分析 。从开发生命周期中收集和分析数据,已不再是少数前沿团队的专利,而是构建高效能、高可靠性软件系统的核心竞争力 。在众多数据分析技术中,线性回归作为一种历史悠久且功能强大的统计 阅读全文
posted @ 2025-09-29 18:20 PetterLiu 阅读(20) 评论(0) 推荐(0)
数据运营DataOps扩展实时数据系统
摘要:引言 实时决策已不再是竞争优势;它正成为基本预期。从欺诈检测到个性化推荐,现代系统需要在毫秒内处理和响应用户活动。然而,尽管对实时数据的需求激增,许多工程团队仍在应对脆弱的数据管道、静默故障和易碎的部署。本文中,我们将探讨数据运营DataOps如何为实时架构带来亟需的纪律性。我们将深入探讨持续集成/ 阅读全文
posted @ 2025-09-02 12:35 PetterLiu 阅读(31) 评论(0) 推荐(0)
Uber Eats优食如何删除上亿张商品重复图片数据
摘要:背景 在 Uber Eats 优食的规模上,图像处理是运营的必要条件。该平台管理着数亿张产品图片,每小时有数百万次更新流经系统。每张图像都有成本:网络带宽、处理时间、存储空间和 CDN 占用空间。随着 Uber Eats 优食从餐厅扩展到杂货、酒类和家居用品,形象渠道开始紧张。例如,单一产品(例如一 阅读全文
posted @ 2025-08-06 10:31 PetterLiu 阅读(29) 评论(0) 推荐(0)
Kafka基于docker-compose单结点部署SASL_PLAINTEXT
摘要:Kafka基于docker-compose单结点部署SASL_PLAINTEXT背景Kafka是一个分布式流处理平台,由LinkedIn开发并开源,如今在多个行业中都有广泛的应用。以下是Kafka的当前用途以及行业应用的详细描述: **Kafka的用途**: 1. **消息队列**:Kafka最常见 阅读全文
posted @ 2024-04-14 11:19 PetterLiu 阅读(1218) 评论(0) 推荐(0)
15个免费数据集-数据科学项目
摘要:15个免费数据集-数据科学项目 如果您曾经参与过个人数据科学项目,那么您可能已经花了很多时间在互联网上搜索有趣的数据集进行分析。 筛选数十个数据集以找到最适合的数据集可能很有趣,但下载和导入多个 CSV 文件也可能令人沮丧,结果发现数据只是丢失,没有那么有趣。 幸运的是,有一些在线存储库可以保存数据 阅读全文
posted @ 2021-11-28 17:04 PetterLiu 阅读(3865) 评论(0) 推荐(0)
数据分析介绍一
摘要:数据分析是指通过建立审计分析模型对数据进行核对、检查、复算、判断等操作,将被审计单位数据的现实状态与理想状态进行比较,从而发现审计线索,搜集审计证据的过程。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程... 阅读全文
posted @ 2020-04-30 09:13 PetterLiu 阅读(501) 评论(0) 推荐(0)
中台MongoDB应用
摘要:中台MongoDB应用目前数据仓库与大数据不足数据中台以打通部门或数据孤岛的统一数据平台为基础,构建统一数据资产体系,并以API服务方式为全渠道业务 分析+应用,提供即时交付能力的企业级数据架构金融行业技术需求技术产品关系型数据库数据仓库大数据NOSQL与非结构数据MongoDb存储的优势,多模数据库对象模型全渠道业务支持触发器API工具集银行案例基于mongodb的数据平台优势今天先到这儿,希望... 阅读全文
posted @ 2020-04-04 17:22 PetterLiu 阅读(937) 评论(0) 推荐(0)
Elasticsearch与Hadoop集成大数据处理介绍
摘要:传统大数据处理现代数据架构Hadoop在20业务场景的应用DataLakeA data lake is a system or repository of data stored in its natural format, usually object blobs or files. A data lake is usually a single store of all enterprise ... 阅读全文
posted @ 2018-12-22 09:08 PetterLiu 阅读(6204) 评论(0) 推荐(0)