会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dlimeng
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
49
下一页
2023年5月14日
AI模型实战
摘要: 文章目录 背景流程示例定义问题数据收集构建特征选择算法并建立模型训练模型模型评估显示 背景 通过示例梳理AI模型训练流程,示例比较简单,方便演示。 流程 机器学习实战步骤 定义问题数据收集和预处理选择算法并建立模型训练模型模型评估和优化 示例 定义问题 根据公开数据集预测加州房价分布 数据收集 im
阅读全文
posted @ 2023-05-14 23:14 Dlimeng
阅读(25)
评论(0)
推荐(0)
2023年5月11日
Flink AggregateFunction
摘要: 一.aggregate 函数 Flink的AggregateFunction是一个基于中间计算结果状态进行增量计算的函数,由于是迭代计算方式,所以,在窗口处理过程中,不用缓存整个窗口数据,所以效率执行比较高。 该函数会将给定的聚合函数应用于每个窗口和键,对每个元素调用聚合函数,以递增方式聚合值,并将
阅读全文
posted @ 2023-05-11 20:16 Dlimeng
阅读(59)
评论(0)
推荐(0)
2023年5月10日
Flink DataStream 转换
摘要: 一.简介 基本转换做一个概述,基于时间算子(窗口,水位线)以及其他一些特殊转换会在后面文章介绍。 DataStream API的转换分为四大类: 作用于单个事件的基本转换。 针对相同键值事件的KeyedStream转换。 将多条数据流合并为一条或将一条数据流拆分成多条流转换。 对流中的事件进行重新组
阅读全文
posted @ 2023-05-10 10:28 Dlimeng
阅读(16)
评论(0)
推荐(0)
2023年5月6日
安装并使用JupyterLab
摘要: 背景 JupyterLab 是用于笔记本、代码和数据的最新的基于 Web 的交互式开发环境。其灵活的界面允许用户配置和安排数据科学、科学计算、机器学习方面的工作流程。模块化设计邀请扩展来扩展和丰富功能。 部署 要在本机搭建 Jupyter Notebook 平台进行机器学习项目,有一种最简单的方法,
阅读全文
posted @ 2023-05-06 20:07 Dlimeng
阅读(114)
评论(0)
推荐(0)
GitChat-Spark 图计算实战
摘要: Spark GraphX 是一个分布式图处理框架,它是基于 Spark 平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。本文以多年的应用实战的角度去讲解把相关知识串联起来(集团谱系为例)。 GraphX 介绍GraphX 实现分析GraphX 实例相关调优集团成员实
阅读全文
posted @ 2023-05-06 00:10 Dlimeng
阅读(11)
评论(0)
推荐(0)
2023年5月4日
ChatGPT AI聊天机器人实践
摘要: 背景 ChatGPT 时代,开发新的 AI 应用的门槛大大降低了,你无需要去研究机器学习,深度学习等等模型,还有去准备GPU硬件,再新的趋势下,伴随着 GPT-3、Stable Diffusion 这样预训练好的大型基础模型的出现,以及这些模型的能力通过开放 API 的形式提供出来,即使没有任何机器
阅读全文
posted @ 2023-05-04 21:58 Dlimeng
阅读(28)
评论(0)
推荐(0)
2023年5月2日
AIGC景观,随身携带AI助理
摘要: 生成式 AI 景观: https://ai-collection.org/zh-CN/ ChatGPT聚合站:https://hokex.com 游戏生成站:https://latitude.io/ 家庭作业辅助站:https://ontimeai.com/ 文字转语音站:https://www.r
阅读全文
posted @ 2023-05-02 22:30 Dlimeng
阅读(12)
评论(0)
推荐(0)
2023年4月19日
AutoGPT:自主完成任务工具
摘要: 文章目录 背景特点环境可选 部署运行 成本小结 背景 Auto-GPT 是一个实验性开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,将 LLM 的“思想”链接在一起,以自主实现您设定的任何目标。作为 GPT-4 完全自主运行的首批示例之一,Auto-GPT 突破了 AI
阅读全文
posted @ 2023-04-19 16:03 Dlimeng
阅读(91)
评论(0)
推荐(0)
2023年4月13日
cube-studio AI平台 提供开源模型示例列表(3月份)
摘要: 文章目录 背景AI应用商店 背景 cube是腾讯音乐开源的一站式云原生机器学习平台,目前主要包含 1、数据管理:特征存储、在线和离线特征;数据集管理、结构数据和媒体数据、数据标签平台 2、开发:notebook(vscode/jupyter);码头图像管理;在线构建图像 3、train:管道在线拖拽
阅读全文
posted @ 2023-04-13 00:04 Dlimeng
阅读(279)
评论(0)
推荐(0)
2023年4月9日
湖仓一体架构
摘要: 文章目录 数据湖 数据湖产生 数据库时代 传统数据仓库 数仓+数据湖 数据湖和数仓的区别 数据湖引发的问题 数据湖和数据仓库 湖仓一体要解决的问题 湖仓一体架构的提出 湖仓一体的主要特征 湖仓一体 现有的技术途径 访问层 元数据层 优化层 存储层 Databricks的技术途径 数据湖 数据湖是指一
阅读全文
posted @ 2023-04-09 20:11 Dlimeng
阅读(38)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
49
下一页
公告