摘要: 深度剖析训练并行性的基础概念 LLM 架构专栏 大模型架构专栏文章阅读指南 Agent系列 强化学习系列 欢迎加入大模型交流群:加群链接 https://docs.qq.com/doc/DS3VGS0NFVHNRR0Ru# 公众号【柏企阅文】 知乎【柏企】 个人网站:https://www.chen 阅读全文
posted @ 2025-04-12 20:26 柏企 阅读(489) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2025-04-12 13:28 柏企 阅读(17) 评论(0) 推荐(0)
摘要: 多智能体微调是一种实现自我提升的补充方法,它将微调应用于语言模型的多智能体群体。一组均基于相同基础模 阅读全文
posted @ 2025-01-23 14:42 柏企 阅读(146) 评论(0) 推荐(0)
摘要: 多LLM文本摘要:创新方法与卓越成果 论文 https://arxiv.org/abs/2412.1 阅读全文
posted @ 2025-01-23 14:29 柏企 阅读(251) 评论(0) 推荐(0)
摘要: 深入探究架构并利用从RNN到Transformer的NLP模型构建实际应用 本系列文章 ❝ 1. L 阅读全文
posted @ 2025-01-23 14:16 柏企 阅读(168) 评论(0) 推荐(0)
摘要: 深度解析从RNN到Transformer:构建NLP应用的架构演进之路 📖阅读时长:50分钟 🕙 阅读全文
posted @ 2025-01-20 21:59 柏企 阅读(274) 评论(0) 推荐(0)
摘要: 谷歌60s视频生成模型Veo的技术亮点如下: 高分辨率长视频生成 高分辨率输出:能够生成高质量的10 阅读全文
posted @ 2025-01-16 22:17 柏企 阅读(53) 评论(0) 推荐(0)
摘要: 使用 Perspective 为 AI 艺术添加真实世界的深度 📖阅读时长:10分钟 🕙发布时间 阅读全文
posted @ 2025-01-16 21:58 柏企 阅读(83) 评论(0) 推荐(0)
摘要: ByteDance新开源模型LatentSync,视频换声对口型超轻松! 阅读时长:9分钟 论文地址 阅读全文
posted @ 2025-01-16 21:47 柏企 阅读(577) 评论(0) 推荐(0)
摘要: 微软Trellis:开启3D生成新纪元 阅读时长:8分钟 图片来源:微软研究院 “ 近日热文:全网最 阅读全文
posted @ 2025-01-16 21:37 柏企 阅读(882) 评论(0) 推荐(0)