摘要: VideoLLaMA 3是基于Llama 3的前沿多模态基础模型,深度融合视觉、听觉与语言理解能力,支持高分辨率图像和长视频的端到端分析。其核心技术包括统一的视听语言架构、高效长视频词元化和万亿级多模态预训练,具备复杂的时空因果推理能力,可同步解析画面与音轨信息。该模型为影视分析、场景理解等任务提供强大支持,相关代码和预训练权重已在Lab4AI平台开源,用户可一键复现实验。 阅读全文
posted @ 2025-11-18 17:56 Lab4AI大模型实验室 阅读(36) 评论(0) 推荐(0)
摘要: 论文《FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection》提出了一种针对航拍图像目标检测的优化方法。针对航拍场景中小目标密集、尺度变化大等挑战,该研究通过轻量化网络设计、增强的多尺度特征融合、专设小目标检测层以及注意力机制等技术,显著提升了检测速度和精度。实验表明,FBRT-YOLO在保持高精度的同时实现了更快的处理速度,为无人机等边缘设备的实时目标检测提供了有效解决方案。论文已提供完整复现环境与预训练模型。 阅读全文
posted @ 2025-11-18 16:51 Lab4AI大模型实验室 阅读(163) 评论(0) 推荐(0)
摘要: 论文标题:Scaling Instruction-Based VideoEditing with a High-Quality Synthetic Dataset 作者团队:香港科大、蚂蚁集团、浙江大学、东北大学 发布时间:2025年10月17日 👉一键直达论文 [👉Lab4AI大模型实验室论文 阅读全文
posted @ 2025-11-18 16:38 Lab4AI大模型实验室 阅读(7) 评论(0) 推荐(0)
摘要: CVPR 2024 目标检测!开放词汇 01 论文概述 论文名称:YOLO-World: Real-Time Open-Vocabulary Object Detection 会议名称:CVPR (2024) 👉一键直达论文 [👉Lab4AI大模型实验室论文](https://www.lab4a 阅读全文
posted @ 2025-11-18 15:33 Lab4AI大模型实验室 阅读(28) 评论(0) 推荐(0)
摘要: 本文探讨了LightLLM框架在法律智能体中的应用,解决大语言模型知识滞后和幻觉问题。通过RAG框架整合外部知识库,LightLLM实现轻量化部署与高效推理,支持多模型规模与量化策略。文章详细演示了在Lab4AI平台三步搭建法律智能体的过程:部署LLM服务、RAG服务和应用体验。该方案不仅适用于法律领域,还可迁移至金融、医疗等专业场景。Lab4AI平台提供算力、实验环境和社区支持,助力科研人员和开发者从理论到实践的完整闭环。 阅读全文
posted @ 2025-11-17 17:38 Lab4AI大模型实验室 阅读(21) 评论(0) 推荐(0)
摘要: 【项目复现上新】LLaMA Factory 微调实践:从零构建苏东坡角色扮演大模型 | 附Lab4AI平台一键复现指南 你是谁? 我是多才多艺的文学家、书法家和画家,我是苏东坡,我…… 这是微调后大模型的回答,随着人工智能的发展,虚拟角色不再只是冰冷的对话机器,而是可以承载历史人物气质、知识体系乃至 阅读全文
posted @ 2025-11-17 16:22 Lab4AI大模型实验室 阅读(11) 评论(0) 推荐(0)
摘要: 最近电子科技大学联合之江实验室的研究人员开发了 Table2LaTeX-RL,这是一个使用多模态语言模型和双奖励强化学习框架将表格图像转换为高保真 LaTeX 代码的系统。这种方法在复杂表上表现出卓越的性能,实现了 0.6145 的 CW-SSIM 和 0.9218 的 TEDS-Structure 阅读全文
posted @ 2025-11-17 10:41 Lab4AI大模型实验室 阅读(11) 评论(0) 推荐(0)
摘要: 01 论文概述 论文标题:Less is More: Recursive Reasoning with Tiny Networks 作者团队:三星AI实验室(Samsung SAIL Montréal) 发布时间:2025年9月6日 👉一键直达论文 👉Lab4AI大模型实验室论文阅读 研究背景与 阅读全文
posted @ 2025-11-14 16:02 Lab4AI大模型实验室 阅读(4) 评论(0) 推荐(0)
摘要: 01 论文概述 论文标题: Agent Learning via Early Experience: Bridging Imitation and Reinforcement Learning Without Explicit Rewards 作者团队: 由Meta AI FAIR实验室(Faceb 阅读全文
posted @ 2025-11-14 16:01 Lab4AI大模型实验室 阅读(10) 评论(0) 推荐(0)
摘要: Part one :论文概述 论文标题: SAM3: Segment Anything with Concepts 作者团队: Anonymous authors 发布时间: ICLR2026 👉一键直达论文 👉Lab4AI大模型实验室论文阅读 01 摘要解析 SAM3(SegmentAnyth 阅读全文
posted @ 2025-11-14 15:59 Lab4AI大模型实验室 阅读(408) 评论(0) 推荐(0)