摘要: The best ChatGPT that $100 can buy. 10月13日,AI领域大神AndrejKarpathy发布了自己的最新开源项目。截至当前,GitHub项目上已经达到29.1KStar。 nanochat是什么 nanochat是AI领域专家AndrejKarpathy发布的开 阅读全文
posted @ 2025-11-14 15:53 Lab4AI大模型实验室 阅读(13) 评论(0) 推荐(0)
摘要: 开发鲁棒且通用的操作策略是机器人领域的关键目标。为实现有效的泛化能力,构建包含大量 演示轨迹 和 在复杂真实环境中完成多样化任务 的综合数据集至关重要。尽管现有研究已致力于整合各类机器人数据集,但仍 缺乏统一的数据收集标准,且在多样化任务、场景和机器人类型方面的 高质量数据不足。 因此,构建一个大规 阅读全文
posted @ 2025-11-14 14:42 Lab4AI大模型实验室 阅读(10) 评论(0) 推荐(0)
摘要: 【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理 当“8000行代码手搓ChatGPT”的热度还未褪去,大模型领域又迎来新惊喜——DeepSeek团队于10月20日开源的 DeepSeek-OCR,以“上下文光学压缩”为核心突破, 阅读全文
posted @ 2025-11-14 10:26 Lab4AI大模型实验室 阅读(585) 评论(0) 推荐(6)
摘要: 仅需五步! SwanLab助力Qwen3-"VL "超小中文多模态模型的”拼接微调“之路 随着人工智能技术的飞速发展,视觉-语言(Vision-Language, VL)多模态模型已成为AI领域的新热点。然而,传统的多模态模型训练往往面临算力需求大、技术门槛高、环境配置复杂等挑战。 针对这一痛点,我 阅读全文
posted @ 2025-11-13 10:53 Lab4AI大模型实验室 阅读(62) 评论(0) 推荐(0)
摘要: 01 | 引入 在人工智能快速发展的今天,通用大语言模型虽然具备强大的语言理解和生成能力,但在专业领域服务时往往显得力不从心。以心理健康支持为例,普通预训练模型无法理解"共情"深层含义,难以给出符合认知行为疗法(CBT)原则的专业建议,导致回答要么过于机械,要么缺乏针对性。 仅靠通用模型无法实现"懂 阅读全文
posted @ 2025-11-12 15:33 Lab4AI大模型实验室 阅读(30) 评论(0) 推荐(0)
摘要: 当前大语言模型(LLM)虽能力突飞猛进,却难逃“知识静态滞后”与“专业内容幻觉”两大痛点。在法律、医疗等强合规场景中,这几乎是“致命缺陷。而 RAG(检索增强生成)框架虽能通过融合外部知识库破解此困,却在落地时遭遇新瓶颈:有限硬件资源下,如何实现高效、低延迟推理? 在此背景下,以LightLLM 为 阅读全文
posted @ 2025-10-30 14:36 Lab4AI大模型实验室 阅读(39) 评论(0) 推荐(0)
摘要: 【每日Arxiv热文】北大新框架 Edit-R1 炸场!破解图像编辑 3 大难题,双榜刷 SOTA 当前基于指令的图像编辑虽借助扩散模型取得进展,但仍面临挑战,本研究突破SFT范式的泛化性与可控性限制,解决扩散模型结合 RL 时的策略优化偏差问题。 阅读全文
posted @ 2025-10-29 11:37 Lab4AI大模型实验室 阅读(163) 评论(0) 推荐(1)
摘要: 【每日Arxiv热文】还在为视频编辑发愁?港科大&蚂蚁集团提出Ditto框架刷新SOTA! 【01 论文概述】 论文标题:ScalingInstruction-BasedVideoEditingwithaHigh-QualitySyntheticDataset 作者团队:香港科大、蚂蚁集团、浙江大学、东北大学 发布时间:2025 年 10 月 17 日 论文链接:https://arxiv 阅读全文
posted @ 2025-10-27 17:40 Lab4AI大模型实验室 阅读(138) 评论(0) 推荐(1)
摘要: 【项目复现上新】Karpathy大神开源GitHub高分项目NanoChat!仅用100美元+8000行代码手搓ChatGPT 10月13日,AI领域大神AndrejKarpathy发布了自己的最新开源项目。截至当前,GitHub项目上已经达到29.1KStar。 阅读全文
posted @ 2025-10-22 11:47 Lab4AI大模型实验室 阅读(34) 评论(0) 推荐(0)
摘要: 【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理 DeepSeek团队于10月20日开源的DeepSeek-OCR,以“上下文光学压缩”为核心突破,重新定义了OCR(光学字符识别)的效率边界。 阅读全文
posted @ 2025-10-22 10:54 Lab4AI大模型实验室 阅读(67) 评论(0) 推荐(0)