上一页 1 2 3 4 5 6 7 8 9 ··· 234 下一页

2025年3月21日

Pre-training、Post-training、Continue training的区别

摘要: 在训练大语言模型时,大家可能会搞混以下几个概念,下面做一个详细的对比区分: 概念 Pre-training(预训练) Post-training(后训练) Continue Training(持续训练)定义 预训练是指在模型的初始阶段,使用大量数据对模型进行训练,以便让模型学习到通用的特征和知识。这 阅读全文

posted @ 2025-03-21 15:56 ExplorerMan 阅读(1257) 评论(0) 推荐(0)

2025年3月20日

CRAG 纠错检索增强方法详解

摘要: CRAG(Corrective Retrieval Augmented Generation)是一种纠错检索增强生成方法,其主要步骤如下: 1. 检索阶段 用户输入查询 :用户向系统输入一个查询请求,例如“艾萨克·牛顿是如何发现万有引力的?”。 检索器检索文档 :系统中的检索器根据用户查询从预设的知 阅读全文

posted @ 2025-03-20 16:23 ExplorerMan 阅读(195) 评论(0) 推荐(0)

2025年3月19日

INP 洞见,AI 时代 Data Infra 的必争之地——湖仓架构

摘要: 湖仓架构与概念在北美大火,多家科技巨头纷纷跟进 01 今年众多的 AI 交易中,有如下两笔交易: 6月4日,Databricks 宣布收购最火的数据湖表格式 Apache Iceberg 背后的商业机构 Tabular,Databricks 表示最终的交易价格将在 10 亿美元以上。 6月21日,O 阅读全文

posted @ 2025-03-19 19:57 ExplorerMan 阅读(405) 评论(0) 推荐(0)

反幻觉(Anti-Hallucination)

摘要: 反幻觉(Anti-Hallucination)的核心目标 问题本质:生成模型(如大语言模型)可能虚构信息(幻觉),需通过技术手段约束其输出,使其更忠实于事实或输入数据。 常见方法: 知识增强:引入外部知识库(如检索数据库、向量数据库)辅助生成。 事实检查模块:通过后处理验证输出准确性。 Prompt 阅读全文

posted @ 2025-03-19 17:26 ExplorerMan 阅读(66) 评论(0) 推荐(0)

减少 LLM 幻觉方法--CoVe

摘要: https://zhuanlan.zhihu.com/p/678902427 来自于 Meta AI,原文链接如下: 原文链接​arxiv.org/abs/2309.11495 LLM 经常遇到的主要问题就是幻觉,减少幻觉的方法大致可分为三类:训练时校正、生成时校正和通过增强(使用工具)进行校正。 阅读全文

posted @ 2025-03-19 17:25 ExplorerMan 阅读(281) 评论(0) 推荐(0)

蚂蚁集团在大模型推荐上的算法和应用

摘要: 导读 本文将分享大模型在蚂蚁集团推荐场景中的应用(以下全部为蚂蚁集团的研究工作及落地)。 主要内容包括以下几大部分: 1. 背景介绍 2. 利用大模型进行知识提取 3. 大模型作为教师模型 4. Q&A 分享嘉宾|胡斌斌 蚂蚁集团AI创新研发部门NextEvo 算法专家 编辑整理|王甲君 内容校对| 阅读全文

posted @ 2025-03-19 16:52 ExplorerMan 阅读(580) 评论(0) 推荐(0)

EmoLLM-心理健康大模型

摘要: EmoLLM 是一系列能够支持 理解用户-支持用户-帮助用户 心理健康辅导链路的心理健康大模型,由 LLM指令微调而来,欢迎大家star~⭐⭐。目前已经开源的 LLM 微调配置如下: 心理健康大模型(Mental Health Grand Model)是一个综合性的概念,它旨在全面理解和促进个体、群 阅读全文

posted @ 2025-03-19 16:30 ExplorerMan 阅读(176) 评论(0) 推荐(0)

2025年3月18日

PingCAP 王琦智:下一代 RAG,tidb.ai 使用知识图谱增强 RAG 能力

摘要: 导读 随着 ChatGPT 的流行,LLMs(大语言模型)再次进入人们的视野。然而,在处理特定领域查询时,大模型生成的内容往往存在信息滞后和准确性不足的问题。如何让 RAG 和向量搜索技术在实际应用中更好地满足企业需求?如何在向量之上构建全链路 RAG 服务,提升开发者效率,降低成本?本文整理自 T 阅读全文

posted @ 2025-03-18 23:28 ExplorerMan 阅读(124) 评论(0) 推荐(0)

万字长文分享快手 Kolors 可图大模型应用实践

摘要: 在企业提效方面,多模态能力同样具有重要意义。在 AICon 北京站活动中,我们邀请了快手「可图」大模型负责人李岩,他分享了主题为《快手「可图」文生图大模型应用实践》的演讲内容,以下为李岩演讲内容~期待对你有所启发! 另外,在 8 月 18-19 日即将举办的 AICon 全球人工智能开发与应用大会上 阅读全文

posted @ 2025-03-18 23:20 ExplorerMan 阅读(151) 评论(0) 推荐(0)

LLM 幻觉检测技术简介

摘要: 在LLMs中,幻觉出现在模型生成的文本偏离其训练集中实际数据的情况下。相反,它制造出看似可信但缺乏事实或背景证据支持的信息。这些幻觉可能导致生成不准确或误导性信息,对于精度和可靠性至关重要的应用而言,这是一个重大问题。幻觉对于广泛实际应用LLMs构成了重大障碍。认识到这一挑战强调了开发自动化方法以识 阅读全文

posted @ 2025-03-18 23:08 ExplorerMan 阅读(262) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 7 8 9 ··· 234 下一页

导航