2025 年 7月 23 日随笔档案 - m516606428

2025年7月23日

这一段是把预测的结果跟实际结果比较么 pred_results 和 labels

摘要：是的，这段代码的核心逻辑就是将模型的预测结果（pred_results）与实际标签（labels）进行比较和统计，以评估模型在验证集上的表现。具体来看：首先通过循环获取验证集的批次数据（batch_data）将数据转移到 GPU（batch_data = [d.cuda() for d in 阅读全文

posted @ 2025-07-23 21:48 m516606428 阅读(30) 评论(0) 推荐(0)

rag 召回怎么做的

摘要：在 RAG（Retrieval-Augmented Generation，检索增强生成）中，召回（Retrieval）是核心环节之一，其目标是从海量知识库（如文档、数据库、网页等）中快速、准确地找到与用户查询（Query）最相关的候选内容（如文档片段、句子、段落），为后续的生成模型（LLM）提供 “ 阅读全文

posted @ 2025-07-23 17:06 m516606428 阅读(195) 评论(0) 推荐(0)

论文查重什么原理

摘要：论文查重（学术不端检测）是通过技术手段识别论文中与已有文献的相似性内容，核心目标是防止学术抄袭、规范学术写作。其原理涉及文本处理、相似性计算、数据库比对等多个技术环节，具体可拆解为以下步骤：一、文本预处理：将论文转化为可分析的 “数字信号” 查重系统首先需要对送检论文和比对库中的文献进行标准化处理阅读全文

posted @ 2025-07-23 16:58 m516606428 阅读(69) 评论(0) 推荐(0)

保险行业有多个适合 NLP 大模型的任务

摘要：保险行业有多个适合 NLP 大模型的任务，以下是一些较为突出的：理赔流程优化理赔反欺诈：传统反欺诈建模主要围绕结构化数据展开，精准度不高。NLP 大模型可直接对文本、语音等非结构化数据进行训练，例如通过分析报案客服人员备注、查勘人员备注等文本信息，快速准确地识别潜在的欺诈行为，大幅提升精准率，减阅读全文

posted @ 2025-07-23 16:57 m516606428 阅读(24) 评论(0) 推荐(0)

保险行业有多个适合 NLP 大模型的任务，以下是一些较为突出的：

posted @ 2025-07-23 16:50 m516606428 阅读(34) 评论(0) 推荐(0)

深度学习问答型任务型

摘要：在深度学习领域，“问答型任务” 和 “任务型对话任务” 是自然语言处理（NLP）中两类重要的应用方向，均依托深度学习模型实现对语言的理解与交互，但目标、场景和技术重点存在显著差异。以下从基础概念、核心技术、应用场景等方面详细解析：一、深度学习基础：两类任务的技术底座深度学习是机器学习的分支，核心阅读全文

posted @ 2025-07-23 16:45 m516606428 阅读(53) 评论(0) 推荐(0)

NL2SQL（Natural Language to SQL）是将自然语言问句自动转换为结构化 SQL 查询语句的技术，核心目标是让用户通过日常语言（如中文、英文）直接查询数据库，无需掌握 SQL 语法，从而降低数据查询的技术门槛，实现 “用语言对话数据”。

摘要： NL2SQL（Natural Language to SQL）是将自然语言问句自动转换为结构化 SQL 查询语句的技术，核心目标是让用户通过日常语言（如中文、英文）直接查询数据库，无需掌握 SQL 语法，从而降低数据查询的技术门槛，实现 “用语言对话数据”。一、核心目标与价值在传统数据库查询中，阅读全文

posted @ 2025-07-23 16:42 m516606428 阅读(203) 评论(0) 推荐(0)

“Agent” 是一个多领域术语，在不同语境下有不同的核心含义，其本质都围绕 “通过自主行动或代理行为达成目标” 这一核心逻辑。以下从主要应用领域展开详细解释：

摘要： “Agent” 是一个多领域术语，在不同语境下有不同的核心含义，其本质都围绕 “通过自主行动或代理行为达成目标” 这一核心逻辑。以下从主要应用领域展开详细解释：一、商业与法律领域：代理人（Agent）在商业和法律中，“Agent” 指受他人（委托人，Principal）委托，在授权范围内代表委托阅读全文

posted @ 2025-07-23 16:35 m516606428 阅读(270) 评论(0) 推荐(0)

混合精度：原理、优势与实践指南

摘要：混合精度：原理、优势与实践指南在深度学习和高性能计算领域，混合精度（Mixed Precision）是一种通过同时使用不同精度的数据类型进行计算，在保证模型性能基本不变的前提下，显著提升计算效率的关键技术。随着深度学习模型规模的爆炸式增长（如大语言模型、扩散模型），混合精度已成为大规模模型训练与阅读全文

posted @ 2025-07-23 16:29 m516606428 阅读(604) 评论(0) 推荐(0)

LoRA（Low-Rank Adaptation of Large Language Models）是一种轻量级参数高效微调（PEFT）技术，可在不重新训练大型语言模型（LLM）全部参数的情况下，高效适应特定任务或领域。相比传统全量微调（需训练数十亿至数万亿参数），LoRA 仅更新少量新增参数，大幅降低计算和存储成本。

摘要： LoRA（Low-Rank Adaptation of Large Language Models）是一种轻量级参数高效微调（PEFT）技术，可在不重新训练大型语言模型（LLM）全部参数的情况下，高效适应特定任务或领域。相比传统全量微调（需训练数十亿至数万亿参数），LoRA 仅更新少量新增参数，大幅阅读全文

posted @ 2025-07-23 16:27 m516606428 阅读(209) 评论(0) 推荐(0)

在深度学习和大规模模型训练中，混合并行（Hybrid Parallelism）是一种结合多种并行计算技术的策略，旨在高效利用多设备（如 GPU、TPU）资源，解决超大模型（如千亿 / 万亿参数 LLM）的训练和推理难题。其核心思想是通过 “拆分数据、拆分模型、拆分计算” 的组合方式，突破单设备内存、算力的限制，同时提升整体效率。

摘要：在深度学习和大规模模型训练中，混合并行（Hybrid Parallelism）是一种结合多种并行计算技术的策略，旨在高效利用多设备（如 GPU、TPU）资源，解决超大模型（如千亿 / 万亿参数 LLM）的训练和推理难题。其核心思想是通过 “拆分数据、拆分模型、拆分计算” 的组合方式，突破单设备内存阅读全文

posted @ 2025-07-23 16:24 m516606428 阅读(89) 评论(0) 推荐(0)

GRPO 是指群组相对策略优化（Group Relative Policy Optimization），是一种基于强化学习的策略优化算法，旨在提升大语言模型在复杂任务中的表现。以下是具体介绍：

摘要：在深度学习领域，没有 “GPRO” 相关的常见概念，你想问的可能是 “GRPO”。GRPO 是指群组相对策略优化（Group Relative Policy Optimization），是一种基于强化学习的策略优化算法，旨在提升大语言模型在复杂任务中的表现。以下是具体介绍：提出背景：传统的近端策略阅读全文

posted @ 2025-07-23 16:20 m516606428 阅读(172) 评论(0) 推荐(0)

DPO 深度学习

摘要：在深度学习领域，DPO（Direct Preference Optimization）是一种重要的模型对齐技术，主要用于将预训练语言模型（LLM）与人类偏好对齐，无需依赖传统强化学习（RL）中的奖励模型（RM），简化了训练流程。 DPO 的核心思想 DPO 旨在直接通过人类对模型输出的偏好数据（即阅读全文

posted @ 2025-07-23 16:19 m516606428 阅读(98) 评论(0) 推荐(0)

m516606428

公告