摘要: 【人】核心:培养 招聘优秀人才,打造质量团队 定期专项分享,培训专业技能 明确质量责任,强化质量导向 【法】核心:标准 明确质量目标,量化评价标准 制定操作规范,统一执行标准 监控过程质量,确保符合标准 持续改进体系,优化质量标准 【测】核心:评估 强化测试环节,验证标准符合性 严格质量监测,保障产 阅读全文
posted @ 2024-06-03 10:48 Syw_文 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-06-03 10:18 Syw_文 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 标注样例: 阅读全文
posted @ 2023-12-21 15:53 Syw_文 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 算法质量保障要点解读 算法质量保障流程 数据标注事项 ● 明确数据标注目的和需求:如明确是训练模型、测试模型、评估模型等 ● 制定标注计划:范围、进度、人员、工具等 ● 选择合适的标注人员:专业知识、背景、能力等 ● 提供标注培训/指导:标注目的/需求的介绍、标注标准的讲解、标注方法的演示、练习 ● 阅读全文
posted @ 2023-12-12 16:08 Syw_文 阅读(429) 评论(0) 推荐(1) 编辑
摘要: 大模型事实核查测试介绍 大模型的事实核查维度主要包括以下几个方面: 事实理解:大模型需要能够理解事实陈述中的事实信息,包括事实的主体、客体、属性、关系等。 知识推理:大模型需要能够根据事实信息进行推理,从而得出新的事实信息。 语言生成:大模型需要能够生成准确的事实陈述,以回答事实核查问题。 具体来说 阅读全文
posted @ 2023-12-08 18:41 Syw_文 阅读(306) 评论(0) 推荐(0) 编辑
摘要: ● 评测工具:用于评估模型的整体能力 ● 评测基准:用于评估模型在特定任务方面的能力 评测集名称 核心维度 测试模型的描述 评测类型 MMLU 多模态语言理解 理解文本、图像和音频等多种模态数据之间的关系方面的能力 评测工具 AGIEVAL 通用人工智能 自然语言理解、机器翻译、视觉识别等多种不同任 阅读全文
posted @ 2023-12-08 11:16 Syw_文 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 语言大模型(Large Language Models, LLMs)是近年来自然语言处理领域的重要发展之一。其主要特点是: 海量参数:LLMs包含了上十亿个参数,特别是GPT-3包含了1759亿个参数。这些大规模的参数使其可以学习非常复杂的模式和表征。 巨量数据集:LLMs通过海量数据进行预训练,例 阅读全文
posted @ 2023-12-05 20:21 Syw_文 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 概念:特征工程是机器学习中的一项重要技术,它通过对数据进行预处理、转换和提取,使得机器学习算法能够更好地利用数据特征进行模型训练和预测 特征处理和选择是特征工程的核心环节,其主要目的是从原始数据中提取出与特定任务相关的特征,并去除无关或冗余的特征,从而提高模型的性能和准确性。通过这些特征处理和选择的 阅读全文
posted @ 2023-12-05 14:29 Syw_文 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 数据标注是将原始数据进⾏加⼯处理,⽐如分类、拉框、注释、标记等操作转换成机器可识别信息的过程。 国内数据标注⼚商,⼴义称之为基础数据服务提供商,通常需要完成数据集结构/流程设计、数据处理、数据质检等⼯作,为下游客⼾提供通⽤数据集、定制化服务、数据闭环⼯具链等。这也是本次AIGC数据标注全景报告的研究 阅读全文
posted @ 2023-11-22 10:00 Syw_文 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 建立大模型的数据质量保障机制是确保模型性能和可靠性的关键一步。以下是建立此类机制的一般步骤: 1. **数据采集与收集**: - 确定数据来源:明确定义从哪里获取数据,例如数据库、外部API、传感器等。 - 数据采集策略:定义数据采集频率、数据范围、采集设备等。 - 数据收集:设计和实施数据收集过程 阅读全文
posted @ 2023-10-30 20:39 Syw_文 阅读(71) 评论(0) 推荐(0) 编辑