摘要: Task01笔记 由比赛任务可知我们的任务是一个机器翻译任务,它是在术语字典的干预下进行的,通过术语词典的干预可以获得更好的结果。 很感谢datawhale提供的baseline,在这篇笔记中我首先会对baseline进行分析,分享我的理解,并在这个过程中穿插一些我掌握的nlp相关知识 1. 数据集 阅读全文
posted @ 2024-07-14 00:21 zakarRoman 阅读(5) 评论(0) 推荐(0) 编辑
摘要: Task 2 笔记 数据分析 可以先通过对标签中各个项进行数据分析(使用values_count方法),可以得到主要任务的各个指标的值分布情况。 我认为这一步的作用: 帮助理解数据。 大模型的本质还是概率生成,通过prompt提示词去进行生成 Baseline优化思路 1.数据处理 角色合并:将同一 阅读全文
posted @ 2024-07-04 00:28 zakarRoman 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 用于讲话者视听追踪,基于自监督学习的多模态感知注意力网络——论文阅读 本文是在阅读原论文的过程中的一些学习笔记和自我理解,若有不当,敬请勘误。 1.摘要 概念解释 端到端模型:输入和输出之间没有中间步骤或阶段。端到端模型直接从原始输入数据映射到最终输出结果,没有人为设计的特征提取,中间表示或者预处理 阅读全文
posted @ 2024-04-07 12:37 zakarRoman 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 1.Introdcution 大多数传统声源追踪技术可以分为以下几类 基于到达时延(TDOA)的技术,即首先使用互相关(GCC)函数来估计到达时延,紧接着测算出最有可能的DOA 基于波束成形技术,例如SRP-PHAT。通过搜寻波束成形器最大功率的方向来找寻最可能的DOA 子空间技术,例如多信号分类( 阅读全文
posted @ 2024-03-24 18:58 zakarRoman 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 1.1 什么是操作系统 操作系统是指控制和管理整个计算机系统的硬件的软件资源,并合理的组织调度计算机的工作和资源分配;以提供给用户和其他软件方便的接口和环境;是计算机系统中最基本的系统软件 操作系统是系统资源的管理者 提供功能: 处理机管理 存储器管理 文件管理 设备管理 目标:安全高效 操作系统的 阅读全文
posted @ 2024-01-23 00:40 zakarRoman 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 本文主要介绍了一些声源识别的基础概念,常用方法,以及传统的运用广义互相关GCC的TDOA方法。 一、相关定义 混响 定义:声波在室内传播时,被障碍物反射,每一次被反射都要被障碍物吸收一些。当声源停止发声后,声波要在室内经过多次反射和吸收后才会消失。并且在声源停止发声后,还有若干个声波混合持续一段时间 阅读全文
posted @ 2024-01-08 13:37 zakarRoman 阅读(301) 评论(0) 推荐(0) 编辑