会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zakar
博客园
首页
新随笔
联系
订阅
管理
2024年7月14日
Task01 笔记
摘要: Task01笔记 由比赛任务可知我们的任务是一个机器翻译任务,它是在术语字典的干预下进行的,通过术语词典的干预可以获得更好的结果。 很感谢datawhale提供的baseline,在这篇笔记中我首先会对baseline进行分析,分享我的理解,并在这个过程中穿插一些我掌握的nlp相关知识 1. 数据集
阅读全文
posted @ 2024-07-14 00:21 zakarRoman
阅读(57)
评论(0)
推荐(0)
2024年7月4日
DataWhale暑期夏令营第一期——大模型技术方向task2笔记
摘要: Task 2 笔记 数据分析 可以先通过对标签中各个项进行数据分析(使用values_count方法),可以得到主要任务的各个指标的值分布情况。 我认为这一步的作用: 帮助理解数据。 大模型的本质还是概率生成,通过prompt提示词去进行生成 Baseline优化思路 1.数据处理 角色合并:将同一
阅读全文
posted @ 2024-07-04 00:28 zakarRoman
阅读(86)
评论(0)
推荐(0)
2024年4月7日
用于讲话者视听追踪,基于自监督学习的多模态感知注意力网络——论文阅读
摘要: 用于讲话者视听追踪,基于自监督学习的多模态感知注意力网络——论文阅读 本文是在阅读原论文的过程中的一些学习笔记和自我理解,若有不当,敬请勘误。 1.摘要 概念解释 端到端模型:输入和输出之间没有中间步骤或阶段。端到端模型直接从原始输入数据映射到最终输出结果,没有人为设计的特征提取,中间表示或者预处理
阅读全文
posted @ 2024-04-07 12:37 zakarRoman
阅读(142)
评论(0)
推荐(0)
2024年3月24日
论文阅读笔记——基于SRP-Phat与3D卷积神经网络的声源追踪
摘要: 1.Introdcution 大多数传统声源追踪技术可以分为以下几类 基于到达时延(TDOA)的技术,即首先使用互相关(GCC)函数来估计到达时延,紧接着测算出最有可能的DOA 基于波束成形技术,例如SRP-PHAT。通过搜寻波束成形器最大功率的方向来找寻最可能的DOA 子空间技术,例如多信号分类(
阅读全文
posted @ 2024-03-24 18:58 zakarRoman
阅读(439)
评论(2)
推荐(0)
2024年1月23日
操作系统学习Part1
摘要: 1.1 什么是操作系统 操作系统是指控制和管理整个计算机系统的硬件的软件资源,并合理的组织调度计算机的工作和资源分配;以提供给用户和其他软件方便的接口和环境;是计算机系统中最基本的系统软件 操作系统是系统资源的管理者 提供功能: 处理机管理 存储器管理 文件管理 设备管理 目标:安全高效 操作系统的
阅读全文
posted @ 2024-01-23 00:40 zakarRoman
阅读(36)
评论(0)
推荐(0)
2024年1月8日
初识声源识别-TDOA及GCC-PHAT简述
摘要: 本文主要介绍了一些声源识别的基础概念,常用方法,以及传统的运用广义互相关GCC的TDOA方法。 一、相关定义 混响 定义:声波在室内传播时,被障碍物反射,每一次被反射都要被障碍物吸收一些。当声源停止发声后,声波要在室内经过多次反射和吸收后才会消失。并且在声源停止发声后,还有若干个声波混合持续一段时间
阅读全文
posted @ 2024-01-08 13:37 zakarRoman
阅读(1330)
评论(0)
推荐(2)
公告