• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

cwilling

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

2022年9月17日

自然语言第一课(综述)

摘要: 人类处理语言一共有六种模型 第一种,输入是语音,输出是文字——语音辨识(Automatic Speech Recognition-ASR) 第二种,输入是文字,输出是语音——语音合成 第三种,输入是语音,输出是语音 第四种,输入是语音,输出这是语音的哪个类别(class) 第一种例子是输入一段语音, 阅读全文

posted @ 2022-09-17 21:29 陈willing 阅读(55) 评论(0) 推荐(0)

自然语言第二课(语言辨识)

摘要: 如何做语音辨识呢 我们需要一个model或者一个Function,它的输入语音信号,它的输出就是文字。 对于一个语音辨识系统而言,它输入和输出的语音和表示被表示成什么呢? 输入的声音会被表示成为一串的向量,它的强度用T来表示,它的dimension(尺寸)用d表示。 输出的文字会被表示成为一串tok 阅读全文

posted @ 2022-09-17 21:28 陈willing 阅读(169) 评论(0) 推荐(0)

 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3