随笔分类 - 微软语音识别语音朗读技术
基于Kinect for Windows SDK beta开发语音命令,实现语音控制游戏
摘要:微软在2009年6月2日的E3大展上。正式公布的XBOX360体感周边外设。Natal彻底颠覆了游戏的单一操作。使人机互动的理念更加彻底的展现出来。 它是一种3D体感摄影机(开发代号“Project Natal”),同时它导入了即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。微软的Natal不需要使用任何控制器;它是依靠相机捕捉三维空间中玩家的运动。Kinect 的出现不仅带来了一种新的游戏操控体验,由之引发的让机器“读懂人”的交互方式,也正在引领人机交互技术的新一轮变革。微软在今年的6月16日正式发布了Kinect for Windows SDK beta, 让开发人员可以在W
阅读全文
VC++基于微软语音引擎开发语音识别总结
摘要:关于SAPI的简介API 概述SAPI API在一个应用程序和语音引擎之间提供一个高级别的接口。SAPI 实现了所有必需的对各种语音引擎的实时的控制和管理等低级别的细节。SAPI引擎的两个基本类型是文本语音转换系统(TTS)和语音识别系统。TTS系统使用合成语音合成文本字符串和文件到声音音频流。语音识别技术转换人类的声音语音流到可读的文本字符串或者文件。文本语音转换API应用程序能通过IspVoice的对象组建模型(COM)接口控制文本语音转换。一旦一个应用程序有一个已建立的IspVoice对象(见Text-to-Speech指南),这个应用程序就只需要调用ISpVoice::Speak 就可
阅读全文
基于微软嵌入式系统添加语音功能(语音合成与语音识别)
摘要:基于Windows Embedded Standard以及Windows Embedded XP,如果需要添加语音识别,语音朗读功能,需要下列组件的支持。Speech Control Panel:添加该组件可以在控制面中添加语音控制图标,我们可以通过这个功能来选择或者配置Speech recognition(SR-语音识别)或者 text-to-speech engine(TTS-文本语音转化引擎)。 这些设置取决与可选择的语言,声音输出和声音质量, 也包括可选择的麦克风输入。 在语音属性中可以制定和更新用户配置文件。通过用户配置文件,使语音识别引擎能够更好地认识到一个发言者的习惯和在一个特定
阅读全文
浙公网安备 33010602011771号