智能家居入门DIY——【二、LD3320之语音识别】

前一篇说了一下只有RX,TX,VCC,GND的WIFI模块软串口通讯；在实现了远程观察数据，类似的就可以实现远程控制。接下来说一下近距离控制，很多情况下应用语音识别技术无疑比掏出手机操作要更人性化一些，当然有些情况是例外，例如半夜起床来，那么人体感应模块和光传感器结合就更人性化。LD3320模块本身识别准确率并不高，但是通过编写程序的一些技巧，可以提高这个准确度。不过这个模块接线的时候有一些小问题，我买的是很多教程上的那个长方形模块，头上有俩插孔，尾巴上面2排12个针那种。说一下怎么用起来：

一、接线

A、下排

CS是片选，很多教程讲接GND，如果有多个SPI设备，则需要接一个引脚。

P0-P2，接UNO11-13引脚。（通讯+时钟）。

同排的GND,3.3V接UNO的GND，和3.3输出。

B、上排

IRQ是中断，接PIN2

WR接GND

RST接PIN9

共9线完成。

二、程序

首先，感谢ld3320.h的原作者。

然后，说一下这个“垃圾关键词”：首先，明确的说，把垃圾关键词都认为是真垃圾的思路我不认同；让我说严重点这就是误导，是背道而驰，贵圈确实很乱。提出几点原因：

1、本身识别准确率并不高，假定为60%，并且要求发音清楚、连贯性适中。

2、“垃圾关键词”是接近正确命令的发音，其中有相当部分是用户正确发音但未正确识别，假定为30%。

如果，代码中让“垃圾关键词”并不“垃圾”，那么识别率就是60%+30%；换一种说法，垃圾关键词中即使有1%是正确发音但未被准确识别的，我们把它加上，也是提高1%的正确识别。那么，接下来的问题就是真的垃圾怎么办。

1、场景切换（口令模式），当15%的真垃圾进入下一个场景，接下来的语句仍然符合下一场景的关键词的几率是多少？

2、长口令，带称呼的口令更符合人们的习惯，所以开灯可以变成二狗子开灯……长口令的错误识别率无疑要低。

所以，我的程序中，数据结构和逻辑结构是这样的：

struct AsrCommand
{
    char* flag;
    int ID;
};

AsrCommand CallName[] = { 
{ "da hei", 0 },
{ "da ei", 0 },
{ "da kei", 0 },
{ "da bai", 1 },
{ "da he", 1 } };

AsrCommand ExecuteCommand[] = { 
{ "kai dian shi",0 },
{ "ai dian shi",0 },
{ "kai yan shi",0 },
{ "ai yan shi",0 },
{ "kai tian shi",0 },
{ "ai tian shi",0 },
{ "guan dian shi",1 },
{ "kuan dian shi",1 },
{ "guan yan shi",1 },
{ "kuan yan shi",1 },
{ "guan tian shi",1 },
{ "kuan tian shi",1 } };

CallName中，编号为1的是真垃圾关键词，但是编号是0的部分里面包含了一部分假垃圾关键词，通过场景切换，使用ExecuteCommand中的关键词，两组都是命令，一组是开电视，一组是关电视。通过场景切换，第一组中的错误识别将被缩小。你可以尝试一下这个模式，它可以让你不必咬文嚼字的和机器对话而机器也会正确的响应你。识别率被提高，而不必非常担心：它会不会知道我说了什么？尽可能的不要让我们找方便的时候被搞得不痛快吧，那就不是用机器了，简直就是被机器用。

posted @ 2018-06-23 15:33 zcsor~流浪dè风 Views(5771) Comments(0) 收藏举报

刷新页面返回顶部

zcsor

——没有比狭隘的自大更可悲的事情。

智能家居入门DIY——【二、LD3320之语音识别】

公告