第一次团队作业

一、介绍团队及组员情况,这样组队原因。

1、团队介绍:我们团队由五名成员组成,都是舍友。由于对深度学习感兴趣,决定探索基于深度学习的语音识别。

五名成员分别是:陈进山、吴培钦、林志平、胡鹏飞、孙浩景。

这样组队的原因:五名队员都具备已订购编程能力,学习过高数、线性代数、概率论等数学基础知识,对深度学习中相关模型的理解具备一定数学力, 五个人可以分别负责数据的收集和预处理、模型的调参、UI界面的设计、文档的书写、系统的维护和团队的沟通交流。

二、基于深度学习的语音识别背景

语音识别主要作用就是把一段语音信号转换成相对应的文本信息,系统主要由声学特征提取、语言模型、声学模型和解码器等组成。训练识别的过程是从原始波形语音数据中提取的声学特征经过训练得到声学模型,与发声词典、语言模型组成网络,对新来的语音提取特征,经过声学模型表示,通过维特比解码得出识别结果。

进入移动互联网时代,语音识别作为实现人机自由交互的关键技术,值得深入研究。同时面对大数据的挑战,由于深度学习能够从海量数据中挖掘有效信息,成为模式识别领域的一个研究热点。以深度学习理论为基础,对语音识别进行研究具有理论意义和实用价值。

 

三、语音识别的意义

语音识别是人机通讯的基础,它是理想的人机交互的中介工具,是推动机器向更高智能发展的重要技术。由于语音识别的应用场景逐渐复杂化,许多语音识别系统的性能提高都遇到了瓶颈,因此为了解决技术障碍,需要引入新的方法解决。深度学习对大数据进行特征提取、分类识别,对语音识别系统性能提升具有重大意义。深度网络能在低层网络去除噪声,将语音信息保存在高层网络。深度学习能够提取语音数据更深层次的特征,挖掘有用信息用于语音识别,提高系统性能。

四、竞争性需求分析框架NABCD模型分析你的产品

1.N(Need,需求)

打字功能是手机的基本功能之一,在进行短句的输入时耗费时间较短,但当要输入一大段文字时,往往要耗费大量时间,对于不擅长打字的人来说更是个难题。而在使用手机的人群中存在一小部分人不懂使用输入法,语言识别可以识别他们发出的语句,并将其转化成文字,不仅减少了打字的繁琐,更节约了大量的时间。

2.A(Approach,做法)

通过深度神经网络,实现语音识别功能。

3.B(Benefit,好处)

帮助用户节约打字时间,解放双手。

4.C(Competitors,竞争)

语音识别作为当下火热的人工智能的一个领域,竞争者众多且竞争激烈。不仅微软、谷歌、苹果、亚马逊等国际巨头在做,国内也有百度、讯飞等一批公司,而且都已经有成型甚至优秀的产品在市场上发售了。在创业初期,需要研发出属于自己的独特高效的算法,与一众语音识别初创公司竞争,博取知名度,赢得用户量;具有一定基础后,寻求与大公司合作,为自己的技术找到大客户,以便寻求收购或者继续成长;在目前的情况下和巨头竞争基本是没有赢的可能的,语音识别不是一个单独的技术,它需要大量的用户数据进行训练以改进算法,所以需要有一个广泛的用户群体,而这不是一个初创公司能够做到的,所以最好的选择是寻求收购或者找到稳定合作的大公司。

    在这个日新月异的环境里,虽然竞争已然十分激烈,但现在入局也不算晚,如果能研发出在现有算法上具有优势的高效算法甚至颠覆性的技术,还是有后来居上的机会。毕竟现在人工智能还只是一个开场。

5.D(Delivery,推广)

可以寻求和集大通的合作,做一个语音微博,通过我们的技术将语音转化为文字显示在屏幕上。每发一条语音微博就获得一次抽奖机会,以此来鼓励用户尝试我们的技术

posted @ 2017-10-31 21:59  jmu小七  阅读(224)  评论(0编辑  收藏  举报