Sprint 3 : oxford project API 尝试

本次Sprint我们大家主要在调研和尝试阶段,主要是对photo experience 中的语音接口部分进行相应的调研和分析。

工作进度:

1. 图像界面设计兆阳和敏龙的工作进一步推进,除去之前介绍的相应界面以外,拥有了Query suggestion 功能和缩略图的suggestion,进一步完善了整体界面的布局和设计。

2. 牛津语音接口方面,栋调研了接口的使用方法,并将样例代码进行了详尽的分析。并且和我们一起讨论,以相应文档形式给出。

3. 自然语言处理NLP是我们project的重要环节,audio to sentence 是语音API的工作,而sentence to query 则是NLP的工作。这部分由敏龙负责,并且已经实现了相应接口可供初步调试。

4. 算法整合方面,延东已经将基本的pipeline搭建完毕,能够顺利抽取CNN feature。拂尘则foucs在其他feature整合工作,实现较好的整体算法流程。

 

这次站会我们确立了接下来的Sprint4的具体工作内容,同时也是为alpha release 做最后的工作:

1. oxford api 调试工作,此项为敏龙和栋负责。

2. NLP处理以及query的提取工作,由敏龙和兆阳负责。

3. 在query to vector工作需要使用word vector词表,尝试使用词汇量较少但是比较general的model 完成手机客户端的移植,此项由拂尘和栋负责。

4. 完成后台服务的工作,此项为兆阳负责。

5. 提升search的精度,在vector词距的时候尝试使用其他算法,并且对multi-label的图片搜索进行算法改进。

 

期待下周结束能完成alpha release。

 

posted on 2015-12-05 19:31  MSRA_ASE_为道智能  阅读(252)  评论(0编辑  收藏  举报

导航