机器学习(10)- 应用举例

根据Andrew Ng在斯坦福的《机器学习》视频做笔记,已经通过李航《统计学习方法》获得的知识不赘述,仅列出提纲。

1 应用举例

照片OCR(Optical Character Recognition)

OCR流水线

  1. 文本检测text detection
  2. 字符分离character segmentation
  3. 字符分类character recognition

滑动窗口分类器

选取一个固定大小的矩形,然后根据步长移动该矩形,每次都用分类器进行判断。结束后,用更大尺寸的矩形继续重复上面步骤。

获取大量数据和人工数据

原因:低偏差,增加训练集数量

  • 使用不同字体
  • 人工拉伸/扭曲
  • 语音识别:引入额外的语音失真(嘈杂的背景音)

上限分析

将前面所有模块正确的输出作为输入给下一个模块,得到该模块准确率上线。可以了解到每个模块的改善上限。

posted @ 2019-06-02 17:08  白芷呀  阅读(473)  评论(0编辑  收藏  举报