这段讲语言模型在手写字识别里咋帮忙,大白话拆解:
手写识别时,机器先把图片里的字,变成一堆 “候选汉字”(比如写得潦草,一个字可能被看成好几种写法 )。但光有候选还不够,语言模型要从这些候选里,挑出 “连起来最像人话、概率最高” 的句子 。
看手写的 “浙江” ,机器可能识别成 “淅江(gang)” 这种奇怪组合;但语言模型知道 “浙江” 是常用词,“淅江” 不像正常说法,就会选 “浙江” 。再比如手写潦草的字,可能对应好几个候选,语言模型负责判断哪串连起来合理。
手写识别分两步:
- 先定位 + 识别,把手写笔迹转成一堆 “可能的字”(候选汉字);
- 语言模型上场,根据 “哪串字连起来最合理”,选出最终结果,让识别更准、更像人话~
简单说:语言模型就是手写识别的 “逻辑考官”,帮机器从一堆候选字里,选出人类能看懂、读得通的句子!