人工智能实战_第八次作业(个人)_王涛

作业要求

标题 内容
这个作业属于哪个课程 班级博客的链接
这个作业的要求在哪里 作业要求的链接
我在这个课程的目标是 完成一个完整的项目,学以致用
这个作业在哪个具体方面帮助我实现目标 实现
思考题 1:如何识别不合法(既非数字又非符号)的输入?

一般来说,数字识别一般取得最后logits层,进行softmax,取argmax的索引对应输入。
1) 实际上,很有可能的对于不合法输入的,他的softmax层的概率一般不会很高,而且感觉这个与生成对抗网络相关,可以考虑GAN方法解决。
2)我们也可以设置个others类别,对图片加噪,生成不合法输入,让神经网络训练others类别,而且一般人写算式,一般不会故意写不合法输入,你可以识别不出来图片,但是,我们分割图片时,例如分式,上下书写的一定是合法的输入,只是可能模型无法很好地识别,这时候也不能归与others。

思考题 2:如何设计该计算器应用以识别下列元素:

A. 更多的符号,比如sin函数
实际对于sin函数,或者其他三角函数,一般可以分割为3个字符逐一检验,实际上,sin()函数后面一般带有括号,而且判别函数也要注意他的反三角形式,也应该和其他sigma,arcsin区分开来。
B. 复杂的表达式结构(上下结构),比如指数 ,分数
指数一般一个大,一个小,可以看分割出来的图像大小,和投影的位置关系。分数一般骨架结构也比较固定中间会有一个横线,而且与乘除等符号一般是一起的。
C. 更复杂的表达式结构(包围结构),比如平方根 。
其实复杂的表达式结构一般有一定结构,但是如何分隔开,是一个问题。
如果采取投影,一般也是重合的,感觉可以识别平方根的根号,根号与一般的符号是不同的,但是如何分隔开根号与根号下数字,可以将图片进行预处理,对图片进行分隔,不只是垂直投影进行分隔。
现在图像分隔技术应该能对根号有一定的识别能力了,对于困难识别的字符,可以尝试改变分割方法。
感觉没有去做,没有看一定文献,写的好水啊,还是得去尝试才出真知啊!

posted @ 2019-06-03 17:50  iamownt  阅读(173)  评论(0编辑  收藏  举报