一张广告图片引起的思维DFS

1.概述

    今天老同事发了一张图片,

clip_image001

    结果后面有几个家伙回了“中毒了。。。”“这是挖墙脚的节奏么”(对了,这个老同事也离职了)。

    本来也想说上几句的,发现激情难在。

 

    不过,最近了解到DIP、DM、ML、NPL方面的知识。让大脑跑一遍吧。

    主题:如何过滤图片?

    首先,要做基础的技术点了解。

 

2.DIP

    Dip,Digital Image Processing,数字图像处理。

    其能够做什么?

    图像灰度处理,二值化,反色,分割,投影,识别。

    典型应用:验证码识别,车牌号码识别,借助ML可以实现人脸识别库。

 

3.DM

    DM,Data Mining,数据挖掘。

    其提供了对数据分析处理的一种科学的方法。

    典型的例子:啤酒与尿布。

    包括聚类分析,决策树等理论。

 

4.ML

    ML,Machine Learning,机器学习。

    其能够做什么?

    简要地说,就是能够学以致用。包括有监督的学习和无监督的学习。

    包括一堆的分类器算法,如SVM。

 

5.NLP

    NLP,Natural Language Processing,自然语言处理。

    人工智能的一个分支,先通过分词,语义分析,再用ML或DM做后续步骤。

    典型应用:垃圾短信过滤,自动邮件回复等。

 

6.重点:识别广告图片的过程构想

image

      Steps:

     1) 训练;

    2) 入训练库;

    3) 输入测试集;

    4) 输出识别字符;

    5) 调用中文分词;

    6) 通过分词结果到关键字库匹配,成功,则表明需要过滤

 

    后续怎样,听天由命吧~~

posted @ 2014-07-04 22:48  _DN  阅读(618)  评论(2编辑  收藏  举报