网络多媒体信息的过滤方法
网络多媒体信息的过滤主要采用四种方法:
(1)基于分级标注的过滤
通常使用浏览器本身或第三方分级标注过滤,具体是用户或管理员通过浏览器的安全设置选项实现网页内容过滤。
(2)基于URL的过滤
指将已知有害页面和网站收集到 URL 禁止列表库,将允许访问的网页和网站收集到 URL 允许列表库,即设置网页黑白名单。过滤系统检测到某网络地址在黑名单中时,将过滤该网络地址以阻止用户访问,否则,将放行。
(3)基于关键词的过滤
对文本内容、文档的元数据、检索词、URL等进行关键词匹配,再对满足匹配条件的网页或网站进行过滤,称为基于关键词的过滤。具体就是从网页中提取出关键词与预先建立的不良或敏感关键词数据库匹配,通过设定阈值计算匹配程度来判断是否为不良网站,如果是,则过滤该网站,否则放行该网站。
(4)基于内容分析的过滤-------发展趋势!
指通过语义分析、机器学习、图像处理等技术分析用户浏览的网页内容来判断该网页是否该过滤。

浙公网安备 33010602011771号