2020-2021-1学期2020249《网络空间安全导论》第十二周学习总结
第五章 内容安全基础
5.1 信息内容安全概述
社会信息化和网络化发展加快,现在全球数据增长十分迅速,数据内容成为了互联网的中心关注点。各种社交网络不断涌现。
但是!互联网和信息媒体的发展带来了许多负面影响,出现了很多恶性事件,因此,信息内容安全越来越值得人们重视。
我国现代化建设有一个重要举措——大力推进信息化,是贯彻落实科学发展观、全面建设小康社会等迫切需要,信息安全作为网络安全中智能信息处理的核心技术,为先进网络文化建设、加强社会主义先进文化传播起到了技术支撑。所以研究信息安全,不仅有学术意义,还有社会意义。
5.2 信息内容安全威胁:
1.内容安全建立在保密性、完整性、可用性之上。
2.命名攻击可以分为监视攻击和嗅探攻击。
5·3 网络信息内容获取
网络爬虫:网络爬虫是在互联网上实现信息内容获取的最主要工具,是一种按照一定的规则自动抓取互联网信息的程序或脚本。
爬虫大体分为两大类:一类是服务于搜索引擎等搜索类应用的网络爬虫。另一类是服务于针对性进行信息收集的应用网络爬虫,具有高搜索深度的网络爬虫被称为路径追溯网络爬虫;具有主题选择能力的爬虫被称为主题爬虫。舆情分析系统采用的爬虫是两者的组合,并作一定的定制改动。
网络爬虫通常采用分布式机制来保证信息获取的全面性和时效性,网络爬虫还要避免过于频繁地获取信息而被媒体网络判为恶意,一种方式是通过周期遍历,另一种方式是定期修改客户端地请求内容。
1.文本信息内容的特征抽取与选择
特征选取有4种:
用映射或变换的方式把原始特征变换为较少的新特征。
从原始特征中挑选出一些最具代表性的特征。
根据专家的知识挑选最有影响的特征。
用数学的方法进行选取,找出最具分类信息的特征。
2.音频信息内容的特征抽取与选择
基于帧的音频特征:
MFCC
频域能量
子带能量比
过零率
基音频率
基于片段的音频特征:
静音帧率
高过零率帧率
低能量帧率
谱能量
和谐度
3.图像信息的特征抽取与选择
(1)图像信息的特征抽取与选择
(2)图像纹理特征提取
(3)其他图像特征
5.4 信息内容分析与处理:
1.海量信息内容分析的基本处理环节可以归结为分类和过滤。
2.任何分类器构建都可以抽象为一个学习的过程,学习可分为监督学习和无监督学习。
3.线性分类器通过训练集构造一个线性判别函数,在运行过程中根据该判别函数的输出,确定数据类别。
4.最近邻分类法是图像分类和识别领域比较常用的分类方法,没有复杂的学习过程。
5.支持向量机是一种监督学习的方法,广泛应用于统计分类以及回归分析中。
6.信息过滤是大规模内容处理的一种典型操作:从动态的信息流中将满足用户兴趣的信息挑选出来,用户的兴趣一般在较长一段时间内不会改变(静态)。
7.信息内容过滤的常见应用:
- Internet搜索结果的过滤
- 用户电子邮件过滤
- 服务器/新闻组过滤
- 浏览器过滤
- 专为未成年人的过滤
- 为客户的过滤
5·5 网络舆情内容监测与预警
网络舆情监测技术的发展趋势:1· 真对信息源的深入信息采集;2· 异构信息的融合分析;3· 非结构信息的结构化表达。
网络舆情系统的功能分解:1· 高仿真网络信息(论坛、聊天室)深度提取技术;2· 基于语义的海量媒体内容特征快速提取与分类技术,其系统可分为基于文本特征提取模块、基于词频统计的文本特征提取模块、基于互联网网络媒体特征的多媒体特征提取模块,以及分类特征统计与分析模块。
5.5.1 网络舆情系统的背景与应用范围
网络舆情预警监测系统主要完成互联网海量信息资源的综合分析,提取支持政府部门决策的有效信息。
5.5.2 网络舆情系统的功能分解
高仿真网络信息深度提取技术
基于语义的海量媒体内容特征快速提取与分类技术
非结构信息自组织聚合表达技术
5.5.3 互联网舆情内容分析
伴随互联网的迅速普及,各式各样的内容日渐泛滥,面对各种的信息,我们必须部署互联网舆情内容监控技术。
5.6 应用安全基础
应用安全是为保障各种应用系统在信息的获取、传输和处理各个环节的安全所涉及的相关技术的统称,密码技术是应用安全的核心支撑技术,应用安全涉及如何防止身份或资源的假冒、未经授权的访问、数据的泄露、数据完整性的破坏、系统可用性的破坏等。主要研究领域包括:身份认证与信任管理、访问控制、电子商务系统安全、隐私保护。云计算安全、大数据安全、区块链安全、人工智能安全、工业互联网安全、供应链安全。