周总结
本周预习了下学期课程——大数据
了解了大数据地定义:
我们经常用4个V来定义大数据:容量、多样性、吞吐量、价值。即大数据必须是数量大(至少T、P级别),来源多,大部分为非结构化,且进出分析系统的速度快,并以获取价值为目的的数据。
特征:第一个特征是数据量大。. 大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。. 第二个特征是数据类型繁多。. 包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。. 第三个特征是数据价值密度相对较低。. 如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。. 第四个特征是处理速度快,时效性要求高。
提前了解一下大数据课程一些内容。
浙公网安备 33010602011771号