结构化数据与非结构化数据的区别(转载)

    在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例。 

定义:

 结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。

   非结构化数据:包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

   半结构化数据:就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。

示例:

 数据模型:
  结构化数据:二维表(关系型)
  半结构化数据:树、图
  非结构化数据:无
  RMDBS的数据模型有:如网状数据模型、层次数据模型、关系型
  其他:
  结构化数据:先有结构、再有数据
  半结构化数据:先有数据,再有结构

 

参考文章:

1、http://blog.csdn.net/utnewbear/article/details/8267653

2、http://renyangok.iteye.com/blog/45459

posted on 2013-10-10 11:02  Peter Jiang  阅读(14622)  评论(0编辑  收藏  举报

导航