定义数据
数据是信息的载体,反应客观事实的一部分,它由两部分构成,一是指标,一是内容,分别对应定性和定量。
指标
指标是对业务定性的表达,它需要记录业务流的每个节点,并在业务结构发生变化时,也随之变化,业务流可以看成一张RoadMap,指标就是路标,来反应整个业务图的客观状态以及结构,变动等等。指标设计时需要遵从一个原则,相互独立,完全穷尽。相互独立保证了单个标地物的干净程度,若是指标之间有重叠的情况,那么它所反映的事物关系会呈阶乘式增长,以至于看起来就是黑盒。完全穷尽保证了业务结构的完整程度,数据使用者可以看到业务的方方面面。业务结构随时都可能变化,即有可能爆发,也有可能凉凉,所以判断一项数据需不需要跟进,以及该使用哪种方案就需要考量。
内容
指标是系统的骨架,内容则是具体的血肉。分工的细化,使得每一个可用的产品都是由许多系统组合而成,数据也就散乱分布在不同的节点,而使用时,数据往往需要整合,才可以成为可用的资料,实际中,需要分主题域来用,就要再次变换不同的维度来看待数据,如同描绘一栋房子,需要从不同的角度和方向,来尽量逼近现实,数据的内容,整体流程是一个分总分的形式。
生产方式
数据的生产方式有两种,流处理和批处理。流处理的数据往往是事件驱动的类型,解决单个场景的数据需求,以电商场景为例,每天实时的新增订单,就是事件驱动。批处理的数据是一段时间内的大量记载记录,能将事实表和维度表的信息都提炼出来,以主题驱动为类型,是为了解决特定场景的需求。
社会运转方式
数据是为了反映客观事实,而客观事实由社会的基础运行方式决定,社会的运行包含三个元素:生产、经营、消费,生产解决物质从0到1的过程,经营解决从1到10的过程,而消费则是社会维持自身结构的燃料,生产经营和消费构成一个完整的链路,一环套一环,驱动社会发展,而数据也是在这种循环的过程中发挥价值,往往充当传输媒介或者润滑剂的作用。
互联网的特征
互联网的价值在上述的循环体中表现方式有两种,第一种它将生产成本由指数型变为线性,第二种它将收入由线性变为指数型,处于经营角色多一点,它加速了信息的流动,依附于实体角色可以有效的解决经营的问题。产品分两块,一块在前端,一块在后端,前端触达用户,后端负责资源配置,生产的数据也就围绕这两块展开。

浙公网安备 33010602011771号