计算时代之大数据-分类阅读时代

从语言到库到框架,再到API,再到标记最后到DSL语言

这里提到了互联网及移动互联网的发展,软件研发的越来越深化,分工会越来越细,同样,互联网庞大的信息资源,哪怕只是新闻,也超出了我们的承受量,从网站门户,过度到新闻客户端就是一个明显的例子。

人类的能力并没有随网络近进化而大幅度的提升,一天24小时也没有改变,我们能做的,就是要把数据也细分。主要关注我们想关注的。忽略大多数不太关心的数据。

这里头,数据抽取是一个大问题。哪些才是有价值的,哪些是我们应该关心的?比如,同样新闻,明天开始限行,这可能是我们都要关心的。忽视了会带来不便。但有家人的小狗走丢了或者是某XXX星又发露PP图了,这类东西我们可能不想让它占据我们的视野。

数据海求生就象学游泳,需要一些方法和技巧,象豆瓣这类网站,就很超前,N年前就看到这一点,在数据越来越庞大的今天,它反而越来越有价值。

同样,IT技术也是,本来IT技术就很难了,再乱七八遭一堆,根本没有时间消化,庞大的无用或价值过低的信息,是我们通往大牛路上最大的障碍,就象是在杂草从生的路上前进。

怎么把有价值的,我们关心的东西分捡出来,哪怕是手工或自动,这是很关键的一个问题。

posted @ 2014-01-14 16:35  人工智能-群513704292  阅读(286)  评论(0编辑  收藏  举报