电脑格盘之后想到的

 

 

   最近的一个项目需要用到mandriva ,所以就捣鼓着装了一个。装得时候分区神马因为自己基本不懂的还是有一定危险性的。还好装的时候比较小心,正好把ubuntu 的分区格了,拿来装mandriva。用了一天,感觉英文版的不爽,打算换成中文版的,也正好能更快得上手。于是周一下午一下课,就回来重装搞起。本来想把老的mandriva分区格了的。结果在用mandriva的分区选择时,一不小心,把整个盘给格了,这下我一下子就慌了。盘里面有我的几个G的照片(正常的~),以前写的各种代码,还有我这科协的所有资料(很多都是没有备份的)就这样一下子全没了。赶快用软件恢复(用的Disk Genius),花了3个小时,恢复了大部分数据。结果把恢复的东西拷到别的电脑一看,根本打不开了。而且最重要的数据,都是用lockdir加密的,恢复软件也搞不定。后来想想,就算了——一是因为自己折腾的有点累有点烦,二是也想把这次的教训给自己留下点念想,三呢,也正好在重新整理自己的数据存储。(后来我想了新的组织数据的方式)。

 

   这次“数据灾难”之后,包括过程中,我也有一些自己的思考和想法,大概是这样的——想得比较乱,也就想到哪说到哪了。(其实我还想了一下点关于数据的比较深层次的东西,不过囿于自己知识水平太过浅显,我也没法判断自己的想法有没有价值,所以打算等自己了解点东西之后再仔细审视一下关于数据的想法吧)

 

 

       现在想想这样一个场景:你在火车上,吃着火锅唱着歌,突然发现自己的硬盘被格了,或者 自己的电脑丢了。这个时候,你最痛心疾首打算想尽一切办法找回的数据是什么?你觉得非常可惜,觉得这些数据不去找回来不忍心,但也不至于不能放弃的数据是什么?你觉得可有可无,即使删了也无所谓的数据又是哪些?一般来说,最后一种大多是从网上下来的比较大的影视资源,或者是很大的安装程序。虽然已经看过(或者安装过了)但是不晓得这个在未来的那一天这些东西还会不会有用——即使有用的概率不大。

       当你想过之后,我的建议只有一个,那就是“删”。前一段时间写过一篇博客,题目就叫“节制是一种强大的人生态度”。大意就是说对于生活中的方方面面,形形色色的事物,特别是对你有诱惑的东西,都要用理性去达到一种有节制的状态。这样的话,你的生活很有可能就会过得比别人好很多。现在想想,或许可以把这个观念扩充一下,就是说对生活中的方方面面,形形色色的东西,都要用理性去渲染一下——说白了就是都要过一下大脑。即使像对电脑中的文件存储这样的事情,也要想办法去做到尽善尽美,甚至达到一种美学或者说是艺术的气息。Paul Grahm 在他的《黑客与画家》一书中,特意强调了“品味”和“优美”的重要性。细想之下,不难发现,一个追求“优美”的人,在生活中,处处应该都在用理性去尽力达成尽善尽美的状态——很显然,这并不会比生活邋遢的人多浪费多少时间,但带来的快感是强大且不可替代的。黑客与画家,在共通之处上,追求一切的尽善尽美和对“优美”的热切渴望,必定是其中浓墨重彩的一笔。

      所以,对待我们电脑上的数据,何不也费些心思,以达到形式和内容上的“优美”呢?

      

 

       为此,我重新设计了一下电脑存储的方案和一些原则。大致上说就是对于非系统盘(我只留了一个),采用类似unix系统下的树状结构存储。在最上层,我把数据分成了三个最基本分类:decu. emo. Prom分别存储所有针对人的文件(学术上和工作上的)——这个可以理解为是理性上的东西,感性上的东西(多是一些影音娱乐和能激起自己感情上波澜或者共鸣的东西)。程序(这一部分是存储针对电脑的数据,主要是一些安装程序,程序生成并只用于程序的文件——比如说游戏《孢子》里面一个非常大的游戏存档)。然后对于平时产生的数据,先用桌面作为缓冲区,一般一天推送一次缓冲区。在推送的过程中,本着宁缺勿滥的原则,重要的东西分类存储,非重要的东西,一概不存。

       这种存储模式可以理解为一种Interface-Oriernted,即文件的分类取决于它是面向谁的接口。然后因为是在一个盘,所以三个文件夹里面的文件大小分盘的限制。每个文件夹的子文件夹按需扩充,动态平衡。

 

 

       这样昨晚之后,不禁会想一个问题:我现在需要做的一些工作,比如对文件进行分类,动态维护整个文件树。这些工作在未来,会不会由数据自己来完成(比如说人工智能方法的一个分支),或者说说的更深入一点,在以后,数据会不会自己思考?会不会自己替你做决定(这个数据要存到哪,什么时候把这个数据删了,这个数据要不要和别的数据相互作用,甚至是这个数据能发现你的误删除并且拒绝执行该操作。)。仔细想想,对于现代的计算机模型,数据是其最基本单元,所有的程序也都是数据。如果真的有一天,作为最基本单元的数据有了智能,那又会是一个什么样的图景呢?而在现阶段的情况下,数据的本质又是什么呢?数据从被创建到被删除,这其中又有哪些宏观和微观的特征呢?

 

 

       这些问题充满了趣味性和挑战性,确实值得深入思考。打算过一段时间,等自己接触的相关的东西多了,再着手细致谈谈自己的想法。在这里先做一个展望,想想都需要思考或者研究什么问题:

  1. 数据的生命周期;
  2. 数据的专属性,安全性。
  3. 从图,流。节点,的角度分析数据的宏观流转。
  4. 网络数据和本地数据的关系。
  5. 数据冗余度的研究。

  大概就先想了这么多,更多的问题,自己再慢慢想吧。

 

 

 

  最后,向我那失去的2个多G的生活照片表示沉痛哀悼!

 

 

 

 

 

posted @ 2012-03-18 08:50  TiLion  阅读(252)  评论(0)    收藏  举报