字王·汉字结构·熵·理论

字王·汉字结构·熵·理论
---汉字结构的数字化大门,量化分析之路,终于开启
 
字王·汉字结构·熵·理论
 
前几天,blog《字王·百字工程》发布,百字工程正式启动
虽然,还只是最初期的数据整理阶段,也涌现了大量的创意idea、理论突破。
看来,任何事情,只要动起来,都会有收获。
 
这几天,最大的收获,就是《汉字结构·熵·理论》。
如果说,20年前的字王字库智能字模,只是一个概念,那么,《汉字结构·熵·理论》,可以说是套完整的“汉字结构”量化分析理论体系。
也许,在五千年的历史当中,我们第一次能够,对汉字结构,进行数字化的量化分析。
 
在信息论中,熵被用来衡量一个随机变量出现的期望值。
 
很自然的,熵这个物理学、热学的概念,被导入了字王的汉字结构体系。
1z,一个标准单位的汉字结构的熵,是1K(1000x1000像素)字库的1/n,(这个目前只是概念参数,日后会细化)
汉字结构的熵,单位是英文字母:z,发音“泽”。
字母:z,是zw字王拼音的缩写,也可以纪念太祖:泽东先生,汉字始祖“仓颉”;“颉”字,在南方某些地区,发音也有些类似。
 
 
根据这几天的数据整理,套用萌芽阶段的《汉字结构·熵·理论》,发现了几个有趣的现象:
  • ::500像素版本,仿宋体最高,690z,黑体:500z,楷体:560z,新宋体/宋体:530z,雅黑:480z
  • ::取样像素的大小,对字体"熵"值影响不大,雅黑400像素:500z,雅黑500像素:480z,雅黑1K像素:460z,
  • ::奇怪的是,取样精度越高,"熵"值越小,理论上,所需要的“核心字”数目也越少
 
未来数月,随着《字王·百字工程》的逐步推进,将会发布更加完整的相关文章和报告。
目前,规划的方向有:
  • ::"熵"值、"熵"密度单位的定义与延伸
  • ::汉字笔画、单字、字库的"熵"值、"熵"密度
  • ::各种字形的"熵"值表(类似早期的对数表)
  • ::字王·工具箱字体公益软件,也会收入"熵"值计算模块
  • ::“永”字八法、“国”字结构的数学基础
ps,补充
昨晚,导入"熵"值,连夜发布了blog:《汉字结构·熵·理论》
睡了一觉,思路打开,继续喷
 
 
"熵"值的导入,类似现代物理学原子、电子的发现,
从底层、根本上解决了汉字结构的最基本的量化单位问题,
也许,目前版本的"熵"值:定义,模型、参数、。。。,与未来,最终的数字化、汉字结构理论,天差地别,
无所谓,毕竟,汉字结构的数字化大门,量化分析之路,终于开启了。。。。。。
 
补充几个新的思路
  • ::"熵"密度,"熵"值与汉字“黑”像素的比率
  • ::统一的"熵"值,为不同汉字字体的结构分析,奠定了基础
  • ::基于"熵"值的汉字笔画排序
  • ::从"熵"值角度,分析,古代、现代诗歌、散文的形体美,包括国外作品
  • ::延伸下,从"熵"值角度,对圣经、古兰经、四书五经等经典作品,宗教作品进行数字化的量化分析,这个可以参考近年的定量历史学,例如 从盐、布匹消耗量,分析历史人文环境
  • ::"熵"值角度,对艺术作品,不同风格、流派的量化分析,尤其是黑白色调的中国山水画、书法,可以将每幅作品(视为一种字库)
  • ::不同艺术家,不同阶段,作品的"熵"值演化历史,以及与其他人物作品的"熵"值对比分析
  • ::目前机器学习的热点:人脸识别、图像识别,也可以进行"熵"值处理,延伸下,这个与大数据、AI人工智能,完全是100%无缝对接;
(殊途同归,立地成佛,万流归宗。。。,古人诚不欺我也。 
这句话中的:文艺气、禅味,懂的,可。。。)
::。。。。。。。
 
 
【字王·中国】
 
:: 技术blog:http://blog.sina.com.cn/zbrow
:: 网盘下载:http://pan.baidu.com/s/1tY7Wq
:: 字王·Git:https://github.com/ziwang-com/,
 

 

posted @ 2015-09-15 00:35  统领  阅读(509)  评论(0)    收藏  举报