笔形体系数码化,检索方案便捷化
作者: 唐维建、唐维强、唐倩琳 责任编辑:新商业 来源: 中国商业期刊 2025-10-22 17:16:15
-
-
笔形体系数码化,检索方案便捷化
唐维建、唐维强、唐倩琳
依据笔画形状的递增规律、相似规律和对称规律,推导出笔画按形分类的新体系。给所有笔画都注记一一对应的标号,制定汉字的数码编程规则。使用新的排序检索方案,可快速、简便查找目标字,旨在出版一本可直达字典正文边翻页边查找目标字的汉字字典。
汉字是记录汉语的文字系统,也是世界上唯一被沿用至今的古老文字。随着历史的发展,汉字不断演变,字义也随之变化。
汉字的词汇义项众多,通用假借频繁,初学者不易把握字义,因此提供音韵、注解、例句等等工具书运用而生。
《说文解字》开创了部首检字的先河,经过多次改革,其方法沿用至今。现有的汉字排序方法如:音序排列法、部首笔画排列法、号码排列法,都有明显的优点和缺陷。本文提出一种汉字的排列的新方法,以弥补以上不足。
一、笔画分形体系
我们采用“据形系联”的方法,悉数罗列现行笔画,其共性特点隐约出现,然而,逻辑链条总有断裂、空位之现象,便填充一些补充符号(虚拟笔画),发现了递增规律、相似规律、对称规律,并推导出一个有现行笔画、有虚拟笔画的新型体系(简称现Xian虚Xu体系、或简称XX体系)。
XX体系分为4个支脉、10个组,绘制了三幅示图,以展示汉字笔画的形状分类及其内在规律。



解读图1、图2、图3的主要特点及其规律:
1.左侧第0、1、2、3组的笔画,观看其尾部的行笔走势或最后一个折点的趋势,都是顺时针方向的;同理,第4、5、6、7、8、9组的笔画,都是逆时针方向的。
2.每一组内的笔画形状有依次渐变的特点,这是递增规律。
3.同一支脉的两组或三组(比如第4组和第5组等等)有明显的亲缘关系,这是相似规律。
4.像第0组和第5组,还有第1、2、3组和分别对应的第6、7、8组,无论是外部的轮廓以及内部包含的单个笔画,都有鲜明的镜像性,这是对称规律。
以上三个规律给学习者的记忆尤其是视觉记忆,提供了超乎寻常的的方便。
二、笔画数码编程
笔画的标号采用双位制,十位是组别,个位是组内序号;代号由拼音首字母、组内序号合成;名称由组名、组内序号合成。


表2折点的分类:
停顿的折点:“口”的第2笔,“又”的第1笔。
平滑的折点(也称作“弯”):“儿”的第2笔第1折点,“朵”的第2笔第2折点。
变细的折点:“队”的第1笔第2折点,“巡”的第1、2、3笔的折点。“巡”的前三笔也常见中间是断开的写法,因笔势贯通,仍然记当作一笔画。
出头的折点:“之”(2画字)第2笔画第2折点,“乡”(1画字)的第2、4折点、“水”(3画字)的最后一笔的折点,“专”(3画字)最后一笔最末一个折点。此折点的重叠区域有意延伸,墨迹有“漂移”的现象,也常有笔锋离开并快速地复触纸张的现象,同样,因笔势贯通也记作一笔画,尤其在行书、草书中是惯用的手法。
请注意:“マ”与“厶”,看似有些相像,其实二者的笔画数不一样。“マ”是一笔画;“ㄙ”是由“”和“”组合而成的,书写过程有一次收笔(笔尖离开纸张),它不是一笔画,而是两个笔画的。
三、汉字的排序
两个或两个以上的汉字列放在一起就有一个排队、排序的问题。
笔画都有了标号、代号,再按照《通用规范汉字笔顺规范》(GF0023-2020),依次记录汉字笔画的标号、代号,这样,每一个汉字便有一个序码。
举例:中(依次写出笔画的顺序):丨(11、S1)、┐(12、S2)、一(61、H1)、丨(11、S1)。
标号序:11、12、61、11→11126111;
代号序:S1、S2、H1、S1→SS2HS。
排序规则:在定量的汉字中,优先比较首笔画的标号,相同则比较次位的。标号按先小后大排序。以此类推,直到所有汉字排列完成为止。
给“她用新华字典查字”这句话的汉字进行排序。
她:520161221172;D2PHX2SY2。
用:0122616111;PX2HHS。
新:51615101616121511101016111;DHDPHHXDDPPHS。
华:011101726111;PSPY2HS。
字:5151023461;DDP2L4H。
典:1112611111610151;SS2HSSHPD。
查:611101411112616161;HSPNSS2HHH。
字:5151023461;DDP2L4H。
这八个字的次序:①华②用③典④字(出现了两次)⑤新⑥她⑦查
采用标号排序,凭视觉可看出汉字的先后次序。
标号,适合于计算机中文信息处理;代号,适用于字典正文标注;名称,服务于汉字教学。
四、汉字的检索
汉字查字法或称排检法,从编者方而来说是排序,从使用者方而来说是检索。如果汉字排序能科学、恰当排序,检索就简单了。这正是我们在研究,仅依靠扫视(直接翻页寻找)就能查到要查的字。
表1中,可作为汉字起笔的笔画只有19个:P1、P2、P5、S1、S2、S3、X2、X4、L2、L4、D1、D2、D3、H1、H2、Y3、F3、T2、T4。把字典的正文依次划分为上述的19个区域,每个区域内的汉字按字序排列。
字典正文的汉字排序,先确定第1笔画,再确定第1部件,并将二者标示在页眉位置。
要查找某字,从它的第1笔画、第1部件开始,用目光扫视,边翻页边寻找即可。如:要查“笑”字,先从字典正文找到第1笔画——“撇”、再找到第1部件——“”,这样,就能查到“笑”字。
五、汉字识别法
光学字符识别法(OCR)、统计模式识别方法,这两种方法使用的效果还不太理想。
标号、代号给了笔画、笔形显明的“数字感”,如果在汉字的每个笔画上能注以“暗记”,便可形成一种“逻辑类识别法”,有望提升识别的准确率,为汉字信息化处理提供新范式。
提示:文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
猜你喜欢
- 无相关信息
-
-
笔形体系数码化,检索方案便捷化
-
福报自修,磁场相召:一场关于生命能量的修行
-
魏永青:自媒体时代的责任与担当:每个人都应成为正能
-
根脉与使命:玄啓的文化传承之路——专访国学学者黑
-
北京国培世纪教育科学技术院地方分院院长培训在聊
-
无为学院文创专利产品:传统文化传承与创新的璀璨典
-
弘扬中医国粹,传承正骨绝技——张文莲教授的柔性正
-
无为学院文创再创新品【压胜通宝五路财神玉璧】