b讠b讠gg的原形

一讠另一个全这读什么字... 一讠另┅个全这读什么字

你对这个回答的评价是

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

本发明涉及电数字数据处理

自苐一台电报机问世()后,任何语言文字都面临一个输入方法问题西文以字母为码元都比较容易实现,而汉字为象形文字需要编码或创建碼元集供传递信息设备进行输入,那么汉字是一种能够创建码元集的文字吗至新世纪来到之前,传统的认识仍然是汉字不仅是一种无码え集文字而且也是一种不能够创建码元集的文字!在这种“传统认识”影响下导致了众多编码输入方法(约900种)的产生,形成为汉字进入发達信息时代的一种有益的过渡各种编码实践已经证明不管怎样编,现有编码输入方法都难以摆脱重码的困扰都难以将使用范围扩展到所有简繁体汉字,都难以使编码达到按定量和唯一性要求的程度存在的缺点有1.现有汉字编码输入法存在着输入难度较高的缺点,而且嘟有重码

1978年以后,汉字计算机编码输入技术虽取得长足的发展已引起中文信息产业的巨大变化;但汉字编码输入法的输入操作和质量提高不大。基本情况是难以避免重码及重码与方便的矛盾“好学的重码多,效率低;重码少、效率高的不好学。”例如“音码”(如全拼输入法)易学但重码多;“形码”(如五笔字型输入法)重码少,但难学记忆难度高,要借用“助记词”记忆一个月不用就会忘,要恢複也有一定的工作量2.汉字编码输入法的使用范围不能直接扩展到所有简繁体汉字。

目前数百种的汉字编码输入法,都还是设在GB2312汉字范围内是根据汉字的音特征、或形特征、或音形特征统计而形成的编码输入法。因此其使用范围受到制约,至今的所有这些方法都不能直接扩展到所有简繁体汉字3.按照传统编码的理论,“拆字”达不到定量和唯一性

《六书》之说是古人论述造字的方法,“造字的方法”与“汉字的组成结构”是截然不同的两回事;但在编码输入法中却把《六书》视为汉字结构的理论依据这就难免陷入传统的认识誤区。例如五笔字型输入法关于“汉字的上下结构,左右结构杂合结构”的认识,“取大优先兼顾直观,能连不交能散不连”的拆字原则容易受人为着眼点和见解不同的制约,难以达到定量和唯一性的标准

总之,编码输入法存在着三种无法摆脱的美中不足难以勝任彻底解决汉字计算机输入方法的历史使命。看来需要“跳出三界外方能洞明之,”才能免受传统观念的束缚才能有所前进。

本发奣的目的是要提出一种汉字码元输入方法它试着从创建汉字的码元集开始,给出汉字的码元输入方法的技术方案解决通常存在的重码問题,使汉字分部达到定量和唯一性标准适应计算机输入的需要。

本发明的汉字码元输入方法基于以下原理和设定一、汉字码元输入方法一改传统编码输入的统计手段编码思路将其确立在创建码元和码元集的基点之上。为了利用现有的计算机通用键盘选用26个英文字母莋为码元,因此所创建的码元集为26个码元,选用《汉语拼音方案》中的26种相应的语音作为码元的名称适当归一调整后,名称与符号如丅名称玻 坡 摸 佛 得 特 讷 勒 哥 科 喝 基 欺符号Bb Pp Mm

2)、有了码元集后将码元作为汉字的标识符号,标识为唯一对应的字符串

3)、在通用英文键盘按鍵上增添码元的名称标志欺知鹅…摸,详见表1表1键盘上的字母和音符名称标志 二、汉字码元集创建的依据汉字的组成结构是排列结构汉芓的表观字形结构分为四种类型,汉字具有字标志

(1)汉字的组成结构是排列结构。排列单元是客观存在的一组部件它能够定量描述所有漢字(指所有简繁体汉字,下同)所谓定量描述是指每个汉字与其排列单元(部件,下同)的一种排列唯一对应

排列单元分为字部件、笔画部件和寄生部件三种类型一字部件就是被选为部件的汉字,字部件共有132个见表2。字部件有原形、字块形和变异形三种形态所谓原形是指芓部件在构字时以汉字形态出现,此时称作字部件的原形所谓字块形是指字部件在构字时以非汉字形态出现,只使用字部件中局部的一塊参与构字此时,称作字部件的字块形(字块也有变异现象)所谓变异形是指字部件构字时以非汉字形态出现,使用它的变异形去参与构芓这些变异形是传统上的演变形(有的是人为新定义的),此时称作字部件的变异形

一笔画部件是由笔画元素组成的一种部件。笔画部件呮有单元素笔画部件和多元素笔画部件两种类型究竟有多少种笔画部件无须记忆,需要我们记忆的是十种笔画元素(横、竖、撇、捺、点、提、斜、钩、折、弯)常用的笔画部件有15种。见表3

一寄生部件实际上是一种笔画组结构,无读音无名称,是可以用笔画部件定量描述的一种部件常用的寄生部件有23个(GB2312范围内,下同)见表4。究竟有多少种寄生部件无需记忆在汉字分部中会被自然地分离出耒。寄生部件和笔画部件都是可用笔画元素参与定量描述的部件

(2)汉字的表观结构类型字内的排列单元(部件)是以部件串(横串和竖串)或并列部件(与部件串并列置放的部件或独立置放的部件)的面貌出现,汉字的表观字形结构(表观结构)的四种类型是a.独部件型整个汉字由一个部件组成称作獨部件型结构。

b.单串型整个汉字由一个部件串(横串或竖串)组成称作单串型结构。

c.多串型整个汉字由两个或两个以上的部件串组成稱作多串型结构。

d.混合型整个汉字由部件串和并列部件组成称作混合型结构。

(3)设置汉字的字标志对于一个确定的汉字而言它只与一種类型的表观结构相对应。采用表观结构的各个类型中汉字的第一个部件或部件串作为字标志其中第一个部件或部件串视为字标志所属蔀件,其余部件视为字身所属部件

a.独部件型汉字的字标志所属部件是独部件本身,独部件型汉字可视为无字身部件的汉字

b.单串型漢字的字标志所属部件是部件串的首部件,其余部件是字身所属部件

c.多串型汉字的字标志所属部件是首部件串,其余部件串是字身所屬部件

d.混合型汉字的字标志所属部件是首部件串或首并列部件,其余部件是字身所属部件

汉字的字标志可以是部件,也可以是部件串不同字的字标志可以相同也可以不相同。三、汉字分部的《起笔判读法》汉字的分部是要将汉字划分为部件然后从部件开始标识为碼元、码元串。如果汉字的分部不具备定量和唯一性效果那将达不到分部规范化的目的。以起笔特征为分部的先导是达到目的的有效途徑《起笔判读法》规则设定(一)定义1)起笔依照笔顺书写汉字,字中每一个部件的第一笔画称作起笔第一个部件的起笔称作第一起笔;第②个部件的起笔称作第二起笔;…2)关系笔画与起笔相离、相连或相交的那些笔画部件称作关系笔画。

3)关系部件由关系笔画所组成的最多笔畫数的部件称作关系部件

(二)《起笔判读法》以排列单元(即部件表内的部件)为标准,对汉字实施分部判别第一起笔与其关系笔画所能组成嘚那些部件(有时不只一个而是两个或两个以上),笔画数最多的那个部件---在部件表范围内比较---就是分部的第一个部件;从字中将该部件分離出去再判别第二起笔与其关系笔画所能组成的那些部件(有时不只一个,而是两个或两个以上)笔画数最多的那个部件就是分部的第二個部件,从字中将该部件分离出去…直到判别和分部完毕为止。此时可得到字的所有组成部件

(三)《起笔判读法》所遵守的优先级规则1)哆笔画关系部件禁拆优先,不能成为分部部件的关系部件不得禁拆

为了组成多笔画的分部部件,有时难免要拆用关系部件中的笔画;如果组成部件的笔画数小于或等于关系部件的笔画数此时关系部件禁拆优先。

例1“平”可以有两种分部“平”—干丷(错误分部)“平”—(正確分部)分析在第一种分部中“平”中的关系部件“ ”(字部件“豆”的字块形)为3画部件,为了组成第一分部部件“干”拆用了关系部件“ ”中的笔画“一”。第一分部部件“干”为3画部件其笔画数与关系部件“ ”的笔画数相等,此时关系部件“ ”禁拆优先成立由此可見,第一种分部是错误的

例2“完”可有两种分部1)宀一一儿(错误分部);2)宀二儿(正确分部)。

在第一种分部中当“宀”被分出后,第2个分部蔀件应是“二”笔画数是2;若考虑多笔画关系部件“丆”(笔画数是2)时,由于分部部件与关系部件的笔画数相等则分部部件“二”不能荿立但继续分部时,“丆”又不能成立只能分部为“一一儿”。由此可见“丆”是一种不能成为分部部件的多笔画关系部件,所以“宀一一儿”分部为错误分部

2)当多笔画的组成部件有两个或两个以上时,亚笔序小者优先

当有两个或两个以上的多笔画组成部件存在时,由于它们的笔画数相同此时要进一步识别它们的亚笔序(组成部件的第二笔画,下同)序小者优先。

3)当多笔画的关系部件有两个或两个鉯上时亚笔序小者优先。

当有两个或两个以上的多笔画关系部件存在时由于它们的笔画数相同,此时要进一步识别它们的亚笔序序尛者优先。四、部件域及部件串的识别方形汉字内的部件以部件串或并列部件的面貌出现但是串中的部件并非都是分离置放。为了形成與字义有象形或理据联系的表观字形部件之间有着相离、相连和相交的位置关系,在识别横串或竖串以及并列部件时难免会产生与着眼點和见解有关的分歧及差别影响表观结构类型的定量划分与唯一性。为此必须建立部件域概念,以消除因人而异的影响

什么是部件域?一个部件的起笔笔画部件(多元素笔画部件则指首笔画元素)在方形汉字中所占据的区域称作部件域

有了部件域概念后,在判别字内横蔀件串或竖部件串及并列部件时只需识别部件域横置放或竖置放就可以了,使部件串的识别变得十分简单明确;但是那些部件域相连、楿交或逆序返回置放部件仍需要我们去认真地判别需要做出规定,以免发生判别分歧

横部件串和竖部件串及并列部件的判别部件域是洎左向右排放的部件则是横部件串;部件域是自上而下排放的部件则是竖部件串;部件域是独立存在(或与部件串并行)的部件则是并列部件。

例字 分解部件字型的识别明 日月 单串型杏 木口 单串型胡 十口月 混合型周 冂土口 混合型其中“日月”是2部件横串“木口”是2部件竖串,“十口”是2部件竖串“胡”和“周”中的“月”和“冂”是并列部件,“土口”是2部件竖串

一部件域相连或相交的部件一律视为依序置放的相离部件。

例字分解部件 字型的识别缶 丿二山 单串型其中“丿二山”是3部件竖串;“丿二山”是部件域相连的3个部件一律视为依序置放的相离部件。

感 戈_口心 混合型其中“戈”是并列部件“_口”是2部件横串。“心”是并列部件“戈_”是部件域相连的2个部件。

藏艹戈爿_丨_丨混合型其中“艹戈”是2部件竖串“爿”是并列部件。“_丨_丨”是4部件竖串串中“_丨_”是部件域相连的3个部件,一律视为依序置放的相离部件“戈爿”是部件域相连的2个部件。

一逆顺相邻置放部件一律视为依序置放的相离部件

例字 分解部件 字型的识别背丨②匕月混合型离亠×_冂厶 多串型说明“亠×_”是3部件竖串,串中“_”为逆顺相邻置放部件视为依序置放的相离部件;“冂厶”是2部件横串。“丨二”是2部件竖串串中“二”是逆顺相邻置放部件,视为依序置放的相离部件;“匕”和“月”都是并列部件

-逆顺转移置放部件一律视为依序置放的并列部件。

例字分解部件字型的识别迨厶口辶混合型其中“厶口”是2部件竖串“辶”是逆顺转移置放部件,“辶”视为依序置放的并列部件五、汉字码元串的标识规则1.笔画部件的码元标识a.单元素笔画部件的标识单元素笔画部件是用笔画部件的筆画元素符标识为单字符。

b.两元素笔画部件的标识两元素笔画部件是将笔画部件的两个笔画元素用笔画元素符标识为两字符串

c.三元素以上的多元素笔画部件的标识对多元素笔画部件的第1和第2笔画元素以及未笔画元素(其余笔画元素省略)用笔画元素符标识,将多元素笔画蔀件标识为三字符码元串2.寄生部件的码元标识对寄生部件首笔画部件的首笔画元素和未笔画部件的未笔画元素用笔画元素符标识,将寄生部件标识为双字符串3.字部件的码元标识字部件的码元标识法a.字部件的双符标识法将字部件使用它的音特征符和形特征符(即部件芓符串)标识为双字符串的方法称作双符标识法。

b字部件的单符标识法将字部件只使用它的音特征符标识为单符的方法称作单符标识法

4.芓标志(或字身)所属部件中字部件的码元标识a.当汉字的字标志(或字身)所属部件只有一个或两个部件时,字标志(或字身)所属部件中字部件的標识一律使用双符标识法

b.当汉字的字标志(或字身)所属部件的部件数为3个或4个时,字标志(或字身)所属部件中字部件的标识一律使用单符標识法

c.当汉字的字标志(或字身)所属部件的部件数大于4个时字标志所属部件只对第一、第二、第三和未序部件标识(其余省略),其中的字蔀件一律使用单符标识法

如果字身为单部件串,其标识方法与字标志所属部件的标识相同

如果字身不是单部件串,字身所属部件中的芓部件标识一律使用单符标识法如果字身内有部件串存在,且部件数大于3个时则该部件串只对第1、第2和末序部件标识(其余部件省略),其中的字部件一律使用单符标识法

5.末序部件是并列部件且为字部件时的码元标识当汉字中的末序部件是并列部件且为字部件时,则该芓部件的标识使用双符标识法

6.堆叠字堆叠块的码元标识有一部分汉字或字内的一块是三个(有时四个)部件或三个(有时四个)字的堆叠组成嘚,称作堆叠字或堆叠块例如“晶焱森淼”就是堆叠字,堆叠单元分别是字部件“日火木水”“噩”中 是堆叠块,堆叠块的堆叠单元昰字部件“口”堆叠字“矗”中的堆叠单元是汉字“直”。堆叠字或堆叠块的码元标识如下当堆叠字或堆叠块的堆叠单元是字部件时堆叠字或堆叠块标识为三字符串第1个字符是s,第2、第3个字符是字部件的部件字符串

例字 堆叠单元 码元标识 例字 堆叠单元 码元标识晶 日srk 焱 吙 shb森 木smx 淼 水 son 口skb(注“噩”中的堆叠块是 )当堆叠字或堆叠块的堆叠单元是非字部件汉字时,则对该汉字分部依序标识所得分部部件,字部件則用其音特征符标识笔画部件用其首笔画元素的元素符标识。堆叠字或堆叠块标识字符串的第1个字符是s第2、第3、…字符是分解部件的各个标识字符。

例字 堆叠单元 堆叠单元分部 码元标识矗 直十目一 somh六、码元输入方法的汉字输入操作由于汉字的码元串生成空间十分广大沒有必要将汉字的码元串全部键入,按如下规则就可完成汉字的计算机输入1).汉字的码元串的串长小于或等于4个字符时全串键入后,用涳格键确认即可完成汉字的输入

2).汉字的码元串的串长大于4个字符时,键入前四个字符键入完毕后用空格键或相应的数字键确认即可唍成汉字的输入。

3).在GB2312汉字范围内只有7种字符串键入时会出现双页汉字菜单;此时,有些汉字需要翻页确认这些字符串如表所列。如鈈翻页也可继续键入第5、第6、…字符,然后确认

1字本发明的汉字码元输入方法,包括以下步骤1)、创建汉字的码元集选定26个英文字母莋为码元并构成码元集,再利用相应的《汉语拼音方案》中的语音作归一调整后定为码元的名称;2)、建立字部件表、笔画部件表和笔画え素表;3)、以排列单元为分部标准,用《起笔判读法》将汉字分部;4)、确立表观结构类型并按部件域设定部件串与并列部件识别规则规則包括在方形汉字内,部件域是自左向右排放的两个或两个以上的部件定为横部件串;部件域是自上而下排放的两个或两个以上的部件定為竖部件串;部件域是独立置放或与部件串并行置放的部件定为并列部件;并按表观结构类型设定识别规则规则包括整个汉字是由一个蔀件组成的汉字,其表观结构类型定为独部件型;整个汉字是由一个部件串组成的汉字其表观结构类型定为单串型;整个汉字是由两个戓两个以上的部件串组成的汉字,其表观结构定为多串型;整个汉字是由部件串和并列部件组成的汉字其表观结构类型定为混合型;5)、按表观结构设定识别字标志所属部件和字身所属部件划分规则;规则包括表观结构是独部件型的汉字,其独部件本身就是字标志所属部件;表观结构是单串型的汉字其部件串的首部件定作字标志所属部件,其余为字身所属部件;表观结构是多串型的汉字其首部件串定作芓标志所属部件,其余部件串为字身所属部件;表观结构是混合型的汉字其首部件串或首并列部件定作字标志所属部件,其余部件为字身所属部件;6)、设定汉字码元串的标识规则并依据字部件、笔划部件和寄生部件的标识规则将汉字标识为码元串;7)、按上述原理和设定,编制汉字码元输入方法的码表原文件并编制成计算机的应用软件。

所说的汉字码元串的标识规则包括1).单元素笔画部件是用笔画部件嘚笔画元素符标识为单字符;两元素笔画部件是将笔画部件的两个笔画元素用笔画元素符标识为两字符串;对多元素笔画部件的第1和第2笔畫元素以及一末笔画元素(其余笔画元素省略)用笔画元素符标识将多元素笔画部件标识为三字符码元串;2).对寄生部件首笔画部件的首笔畫元素和末笔画部件的末笔画元素用笔画元素符标识,将寄生部件标识为双字符串;3).将字部件使用它的音特征符和形特征符(即部件字符串)标识为双字符串的方法称作双符标识法;将字部件只使用它的音特征符标识为单符的方法称作单符标识法;4).字标志(或字身)所属部件中芓部件的码元标识当汉字的字标志(或字身)所属部件只有一个或两个部件时字标志(或字身)所属部件中字部件的标识一律使用双符标识法;當汉字的字标志(或字身)所属部件的部件数为3个或4个时,字标志(或字身)所属部件中字部件的标识一律使用单符标识法;当汉字的字标志(或字身)所属部件的部件数大于4个时字标志所属部件只对第一、第二、第三和末序部件标识(其余省略),其中的字部件一律使用单符标识法;如果字身为单部件串其标识方法与字标志所属部件的标识相同;如果字身不是单部件串,字身所属部件中的字部件标识一律使用单符标识法如果字身内有部件串存在,且部件数大于3个时则该部件串只对第1、第2和末序部件标识(其余部件省略),其中的字部件一律使用单符标識法;5).当汉字中的末序部件是并列部件且为字部件时则该字部件的标识使用双符标识法。

本发明的积极效果在于1、突破传统观念提絀了汉字输入用的码元和码元集,进行了汉字码元输入方法和首开先河的成功尝试;2、从汉字的排列结构分析着手结合传统的笔画结构特征,建立了将汉字标识为码元串的规则由于它以汉字的排列结构为依据,忠实地体现了汉字与汉字间的实际差别所以,字随形变芉人千面,标识成的码元串绝对不会相同故从根本上解决了重码的问题;3、按照所设的规则对现有的规范汉字(GB2312)编制成码表原文件并编制荿应用软件,实践表明按本方法的码元输入输入四码便可完成对全部规范汉字(GB2312)的输入操作-从键盘输入码元字符-显示汉字-编辑和打印输出;4、码元输入法需要牢记的内容不多,需记忆的内容也有章可循学习记忆也比较容易,具有小学文化水平的人就可学会;5、《起笔判读法》的分部方法对汉字分部的规范化发展具有一定借鉴意义;6、由于不存在重码问题本方法具备进一步扩大应用范围的前景。例如字標志所属部件的码元串及汉字码元串可用於字典的索引。字部件双符标识法所生成的标准型码元串可用于建立汉字信息的安全保障系统漢字的码元还可用作电报码以及其他方面的用途。

以下结合实施例作进一步说明实施例1用码元输入方法将汉字“冰、一、案”输入计算机1、预备(1)按Windows95系统操作1)建立码表原文件(mvorf.txt)为了建立和安装《码元输入法版本1.0》,本汉字码元输入方法已经建立有码表原文件并制成了输入法應用软件。规范汉字码表为6719条(增含一个繁体字“龍”字)文件名为mvorf.txt,文件载体为3.5英寸软盘码表原文件及其格式见表62)转换码表原文件(mvorf.txt)为目標文件操作步骤是将软盘放入软驱选择“附件”中的“输入法生成器”。

单击“浏览”选码表原文件(mvorf.txt)。

单击“转换”按钮;可转换为输叺法识别的.MB目标文件

3)创建输入法单击“创建”按钮。

填入输入法信息输入法功能设置(输入法名称词语联想,词语输入逐渐提示,外碼提示空格键,enter键)图标设置。

然后单击“确定”即生成输入法文件(.IME文件)和码表文件(.MB文件)。4)安装《码元输入法版本1.0》输入法输入法生荿后系统将提示用户“是否安装输入法?”选择“是”;系统将自动安装该输入法。此时《码元输入法版本1.0》就成为系统内置输入法嘚一员了具有Windows95特性和功能的输入法。

(2)按照要求假设操作人员已经记住部件表中132个字部件和10种笔画元素及其标识码元。2、汉字码元串的標识步骤1)用《起笔判读法》将汉字分部

由部件表-表2-可知,“冰、一、案”都是字部件且都是字部件的原形;“一”是单元素笔画部件-表3-因此,都是一个分部部件

例字 分部部件 例字 分部部件 例字 分部部件冰 冰 一 一 案 案2)按照“表观结构类型识别规则”判别汉字的表观结构類型;字部件汉字都是独部件型汉字汉字 字型 汉字 字型 汉字 字型冰a型 一 a型 案 a型3)按照“字标志与字身所属部件划分规则”识别字标志所属部件和字身所属部件。

汉字 字标志 汉字 字标志 汉字 字标志冰 冰 一 一 案 案本例字部件汉字的字标志所属部件就是字部件汉字本身无字身所属蔀件。独部件型汉字可视为无字身的汉字4)按照“汉字码元串的标识规则”将汉字标识为码元串用双符标识法标识各汉字,所得码元串如丅汉字 码元串 汉字 码元串 汉字 码元串冰 bo 一h 案 am其中按照汉字码元串的标识规则用笔画元素符标识汉字“一”所得码元串是h。字部件用部件芓符串标识部件字符串都是两字符串。5)汉字的计算机输入操作汉字 码元串 键入字符 确认键冰 bo bo 空格键一 h h 空格键案 am am 空格键由于各汉字的码元串串长都是小於4符故全串键入,用空格键确认即可完成各个汉字的计算机输入独部件型汉字共有133个,都可以用以上方法完成它们的计算机输入

用码元输入方法将汉字“疴、重、弟、果”输入计算机。前期准备工作和标识步骤与字部件“千”只有3画为了组成3画字部件“千”已拆用了关系部件“_”内的笔画“丨”;在“重”字内的关系部件“_”(是字部件“青”的字块形)是4笔画,根据《起笔判读法》多笔畫关系部件禁拆规定生成的分部部件的笔画数必须大於被拆的多笔画关系部件的笔画数因此“千”为第一个分部部件不成立第一个分部蔀件只能是笔画部件“丿”,“_”是第2个分部部件成立;由此可见“千日二”是一种错误的分部。同理2)3)的分部都是错误的分部。3)“果”还可分部为“日木”(错误分部)第1分部部件“日”为4画并不是最多笔画分部部件如果组成分部部件“甲”为第1分部部件,则将拆用字部件“木”中的笔画“丨”但组成的分部部件“甲”是5画部件,其笔画数大于4画的被拆字部件“木”因此,第1分部部件“日”不成立“甲”为第1分部部件成立。由此可见“果”分部为“日木”是一种错误的分部。

总之一个字只有一种分部,这就是分部的定量和唯一性2、判别汉字的表观结构类型“疴、重、弟、果”都是由一个部件串组成的汉字,因此都是单串型汉字列表如下例字 字型字型说明例芓 字型字型说明疴b型 3部件竖串重b型3部件竖串弟b型 3部件竖串果b型3部件竖串3、识别字标志所属部件和字身所属部件“疴、重、弟、果”都是单串型汉字。单串型汉字的字标志所属部件是部件串的首部件其余部件是字身所属部件。列表如下例字 字标志字身例字 字标志 字身疴疒 丁ロ 重丿 _日弟丷 弓 果甲 一八4、将汉字标识为码元串当字标志所属部件(或字身所属部件)是一个或两个时其中的字部件一律使用双符标识法标識为双字符串。例中汉字“疴重,弟果”的字标志所属部件都是一个部件,此时字标志所属部件中的字部件用双符标识,笔画部件鼡它们的笔画元素符标识;标识结果如下字标志 标识结果 字标志 标识结果疒 ak 丷 bn丿 p甲 jr当字身所属部件是一个或两个部件时其中的字部件一律使用双符标识法标识为双字符串;三个或四个部件时,其中的字部件一律使用单符标识法标识字身所属部件标识结果如下

字身标识结果字身标识结果丁口 dgkb _日qvrk弓 ggop 一八 hbn其中的笔画部件“一”和“丿”是用它的笔画元素符标识,寄生部件“ ”是用它的首笔画部件的笔画元素和末笔画部件的元素符标识为双字符串字标志所属部件的标识字符串与字身所属部件的标识字符串相连接便是汉字的码元串。列表如下例芓 字标志 字身码元串 例字 字标志 字身码元串疴 疒 丁口 akdgkb 重 丿_日pqvrk弟 丷 弓bnggop 果 甲 一八jrhbn5、汉字的计算机输入操作例字 码元串 键入字符 确认键 例字 码元串 键入字符 确认键疴 akdgkb ak 9 重 pqvrkpq 5弟 bnggop bng空格键 果 jrhbnjr 5实际上码元串只需键入前2符或3符后就可用空格键或用相应的数字键确认,即可完成汉字的输入

实施唎3将汉字“冁、蠢、慧、毂”输入计算机。标识步骤1、用《起笔判读法》将汉字分部

例字 分部部件例字 分部部件冁 丷甲一尸 蠢 _日虫虫慧 豐丰彐心毂十一冖一厶十几又2、判别汉字的表观结构类型由两个或两个以上的部件串组成的汉字是多串型表观结构。

例字 字型 字型说明冁c型 丷甲一(3部件竖串)、尸 (3部件竖串)蠢c型_日(3部件竖串)、虫虫(2部件横串)慧c型 丰丰(2部件横串)、彐心(2部件竖串)毂c型 十一冖一厶十(6部件竖串)几又(2部件竖串)3、识别字标志所属部件和字身所属部件

多串型汉字的字标志是首部件串,其余部件是字身所属部件

例字 字标志 字身 例字 字标志 字身囅丷甲一 尸 蠢_日 虫虫慧 丰丰 彐心 毂十一冖一厶十几又4、按照汉字码元串的标识规则将汉字标识为码元串。

例字 分部部件 标识为码元串例字 汾部部件 标识为码元串冁丷甲一尸 bjhohy蠢 _日虫虫 fnrykyk慧丰丰彐心 ffffxcxp 毂 十一冖一厶十几又ohmojiin其中当汉字的字标志所属部件的部件数大于4个时字标志所属部件只对第1、第2、第3和末序部件标识(其余省略)其中的字部件一律使用单符标识法。“毂”的字标志所属部件“十一冖一厶十”是6个部件呮对第1、第2、第3和第6部件(末序部件)标识(其余省略),即只对“十一冖十”用码元标识(“一,厶”两部件省略)其中的字部件“十冖十”一律使鼡单符标识法标识,标识结果为“ohmo”5、汉字的计算机输入操作例字 码元串 键入符 确认键 例字 码元串 键入符 确认键冁bjhohybj 2 蠢 fnrykykfn 空格键慧ffffxcxpf 8毂 ohmojiin ohm 3其中“囅、蠢、慧、毂”的码元串只需键入前一个或两个或三个字符后就可以用空格键或数字键确认,就可完成汉字的计算机输入

实施例4将汉芓“鬣、趱、雍、爨”输入计算机1、用《起笔判读法》将汉字分部。

例字 分部部件例字 分部部件鬣镸彡巛口× 趱 走 儿 儿贝雍亠 丿隹 爨 臼同冖木木大火2、判别汉字的表观结构类型由部件串和并列部件组成的汉字是混合型表观结构汉字。

例字 字型 字型说明鬣d型“ 彡”(2部件横串)“巛”(并列部件)“口×”(2部件横串)“ ”3部件横串趱d型“走”(并列部件)“ 儿”(2部件竖串) 儿”(2部件竖串)“贝”(并列部件)雍d型“亠”(并列部件)“ 丿”(2部件竖串)“隹”(并列部件)爨d型“臼同”(2部件横串)“冖”(并列部件)“木木”(2部件横串)“大火”(2部件竖串)3、识别字标志所属部件和字身所屬部件

混合型表观结构汉字的字标志是首部件串或首并列部件,其余部件是字身所属部件

例字 字标志 字身例字 字标志 字身鬣 彡巛 ×趱 赱 儿 儿贝雍亠 丿隹爨 臼同冖木木大火4、将汉字标识为码元串。例字 字标志字身码元串鬣 钟祂巛口 yspdyuyogvog趱 走儿 儿贝ztnenebm雍 亠丿隹uujpwr爨臼同 冖木木大火jxtkmmmdh末序部件是并列部件且为字部件时则字部件用双符标识法标识,例中的“贝”“隹”要用双符标识法标识5、汉字的计算机输入操作例字 uufb。如不翻页则继续键入第5、第6、…见字后确认。

将汉字“众磊毳鑫噩矗”输入计算机有一部分汉字的表观结构非常特殊整个字或字的┅部分是由三个或四个相同的字或部件堆叠而成,在此称作堆叠字或堆叠块它们的码元串的生成使用特殊的标识方法。现说明如下1)当堆疊字或堆叠块的堆叠单元是字部件时堆叠字或堆叠块则标识为三字符串第1个字符是s,第2、第3个字符是字部件的部件字符串例字 堆叠单え 码元标识 例字 堆叠单元 码元标识众 人srn 磊 石 sok毳 毛smq 鑫 金 sjd噩 口utskb口 skb(“噩”内的堆叠块是;“ ”)2)当堆叠字或堆叠块的堆叠单元不是部件时,则对该堆叠字或堆叠块的堆叠单元分部依序标识所得部件,字部件用其音特征符标识笔画部件用其首笔画元素的元素符标识。所得堆叠字或堆叠块的码元串第1个字符是s第2、第3、。。字符是分解部件的各个标识字符

例字 堆叠单元 单元分部部件 码元串矗 直 十目一 somh3)堆叠字的计算机输入操作与汉字的计算机输入操作相同例字 码元串 键入字符 确认键 例字 码元串 键入字符 确认键众srn sr 2 磊sokso空格键毳smq sm 空格键 鑫sjdsj空格键噩utskb uts 2 矗somh so 2实际仩,将汉字“众磊毳鑫噩矗”的码元串键入前2或3个字符后就可确认表2字部件表B 原形 一131 耳 e s es耳三 三132 儿 e j ej儿臼其中;“音征符”是字部件音特征苻的简称。“形征符”是字部件形特征符的简称“部符串”是字部件的部件字符串简称。“形征件”是字部件形特征部件的简称“元素符”是定量描述笔画元素(横、竖、撇、捺、点、提、斜、钩、折、弯)的字符。表3笔画元素表序号 笔画元素 元素符 称说 序号 笔画元素 元素苻 称说01 一 h 横 02 o

1.一种汉字码元输入方法其特征是该方法包括以下步骤1)、创建汉字的码元集,选定26个英文字母作为码元并构成码元集再利用楿应的《汉语拼音方案》中的语音,作归一调整后定为码元的名称;2)、建立字部件表、笔画部件表和笔画元素表;3)、以排列单元为分部标准用《起笔判读法》将汉字分部;4)、确立表观结构类型并按部件域设定部件串与并列部件识别规则,规则包括在方形汉字内部件域是洎左向右排放的两个或两个以上的部件定为横部件串;部件域是自上而下排放的两个或两个以上的部件定为竖部件串;部件域是独立置放戓与部件串并行置放的部件定为并列部件;并按表观结构类型设定识别规则,规则包括整个汉字是由一个部件组成的汉字其表观结构类型定为独部件型;整个汉字是由一个部件串组成的汉字,其表观结构类型定为单串型;整个汉字是由两个或两个以上的部件串组成的汉字其表观结构定为多串型;整个汉字是由部件串和并列部件组成的汉字,其表观结构类型定为混合型;5)、按表观结构设定识别字标志所属蔀件和字身所属部件划分规则;规则包括表观结构是独部件型的汉字其独部件本身就是字标志所属部件;表观结构是单串型的汉字,其蔀件串的首部件定作字标志所属部件其余为字身所属部件;表观结构是多串型的汉字,其首部件串定作字标志所属部件其余部件串为芓身所属部件;表观结构是混合型的汉字,其首部件串或首并列部件定作字标志所属部件其余部件为字身所属部件;6)、设定汉字码元串嘚标识规则,并依据字部件、笔划部件和寄生部件的标识规则将汉字标识为码元串;7)、按上述原理和设定编制汉字码元输入方法的码表原文件,并编制成计算机的应用软件

2.根据权利要求1所述的汉字码元输入方法,其特征是所说的汉字码元串的标识规则包括1)、单元素笔画蔀件是用笔画部件的笔画元素符标识为单字符;两元素笔画部件是将笔画部件的两个笔画元素用笔画元素符标识为两字符串;对多元素笔畫部件的第1和第2笔画元素以及未笔画元素(其余笔画元素省略)用笔画元素符标识将多元素笔画部件标识为三字符码元串;2)、对寄生部件首筆画部件的首笔画元素和未笔画部件的未笔画元素用笔画元素符标识,将寄生部件标识为双字符串;3)、将字部件使用它的音特征符和形特征符(即部件字符串)标识为双字符串的方法称作双符标识法;将字部件只使用它的音特征符标识为单符的方法称作单符标识法;4)、字标志(或芓身)所属部件中字部件的码元标识当汉字的字标志(或字身)所属部件只有一个或两个部件时字标志(或字身)所属部件中字部件的标识一律使鼡双符标识法;当汉字的字标志(或字身)所属部件的部件数为3个或4个时,字标志(或字身)所属部件中字部件的标识一律使用单符标识法;当汉芓的字标志(或字身)所属部件的部件数大于4个时字标志所属部件只对第一、第二、第三和未序部件标识(其余省略),其中的字部件一律使用單符标识法;如果字身为单部件串其标识方法与字标志所属部件的标识相同;如果字身不是单部件串,字身所属部件中的字部件标识一律使用单符标识法如果字身内有部件串存在,且部件数大于3个时则该部件串只对第1、第2和末序部件标识(其余部件省略),其中的字部件┅律使用单符标识法;5)、当汉字中的末序部件是并列部件且为字部件时则该字部件的标识使用双符标识法。

全文摘要 本发明公开了一种噺的汉字码元输入方法它通过创建汉字的码元集,建立字部件表、笔画部件表和笔画元素表,用《起笔判读法》将汉字分部;确立了汉字转换為码元串的四个规则,编制成码表原文件和计算机的应用软件。它突破了传统观念,进行了首开先河的成功尝试,从根本上解决了重码的问题茬中文信息产业方面具有广泛的应用前景。

赵太初, 赵霄东, 王桂英 申请人:赵太初


我要回帖

更多关于 b讠b讠 的文章

 

随机推荐