中文信息化书写方法――元根码
元根码――汉字与符号信息化书写系统
我国文化教育现代化中一个急待解决的问题
文化是民族的魂,中文书写文化又是中华民族文化的根。然而,我们正面临着民族文 化的根被丢弃的严峻局面。 这不仅令许多有识之士十分担忧, 而且也引起国际舆论的关注。 舆论惊呼, “这种情况已经发展到引起一场文化危机的地步” 。造成这一局面的根本原因就 是,在电脑与手机成为人们工作与生活的基本工具的今天,中文书写方式的根本变革问题 却没有得到解决。要解决这个问题,首先要开发出能够实现这种变革的中文信息化键盘书 写系统。所以,中文的信息化书写是我国文化教育现代化进程中一个急待解决的问题。 那么,什么是“信息化书写”? 传统的书写是一种“描画性书写方式” ,即用笔在纸上具体描画文字图形的书写方式。 而以标准键盘为书写工具、通过双手十指敲击文字的字形信息码实现文字快速盲打的书写 方式,称为“信息化书写” 。由描画性的“笔书”发展为信息化“键书” ,是人类书写方式 的一种根本性变革。 一百多年前, 西方国家通过使用打字机率先实现了西文书写方式的历史性变革。 当时, 汉字因为数量庞大,结构复杂,无法像西文那样用打字机进行快速盲打。所以,中国人曾 经痛感,汉字由于不能实现书写方式的这一变革而无法步入现代文明。计算机的出现,为 中文书写方式的变革提供了可能,这种变革可以通过开发中文信息化书写方法来解决。 与开发汉字输入方法的要求不同,中文信息化书写方法必须同时具备以下三个基本要 求: 1、以计算机标准键盘作为书写工具、双手十指都参预敲击的键盘书写; 2、 文字的键盘书写码必须建立在汉字字形结构基础上, 使键书与笔书在书写文化上保 持一致; 3、为所有通用词语提供规范的书写码,能实现以词语为主要书写单元的快速盲打。 信息化书写是要在保留传统书写文化基础上实现书写的现代化。无论从开发的宗旨和 要求的目标去看,还是从遵守的规范与实现的意义来说,信息化书写方法与汉字输入方法 是两个不同的概念。开发中文的信息化书写方法,将几千年又累又慢的传统书写换成轻松 快速的键盘书写,这是中国人一百多年来梦寐以求的事情,也是实现我国文化教育信息化 的一个迫切需要解决的问题。元根码正是基于这一点,为解决中文的信息化书写问题而开
汉字与符号信息化书写系统――元根码
我国在 1958 年颁布实施了《汉语拼音方案》,这个方案是为了解决汉字的注音而制定 的。由于汉语拼音是用标准键盘上的英文字母作为汉字的注音符号,因此可以直接借用它 作为汉字的一种输入方法。 汉语拼音早在 50 多年前就被纳入我国九年制义务教育, 所以国 人用它输入常用汉字时,不需要另外学习就可以使用。这也造成了目前我国大多数人都是 用拼音或由其派生的其它音码输入法输入中文。由此,业界有人认为,《汉语拼音方案》 不仅解决了汉字的注音问题,同时也解决了中文的键盘书写问题。 然而,现实情况告诉我们,这种看法是完全错误的。二十多年的实践证明,汉语拼音 虽然可以用来输入常用汉字,但使用它却存在很多问题。其中最主要的两个问题是: 第一、拼音输入法只能输入常用汉字,面对 7 万多个国标汉字,大多数是无法输入的。 因为用拼音输入汉字的前提是,用户必须认识所要输入的字(知道它的正确读音)。大部 分用户 (包括学生、 知识分子、 国家公务员) 能够认识的汉字一般都在 3000~3500 个左右, 也就是说, 95%以上的汉字无法用拼音输入。 而能不能对所有汉字作到见字知码、 快速输入, 直接关系到中文信息处理的全面解决和我国文化教育的现代化。在西方国家,西文的电子 字典(或电子词典)早就在使用,而中国人为什么至今还在使用老式的纸质字典呢?就是 因为大多数人对不认识的字无法用拼音输入来检索它, 即使有了汉字电子字典也无法使用。 第二、用拼音输入中文虽然也是在键盘上敲击汉字的信息码,但敲击的是汉字的注音 信息码。汉字的注音信息与体现汉字文化的字形信息毫无关系。中文的文化内涵主要是汉 字的字型结构体现的,所以,拼音输入是一种脱离汉字文化的中文输入,它在敲击键盘时 没有汉字的传统书写概念。而信息化书写则是在保持中文书写原则基础上的键盘书写,它 与传统书写的区别只是将字形部件的描画书写变为字形部件的信息化敲击书写。实际上, 西方人在用键盘打字时,敲击的就是西文的字形信息码,西文键书与西文笔书在书写文化 上是一致的。目前,我国大多数人都用背离中文书写文化的音码输入中文,这正是我国中 文信息化道路上的严重问题所在,也是让有识专家们最为担心的问题。中国青年报曾有一 项调查显示,现在我国的青少年 83%以上的人承认自己书写困难――“提笔忘字”,这在 过去并不多见。造成这种情况的原因就是他们长期使用拼音打字、发短信。这种情况如果 不改变,我们的后代都将成为新型“文盲”,这将是灾难性的民族文化危机。 使用音码输入法既不能解决电子字典的使用问题,又会造成中文书写文化的丢弃。对 我国文化教育事业来说,这是两个极为严重的问题。为了我国文化教育信息化进程的健康 发展,必须坚决抛弃音码输入方法。
语音输入和手写输入不能替代键盘书写
有人预言,文字的计算机输入技术将发生质的变革,将由键盘输入改为“语音”和 “手 写”方法输入,认为键盘编码已经过时。
元根码――汉字与符号信息化书写系统
究竟应该如何看待这个问题呢?实际上,早在二十年前就有人认为,语音输入和手写 输入是今后中文输入研究应用的主要方向。而且二十多年来,很多人都在从事语音输入系 统或手写输入系统的研究和开发,也推出了许多这样的应用软件,但是,至今也没有发生 专家所说的“质的变革”,无论是国内还是国外,人们都还是用键盘来输入文字。可以说, 语音输入和手写输入不仅过去没有,而且今后也永远不可能替代键盘输入。因为: 1、手写输入是保留了原始的、落后的描画性书写方式的汉字输入方法,效率很低。当 初是为那些不会汉语拼音、 不会输入方法的老年人解决汉字输入而开发的, 很少有人使用, 没有什么实用价值。 2、 语音输入是利用语音识别系统将话音转化为文字, 其开发的初衷是提高文字的输入 效率,希望它的输入速度达到用户的讲话速度。而实际上,由于它在使用上很不方便,加 上局限性太大,极不实用。语音输入只能对那些有明确含意的通用词语的读音才能识别, 而很难识别诸如单字、普通人名、一般的村镇地名、古文等读音,对于含有很多数学符号 和英文字母的现代科技文章也难以输入,误码率很高,修改起来更为麻烦。语音输入的上 述问题使得它在作为中文输入工具时,不仅不能提高效率,根本就无法使用。 语音输入不仅存在应用层面上的上述问题, 更为严重的是, 它在使用时只动嘴不动手, 与文字书写毫不相干,长期使用它人们还会写字吗?都不会写字了,这不就等于丢弃了中 华民族的传统文化的根本吗?关键的问题就在于,我们决不能由于技术的发展而丢弃民族 书写文化。语音输入作为一个科研课题,可以进行开发研究,也有可能用在某些特定场合, 但不会成为一种通用的中文输入方法。 语音输入与手写输入是一种没有多大实用价值的输入方法,永远也不可能代替文字的 键盘书写。利用标准键盘实现的信息化书写,代表的是现代化的书写方式,最方便、最快 捷、最廉价、最通用,永远不会被淘汰。
中文信息化键盘书写系统
通过对中文书写问题的上述分析,不难得出这样的结论:现在,我们的当务之急是要 开发和推广中文信息化键盘书写系统,尽快建立起民族键盘书写文化。元根码正是基于建 立民族键盘书写文化这一根本宗旨,为解决中文的信息化书写问题,在对汉字的结构特点 深入研究的基础上开发出来的。它是一个针对七万个国标汉字、十五万条通用词语和五百 多个特殊符号,按照双态书写原则开发的智能化键书系统。其主要特点是: (1)规范易学,宜全面纳入中小学基础教育 元根码是以构成汉字的字元为根据建立中文键盘书写码的,既符合中文的书写文化规 范,又符合信息化原则。规范易学是元根码的第一特点,它的字元、分解、编码等概念符 合我国国民教育的知识背景,符合人们对汉字的认知心理和书写习惯,完全可以和中小学 的语文教学相结合。元根码的基本目标,就是要使信息化书写全面纳入我国基础教育。 (2)实现了以词语为书写单元的中文高速盲打 构成语言的基本单位是词语,中文信息化书写也就是以词语为主要书写单元的键盘书
汉字与符号信息化书写系统――元根码
写。元根码为所有通用词语(约 15 万条)提供了信息化的书写码,每条词语的码长均为 4 个码元,加之智能化的软件设计,实现了中文的无键选书写。所以,元根码是以词语为主 要书写单元的中文高速盲打系统。 (3)支持超大字符集汉字的快速书写 元根码为 GB 国家标准 (等同国际标准 ISO/IEC ) 7 万多汉字 的 均提供了书写码,支持所有生僻字与繁体字的快速书写。汉语电子字典的应用问题,人名 和地名中生僻字的输入问题,以及国际交流、汉字研究等领域涉及的冷僻字与罕用字的录 入问题,都能够通过推广使用元根码得以完满解决。 (4)人人都可用它对特殊符号快速盲打 所谓特殊符号就是指在各种文稿中,特别是科技论文、教材和各学科的电子教案中频 繁出现的单位符号(如:? ?