您好,欢迎来到达州工业云! 平台首页 企业驾驶舱 帮助中心 企业登录 企业注册

HI,欢迎使用达州工业云平台!

账号必须大于2位

创新资源平台
服务平台首页>专利库>专利详情

汉字形态数码(公开号:CN1133989A)

  • 申请号:CN95114897.4 申请公布号: CN1133989A
  • 申请日: 1995-04-28 申请公布日: 1996-10-23
  • 申请(专利权)人: 专利代理机构: 邵阳市专利事务所
  • 分类号:

专利介绍

一种汉字编码方法。根据汉字的基本结构和笔顺编码,其特征是,将汉字基本结构分成10类单码字基和13类双码字基,分别用0,1,2……9和00,01,02……09,10,11,12表示,并根据汉字笔顺和字基出现的先后顺序将汉字编成4码,将词语编成6码。字基辨别原则是:取基宜大,同等优先,单笔随离,相离随人,线折随口,一切随交。本编码文案易学易记,电脑输入速度较快,单个汉字重码率低,词语码无重码。也可用于查字典、词典,将汉字电脑输入和查词典融为一体。1、一种汉字编码方法,根据汉字的基本结构和笔顺编码,本发明的 特征在于:该方法包括字基编码规则;取基原则、记码顺序、字词编码; 字基编码是将汉字基本结构分成23类,其中:独点、独线、纵离、单折、单 交,口形、人形、双折、横离、双交10类为单码字基,依次用0,1,2,……9 表示;疒、立、禾、衤、石、鱼、虫、讠、门(宀)西、金、王、竹13类为双 码字基、分别用00,01,02,……09,10,11,12表示;根据汉字书写笔顺和字 基出现的先后顺序将汉字编成4码,复杂汉字,取首、末各2码;简单汉字不 足4码,后面可以添0凑足4码。 2、根据权利要求1所述的编码方法,其特征是:独点(0)即单独一 点;独线(1)即单独一线,包括:一丨xa0丿ue015 ,独线无折无钩;纵离(2) 包括二三冫氵亠 ,即点或线从上到下相离排列;单折(3)包括: ,即单独一折或两笔头相接成折,有一个角,有的还可 带一小钩,如 ;单交(4)包括×十又力巾 ,即一笔穿过一 笔,只有一个交点;口形(5)包括口尸 巨,即四面封闭或包 围,还包括 已;人形(6)包括人入亻 丆卜,即一线的端点接另 一线的中间,或一点粘在一线上,有一接点;另外从相交字基非端点处引出 的点或线亦作6;双折(7)包括冂冖几匚ue021凵卩 ,即一 笔有2折或2笔头连成2折,有两个角,另外ク勹阝,亦作7;横离(8)包括: 八丷儿刂ue088川州忄小ue087巛灬,即点、线、单折从左到右相 离排列,互不包含;双交(9)包括艹 中由甲,即一笔穿过两笔,有两个交点;若一笔穿过三笔或连续3交,有3个 交点者,一律记作49;若一笔穿过4笔或连续4交有4个交点以上者,一律记作 99。 3、根据权利要求1所述的汉字编码方法,其特征是:字基辨别有以 下原则: a、取基宜大:应尽量先取双码字基; b、同等优先:如“亲”作立木,不作亠丷禾; c、单笔随离:若“单笔”是相离字基(2,8)的一个组成部分,则服从 相离字基; d、相离随人:若相离2笔中有一笔同它笔构成人形,则服从人形字基6, 如果相离各部分同旁端点共接一线,仍视为相离字基; e、线折随口:如线、折围成口形,则服从口形5; f、一切随交:各种形态被他笔穿过,则服从相交字基。 4、根据权利要求1所述的编码方法,其特征是:记码顺序为:从左 到右,从上到下,由外到内,先中间后两边,先两边后中间,右上角独点 记在右下角字基之前,相交字基按交点位置记码,连续相接成人形,按接 点记码,特殊规定的有ue09e(足)、页、纟都只记前2码。 5、根据权利要求1所述的编码方法,其特征是:词语编码规则为每 个词语不论字数多少均是6个数码;二字词取每字前3码,三字词取每字前2 码,四字以上词,取第一、二字各前2码,第三字和末字各前1码,相应码位不 足的添0凑足。 本发明涉及一种汉字与词语的编码方法,适用于电脑输入与查字典。 汉字编码方法已有几百种,各有所长,也各有其短。常见的有字形编 码(如五笔字型),首尾码,拼音码,区位码,自然码等等。拼音码易学易掌握, 但重码较多,翻页选字相当麻烦。区位码无重码,但不便记忆。五笔字型 输入速度快,效率高,容易实现盲打,但掌握比较困难,基本字根130个, 拆字往往搞不准,特别是末笔识别码带来许多麻烦。 本发明的目的是:提供一种易学易记,电脑输入速度较快,重码选择 基本不翻页的汉字编码方法,同时将编码应用于查字典,使汉字电脑输入 与查字典融为一体。 本发明的目的是这样实现的:将汉字依据基本结构分成23类字基,即 独点、独线、纵离、单折、单交、口形、人形、双折、横离、双交10类单 码字基,依次用0~9数字表示,以及疒、立、禾、衤、石、鱼、虫、讠、门、 西、金、王、竹13类双码字基,分别用00,01,02,……09,10,11,12表示。 根据汉字书写笔顺和字基出现的先后顺序将汉字编成4码,用4位数字表示。 复杂汉字,取首尾各2码;简单汉字不足4码,后面可以添0凑4码。字基辨别 原则是:取基宜大,同等优先,单笔随离,相离随人,线折随口,一切随交。 词语编码为:每个词语共6码,即:2字词语取每字前3码;3字词语取每字前2 码;4字以上词语,前2字各取前2码,第3字和尾字各取前1码;相应码位不足 的添0凑足。 下面对本发明作详细说明: 本编码将汉字基本结构(字基)分为23类,前10类为单码字基,其余13类 为双码字基,代号如下: 一、字基含义(括号内为例字) 0:独点。表示单独一点(不夕私劲) 1:独线。表示单独一线,如一丨丿ue015 (干个血瓜刁),可有弧度, 无钩。 2:纵离。表示点、线从上到下相离排列,如二三冫氵亠 (目叁北习汉文参飞聚)相离部分也可被隔开,如“母”之两点。 3:单折。单独一折或两笔头相接成折,有一个角。如 (买公丫库后心)有的还另带一小钩,如 (习飞)。 4:单交。一笔穿过一笔,有一交点。如十×又力巾 (古父麦 劳幅晚丙)。 5:口形。四面全封,如口尸 巨(国吃户良巴且 骨巨),另外, 已未全封亦归此类(臼,已经的“已”)。 6:人形。一线端点接另一线中间,有一接点。如人入亻 丆(合 入仁农百)一点沾在一线上亦属之,如 卜(惠仆)。从相交字基(4,9) 非端点处引出的点或线亦作6,如:大内才长夫头。注意,如果引出的 是折,则仍作3,如尢记为43。另外,戊的左边“丿”是从端点引出的,厂 看作一笔,不属人形, 作9。 7:双折。连续两折,有两个角。有的还可另带一小钩,如顺双折冂冖 几匚ue021凵卩(同罕风区 凶却留),反双折 (之与鼎), 另规定ク勹阝亦作7(陪夕勾)。注意“ ”不属双折(丑),“丑”记 为 十一341,“彐”记为32。 8:横离。点、线、单折以左到右相离排列,如八丷儿刂ue088xa0灬忄小ue087 巛川州(父关元划学杰示怕恭巡荒洲),相离部分也可被隔开(木办)。有时 同纵离不易区别,如“豕、聚”左下的“ ”,前者在“ ”下边,有从 左到右趋势,故从8,后者在直线左旁,有从上到下趋势,从2。“为”的两 点,即不作8,也不作2,记作两个独点。相离各部分若有包含或半包含,则 不属相离,如“刁”作31,不作8或2,规定“水”中的“ ”构成8,“永” 中的“ ”亦构成8。 9:双交。一笔穿过两笔,有两个交点。如艹 中甲由(共隹译打如戈毛鹿两黑弟丹衷央鬼轴),规定“奂” 的下边作央96。若一笔穿过三笔,或连续三交有三个交点者,一律记作49, 如丰韦车尹ue033 申电 (耕伟较伊史带果伸黾母革), 若一笔穿过四笔以上或连续四交以上有四个交点以上者,一律记作99,如 弗聿事串曲毋册井冉肃(辅使便费律事窜曲毋栅 进再庸)注意“孝”上的“ ”不是9,而作44,规定“龟”下边作电。 双码字基编码如下(括号为字例): 00:疒(病疼)xa0xa0xa0xa0xa0xa007:讠(讲储边) 01:立(音位)xa0xa0xa0xa0xa0xa008:门宀(阔们安) 02:禾禾(禾余)xa0xa0xa0xa009:西(要酉晒) 03:衤衣(初裔裴)xa0xa010:金钅(鉴针) 04:石(硬岩)xa0xa0xa0xa0xa0xa011:王壬(瑰主丢妊) 05:鱼(鱿鲁鲨)xa0xa0xa0xa012:竹ue022(竹笠) 06:虫(蚯蛊虽) 二、取基原则 (一)取基宜大:应尽量先取双码字基,如虫06,不作96;立01,不作281。 “乘”从禾北。 (二)同等优先:如亲作立木,不作亠丷禾。 (三)单笔随离:若“单笔”是相离字基(2,8)的一个组成部分,则服从 相离字基。如汁作24,不作0004;文作24,不作014;爪作38,不作311。 (四)相离随人:若相离两笔中有一笔同他笔构成人形,则服从人形字基。 如彳作16,不作21。若虽相接而不构成人形,则相离不受影响,如亍作23, 不是16。另外规定:如果相离各部分同旁端点共接一线,相离亦不受影响, 如兀作18;光作818,非作282,业881(上面看作 丷),故相离字基接线原 则是“全或无”式的。 (五)线折随口:如果线、折围成口形,则服从口形,如 作5,不作71; 骨的上边 作5,不作77, 作53,不作737;局作535,不作775,巨作5,不作 77(注: 7151,与臣511不同)。 (六)一切随交:各种形态被它笔穿过,则服从相交字基,被穿过的部分 根据交点的个数而分别记为4,9,49,99,未被穿过的部分脱出另记。例如, 一竖穿过两横,成“ ”,作9,若这一竖只穿过下面一横,成“干”,则 上面的“一”脱出另记,“干”作14;规定:口形,双折被穿过(即使是部分 穿过),未被穿过的部分亦不脱出,是为例外,如免的下边的 作4,不作74; 巾作4,不作14;耳作624,不作52,注意 不是口形)。 三、记码顺序 记码顺序基本上同汉字笔顺,例如: (一)从左到右:乃133xa0及134xa0扎93xa0兆282 77水86 (二)从上到下:匕13xa0寸40xa0歹170xa0饣73xa0出47xa0包75xa0贝78xa0月72 冬142xa0仓633xa0己73xa0叟844xa0大46xa0内46xa0才46xa0长646xa0片67 34xa0心83xa0必84 可153xa0永086,另外“万”规定为17,不作63,(如豕1786);“方”作27,不 作063。 (三)由外到内:日51xa0田54xa0且52xa0皿58xa0臼58xa0图5142xa0面6582。 (四)先中间后两边:办48xa0木48“齑”的顺序是文非一‖。“函” 的顺序是 凵。“暴”下的 322。但是,规定“犀”中的牛 “率”中的 ,“豐”上的 ,“兜”上的 仍按从左到右记 码,是为例外。 (五)先两边后中间:火86xa0脊22672xa0拳89619都有从上到下趋势。 (六)之廴在字尾:这2407xa0建9934。 (七)右上角独点记在右下角之前:弋04xa0戈09xa0尤403xa0犬406xa0龙404xa0术 408xa0甫099;弋戈(戊)在字的右边时一律作末2基,如忒8304xa0咸1509(注戊 09,不作609,因左边“丿”不是相交基非端点处引出,而是从端点引出, “厂”看作一笔。“鸢”的顺序鸟、戈。 (八)相交字基按交点位置记码,如义04,寸40,叉04,丹09,母492,臾846, 黑8918。双交被八隔开,先记双交基,如本98,夹986,来988,柬4988。 (九)连续相接成多个人形,按接点记码,如上66,下66(注:下面一点沾 在竖上,故作6,而词典中,“不”的一点未沾上,故“不”作660)止666 疋6666,正6666。 (十)特殊规定:足(足)只记56,页只记67,纟只记33(即都只计前两码)。 四、查字方法 (一)四码以上的复杂汉字,取首二码,末二码,如: 镌1033xa0xa0殷1574xa0xa0藏9309xa0xa0作662xa0xa0所1536xa0xa0两1966xa0xa0鬼1930 (二)不足四码,依次取之,在后面添0凑足四码,如: 依6030xa0xa0单8490xa0xa0夕7000xa0xa0电4900xa0xa0计0740xa0xa0仁6200 (三)广丫礻位于字首时独点不计码,如: 庆3460xa0xa0鹿3913xa0xa0麻3448xa0xa0福3654xa0xa0丫3000,如果不在字首,其点 照记,如扩9030xa0xa0吖5030。注意“广”不是“疒”,“礻”不是“衤”, 应予区别。 如果有重码,输入电脑时,需加按序号码。因此,有重码的汉字输入 电脑时为五码。如果用作查词典,则四码均可。 五、词语编码 每个词语不论字数多少,均是六码,且无重码。 (一)二字词语,取每字前三码,如: 劳动974230xa0xa0考查441485xa0xa0美国811511xa0xa0幽会330623xa0xa0具体528698 (二)三字词语,取每字前二码,如: 地质学413487xa0xa0以色列307517xa0xa0科威特021919xa0xa0乌拉圭779041 (三)四字以上词语,取第一、二字各前二码,第三字和末尾字各前一 码,如: 恩将仇报542169xa0xa0添枝加叶214845xa0xa0割鸡焉用牛刀084763 牛头不对马嘴192465xa0xa0北大西洋公约组织214603 (四)相应码位不足的添0凑足,如: 也许900076xa0xa0回忆550830xa0xa0人生观601947xa0xa0中国共产党905198 有关汉字编码表和词语编码表的说明: (一)《汉字编码表》收汉字7500多个,其中包括了国标区位码的全部 汉字6700多个。 (二)部分汉字有重码,另有九个字需要换页,它们是:弗,聿,冉,毋,妯, 抟,芄,芾,曳(均在9900)。 (三)《词语编码表》共收常用词语二万余条,无重码。(有重码的词 语约占4%,本表未收)。如果输入时无相应词语码,则按单个汉字输入。 (四)所收汉字和词语都以《现代汉语词典》和《新华词典》为准,二 者相互补充,如:中间(900085),前者载而后者无,取。孔子(343340)前者 无而后者有,取。 (五)为了照顾人们不同的用词习惯,将义同而词异者一概录用之,例如: 拔苗助长949556xa0xa0xa0xa0网开三面741926xa0xa0xa0xa0疾恶如仇001896 揠苗助长979556xa0xa0xa0xa0网开一面741916xa0xa0xa0xa0嫉恶如仇901896 附:二十三类字基记忆歌诀: xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0西江月 xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0二八相离五口, xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0四九相交六人; xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0三七含折点为零, xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0一线单码确定。 xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0双码虽然义简, xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0却须首次分清; xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0立禾衫石鱼虫评, xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0xa0门西金王竹病。① 注①衫评病只取部首偏旁衤讠疒,是为上口而设。立禾衫石鱼是一 二三四五的谐音。 由于采用数字编码,不但可简化键盘,制成笔记本式的袖珍电脑,而 且操作输入简便,记住数字键就行,因此可提高输入速度。本编码只有10 类单码字基和13类双码字基,且界限清楚,不易混淆,便于记忆。 本编码方案,可作为检字表查字典用,较四角号码查字法快捷,同码 字少,号码容易确定。