第二百一十九章 汉字输入法

鸷鸟皴 / 著投票加入书签

书阅屋 www.shuyuewu.io,最快更新重生之奋斗在香江最新章节!

    艾莉森与凌世哲达成共识之后,接下来的一个月和福斯特一起帮助凌世哲完善相关计划。

    在这一个月里,熊猫qq一上线就受到了各个企业的青睐,一套熊猫qq即时通讯软件分为服务器版与pc终端版本,其中服务器版本每套售价100美元,pc终端版每套售价是10美元。

    熊猫qq的使用让企业的内部交流变得更加的顺畅,也为企业节省了很多不必要的开支,因此一上市就受到了广大企业的追捧,连带的pc个人电脑、服务器,以及各种网络设备因熊猫qq这款小软件的促进下,销量也提高了不少。

    具安布雷拉信息部统计,自qq推出以来,服务器的订单比上个月增加了30%,pc订单增加了100%,而各种网络设备更是增加了400%的销量。

    网络设备之所以有这么大的增长,是因为凌世哲提出的局域网和办公自动化概念才刚刚诞生一年不到,还处在推广阶段,因此网络设备每月只有两位数销量,这么低的销售基数,销量稍微增长一点自然就是100%、200%、300%的可观数据了。

    而且这个增长幅度还在持续加大,据统计目前北美几乎所有的企业都正在或者是计划上马企业局域网系统,以此来提高效率降低成本。

    唯一遗憾的是受这个时代网络技术的限制,总公司与子公司还不能互相联系,只能继续用传真机和电话,未免有些遗憾。

    熊猫qq在北美受到追捧,但在香港的销售却相当的冷清,原因是熊猫qq只能使用英文,而不能用中文来进行彼此之间的交流,所以除了英资、美资等西方企业愿意使用外,香港本土企业除了安布雷拉外,没有一家企业愿意使用。

    于是他们纷纷要求安布雷拉公司推出具有中文输入法的熊猫qq,但安布雷拉却没有做长任何的回应。

    凌世哲不是不想推出与qq配套的中文输入法,他的笔记本电脑里面就有一套完整的腾讯qq中文输入软件,里面不但有完整的简体字库还繁体字字库,字体之间可以非常方便的切换输入。

    既然有为什么凌世哲不拿出来呢?原因就在这套输入法不适合港台,那里面输入法是拼音输入法,这套输入法是建立在大陆拼音基础上的,而香港、台湾、东南亚等华人地区并不使用拼音,而是使用注音!港台的汉字输入必须使用注音输入法,拼音输入法在这里是行不通的。

    况且只有大陆才使用拼音,其他地区都是用注音,你凌世哲一个香港人,又是国民党的上将,汉字输入不用注音而用拼音,算怎么一会事?那些媒体肯定会产生联想,认为凌家或者凌世哲叛变了,所以凌世哲犯不着为了一个小小的中文输入法系统,惹来不必要的风波。

    于是凌世哲在熊猫qq正是在公司使用的哪一天,组建了中文输入法研发小组,项目负责人是在历史上具有“中文电脑之父”之称的朱邦复先生。

    历史上朱邦复出生于1937年,幼年时期因为战乱,辗转迁移,最后于中学入学年龄,落居宝岛,后赴巴西发展,也曾经在美国停留一段时间。这期间,母亲和父亲先后去世。

    朱邦复在巴西文化出版社工作的时候,目睹了在一本书的出版过程当中,与英文比较,中文印刷技术是如何的落后,于是他转行致力于中文印刷技术的改良。

    1973年,朱邦复就会返回宝岛,在之后数年的刻苦生活当中,他按照构想,以中文打字机为实践目标,发展中文检索方式,改良中文印刷技术。

    朱邦复虽是电脑中文输入法的先驱,但他的一生却非常的坎坷。如果凌世哲不插手,按照原本历史的发展,1980年,朱邦复在施振荣的技术支持下,与宏碁公司共同研发了具有“中文操作系统、中文程序语言、中文套装软件”的中文电脑——天龙中文电脑,售价75万元台币。但显然,两万美元的个人电脑是不可能赢得市场的。

    次年,朱邦复又推出了中文终端机,其后,他成立了零壹电脑公司,为厂商提供低成本的电脑中文化服务。

    为使中文电脑更普及,让国人一同研究,朱邦复登报声明放弃仓颉输入法的专利权,宣布愿意把全部技术公开,并以新台币1000万元的价格,卖出零壹公司的股份。

    宝岛相关方面认同了这个提议,委托王安、宏碁、神通三家公司的技术人员,到零壹公司详细鉴定,并由朱邦复做公开讲解。提议终于获得通过,计划于1983年确定这桩收购案的最终结果。

    但就在这个期间,宝岛有关方面制定的13000字的big5编码,和朱邦复的可容纳50000多字的中文编码系统,发生了纷争。

    此外,有人诬告朱邦复的系统同样向大陆推广使用,于是乎,朱邦复于1983年4月被迫离开宝岛,躲避到美国,并把零壹公司所有权全部转移给员工。

    自此,朱邦复距离他的中文信息计算机处理的理想就越来越远。

    不过现在吗,凌世哲来了,pc电脑也提前诞生了,实实在在的功能摆在眼前,谁再敢质疑中文信息的计算机处理,那就是想被抽脸了,而还在技术摸索阶段的朱邦复则发现了指引方向的灯塔。

    计算机要用二进制处理各种信息,就必须借助编码技术,对各种基本组成要素进行标识。

    在这方面,像英语这样只有26个基本字母、仅用一个128位的ascii表便能完成编码的西方语言有着天然的优势,而中文就要费事多了。

    从逻辑构造上看,汉字虽然可以分成不同的部首、偏旁等文字基本构件,但是数量过多,远远不止26个,而且这些基本构件在组成汉字的时候,还有着位置、方位、朝向的变化。

    因而,以文字构造为标准来分类归放和处理中文信息,困难重重。

    一些激进的技术人员甚至借此鼓吹淘汰汉字。对于发明了造纸术和印刷术的华夏来讲,这个现象未免有些悲哀了。

    在攻克这些难关的道路上,涌现了很多著名的华人,如朱邦复、倪光南、王选、王永民,等等,可以说,花费了十年多的心血,才逐步解决了这个难题。

    做为重生者,凌世哲自然要缩短这个过程,好让华人有更多时间去关注操作系统、网络等其它方面的技术。

    首先,凌世哲已经规划好了一套包含简体字和繁字体在内的编码方案——中华标准码,直接涵盖了原本时空当中的gb-2312和big5的内容。

    随着pc电脑的强势普及,中华标准码必然会成为行业标准,直至官方标准。

    其次,在输入法方面,凌世哲选择了简单易用的拼音输入法。

    宝岛这里的基础教育是由注音符号教起的,繁体字便是注音输入法,而简体字则是汉字拼音输入法。

    整个项目的工作量非常大,凌世哲凭借一己之力是无法完成的,而且也没那个必要,他只规划出了一个总体框架,实现了开创性以及核心模块的功能,然后把研发小组分成两个小组,一组负责繁体字方面的工作,一组负责简体字方面的工作。

    这里就不得不说一下简体字,新中国成立以后,大陆就开始了简体字普及,但是当时的简体字标准并不完善,因此在相当长的一段时间内,引起了一定的使用混乱。于是在1964年,大陆政府开始着手完善简体字标准的研究方案,但是后来由于特殊时期的影响,研究一度中断,直到特殊时期结束以后,大陆才恢复对简体字的完善性研究。到凌世哲穿越前,大陆的简体字方案已经发展到第五代,字形编排已经完全的成熟。

    既然这套方案已经成熟,凌世哲就没有必要另外再整一个方案出来,直接把第五代简化字标准丢给了研究小组,让他们按照要求一个字一个字的填行了。

    这些困难还只是智力方面的软件开销,硬件成本的因素也要考虑进去。

    文字按照一定规则排序编码、并可以通过输入法的方式进行检索后,仍然不算万事大吉,计算机为了显示它们,还必须安排与之匹配的存储空间,包含英语26个基本字母的ascii表,所需不多,但包含成千上万汉字的字库开销就大了。

    好在苹果电脑买出是九针16*16的打印机,能够较为完美的打印出汉字来,但繁体字字库包含了将近一万个字,大致算下来,需要的存储空间达到了320k,这个成本是目前打印机还无法承受。

    要知道pc现在使用的cpu还是8位,其最大寻址地址空间是64k,苹果公司现在热销的pc机型号,也只是搭载了48kb的内存。

    见此情况,凌世哲只好再次披挂上阵,采用数据压缩技术,把汉字字库所占用的空间降低到了可以接受的水准,这才有了可以商用的可能。

    因此从以上可以看出,原本的历史时空当中,汉字的计算机信息化道路是非常的曲折。

    现在好了,凌世哲在起步阶段就高屋建瓴的设定好了方向和框架,虽然这增加了中文输入研发小组的工作量,要过很长的时间才能推出电脑中文输入法,但一旦完成,它将是全世界最完善的中文输入法标准。而且这套输入法还包含了完善的日本汉字输入标准,以及韩国汉字输入标准,至于日韩后世推出的漏洞百出的汉字编码标准,凌世哲给直接忽视了。

    同时为了让这套编码成为东南亚的唯一标准,凌世哲还根据后世日文和韩文拼写习惯,另外搞出一套日韩文编码和输入法标准出来,至于日本和韩国历史上原来的那一套编码标准,也被他直接忽视了。

    之所以那么搞,完全是为了满足凌世哲的恶趣味——盗版日本的游戏。历史上日本游戏在中国大陆非常的吃香,但由于绝大部分中国人看不懂日本的文字,因此民间诞生了大量的汉化翻译小组,由于翻译的工作量巨大,所以翻译后的中文版的日本游戏软体市面上非常的稀少。

    现在好了,凌世哲编辑的这套统一了汉字、日文、韩文编码和输入的标准如果在日后成为统一的官方标准的话,那么日文与汉字之间的翻译将不再是问题,只需要一套软件就能轻松进行日文与汉字之间的互换,不管是简体还是繁体,都会非常的方便,而且还很节省大量的时间。

    凌世哲搞这套编码标准,根本没考虑过国民政府与日韩政府是否会接受。在他看来你们接受得接受,不接受也得接受。不接受,他就利用pc电脑来个硬件和操作系统,以及qq即时通讯软件的捆绑进行强推,当人们习惯了这套编码标准之后,他们的官方标准自然也就作废了。

    当然你要翻译的精准无误,把文字背后的意思准确的表达出来,任需要花费大量的时间,但一般的白话文和口水话的翻译,还是没有什么问题(地方俚语除外,不是本地人谁也搞不懂),准确率基本能达到90%,剩下的10%需要编辑来审查做最后的修正。

    朱邦复还是有些理想化了,在凌世哲看来,朱邦复没有遵守技术发展的趋势和相应的市场发展规律,这对务实的凌世哲来说不是很容易接受,当然也不是没有好处,那就是对华夏的各种古籍的保存和研究是一大促进。

    想了想,凌世哲向朱邦复提出了一个折中方案:不要一次性追求最好,而是分三个阶段完成,即按照繁体、简化、古生僻三个阶段一步步的完成,在使用上按照拼音、注音和古文、韩文、日文的市场划分来。

    你朱福邦不是想要保护古籍吗?好啊,我们可以推出一种基于繁体字的专门用于古籍保护的输入法来,分为注音和拼音两种,习惯用拼音的就用拼音,习惯用注音的就用注音,这比你搞出来的这个大杂烩,更具有市场的针对性。

    听了凌世哲的建议,朱邦复也觉得这种方法更好,于是便欣然接受,开始调整自己的研究方向。

    见他接受了自己的建议,凌世哲又借着道:“朱先生,恕我直言,你不见得擅长计算机底层方面的技术,不如把精力全部集中到中文编码的整理,以及输入法的设计和算法上,硬件方面则交由专人来实现。”

    朱邦复脸上露出疑惑的神色,“你说的这种分工方式,我不是很理解。”

    凌世哲笑着解释道:“以pc电脑来说吧,它的内部有一块电路板,我称之为汉卡,专门用来存储汉字字库、处理汉字输入以及汉字显示。拿掉汉卡,pc个人电脑便是一台普通的英文电脑,装上汉卡,它就变成了一台中文电脑。”

    朱邦复恍然地点了点头,“也就是说,我只要专心设计出来另外一种对汉字支持更加全面的汉卡,然后把它装在pc电脑上就可以了。”

    ”呃……差不多吧,我会找来专业的硬件工程师来做汉卡方面的硬件工作,他会积极的配合你,你就安心的负责中文编码的整理,以及输入法的设计和算法,你看行吗?”凌世哲征求朱邦复的意见道。

    具体实现上当然不会那么简单,还要涉及到操作系统等方面的支持细节,但大体思路朱邦复还是说对了。

    “原来是这样。成,就按你说的方法做吧。”朱邦复赞同道。

    见朱邦复同意他的方案,凌世哲便要拿起桌上电话,让安迪.格鲁夫派几名硬件工程师过来,结构电话且先响了,“喂,你好,找哪位?”

    “老公吗,我是倩倩啊,姐进医院了。”