1995年,美国微软公司与中国国家语言文字工作委员会9月20日在北京签署合作备忘录,微软将支持国家语言文字工作委员会(国家语委),研究和开发中国语言文字相关项目, 以促进中文在电脑领域的普及和推广。同年微软发布的具有划时代意义的Windows95,宣布正式支持中文输入法。古老的中国文字开始与最先进的信息系统结缘。
2008年,奥运会112年来首次来到了中国,一条条实时中文奥运报道直达全球华人。当中国的记者们用指尖而非笔尖传递着光荣与梦想时, 微软中文输入法的研发团队的工程师们已经开始为新版本的拼音输入法而冲刺。
十五年的承诺
1995年,李东加入微软在中国成立的第一支研发团队。她接手的第一个项目,就是微软中文输入法。“可能谁也想不到,并不引人注目的中文输入法,成为了微软在中国投资的第一个研发项目。”已经成为输入法项目负责人的李东笑说,“当时我们团队有6个人,今天已经发展到57人的规模”。这个团队正在为亚太地区的多个市场开发各语种的输入法。
1996年,比尔·盖茨来到中国,在钓鱼台国宾馆,他向各部委的领导演示了第一个版本的微软中文拼音输入法, 展示了微软在中国第一个研发项目投资的成功,也带来了未来在中国长久发展的默默承诺。
要让古老的中国文字与基于二进制代码开发的现代软件结合,殊非易事。语料的采集、语句语义的分析、用户习惯的调研等等,都是一项项的空白。与学术界的合作,成为研发的突破口。1995年,微软与哈尔滨工业大学开始合作,双方成立联合语言语音实验室,主要从事中文语言处理研究。 2006年7月,微软与哈工大又合作成立了哈工大教育部微软语言语音重点实验室深圳分室,与本部的实验室在统一的运作模式下南北呼应,互相支持和协作。
“我们当时找到了国内在自然语言处理领域权威地位的哈工大,与李生和王晓龙等著名教授合作,开发了微软拼音输入法。微软拼音输入法的特点,是语句级智能,这与当时的词语级智能相比,是个极大的科技进步。”李东介绍说,“换句话说,就是进行整句输入,系统会自动分析自动校正相应的汉字,整句的拼音输入完了,相应的汉字整句也生成了,正确率相当高。” 经过若干版本的演进,微软拼音输入法风靡一时。
“从1995年开始,微软就不断投资,长期和国家语委合作开发语料库,并且参与到国家语委的标准化研究中。”李东说,“此外,为了提高微软拼音输入法的词库质量,我们还长期与国家名词审定委员会权威专家合作目前形成了58个高质量的专业词库。比如很难的医学语句,一次性输入成功率非常高,在许多专业领域, 微软拼音输入法都成为学者们工作中的必需工具。”
还让李东引以为豪的是,1999年香港回归前后,她主持开发了繁体汉字的拼音输入功能,并且获得了专利。从此,微软Office的用户,就能毫不费力的进行繁体或简体的汉字输入和相互转换,推动了大陆与香港地区的文化融合。而微软拼音输入法台湾版本的成功开发,同样支持简体或繁体的汉字输入转换,也促进了两岸的文化交流与合作。