我们从不害怕失败。如果我们所做的一切都取得了成功,那说明我们没有去冒足够的风险;而如果不敢于承担风险,我们就无法在创新的路上走得更远。要做突破性的研究,就要有冒险精神,我们今天的成绩,正是以无数次成功或不成功的尝试为基础的。
(1). 数字墨水
主要负责人:王坚
参与者:邹宇,魏子乐,张冬梅,韩石,常明
数字墨水让连接到PC机的写字板可以根据数字设置,模仿油墨落在纸张上的特征。它具有真实纸笔写字的所有优点,而避免了传统书写的弊端;用户可以写入普通文本、创建用圆点起头的列表、绘制图解或建立表格,而软件则能够识别它们之间的差异。在数字笔记中查找信息就比在真正的纸张上容易得多,用户也可以更快捷地撷取资讯。
(2). 语音识别与合成
主要负责人:宋謌平,张益肇
参与者:钱瑶,陈一宁,王丽娟,周健来,黄超,王庆,陈正,时宇
语音识别引擎可用于微软产品的电话或桌面语音识别(简体和繁体中文),包括Windows客户端无障碍环境、Office的中文听写以及语音服务器等。这是语音识别领域的一次巨大飞跃。基本声学部件经过定制化设计,用于捕捉汉语普通话有调音节中独特的结构。开发小组开发了高度精确的音高跟踪算法,用于计算汉语普通话中语义语气特性。声学模型和语言模型经过训练,用于同时从声学和语言学这两个领域捕捉汉语普通话的内在属性。
研发小组研发了基于最适波形拼接技术的木兰双语文语转换系统(TTS)。其发展的文语转换(TTS)技术已用于Windows Vista及 Speech Server可以既清晰又自然的朗读输入文本,对于中英混合的文句也都应付自如。木兰系统已经随着Vista走进千家万户,并且由此孵化出一个TTS产品部门。进一步又开发出了最大似然度合成的HMM,成功应用于英,法,西,意语等多20多种 ,并应用于Speech Server等微软产品。
(3). 新一代中文和日文的输入法
主要负责人:周明,黄昌宁
参与者:高建锋,陈正,王益进,李沐,张宏江,李开复
中文和日文的连续语句电脑输入是一个长期困扰用户和技术界的问题。以往的系统存在着输入速度慢、正确率低、用户体验不好等诸多问题。这一项目利用最新的大规模语言模型技术成功地帮助微软产品部门改进了原有的中文和日文输入系统,大大提高了拼音序列转换为汉字序列以及日文假名序列转换为汉字序列的正确率和速度,显著提高了中日文用户的输入体验。本技术已经用于微软中文和日文的操作系统和办公处理系统中。
(4).微软对联
负责人:周明
参与者:陈伟柱 沈向洋 吴法洲 马艳军 陶李天 苏昊
你能够想象计算机来跟你对对联吗?“微软对联”是由微软亚洲研究院自然语言组研究开发的计算机自动对联系统,也是世界上第一套人工智能自动对联系统。
具体而言,用户给定上联,然后系统自动产生下联;或者用户也可通过交互手段优选字词来生成满意的下联。本项技术可以应用于在线数字游戏,以及服务于中小学以及外国人的智能汉语教学