《新科学家》杂志日前对Alpha平台提前进行了测试,结果发现了一些新技术能力,但同时也暴露出部分缺点。与此同时,搜索巨头谷歌为将Alpha的威胁消除在萌芽状态,日前发布数据可视化工具,一旦完全设计好,谷歌在搜索市场的优势可能会进一步扩大。
Alpha由斯蒂芬·沃尔夫拉姆(Stephen Wolfram)创建,他因开发出软件包Mathematica而闻名业界。沃尔夫拉姆招募了150多人去搜集所有重要科学门类的信息,从化学元素的特性到行星位置,从物种间关系到人类基因组序列。除此之外,还包括像特定国家通货膨胀历史这样的经济数据,以及地理、文化等方面的诸多数据集。
Alpha平台的潜力源于一个事实,即将与众不同的数据集汇集于某一个地方,并按照Mathematica可以操作的方式汇集。Mathematica由一系列用以分析和展示数据的工具组成。这意味着,用户可以将以前不能比较的信息汇集在一起,如经济成就和体育成绩,贸易模式与人口变化。沃尔夫拉姆研究公司Alpha开发小组成员拉塞尔·福尔茨-史密斯(Russell Foltz-Smith)说:“我们的目标是向全世界所有人提供专家水平的知识。”
他们是否取得了成功?《新科学家》杂志记者在Alpha平台上线前对其进行了测试。Alpha可以轻松解答一些简单问题,比如说瑞典的人口(900万),二氧化碳的沸点(零下78摄氏度)。尽管维基百科也可以同样快速解答这两个问题,但Alpha平台与竞争对手相比仍有优势:网站所有内容都经过一个专家小组的检查和审核。
沃尔夫拉姆网站的目标是希望其数据同美宇航局气候数据集等“黄金标准”资料来源一样值得信赖。福尔茨-史密斯说:“如果数据在最高标准下达不到百分百的准确率,那么它们不会出现在我们的系统中。”为进一步验证这套系统的能力,记者要求Alpha测算中国同日本人口之比,但结果却是下一次将在廷巴克图出现的月食日期和准确时间。
另外,他还依据胆固醇水平和年龄,对其健康状况进行检测。眼下,谷歌尚不能提供此类问题的答案,除非有网友进行过这些计算,将计算结果置于适当的网页。但这一局面可能不久会改变。沃尔夫拉姆的团队开发出一套软件,可以理解诸如“什么”和“谁”等问题之间的区别,将它们变成搜索要求,由数据库进行处理。
从理论上讲,Alpha可以理解用日常用语输入的任何搜索要求,但自然语言处理水平却非常有限,所以,结果一般是误打误撞的巧合。当《新科学家》杂志记者输入“$25 million 1945 dollars in 2008”以后,Alpha确实理解了记者的用意,明白他想知道过去一定数量的货币在今天值多少钱。果不其然,答案出来了:3亿美元。
然而,当记者以另一形式“$25 million 1945 in 2008”输入时,结果便杂乱无章,“1945 in ”被解释成了1945英寸,然后同2500万美元相乘,接着又与2008相乘,得出了98万亿的结果。这并不是唯一的怪事。例如,记者在寻求获得“period 1990-2000”期间的数据时,Alpha将“period”解释成冰球比赛的一节。冰球比赛分为三节,每节20分钟。
科普作家、《大英百科全书》编委尼古拉斯·卡尔(Nicholas Carr)警告说,网民不会容忍不能按他们期望工作的网站:“一旦让网民产生挫败感,他们从此便不会再回来。”福尔茨-史密斯表示,上面提到的一些问题会在5月11日网站推出以前得到解决,而剩余问题也会随着用户的使用反馈逐步得到改进。
本文来源:新浪科技 作者:佚名