天下网吧 >> 网吧天地 >> 网吧行业 >> 网络追踪 >> 正文

Google推手机版图书搜索 采用OCR技术识别文字

2009-2-7IT世界佚名

  北京时间2月6日消息,据国外媒体报道,Google宣布推出图书搜索的移动版,可供搜索的图书多达150万本。这些图书均是公版图书,分别来自美国和境外出版商。

  2006年Google正式推出图书搜索服务,并与世界上许多知名大学图书馆合作,在全球范围内扫描录入了数百万册图书。

  手机阅读体验亟待改进

  众所周知,在台式电脑使用过Google图书搜索,可供浏览的书籍基本上都是扫描图片,阅读是没有问题的,但在很小的手机屏幕上则无法带来很好的阅读体验。  

  Google的解决方案是使用光学字符识别技术(OCR)把扫描后书籍图片里的文字识别出来,这样就可以像浏览普通网页一样用手机阅读图书。

  OCR识别后,手机上看到的就是这样的文本:

  Because I made a blunder, my dear Watson— which is, I am afraid, a more common occurrence than anyone would think who only knew me through your memoirs  

  文本识别难题导致进展缓慢

  Google表示OCR文本识别是一项艰巨的任务,有些图书印刷时使用了奇怪、古旧的字体,或是书页有所破损,这些问题都会导致识别出错,但工程师正在设法解决这一难题。如下图就很难以被完全正确地识别:

  并非所有手机用户都可以使用手机版的谷歌图书搜索,目前图书搜索只支持iPhone和采用Android系统的手机,黑莓与其它手机则无缘该服务。

本文来源:IT世界 作者:佚名

声明
声明:本站所发表的文章、评论及图片仅代表作者本人观点,与本站立场无关。文章是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 Email:support@txwb.com,系统开号,技术支持,服务联系微信:_WX_1_本站所有有注明来源为天下网吧或天下网吧论坛的原创作品,各位转载时请注明来源链接!
天下网吧·网吧天下
  • 本周热门
  • 本月热门
  • 阅读排行