上传文件到帐户时,用户将看到一个运行OCR扫描的选项,这个选项将提取文件中的字符置于一个新的文本文档中。至于准确性去,公平的说PDF比图片好的多,特别是白纸黑字的文件。
我上传了我的名片尝试,认识卡片上最大字体和清晰的文字是谷歌文档都有点问题,但令人惊讶的是小字体的文件反而效果更好。PDF文件测试的识别结果则近乎完美,但谷歌文件几乎去除了所有的格式(排版),只是简单的输出文本和空格。谷歌操作系统博客给的其他例子的效果不错,但还不够完善或好用。
此外,扫描PDF时谷歌文档不保存PDF副本,所以扫描文本和原始文件需要单独的上传两次。对于偶然使用OCR的用户来说是一个很不错的功能,用户可以迅速从PDF,图像或名片中抓取文字。但对那些严重依赖OCR的用户可能会失望,可能使用商业软件的解决方案结果更好。
本文来源:cnbeta 作者:佚名