互联网 > 正文
人工智能网热度:

Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%

【 图片来源: venturebeat 所有者:venturebeat 】

该团队的解决方案是利用文本参考框架的“管状”表现形式,利用目标文本通常是大小相似的字符串联而成的事实,从而捕获大部分可变性。与使用易于重叠和容易产生噪声的矩形和四边形来捕获文本信息的传统方法相比,它被公式化为一种数学函数,能够训练机器学习场景文本检测器。

研究人员在CTW-1500上评估了TextTubes的性能。CTW-1500是一个数据集,该数据集由从自然场景和图像库中收集的1500张图像(每个图像至少一个曲线实例),超过10000个文本实例组成。同时在Total-Text上进行了评估,Total-Text包含大约1255次训练图像、300个测试图像以及一个或多个曲线文本实例。 他们报告说,他们在CTW-1500上以83.65%的准确度取得了行业领先的结果,而最接近的方法的准确度为75.6%。

“对一个实例的中间轴和平均半径进行建模……可捕获有关实例整体的信息。”该论文的合著者写道。 “在由单个单词组成的数据集上,例如Total-Text,我们的模型能够实现最先进的性能。在具有行级注释的数据集上,例如CTW-1500,我们的模型能够更好地捕获实例中各个单词的文本信息。”

假设有一天,TextTubes能够投入使用,对于那些高度依赖OCR技术开展业务的企业来说,这可能是一个好消息。据估计,超过80%的数字流程中仍保留着纸张;大约有97%的小企业仍在使用纸质支票。据Grand View Research的数据显示,这或许就是为什么到2025年,OCR解决方案市场的价值预计将达到138.8亿美元原因。 (雷锋网雷锋网雷锋网)

via VB

欢迎关注微信公众号:dcwlcm666;合作及投稿请联系:1519329887@qq.com

赞助商