国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

扫描识别文本自动校对技术

2007年 应用技术
  • 成果简介
  扫描后由光栅字符识别软件所获得的结果文档中不可避免的包含识别过程中引入的错误,在识别文档的量非常大的情况下,对这些错误进行编改成为了一项必不可少但又耗费大量人力和财力的枯燥工作。本研究提出“基于正负语料库的扫描识别文本的校对技术研究”,利用大规模真实扫描识别文本及编改后的文本构造正负语料库,设计机器学习算法对用于训练的正负语料进行批量学习,由学习获得训练文本中的识别错误和正确文本的对应关系,并...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统