国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

利用Web资源的自动分词及语料库自动构筑方法的研究

2012年 应用技术  中期阶段
  • 成果简介
  通过对现存的各种汉语分词方法进行考察,分析其优点、不足和各类方法存在的局限性,提出了针对开放文本的汉语分词和电子词典构筑的辅助方法。采用多策略融合利用规则、归纳学习、歧义探测、概率模型等多种技术,使各种方法相互取长补短以达到适合开放文本分词处理的目的。首先通过规则进行处理,使文本在需要分割的明显标志位进行切分。然后通过归纳学习及深度归纳学习进行未知词的预测,并根据预测时的条件不同将预测到的未知...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统