国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

基于概念的中文信息自动获取研究

2010年 应用技术  初期阶段
  • 成果简介
该项研究针对大规模文本分类的降维问题,提出了采用迭代的CCIPCA和ICA算法,该算法在分词和词性标注的基础上,分析概念语义特征,并依次输入文本向量,增量计算其主元,通过迭代的方法逐步收敛得到文本的特征向量。提出了基于搭配模式和统计特征的汉语短语词自动标注方法。在分词和词性标注的基础上,分析汉语短语词结构、语用特征,利用搭配模式和统计特征实现短语词的自动标注。提出了基于概念的汉语称谓语自动...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统