国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

自动文本分类系统的设计与应用研究

2009年 应用技术  初期阶段
  • 成果简介
该项目利用了数据预处理、文本自动分词、特征选择与特征加权、自动分类聚类等技术,提出了一种自动文本分类方案,并基于该方案开发了用于知识管理和文本分类的原型系统。课题提出了一种基于样本分布与熵的数值型属性离散化的数据预处理方法。还提出了一种基于基尼指数的文本特征选择方法。设计了基于香农熵与基尼指数加权的模糊kNN的文本分类器。应用结果表明,该系统可以实现大量文件的定制检索及分类,降维程度高,处...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统