国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

一种基于LZW压缩算法的中文文本分类特征词典生成方法

2014年 应用技术  初期阶段
  • 成果简介
本发明涉及计算机应用中的文本挖掘和知识获取领域,特别涉及一种基于LZW压缩算法的中文文本分类特征词典生成方法。它包括以下步骤:首先假设待分类的文本的r个类别,每个类别对应一个样本集,对于第i类样本集初始化一个字符串表str_tablei,其中i=1,…,r;然后,将第i类样本集中的文档输入LZW压缩算法LZWencode(infile,str_table),并产生相应的压缩编码串,作为候选...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统