国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

一种基于EMD的文档语义相似距离度量化方法

2014年 应用技术  初期阶段
  • 成果简介
本发明涉及一种基于EMD的文档语义相似距离度量化方法,属于信息检索、数据挖掘等领域。其特征在于:首先对于文档进行预处理,将文档表示成为tf·idf项权值矢量,再计算文档矢量的宽度和宽度差,接着计算各特征词汇之间的语义相似距离,之后为文档矢量插入虚拟项补齐总权值,并对处理后的文档矢量进行归一化处理,最后根据全匹配准则和最相似最高优先权准则完成EMD简化计算。有益效果:实现了基于EMD的文档语...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统