国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

用于XML文档分类的语义相似度度量方法

2017年 应用技术  初期阶段
  • 成果简介
  本发明公开了一种用于XML文档分类的语义相似度度量方法,依次将每个文档分解为结构信息和内容信息;从内容信息中抽取关键字特征,构造关键字特征空间;从结构信息中抽取所有的路径,构造路径字典;统计关键字特征空间中每个关键字特征在每个文档的任意路径中出现的频率,同时包含该关键字特征和路径的文档个数以及包含该关键字特征的文档个数等信息,计算关键字特征空间中每个关键字特征在文档中的权重;根据余弦度量计算任...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统