国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

Web文档清洗系统中HTML解析器的开发

2002年 应用技术
  • 成果简介
对于组建一个面向Web的信息系统来说,去除掉脚本,广告链接以及导航链接等无用数据,将提高信息存储和检索的效率;同时,基于语义对Web文档进行合并和分割也会有助于信息的管理,这些都是Web文档清洗系统的任务。在Web文档清洗中,无论是脱机的规则学习还是联机的文档清洗,都需要建立在对Web文档的结构和内容进行分析的基础之上,从HTML解析的一般概念入手,结合Web文档清洗系统的需求,描述了一个...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统