您好,欢迎来到达州工业云! 平台首页 企业驾驶舱 帮助中心 企业登录 企业注册

HI,欢迎使用达州工业云平台!

账号必须大于2位

创新资源平台
服务平台首页>专利库>专利详情

一种元搜索列表结果抽取方法及系统

元搜索结果

  • 申请号:2017108806522 申请公布号: CN109948015A
  • 申请日: 2017-09-26 申请公布日: 2019-06-28
  • 申请(专利权)人:中国科学院信息工程研究所 专利代理机构: 北京君尚知识产权代理事务所(普通合伙)11200
  • 分类号:G06F16/951(2019.01)I

专利介绍

    本发明提供一种元搜索列表结果抽取方法,步骤包括:获取元搜索检索结果的网页源代码;对所述网页源代码基于XPATH解析,确定检索结果区域和扩展区域的XPATH路径,抽取列表项信息和扩展信息;如果基于XPATH解析失败,则对所述网页源代码基于统计信息规则提取列表项信息,并基于启发式规则提取扩展信息;将所述抽取的列表项信息和扩展信息作为抽取结果进行封装,组成用于元搜索的数据结构。本发明还提供一种元搜索列表结果抽取系统。