专利名称 | 视频服务网站内容更新信息的自动搜索与抽取系统及方法 | 申请号 | CN200910160626.8 | 专利类型 | 发明专利 | 公开(公告)号 | CN101599089 | 公开(授权)日 | 2009.12.09 | 申请(专利权)人 | 中国科学技术大学 | 发明(设计)人 | 朱明;易荣锋 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 视频服务网站内容更新信息的自动搜索与抽取系统及方法 至视频服务网站内容更新信息的自动搜索与抽取系统及方法 | 法律状态 | 授权 | 说明书摘要 | 本发明提出一种视频服务网站内容更新信息的自动搜索与抽取系统, 包括系统调度模块、URL组装机构造模块、xpath生成器、URL生成模块、 网页下载模块、信息抽取模块和信息存储数据库。其中,系统调度模块用 于协调和调度各个系统模块;URL组装机构造模块用于构造当前进行信息 抽取的网站搜索结果页URL的组装机;xpath生成器用于生成搜索结果页 各视频摘要信息所在子树顶节点的xpath;URL生成模块用于使用URL组 装机组装搜索结果页的URL;网页下载模块用于下载指定URL的网页;信 息抽取模块用于抽取下载网页的视频摘要信息,并存储到信息存储数据库; 信息存储数据库用于存储抽取下来的摘要信息。本发明有效地解决了网站 内容更新信息的获取问题。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障