专利名称 | 一种从论坛帖子列表页面中抽取帖子元数据的方法 | 申请号 | CN200810119238.0 | 专利类型 | 发明专利 | 公开(公告)号 | CN101661468 | 公开(授权)日 | 2010.03.03 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 郭岩;丁国栋;曹冬林;王宇;张刚 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | 一种从论坛帖子列表页面中抽取帖子元数据的方法 至一种从论坛帖子列表页面中抽取帖子元数据的方法 | 法律状态 | 授权 | 说明书摘要 | 本发明公开了一种从论坛帖子列表页面中抽取帖子元数据的方法,其包括 如下步骤:步骤S1,提供论坛帖子列表页面作为样例页面,根据样例页面中 的帖子记录的组织结构特征生成抽取模板;步骤S2,根据抽取模板,对与样 例页面中的帖子记录的组织结构相同或相似的论坛帖子列表页面作在线抽取 操作,获得帖子元数据。本发明能够满足处理大量的大规模论坛数据的实际需 求,且抽取精度高、抽取速度快、维护代价小。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障