专利名称 | Web视频页面的复杂命名实体的抽取方法及其系统 | 申请号 | CN200910091375.2 | 专利类型 | 发明专利 | 公开(公告)号 | CN101625695 | 公开(授权)日 | 2010.01.13 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 郑刚;张勇东;郭俊波 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I | 专利有效期 | Web视频页面的复杂命名实体的抽取方法及其系统 至Web视频页面的复杂命名实体的抽取方法及其系统 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明涉及Web视频页面的复杂命名实体的抽取方法及系统,方法包括: 步骤1,对于Web视频页面集合中的每个Web视频页面,从Web视频页面中 抽取有效文本信息,有效文本信息组成视频文本,所有视频文本组成训练集 合;步骤2,对Web视频页面进行归类,选择类别,对于每个被选的类别设 置引导词,从训练集合中选择同引导词相关并且在类别内均匀分布在类别间 集中分布的词为特征词;步骤3,从训练集合中提取出同特征词相关的词为 候选复杂命名实体,按候选命名实体相关的特征词同类别的关联度,为各个 被选类别从候选命名实体中选择对应的复杂命名实体。本发明能够不需要经 过长时间的模型训练而从Web视频页面中提取复杂命名实体。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障