专利名称 | 快速内容分析的多关键词匹配方法 | 申请号 | CN02157881.8 | 专利类型 | 发明专利 | 公开(公告)号 | CN1508721 | 公开(授权)日 | 2004.06.30 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 谭建龙;卜东波;张鑫;余智华;郭莉 | 主分类号 | G06F17/22 | IPC主分类号 | G06F17/22;G06F17/00;G06F11/00;G06F12/14 | 专利有效期 | 快速内容分析的多关键词匹配方法 至快速内容分析的多关键词匹配方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明一种快速内容分析的多关键词匹配方法, 包括如下步骤:1)对关键词进行预处理;2)根据字符在关键词 中出现的概率,建立每个字符的哈夫曼编码,然后把每个关键 词编码为一个整数;3)使用全部关键词建立一张检测表;4)对 文本进行扫描;5)使用该检测表,快速的进行文本内容分析。 它能根据关键词中的每个字的出现频率,进行动态调整,从而 提高多关键词匹配的速度。与传统的文件内容分析相比,本发 明的特点是:针对大量短关键词集合设计了新的基于哈夫曼编 码的多关键词匹配算法(Huff-Match)。使用这种新算法,提高 了内容分析系统的性能。本发明适用于高性能网络信息过滤、 入侵检测、信息监控、病毒检测等领域。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障