专利名称 | 一种基于多分类器融合的敏感网页过滤方法及系统 | 申请号 | CN200710065181.6 | 专利类型 | 发明专利 | 公开(公告)号 | CN101281521 | 公开(授权)日 | 2008.10.08 | 申请(专利权)人 | 中国科学院自动化研究所 | 发明(设计)人 | 胡卫明;陈周耀;吴偶;朱明亮 | 主分类号 | G06F17/30(2006.01)I | IPC主分类号 | G06F17/30(2006.01)I;G06K9/62(2006.01)I;H04L12/26(2006.01)I | 专利有效期 | 一种基于多分类器融合的敏感网页过滤方法及系统 至一种基于多分类器融合的敏感网页过滤方法及系统 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开基于多分类器融合的敏感网页过滤系统及方法,处理对 象是一幅网页,其处理结果是该网页是否包含敏感内容,此处的敏感可 以定义为色情,反动,暴力等危害社会的不健康互联网内容。系统包括 数据流的获取与预处理单元、图像与文本流过滤单元、图像过滤器与文 本过滤器的信息融合单元,系统基于多个分类器的协作,在给定网页的 统一资源定位器的条件下,获取该网页的源代码,在预处理阶段进行文 本和图像的分流,获取文本信息和有效图像信息;利用决策树算法将输 入网页分为三种样式;利用连续文本分类器、离散敏感文本分类器和图 像分类器对网页进行识别,根据各分类器识别的输出结果进行融合计算, 给出判别因子,将最终结果返回给浏览器。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障