专利名称 | 一种多文档自动文摘方法 | 申请号 | CN200710308516.2 | 专利类型 | 发明专利 | 公开(公告)号 | CN101231634 | 公开(授权)日 | 2008.07.30 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 张瑾;许洪波;王小磊 | 主分类号 | G06F17/27(2006.01)I | IPC主分类号 | G06F17/27(2006.01)I;G06F17/30(2006.01)I | 专利有效期 | 一种多文档自动文摘方法 至一种多文档自动文摘方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种利用图划分方法来自动提取多文档文摘的方法,包 括以下步骤:进行句子边界切分,把文档用切分出来的句子表示;将句子 表示成向量,计算句子两两间的相似度构成句子关联矩阵,并按指定的阈 值对关联矩阵进行约简,同时进行规范化处理;在多文档文摘中引入主题 的隐性逻辑结构的挖掘,将文档集按主题划分成不同的隐性子主题,从而 把文摘任务转化为对子主题的选取和抽取过程;利用图划分的方法,既从 全局特性上保证句子所在子主题的重要度,又从局部特性上保证不同子主 题之间内容的低冗余性,从而有效提高了文摘质量。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障