专利名称 | 一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法 | 申请号 | CN201710023923.2 | 专利类型 | 发明专利 | 公开(公告)号 | CN106775594A | 公开(授权)日 | 2017.05.31 | 申请(专利权)人 | 中国科学院软件研究所 | 发明(设计)人 | 刘芳芳;杨超;吴长茂 | 主分类号 | G06F9/30(2006.01)I | IPC主分类号 | G06F9/30(2006.01)I | 专利有效期 | 一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法 至一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种基于国产申威26010处理器的稀疏矩阵向量乘异构众核实现方法,由于稀疏矩阵的非零元分布很不规则,该方法设计了静态、动态两种不同的任务划分方法,以适应不同的稀疏矩阵;提出了一套动静态的缓存机制,以提升向量x的访存命中率;提出了一套自适应的优化方法,针对输入的稀疏矩阵,可以动态选出最优的执行参数,以提升其运行性能。本发明采用Matrix?Market矩阵集中的16个稀疏矩阵进行测试,相比国产申威处理器单主核运行版SpMV最高有10倍左右加速,平均加速比为6.51。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障