专利名称 | 一种复数矩阵的优化方法 | 申请号 | CN201210167484.X | 专利类型 | 发明专利 | 公开(公告)号 | CN102722472A | 公开(授权)日 | 2012.10.10 | 申请(专利权)人 | 中国科学技术大学 | 发明(设计)人 | 顾乃杰;杨阳朝;陈强;吴淅 | 主分类号 | G06F17/16(2006.01)I | IPC主分类号 | G06F17/16(2006.01)I | 专利有效期 | 一种复数矩阵的优化方法 至一种复数矩阵的优化方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种复数矩阵的优化方法,特征是先计算在龙芯体系结构下特定的展开粒度,对复数矩阵进行四乘四循环展开,将矩阵分块大小nb选取为一个小于52并使得24乘以矩阵分块大小nb的平方小于龙芯处理器一级数据缓存64千字节的最大的值,得到在龙芯上最优的理想矩阵分块大小;并利用数据存储的连续性和局部性对矩阵乘法中的矩阵进行合理划分与合并,减少龙芯的一级数据缓存访问次数;对复数矩阵运算中的普通复数乘加运算利用复数经典算法中两个复数之间的乘法算法,从而减小了运行规模,使得复数矩阵乘法运算在龙芯3A上的计算性能提高了大约50%,可使BLAS库在龙芯3A上的运算速度达到原来的2.5倍以上。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障