早教吧作业答案频道 -->数学-->
矩阵乘法的优化比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
题目详情
矩阵乘法的优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时候存在重复copyB以至于二级CACHE不够用的情况,怎么解决这个问题,也就是怎么进行优化
▼优质解答
答案和解析
如果A确实能完全存入一级缓存,那么把B按列分块,一块一块乘就行了.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
一般来讲矩阵乘法并不是像你说的那样做的,而要把A,B,C都分块,对于每一级存贮器而言,应该至少分成5个部分来管理.比如说,A的某一块常驻于这一级存贮,然后余下的部分分为四块:
(1)上一步已经运算完成的C块——写入低一级存贮
(2)下一步将参与运算的B块——从低一级存贮读入
(3),(4)正在参与运算的B和C块
然后对于这一级存贮器上的小矩阵块运算C=AB仍然按照同样的管理方式递交给上一级存贮来计算.一般来讲A块选得略小一点,具体的分配方式取决于运算和I/O的速度,尽量保持计算单元忙碌.
看了 矩阵乘法的优化比如说两个矩阵...的网友还看了以下:
复矩阵A={211,1x1,110}与B={1,y,z}相似,求复数x,y,z的值B={100,0 2020-06-03 …
矩阵乘法的优化比如说两个矩阵A和B相乘,A存入一级cache,B存入二级cache,但在做乘法的时 2020-06-10 …
复矩阵的特征值一定是复数吗?由复数构成的矩阵的特征值一定是复数吗?如果不一定的话,什么时候是复数, 2020-07-15 …
复矩阵A={211,1x1,110}与B={1,y,z}相似,求复数x,y,z的值B={100,0 2020-07-18 …
老师这题怎么做?如果复矩阵A=(211,1X1,110)与B=diag(1,y,z)相似,求复数x 2020-07-19 …
矩阵的特征值是唯一的么为什么我用matlab求复矩阵的特征值是4个复数? 2020-07-21 …
下列正确的是()A.如果两个复数的积是实数,那么这两个复数互为共轭复数B.用反证法证明命题“设a, 2020-08-02 …
设A为3阶矩阵,r(A)=1,则λ=0A.必定是A的二重特征根B.至少是A的二重特征根C.至多是A的 2020-11-03 …
“不以规矩,难成方圆”是人们在实践中总结出来的至理名言。下列理解错误的是()A.做任何事情都要有规矩 2020-12-05 …
问几道《矩阵论》的题1设A为n阶复矩阵,已知A的k重特征值,并且秩A=秩A2(A的平方),求证:秩A 2021-02-10 …