[数值计算]矩阵乘法使用的并行化方法

我看到taichi的矩阵运算会被展开,感觉矩阵乘法不是有很多并行化方法吗?Taichi有没有使用一些新的并行矩阵运算方法?