MAGMA(用于 GPU 的下一代线性代数库的集合。由开发 LAPACK 和 ScaLAPACK 库的同一团队设计和实现)
新的重要版本2.5.1已发布(2019-08-02):
- 添加了图灵支持;
- 现在可以通过 cmake 进行编译,为此目的,CMakeLists.txt 已更正以正确安装 spack;
- 修复了无需 FP16 即可使用的问题;
- 改进了各种编译器上的编译;
- 新子例程:magmablas_Xherk_small_reduce (X = 's', 'd', 'c', or 'z') - 一个特殊的 HERK 子例程,其输出矩阵的维度非常小(最多 32),并且输入矩阵又高又窄。
来源: linux.org.ru