基于 CMake 的 magma 使用教程
注意官网的压缩包和 github 的仓库不同,github 的仓库并没有进行 codegen。 官方的 README 告诉我们可以构建一个这样的 make.inc,但是在新版本中似乎无法使用。 BACKEND = cuda FORT = true 新版本必须指定 GPU 架构。所以笔者用的这样的
注意官网的压缩包和 github 的仓库不同,github 的仓库并没有进行 codegen。 官方的 README 告诉我们可以构建一个这样的 make.inc,但是在新版本中似乎无法使用。 BACKEND = cuda FORT = true 新版本必须指定 GPU 架构。所以笔者用的这样的
build a framework for me 根据手上现有的代码,重构并实现一个快速开发的框架,避免很多重复的操作。 确定核心抽象层次:目前我主要做矩阵计算相关的一些操作,其中有的操作是 compute bound 的 ,有的操作是 memory bound 的。那么我得首先将 matrix、v