Triton:AnIntermediateLanguageandCompilerforTiledNeuralNetworkComputationsAbstract深度学习领域新颖研究想法的验证和部署通常受到某些基本原语高效计算内核的可用性限制。特别是,无法利用现有供应商库(例如cuBLAS、cuDNN)的操作面临着设备利用率不佳的风险,除非由专家编写自定义实现——通常以牺牲可移植性为代价。因此,开发新的编程抽象来以最小的性能成本指定自定义深度学习工作负载变得至关重要。我们提出了Triton,一种以图块(tile)概念为中心的语言和编译器,即静态形状的多维子数组。我们的方法围绕:基于C语言和基于