Python Target 参数化
摘要
对于任何支持的 runtime,TVM 都应该输出正确的数字结果。因此,在编写验证数字输出的单元测试时,这些单元测试应该在所有支持的 runtime 上都能正常运行。由于这是一个非常常见的用例,TVM 的辅助函数可以对所有单元测试进行参数化,从而便于单元测试在所有启用并具有兼容设备的 target 上运行。
测试套件的单个 Python 函数,可以扩展为几个参数化单元测试,每个单元测试一个 target 设备。为了保证测试正常运行,以下所有条件必须为 True:
- 测试存在于已经传递给 pytest 的文件或目录中。
- 应用于函数的 pytest 标记,无论是显式还是通过 target 参数化,都必须与传递给 pytest 的 -m 参数的表达式兼容。
- 对于使用 target fixture 的参数化测试,target 必须出现在环境变量 TVM_TEST_TARGETS 中。
- 对于使用 target fixture 的参数化测试,config.cmake 中的构建配置必须启用相应的 runtime。
单元测试文件内容
在多个 target 上运行测试,推荐方法是通过参数化测试。对于一个固定的 target 列表,可以通过用 @tvm.testing.parametrize_targets('target_1', 'target_2', ...)
修饰同时接受 target
或 dev
作为函数参数来显式地完成。
该函数将为列出的每个 target 都运行一遍,并单独报告每个 target 的运行结果(成功/失败)。如果一个 target 因为在 config.cmake 中被禁用而无法运行,或者因为没有合适的硬件存在,那么这个 target 将被报告为跳过。
# 显式列出要使用的 target
@tvm.testing.parametrize_target('llvm', 'cuda')
def test_function(target, dev):
# 测试代码写在这里
对于在所有 target 上都能正常运行的测试,可以省略装饰器。任何接收 target
或 dev
参数的测试,都将自动在 TVM_TEST_TARGETS
指定的所有 target 上进行参数化。参数化为每个 target 提供了相同的成功/失败/跳过报告,同时允许轻松扩展测试套件,以覆盖额外的 target。
# 隐式参数化以运行在所有 target 上
# 在环境变量 TVM_TEST_TARGETS 里
def test_function(target, dev):
# 测试代码写在这里
@tvm.testing.parametrize_targets
也可以用作裸装饰器(bare decorator)来显式地进行参数化,但没有额外的效果。
# 隐式参数化以运行在所有 target 上
# 在环境变量 TVM_TEST_TARGETS 里
@tvm.testing.parametrize_targets
def test_function(target, dev):
# 测试代码写在这里
可以使用 @tvm.testing.exclude_targets
或 @tvm.testing.known_failing_targets
装饰器,将特定 target 排除或标记为预期失败。更多信息,请参阅文档字符串。
在某些情况下,可能需要跨多个参数进行参数化。例如,可能存在一些待测试的 target-specific 实现方法,其中一些 target 的实现方法还不止一个。这可以通过显式地参数化参数元组来完成,如下所示。在这种情况下,只有显式地列出的 target 会运行,但它们仍会应用适当的 @tvm.testing.requires_RUNTIME
标记。
pytest.mark.parametrize('target,impl', [
('llvm', cpu_implementation),
('cuda', gpu_implementation_small_batch),
('cuda', gpu_implementation_large_batch),
])
def test_function(target, dev, impl):
# 测试代码写在这里
参数化功能是在 pytest 标记之上实现的。每个测试函数都可以用 pytest 标记 装饰以包含元数据。最常用的标记如下:
@pytest.mark.gpu
- 将函数标记为使用 GPU 功能。这本身是没有效果的,但可以与命令行参数-m gpu
或-m 'not gpu'
搭配使用,从而限制 pytest 要执行哪些测试。这不应该单独调用,而应该是单元测试中使用的其他标记的一部分。@tvm.testing.uses_gpu
- 应用@pytest.mark.gpu
。用于标记可能使用 GPU 的单元测试(如果有)。只有在显式循环tvm.testing.enabled_targets()
的测试中,才需要这个装饰器,不过这已经不是编写单元测试的首选方法了(见下文)。使用tvm.testing.parametrize_targets()
时,此装饰器对于 GPU target 是隐式的,不需要显式地应用。@tvm.testing.requires_gpu
- 应用@tvm.testing.uses_gpu
,如果没有 GPU,还要标记这个测试应该被跳过(@pytest.mark.skipif
)。@tvfm.testing.requires_RUNTIME
- 几个装饰器(例如@tvm.testing.requires_cuda
),如果指定 runtime 不可用,每个装饰器都会跳过测试。runtime 如果在config.cmake
中被禁用,或是不存在兼容设备时,则该 runtime 不可用。对于使用 GPU 的 runtime,包含@tvm.testing.requires_gpu
。
使用参数化 target 时,每个测试运行都是用跟正在使用的 target 相对应的 @tvm.testing.requires_RUNTIME
修饰的。因此,如果某个 target 在 config.cmake
中被禁用,或没有合适的硬件可以运行,它将被显式列为跳过。
还有 tvm.testing.enabled_targets()
,根据环境变量 TVM_TEST_TARGETS
、构建配置和存在的物理硬件,返回所有在当前机器上启用和可运行的 target。大多数当前测试显式循环是 enabled_targets()
返回 target,但它无法应用于新测试。这种类型的 pytest 输出会自动跳过在 config.cmake
中禁用,或者没有运行设备的 runtime。此外,测试会在第一个失败的 target