有没有办法一开始就编译所有kernel?

描述:
我写了个碰撞算法,只有检测到碰撞的时候,才处理碰撞。没有碰撞的时候,不会触发if条件,大概也就不会编译碰撞处理的kernel。但是这样就会造成第一次碰撞的时候明显的卡顿(大概是去编译那个kernel了)

问题:
请问有没有办法一开始就让它编译所有的kernel。避免由于后续编译造成的卡顿?

这个?

1 个赞

我们即将上线CPU后端和CUDA后端kernel的缓存功能,在第一次执行后就会把kernel编译出来的结果缓存到硬盘里,这样下次(关掉这个脚本以后)再执行这个kernel的时候就不会再次编译了,感觉可以部分解决你的问题。

1 个赞