如何优化代码在gpu上运行比cpu快

写完软渲染器发现在cpu上运行50多帧,在gpu上反而是40帧左右的样子,gpu使用的老苹果本上metal,不清楚是什么原因,有大佬知道如何优化代码,或者有什么办法能查到gpu上运行慢吗?