前言
矩阵乘法非常适合在GPU上并行运行,但是使用GPU并行后能获得多大的性能提升?本文将通过一些实验分析CUDA程序的性能。
测试环境
本文使用Dell XPS 8700作为测试机,相关配置如下:
| 型号 | Dell XPS 8700 |
| CPU | Intel Core i7-4970 3.6GHz |
| 主存 | 16GB |
| GPU | GeForce GTX 750Ti |
| OS | Windows 10 64bit |
矩阵乘法非常适合在GPU上并行运行,但是使用GPU并行后能获得多大的性能提升?本文将通过一些实验分析CUDA程序的性能。
本文使用Dell XPS 8700作为测试机,相关配置如下:
| 型号 | Dell XPS 8700 |
| CPU | Intel Core i7-4970 3.6GHz |
| 主存 | 16GB |
| GPU | GeForce GTX 750Ti |
| OS | Windows 10 64bit |