CUDA|CUDA优化--核函数--浮点数类型转换 Qt5.7|VS2015|CUDA7.5

在编写CUDA内核时，遇到一个问题，如下在核函数中使用一个2.1的浮点数，没有作类型声明，如（float）2.1或double(2.1)..

文章图片

一. 实际上，cuda默认2.1是double，在核函数计算过程中进行了类型转换，流水线中arithmetic workload和单精度的计算峰值的分析结果如下：

文章图片

文章图片

好吃惊！！！43.98%用于FloatP64转换，35%用于数值计算，浪费太严重，峰值性能只有114.83GFlops。
内核的执行时间约为6000微妙左右。
二. 于是乎，提前对数据类型进行了声明，新的分析结果如下：

文章图片

文章图片

流水线中的类型转换被消除，峰值性能提身高300GFlops。内核的执行时间降低至2500微妙左右。
花了好几天的时间才注意到这个问题，还在那使劲地作访存优化
【CUDA|CUDA优化--核函数--浮点数类型转换】

CUDA|CUDA优化--核函数--浮点数类型转换

推荐阅读

关于诚信的名人名言78金句格言关于诚信的

如何查看风之大陆服务器？风之大陆服务器怎么看

全面战争三国刘备玩法流程攻略三国全面战争刘备攻略

好听不俗气的情侣网名三个字好听不俗气的情侣网名三个字有哪些

阿胶糕用什么纸不会粘

红斑石鱼怎么吃石鱼怎么吃

iPhone8能升级ios12吗_iPhone8怎么升级ios12_iPhone8升级ios12教程

jewel怎么读 jewel怎么读英语

科科

杏树苗移栽时间杏树育苗时间和方法

原装机|国行、官翻、官换是什么意思？买苹果手机怕被坑，你要知道这些！

大安全是什么原因分析,男人性时间短是什么原因分析

钓鱼一般什么时候容易上钩

idc|雷军公布小米新目标：三年时间，拿下全球第一

人物形象丰满哈尔威船长是真的吗：小说虚构

如何清洁烤面包机？居家清洁方法

阳台瓷砖什么颜色的比较好阳台瓷砖什么颜色好看

sql对日期排序 mysql日期排序慢

年报的资产总额怎么填

电脑小白是自己组装电脑好,还是直接买整机？预算1万？