利用cublasHgemm来实现cublasHgemv

时间：2020-04-01 00:34:27 阅读：61 评论：0 收藏：0 [点我收藏+]

前几天做half量化时发现cublas竟然没有提供half版本的矩阵-向量乘，也就是half版本的cublasHgemv。自己写一个又太麻烦，重点是精度和耗时不一定比cublas提供的要好，不过cublas提供了half版本的矩阵-矩阵乘函数cublasHgemm，只要维度没啥问题，用cublasHgemm实现cublasHgemv，既方便又好用。

废话不多说，直接上。

前置准备

对于矩阵A和向量V，我们要计算\(y=\alpha * A * V + \beta * y\)，其中矩阵A的维度为\(m*n\)，向量V的长度为\(n\)，二维表示就是\(n*1\)，\(\alpha\)和\(\beta\)都是标量，所以y的维度就是\(m*1\)。由于是用gemm实现，因此还有个ld参数，矩阵A的ldm为m，向量V的ldv为1（这里暂定，待会儿解释），最后值得注意的是结果向量\(y\)的ldy应该是m而不是1.

对于half矩阵-向量乘，这里我们假设A、V、\(y\)都是half类型（不然就用不了cublasHgemm，只能尝试用cublasGemmEx来实现了），当然\(\alpha\)和\(\beta\)也都得是half类型数值（__float2half）。

不考虑转置，接下来直接上代码：

half版本`cublasHgemv`

cublasStatus_t cublasHgemv(cublasHandle_t handle, cublasOperation_t trans,
                           int m, int n,
                           const half           *alpha,
                           const half           *A, int ldm,//由于cublas库是列优先存储，因此ldm常为m，ldv常为1（暂定），ldy常为m
                           const half           *V, int ldv,
                           const half           *beta,
                           half  *y, int ldy
){
    return cublasHgemm(handle, trans, trans, m, 1, n, alpha, A, ldm, V, ldv, beta, y, ldy); 
}

对比cublas库中已有的float版本的cublasSgemv:

`cublasSgemv`

声明

cublasStatus_t cublasSgemv(cublasHandle_t handle, cublasOperation_t trans,
                           int m, int n,
                           const float           *alpha,
                           const float           *A, int lda,
                           const float           *V, int incv,
                           const float           *beta,
                           float           *y, int incy)

调用

status = cublasSgemv(handle, trans, m, n, alpha, A, ldm, V, incv, beta, y, incy);

关于ld参数

注意，相比较于原生的cublasSgemv，自实现版本不是用的incv和incy参数而是使用的ldv和ldy参数，这主要是因为我自己在使用时遇到的大部分情况是这个向量只是矩阵的某一行而不，此时ldv参数应该设置为该矩阵的行数而不是1。当然，由于无论是多少维的张量，在计算机中都是以一维连续空间存放的，因此ldv和incv，ldy和incy大部分情况下都相同。

利用cublasHgemm来实现cublasHgemv

标签：span inline 向量 mat 调用利用没有 lda 情况

原文地址：https://www.cnblogs.com/thisjiang/p/12609758.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

利用cublasHgemm来实现cublasHgemv

前置准备

half版本cublasHgemv

cublasSgemv

关于ld参数

half版本`cublasHgemv`

`cublasSgemv`