avx256 计算点积

作者: GOGOYAO | 来源:发表于2021-12-22 13:04 被阅读0次

avx256 计算点积
numpy计算点积叉积和混合积
OpenGL(3) —— OpenGL 的矩阵变换
核方法 Kernel method
矩阵乘法与Numpy Dot
OpenGL - 获取法向量
判断前后左右和求角度
点积与对偶性
shader 所需的数学公示_向量/矢量_01
矢量积运算

#include <immintrin.h>

#include <iostream>
#include <vector>
bool DotProductSimd256(const std::vector<float>& emb_1,
                       const std::vector<float>& emb_2, double& res) {
  const static size_t kBlockWidth = 8;  // compute 8 floats in one loop
  res = 0;
  const float* a = emb_1.data();
  const float* b = emb_2.data();
  int k = emb_1.size() / kBlockWidth;
  for (int i = 0; i < k; i++) {
    __m256 ai = _mm256_loadu_ps(a + i * kBlockWidth);
    __m256 bi = _mm256_loadu_ps(b + i * kBlockWidth);
    __m256 r = _mm256_dp_ps(ai, bi, 0xF1);
    // debug for the output;
    // for (int i = 0; i < 8; i++) std::cout << r[i] << std::endl;
    res += (r[0] + r[4]);
  }
  return true;
}

bool DotProduct(const std::vector<float>& emb_1,
                const std::vector<float>& emb_2, double& res) {
  res = 0;
  for (int i = 0; i < emb_1.size(); i++) {
    res = res + (emb_1[i] * emb_2[i]);
  }
  return true;
}

int main(int argc, char* argv[]) {
  std::vector<float> f_vec_1;
  std::vector<float> f_vec_2;
  const int len = 8;
  for (int i = 0; i < len; i++) {
    f_vec_1.push_back(0.01 * (i + 1));
    f_vec_2.push_back(0.01 * (i + 1));
  }

  double res = 0;
  DotProductSimd256(f_vec_1, f_vec_2, res);
  std::cout << "use avx res = " << res << std::endl;

  DotProduct(f_vec_1, f_vec_2, res);
  std::cout << "not use avx res = " << res << std::endl;
  return 0;
}

编译方法：gcc -mavx2 -std=c++11 -g -lstdc++ main.cpp
查看机器是否支持avx2：lscpu | grep avx2
simd性能提升一倍以上。
ps：如果开启-O3编译选项，由于编译器的优化效果，simd版本可能会没有任何优势

网友评论

本文标题：avx256 计算点积

本文链接：https://www.haomeiwen.com/subject/zsrqqrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

avx256 计算点积

相关文章

avx256 计算点积

numpy计算点积叉积和混合积

OpenGL(3) —— OpenGL 的矩阵变换

核方法 Kernel method

矩阵乘法与Numpy Dot

OpenGL - 获取法向量

判断前后左右和求角度

点积与对偶性

shader 所需的数学公示_向量/矢量_01

矢量积运算

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读