标签:ESS apt-get strong tar bug 源码编译 代码 may uil
前文已经给出1.3.0gpu版本的编译及安装,本文在此基础上进行分布式组件的安装,前文信息参看:
国产计算框架mindspore在gpu环境下编译分支r1.3,使用suod权限成功编译并安装,成功运行——(修复部分bug,给出具体编译和安装过程)—— 第一部分:依赖环境的安装
国产计算框架mindspore在gpu环境下编译分支r1.3,使用suod权限成功编译并安装,成功运行——(修复部分bug,给出具体编译和安装过程)—— 第二部分:源码编译及编译后文件安装、运行
===============================================================
OpenMPI-4.0.3
:MindSpore采用的多进程通信库。
OpenMPI-4.0.3源码下载地址:
https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.3.tar.gz
参考OpenMPI官网教程安装:https://www.open-mpi.org/faq/?category=building#easy-build。
先安装依赖环境:
sudo apt-get install libibverbs1
解压:
tar -zxvf openmpi-4.0.3.tar.gz
配置:
./configure --prefix=/usr/local --enable-mpi-threads --enable-progress-threads --enable-shared --with-threads=poxis --enable-mpi-thread-multiple --with-cuda=/usr/local/cuda-11.1
(注意:这里我们假设cuda的安装目录为: /usr/local/cuda-11.1 , 该地址可以按照具体情况进行修改)
编译并安装:
make&&sudo make install
国产计算框架mindspore在gpu环境下1.3.0版本的分布式计算组件安装—— (openmpi 和 nccl 的安装,配置,示例代码的运行)
标签:ESS apt-get strong tar bug 源码编译 代码 may uil
原文地址:https://www.cnblogs.com/devilmaycry812839668/p/15063821.html