腾讯云做网站选哪个,深圳域名注册公司,宁波网站设计公司有几家,杭州做网站比较好的公司参考官方指南基本要求官网测试过的源代码配置如下#xff1a;image也就是说#xff0c;按照这个版本安装的话不应该再产生版本的问题了。我的配置ubuntu 16python 2.7nccl 2.3gcc 4.8.5cuda 7.1.4cudnn 9.0 (具体是9.0.176但是在./configure的那里不用输这么仔细#xff0c;…参考官方指南基本要求官网测试过的源代码配置如下 image也就是说按照这个版本安装的话不应该再产生版本的问题了。我的配置ubuntu 16python 2.7nccl 2.3gcc 4.8.5cuda 7.1.4cudnn 9.0 (具体是9.0.176但是在./configure的那里不用输这么仔细具体原因下面会说)安装bazel 0.10从源码编译安装官方的【安装步骤】我试了没用查到【这个博客】才发现缺乏如下步骤。应该要使用./compile.sh编译,要等待几分钟。 image编译后最终生成的二进制文件bazel在当前目录的output/bazel下面由于 image把这个文件移动到venv/bin/bazel下面.note:安装version10的时候用这个方法没问题我卸载干净之后用apt-get安装version21使用的是apt-get官网有教程行得通。bazel版本问题尝试bazel 0.21版本,产生如下报错ERROR: Config value cuda is not defined in any .rc file。最后发现tf1.8的构建版本时使用了bazel 0.10所以果断换成了bazel 0.10bazel路径问题如果没有进入虚拟环境之前可以使用bazel命令但是进入虚拟环境之后不行提示没有这个文件则(把外部环境的bazel加入路径)export PATH/root/bin/:$PATH此时再输入bazel就可以找到啦。卸载bazel,重新安装卸载参考https://github.com/bazelbuild/bazel/issues/962卸载完毕还是没法删除bazel.0.10,是因为虚拟环境下venv/bin/bazel存在。删除这个文件之后终于显示删除成功。安装nccl 2.3因为无法登陆英伟达官方网站所有采用giuthub的方式下载按照build,install执行命令。NCCL-SLA.txt不存在的问题编译Tensorflow按照官网的说明我需要的是r1.8版本的切换分支就可以了。./configure 文件的配置这一步也有挺多的坑除了cuda,剩下的都选择n.gpu的compute capability查询方法nvidia-smi 查看最上面显示的是什么型号的gpu. image 可以看到我的四块gpu都是GeForce GTX 108...然后在【英伟达给出的官网】上查询得知计算能力是6.1nccl路径安装完之后命令行会提示你路径。gcc版本我修改为gcc-4.8cuda,cudnn版本都不用输那么仔细的版本因为可以看到./configure的输出如下exec env –CUDA_TOOLKIT_PATH/usr/local/cudaCUDNN_INSTALL_PATH/usr/lib/x86_64-linux-gnuGCC_HOST_COMPILER_PATH/usr/bin/gcc-4.8LD_LIBRARY_PATH:/usr/local/cuda/extras/CUPTI/lib64NCCL_INSTALL_PATH/data/lirong/py2/nccl/nccl/buildPATH/root/bin/:/data/lirong/py2/venv_python2.7/bin/:/data/lirong/py2/venv_python2.7/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/usr/local/cuda/binPYTHON_BIN_PATH/data/lirong/py2/venv_python2.7/bin//pythonPYTHON_LIB_PATH/data/lirong/py2/venv_python2.7/lib/python2.7/site-packagesTF_CUDA_CLANG0TF_CUDA_COMPUTE_CAPABILITIES6.1TF_CUDA_VERSION9.0TF_CUDNN_VERSION7TF_NCCL_VERSION2TF_NEED_CUDA1TF_NEED_OPENCL_SYCL0 \bazel build这一步踩了很多的坑成功之后。 image然后按照官网的步骤没出错。最后需要重新打开一次命令行窗口再次import tensorflow。 image安装成功踩过的坑bazel build编译的时候如果遇到各种问题。command会提示Use --verbose_failures to see the command lines of failed build steps.我之前一直没有注意直到加了--verbose_failures这个条命令:bazel build --configopt --configcuda //tensorflow/tools/pip_package:build_pip_package --verbose_failures试过才发现完整的报错然后很快google一下就解决了。issue 1报错AttributeError: int object attribute __doc__ is read-onlyTarget //tensorflow/tools/pip_package:build_pip_package failed to build...ERROR: /data/lirong/py2/tensorflow/tensorflow/tools/api/generator/BUILD:27:1: Executing genrule //tensorflow/tools/api/generator:python_api_genfailed (Exit 1)解决pip uninstall enumapt-get install python-enum34重新编译之后还会会报错但是报的是issue 2了issue 2错误提示ImportError: No module named enumTarget //tensorflow/tools/pip_package:build_pip_package failed to build解决方法pip uninstall enumpip install enum34