当前位置: 首页 > 工具软件 > Gluon.js > 使用案例 >

ubuntu16.04安装tensorflow,pytorch,gluon等

何辰沛
2023-12-01
  • 浏览器相关
  • 安装cuda,cudnn相关
  • 编译tensorflow相关
  • 安装bazel相关
  • anaconda相关
  • 安装pytorch与gluon相关

接上一篇文章“ubuntu16.04命令操作”,在其基础上继续进行了安装。

#安装chrome
1、下载谷歌浏览器源文件。链接有很多,以下是64位版本的下载地址
https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
2、下载完成后,在终端运行命令:
sudo dpkg -i google-chrome*; sudo apt-get -f install
即可安装完成
3、直接在终端中输入google-chrome即可运行,如提示密钥窗口,可按下列内容执行:
终端中输入seahorse,密码-login-右键-解锁-输入密码,就不会再提示了。

#卸载火狐浏览器
参考:https://blog.csdn.net/qq_41149269/article/details/81175948
#卸载火狐浏览器之后,
出现了ubuntu16.04 has experienced an internal error的报错。解决方式是,不管它,皮~
参考:https://blog.csdn.net/xiaowei_jin/article/details/49949653按照

#安装学习框架准备过程
按照以下链接的教程安装tensorflow:
参考1:
https://mp.weixin.qq.com/s?__biz=MzUzNjE3NTgxNg==&mid=2247483863&idx=1&sn=12b2c0064d262238ca1c30d57ffdc635&chksm=fafb7470cd8cfd665f04b7a03f5f5b3cf4ac3536670329d30c58f6acaa5025cd79aae79ac526&mpshare=1&scene=1&srcid=1118EtbuZc4D1jpKVNo5Pjms#rd但是教程中有一些操作可以改进:
(1)nvidia的驱动安装可以改为使用使用apt-get在线安装,
参考2:
https://mp.weixin.qq.com/s?__biz=MzUzNjE3NTgxNg==&mid=2247483947&idx=1&sn=d72bb74f698d802d436a4f1fbff26734&chksm=fafb778ccd8cfe9aab7261b0e695f9013ca55845555330974385a9cc11b0e9e287401196bdf0&mpshare=1&scene=1&srcid=1118avNy28yCznmv1eCR0MBu#rd
(2)cuda是否安装成功
查看 CUDA安装情况 :
首先用 cd命令切换到 命令切换到 CUDA自带的例程目录之下 ,
即输入命令 cd NVIDA_CUDA9.0_Sample/1_Utilities/deviceQuery,
之后输入 make命令
接下来输入 ./deviceQuery命令 执行例程
并且最后一行出现 Result=PASS视为 CUDA安装成功
(3)本次配置使用的是cuda9.0+cudnn7.0.3,第三步之后,执行以下过程,避免了第七步的问题。
安装完cudnn以后,要使用以下命令添加软连接。
接着建立软连接:
  cd /usr/local/cuda/lib64/ 
  sudo rm -rf libcudnn.so libcudnn.so.7
  sudo ln -s libcudnn.so.7.0.3 libcudnn.so.7 
  sudo ln -s libcudnn.so.7 libcudnn.so 
配置环境变量:
  sudo gedit /etc/profile
在末尾处添加:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
接着创建链接文件;
sudo gedit /etc/ld.so.conf.d/cuda.conf 
增加下面一行;
/usr/local/cuda/lib64 
保存后在终端输入sudo ldconfig 使链接生效

#查看 CUDA cudnn 版本
https://blog.csdn.net/zhangjunhit/article/details/76532196
#安装tensorflow
直接使用pip install tensorflow-gpu==1.8.0安装tensorflow会报错,应该是pip没有相应的包。
所有要自己使用Bazel编译tensorflow源码安装。使用参考1中各种软件对应的版本是可以正确编译tensorflow的,
这次编译时换了python为3.7,bazel为0.19.1,结果各种报错。

#编译tensorflow时遇到的各种错误及解决方法
(1)出现警告:
WARNING: The following rc files are no longer being read, please transfer their contents or import their path into one of the standard rc files:/home/[user]/Downloads/tensorflow-r1.8/tools/bazel.rc
要将该路径添加到.bazelrc
(2)编译报错为:
ERROR: /home/[user]/.cache/bazel/_bazel_[user]/c7c54c19884fac535f95c7b464dd0c8b/external/local_config_cc/BUILD:57:1: in cc_toolchain rule @local_config_cc//:cc-compiler-k8: Error while selecting cc_toolchain: Toolchain identifier 'local' was not found, valid identifiers are [local_linux, local_darwin]
按照该方法解决问题:
https://stackoverflow.com/questions/53292093/how-do-i-specify-a-toolchain-identifier-when-building-tensorflow-from-source
(3)编译报错为:
ERROR: Analysis of target '//tensorflow/tools/pip_package:build_pip_package' failed; build aborted: no such package '@boringssl//': java.io.IOException: Error downloading [https://mirror.bazel.build/github.com/google/boringssl/archive/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz, https://github.com/google/boringssl/archive/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz] to /home/fengzicai/.cache/bazel/_bazel_fengzicai/c7c54c19884fac535f95c7b464dd0c8b/external/boringssl/a0fb951d2a26a8ee746b52f3ba81ab011a0af778.tar.gz: Checksum was 676ed7516f47b897ce7c3a2c3a57f92f63fc86f4312293acce8932708b21d2a6 but wanted 524ba98a56300149696481b4cb9ddebd0c7b7ac9b9f6edee81da2d2d7e5d2bb3
参考链接:https://github.com/tensorflow/tensorflow/issues/12984

#Bazel相关
(1)使用以下命令可以升级bazel
echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list
curl https://bazel.build/bazel-release.pub.gpg | sudo apt-key add -sudo apt-get update && sudo apt-get install bazel 安装
sudo apt-get update &&sudo apt-get upgrade bazel 更新
参考:https://blog.csdn.net/dlhlSC/article/details/73641039?utm_source=blogxgwz0
(2)降bazel版本
rm -fr ~/.bazel ~/.bazelrc
install bazel (version: 0.14.1, maybe others)
bazel build ...

#anaconda相关命令
(1)python3.7编译会报错,创建python3.6的虚拟环境进行安装
参考:https://www.cnblogs.com/swje/p/7642929.html
(2)创建删除虚拟环境
参考:https://blog.csdn.net/sizhi_xht/article/details/80964099
(3)安装navigator
参考:https://blog.csdn.net/u013372308/article/details/79235393
(4)导出anaconda库环境
参考:https://blog.csdn.net/vola9527/article/details/80744540
(5)anaconda添加源和删除源的命令
conda config --remove channels "https://mirrors.ustc.edu.cn/anaconda/pkgs/free/"

#安装pytorch
参考:https://blog.csdn.net/u010327061/article/details/81001999
参考:https://blog.csdn.net/u013713010/article/details/78645631

#安装gluon
下载gluon-tutorials-zh之后,将environment.yml 修改为以下内容,就可以支持cuda9.0了。
name: gluon
dependencies:
- python>=3.6
- jupyter=1.0.0
- matplotlib=2.2.2
- pandas=0.23.2- pip:
  - requests==2.18.4
  - mxnet==1.2.1
然后在anaconda命令行下,执行
conda env create -f environment.yml 
创建名为gluon的虚拟环境
参考:https://blog.csdn.net/qq_32458499/article/details/78701203
 类似资料: