拯救者Y720-gtx1050-window10-配置tensorflow-gpu环境

https://www.cnblogs.com/31415926535x/p/10536572.html

概述

因为选修了数字图像这门课,,要做一个人脸识别的项目,和室友打算利用tensorflow来训练一个模型,,然后刚开始的环境配置就折腾了一天,,

现在记录一下大致的流程和遇到的坑,,(只是简略的写写配置的要点,,具体的信息别的博客讲的很清楚了,,,

最后的环境: win10x64 + gtx1050 + CUDA9.0 + cuDNN9.0 + Anaconda + Tensorflow1.9.0

英伟达官网你会发现1050不能使用它的CUDA,,但实际上是可以使用的,,后面可以看出算力大概是6.1,,

配置流程

只列出必要的流程以及我遇到的坑,,

详细的安装过程参考别人的博客:

Win10+1050Ti配置Tensorflow教程

Win10下Tensorflow(GPU版)安装趟坑实录

win10搭建tensorflow-gpu环境

tensorflow 安装GPU版本,个人总结,步骤比较详细

在Windows 10上安装TensorFlow并支持GPU的最佳方式(无需安装CUDA

Win10+cuda8.0+cudnn5.1+tensorflow-gpu1.2.0+gtx1050ti,tensorflow环境搭建与配置

tensorflow 使用CPU而不使用GPU的问题解决

Python配置

首先是Python的配置,,Python很简单就可以弄好了,,去官网下载win的安装器,,点一点等一等就行了,,

Anaconda安装

这个也是直接去官网下载安装就行了,,,安装的过程可能会很长,,所以要一直等,,会出现终端,,不要叉掉,,等就可以了,,,(貌似这玩意儿2个多G

CUDA9.0安装

CUDA9.0下载地址

这是一个大坑!!!被这玩意坑了一次,,,

首先,英伟达的官网你直接进去去下CUDA只显示最新版10.1,,,然后我就想着有新的就直接上新版本的算了,,,后来才发现Tensorflow到现在还不支持10.0的版本,,,最多只能用9.0的,,

还有一个坑,,,选择的安装器是第一个(Base Installer)还有选择在线安装(exe(Network)),,,

最后,,因为我的C盘不怎么空余了,,,所以就把这玩意装到了别的盘,,这样的话 系统环境变量 得重新修改,,

参考博客1

参考博客2

都可以

cuDNN v7.5.0 for CUDA 9.0

这玩意也是一个坑,,,

因为CUDA安装的是9.0版本的,,所以这玩意也只能装对应的版本,,,

下载地址

会要你注册账号,,最主要的是10.0版本的可以直接下载,,换成9.0的就得要梯子,,,惊了,,,

下载好后解压,,把里面的那三个文件复制到cuda对应的文件夹里,,参考上面那几个博客的操作

vs2017

看到网上有人说配置环境需要vs来编译什么的,,,因为我在之前就已经装好了vs2017,,所以就省略了这一步的安装,,没有测试不装会发生什么,,

安装Tensorflow-gpu--1.9.0 并测试

之前的所有东西都弄好后就可以安装 Tensorflow 了,,,

打开 Anaconda Prompt

因为地下室这里网还不错,,所以就没有去配置清华的镜像,,

安装Tensorflow: conda install tensorflow-gpu==1.9.0 因为现在(2019-3-15)Tensorflow已经是1.13.0版本了,,直接安装的话就会是最新版,,,不知道怎么回事,,最新版的话我这里在之后不会调用gpu来运行,,用这个版本之后就可以了(CUDA的锅?),,(也有可能是我在改变了其它的因素的原因,,,待验证

创建运行环境; conda create -n tensorflow-gpu python=3.6 等待安装就行了,,

激活环境: conda activate tensorflow-gpu

验证

然后打开python,,

输入:

import tensorflow as tf         //0
hello = tf.constant('hello')
sess = tf.Session()             //1
print(sess.run(hello))          //2
sess.close()
  • 在输完0代码之后,会停顿一会,,
  • 在输完1代码之后,会显示一些信息,,如果说有有关gpu的信息的话证明调用gpu成功,,否则的话只有一条cpu的信息,,可能之前的安装有问题,,重新安装试试,,(我就是因为这个重装了好几遍
  • 在输完2代码之后,显示 b'hello'

1的输出类似这样:

2019-03-15 13:03:55.881573: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
2019-03-15 13:03:56.695820: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1392] Found device 0 with properties:
name: GeForce GTX 1050 major: 6 minor: 1 memoryClockRate(GHz): 1.493
pciBusID: 0000:01:00.0
totalMemory: 2.00GiB freeMemory: 1.61GiB
2019-03-15 13:03:56.702429: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1471] Adding visible gpu devices: 0
2019-03-15 13:03:57.517589: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:952] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-03-15 13:03:57.521414: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:958]      0
2019-03-15 13:03:57.523379: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:971] 0:   N
2019-03-15 13:03:57.525486: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1084] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 1359 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1050, pci bus id: 0000:01:00.0, compute capability: 6.1)

也可以这样验证:

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

会输出一长条的信息,,例如:

>>> from tensorflow.python.client import device_lib
>>> print(device_lib.list_local_devices())
2019-03-15 13:13:03.527577: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1471] Adding visible gpu devices: 0
2019-03-15 13:13:03.545230: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:952] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-03-15 13:13:03.563464: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:958]      0 
2019-03-15 13:13:03.576112: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:971] 0:   N 
2019-03-15 13:13:03.587662: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1084] Created TensorFlow device (/device:GPU:0 with 1359 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1050, pci bus id: 0000:01:00.0, compute capability: 6.1)
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 5406329819980989395
, name: "/device:GPU:0"
device_type: "GPU"
memory_limit: 1425578393
locality {
  bus_id: 1
  links {
  }
}
incarnation: 3552327620198962820
physical_device_desc: "device: 0, name: GeForce GTX 1050, pci bus id: 0000:01:00.0, compute capability: 6.1"
]

如果失败的话(也就是只有cpu运算)就是这样:

[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}

再或者这样:

import tensorflow as tf
a = tf.constant([1.0, 2.0], name="a")
b = tf.constant([2.0, 3.0], name="b")
result = a + b
print(result)

sess = tf.InteractiveSession()
print(result.eval())
sees.close()

正常情况下也会显示gpu等信息

>>> import tensorflow as tf
>>> a = tf.constant([1.0, 2.0], name="a")
>>> b = tf.constant([2.0, 3.0], name="b")
>>> result = a + b
>>> print(result)
Tensor("add_1:0", shape=(2,), dtype=float32)
>>> sess = tf.InteractiveSession()
2019-03-15 13:19:57.500304: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1471] Adding visible gpu devices: 0
2019-03-15 13:19:57.514303: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:952] Device interconnect StreamExecutor with strength 1 edge matrix:
2019-03-15 13:19:57.530082: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:958]      0 
2019-03-15 13:19:57.539267: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:971] 0:   N 
2019-03-15 13:19:57.547441: I C:\users\nwani\_bazel_nwani\ujdkfsks\execroot\org_tensorflow\tensorflow\core\common_runtime\gpu\gpu_device.cc:1084] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 1359 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1050, pci bus id: 0000:01:00.0, compute capability: 6.1)
>>> print(result.eval())
[3. 5.]

使用

每次使用tensorflow时,,因为我们是在Anaconda的虚拟的一个环境里运行tensorflow+python,,所以要先激活环境:conda activate tensorflow-gpu,,,(这么说先前直接安装的python不仅版本过高,,而且没用上)

对了必须要在cmd里使用,,powershell貌似不行,,,进入powershell输入 cmd 切换到cmd就行了,,,激活环境后前面会多一个环境名: (tensorflow-gpu),,这样再进入python等等,,,

结束

这样环境的配置基本就完了,,大概占了12个多G的存储空间,,,emmmm心疼硬盘ing

从昨天晚上到今天上午,,折腾了几遍,,,最后还是弄好了,,,最怕的不是出各种各样的错误,,而是放弃吧,,,毕竟很多人都在弄这个,,会遇到一样的状况,,总会找到解决的方法的,,,

(猜测:安装anaconda时,,发现里面有cuda了,,可能不需要安装cuda就可以,,留坑)
(end)

posted @ 2019-03-15 13:50 31415926535x 阅读(...) 评论(...) 编辑 收藏