AI应用开发实战 - 从零开始搭建macOS开发环境

AI应用开发实战 - 从零开始搭建macOS开发环境

本视频配套的视频教程请访问:https://www.bilibili.com/video/av24368929/

建议和反馈,请发送到
https://github.com/Microsoft/vs-tools-for-ai/issues

联系我们
OpenmindChina@microsoft.com

零、前提条件

  • 一台能联网的电脑,使用macOS操作系统
  • 请确保鼠标、键盘、显示器都是好的

一、工具介绍

Viusal Studio code

Visual Studio Code 是微软继Visual Studio 宇宙第一IDE后出品的又一利器,是一款完全免费的文本编辑器。

Visual Studio Code 支持Windows、Linux和Mac三大操作系统,有着一流的响应速度,不论是本身的启动,还是加载目录、打开浏览大文件的速度,都十分迅速;这款文本编辑器的可扩展能力也十分强大,在其活跃生态的支持下,提供了大量的插件供开发者自行配置,比如对各种小众语言的支持、数据访问、键盘布局等等;另外,它在配置上非常灵活,但大多是基于json的文本配置,使用起来不向图形界面那样简单易懂,但是熟悉后还是很方便的。

Tools for AI

Visual Studio Code 上的Tools for AI 是微软官方出品的一站式机器学习集成开发环境,其与VS code相结合,能让开发人员在同一个开发环境里,完成从编辑、训练、集成模型,到服务与应用的代码开发。

Tools for AI 对训练任务的调度和管理做了很好的集成。现在、后端的计算平台支持本机、Linux服务器、微软的企业级计算资源管理平台、Azure的机器学习平台、Batch AI等。
另外还能够管理各种远程的存储,直接在界面中上传数据、下载模型日志等文件。

二、搭建开发环境

Visual Studio Code 安装

访问 https://code.visualstudio.com

点击Download自动下载对应操作系统的Visual Studio Code

插件安装

首先打开VS Code,点击扩展图标

首先安装好Python插件

有插件自动更新或安装后,就会提示重新加载,点击重新加载后,VS Code就会重新启动,并且加载相应的插件。

然后搜索Tools for AI,选择第一个安装。

这里同样也要点击重新加载。

同样,我们可以把中文包也安装上,这样就能显示中文了。

安装Git

访问 https://git-scm.com/downloads

下载Mac适用的版本

下载机器学习示例库

打开终端,找到一个自己想用来存放这些文件的文件夹,在终端中输入

git clone https://github.com/Microsoft/samples-for-ai/

这时Git开始自动克隆示例库

安装python

这一步大家安装python3.5或3.6皆可,但更推荐大家安装python3.6,同时请一定选择64位的版本,否则很多机器学习框架都无法使用。

访问 https://www.python.org/downloads/ 选择适用于macOS的64位安装包

note:在python安装完成后,请在Application中找到python的安装文件,运行Certificates install.commands,安装常见的根证书,否则python脚本访问任何https网站时都会出现证书错误,这也会影响我们接下来的安装过程

安装机器学习和机器学习的软件及依赖

还是上一步的文件夹,进入installer目录,输入

python ./install.py

等待它安装完成。

至此,环境搭建已经全部结束。

三、运行示例代码

从这一步开始,我们要开始真正进行训练了,如果你是第一次接触机器学习,那么你就可以训练出自己的第一个模型了!

首先打开Visual Studio Code,选择文件->打开打开samples的总目录。

我们使用tensorflow和MNIST来作为例子。

MNIST是一个流行的示例数据集,是人手写的数字的图片集。我们可以用它来训练一个模型,让计算机识别出人手写的数字是什么。

note:如果你的电脑安装了多个版本的python,请点击VS Code窗口下方的Python环境,程序将列出本机找到的所有python环境,我们要将其切换到正确的环境上

本地调试及训练

首先,点击AI Explorer来新建或者修改本地环境配置。在Local - Environment下右键,点击Add Configuration

设置好name,并将上一步选择的python环境的路径填写进去

点击右下角的Finish来刷新环境配置

note:一定要点击Finish才能正确地刷新配置

在配置好本地环境后,还需要添加一个运行作业的配置,这里选择查看->命令面板,输入AI: Edit Job Properties,然后回车。

note:如果你的电脑安装了多个版本的python,请修改startupCommand中的Python改为Python3,然后点击Finish,这样可以确保在执行作业的时候使用python3运行程序

右键convolutional.py,选择AI: Submit Job

选择Local

选择刚才配置好的运行环境

可以看到屏幕下方有一个新的终端窗口,这时程序就已经开始对模型进行训练了

远程训练

由于Mac没有配置Nvidia的显卡,因此只能使用CPU训练模型,如果本机的性能不行,有的时候可能需要花费很长时间,这个时候,如果远程的服务器,特别是有专门的计算资源加持的话,速度会快很多。另外,很多机器学习的框架支持并行计算,远程训练时还可以接入并行的资源,进一步提高训练效率。

Tools for AI支持多种远程训练的平台,包括Remote Machine、私有部署的PAI,以及Azure的Batch AI等,本系列博客以后会详细介绍如何使用这些资源。本篇博客主教讲解如何在远程Linux上进行训练。

首先在AI Explorer中,在Remote Linux上点击鼠标右键,点击Add Configuration,然后填入自己服务器的信息,最后点击Finish完成设置

然后,同样像上次一样选择AI: Submit Job,只是这次要选择刚才配置好的Remote Linux

在提交完作业后,如果想要查看运行情况,则需要在Remote Linux中选择之前配置好的机器,点击鼠标右键,选择List Jobs,这时可以看到这台机器上提交过的任务列表

点击我们刚刚提交的那个,就可以列出这个任务的所有细节

同时可以通过点击页面上的Open Storage Explorer来查看该任务在远程机器下的目录。

如果需要查看远程机器的其他目录,则在机器上右键,选择Open Storage Explorer,选择Custom Directory,然后输入你要访问的目录即可

至此,远程模型训练的部分就完场了。

posted @ 2018-06-08 16:22  UniversalAIPlatform  阅读(3073)  评论(40编辑  收藏  举报