生物信息电脑运行环境搭建-Python R Linux

TOP

# 0 题记 从2018-7-16日开始,我讲了四天课(实际3天半,共21个小时),内容包括Linux入门、Python入门和R入门。目的是让大家能在自己的PC和服务器上进行生物信息学分析相关的实践。去年我用了差不多21小时只讲了R入门。今年为什么添加了Linux和Python?因为去年我自己这两个都还没有入门,也没有任何实践操作经验,去年有基因所的老师来教这个部分。今年,我更希望大家能从基因所老师那里学到 `生物信息` 相关的东西,不要因为`系统操作`跟不上,一直云里雾里,所以讲了这个课程的 `pre course`。
本文总结了一个没有什么计算机知识的学生要入门生物信息,完成个人 `PC` 环境配置的基础知识。算是为这几日以教促学的自我总结。
  • 以下操作在 Mac OS X 中测试无误,Windows 部分主要靠回忆。
  • 如果在 Windows里面进行,打开Termial对应打开 CMD 或者 powershell
  • 快捷需要相应调整,Windows 没有 cmd 键.

1 软件安装

1.1 系统 Linux vs Mac vs Windows

课程中涉及到的系统包括:

  • 一台能远程登录的服务器 Linux(Centos7)
  • 我用 Mac
  • 学生大部分使用 Windows
    • 但是从 XP 到 10 都有。系统和配置的种类很多,维护状态也大不相同,我不能强求大家先重装一个系统再来,所以遇到了五花八门的问题。
  • 总结下问题如下:
    • 内存不足
    • 系统版本老
    • 原安装的软件混乱
    • 使用中文用户名

1.2 软件

  • 服务器端没有做什么事情,它只是有一个校内的固定ip地址,能够让大家远程登录。
  • 个人电脑(PC)上面一共安装了四大类软件。
  • 逻辑如图
    • PC能与服务器通信和文件传输;
    • 能建立和维护 R 和 Python 的工作环境;
    • 能在开发环境中编写和调试代码。

![关系图](data:image/svg+xml;base64,<!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
<svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" width="582px" height="231px" version="1.1" content="&lt;mxfile userAgent=&quot;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) draw.io/8.8.0 Chrome/61.0.3163.100 Electron/2.0.2 Safari/537.36&quot; version=&quot;8.9.7&quot; editor=&quot;www.draw.io&quot; type=&quot;device&quot;&gt;&lt;diagram id=&quot;6a21d4ef-ac69-b966-caf6-4a49a3365f05&quot; name=&quot;Page-1&quot;&gt;5Vprb6M4FP01fK3AYB4fkzSZ1WhWiqYj7exHB5yELcGRMU0zv36veSSAnTQPSquZVIrgYoN97rnHBzeGPdm8fuFku/6bRTQxkBm9GvajgZAXIPiWgX0ZwJ5XBlY8jsqQdQw8xb9oFTSraB5HNGs1FIwlIt62gyFLUxqKVoxwznbtZkuWtJ+6JSuqBJ5CkqjRf+JIrMuoj7xj/C8ar9b1ky03KK8sSPi84ixPq+cZyF4Wn/LyhtT3qiaarUnEdo2QPTXsCWdMlEeb1wlNJLQ1bGW/2Ymrh3FzmopLOiC/7PFCkpzWQy4GJvY1GMV0qOxgGvZ4t44FfdqSUF7dQfYhthabBM4sOFzGSTJhCeNwnrIUGo0zwdkzrYOAyGwWwAeuRCRbFzeWPauBUC7o68nZWAeMgHqUbajge2hSdXBqWCvaIVxNb3dMInKrNutGAusYqXizOtz6iB0cVPCdwD74naG0baxAaVkaKIMeoEQqklPXCCaG/2hMseGPjJElD2DmI18BGe4FOlHAtSZbGQwTlkfXAV4ULnXDUId65AUL0+wHaMvsAG2iBw3USAO13wPUKnxtjjbggQnx/c/myb+yEYzWHv9HhdhXOk5ywSDEuFizFUtJ8o2xbd0tAp2tnnVsMD1Gx2HOXw5EzgThYiQFvVkDEJvFckbFCGkadVpApHG9nKB88PkMAQgs52HVyq5WHcJXtGrl6PPIaUJE/NK++z0psRX2zydKlmpq55tkFApJzLGkYQxr2DeyoMmcZbGIWQpNFkwItoEGibwwPqxQLaoXa9TxHqMkXsm+gnVqhOUiiVMohnrhNTWF44dUXzgLHzu4p8Kx/a5CmUrZ2O+k9YEqOtcR++0iMx88324XGrIOgTnlMYya8uoOl9bfbcXgqMWABioGR7MU+MZ4JleDqSfl3x/LxcGfGiOvWBzgqnvfwtumbSUqPTAW4Y49CVTGYg1j7R4Yq0LyNmMvIWmA2xx1Eb6Xo61CuY2w+OMI672bNLxvjeM78am6zlkMDzkt0l6Hy2WKql4dlA/DuAh4rDeNIA2gC44xHktdkAcTY2QWIjI1Alhr3QRAGS84HK3EAb7Prh0HIAfQjtrmN6D9rqAEUxPnoJC22V242NUZ7SUq/AKpXEcIoNCmpantyCaOoqJidFlo56kHzB2MYc11kI+94ttvq7fnaYy6o8kB6uOVyFQQ70PANVb+Ss8dJiTL4rBlu69RK/oai5/1beH4OJCWKqqUKQ2rQjKz+Nwsg5bG61imnibXaSMARvaNBlupedlp6cS21al41CTMm+2R73cIVo7gVn3VbGf0bno7dEQfwMcPJdpQJqVeLAfM5Z+WSn+gVFrqG9JTvkjAeUPwh1yUkWmf8TTW256G8LBC25GnK06iGPDomJwTuwv9WSDsum1BxKoFCjTLr4N7QFl1lxOWRuQq+3g91B0GR5j6kaNjsI8Wtuv2ZHvsjtV0dDuS74X0TW+qv4E0oRNbzbVnvlya+rcuqtdw8YPXcMaB1nkcbliKpfKSd70jMrXPOe2Izra/3xGputoXVYc24Wcq41YNunoV9QajrxPgDjHs9i1O7ErcS1jH+WDCOoNrq/fx4josY4ey8PXDG47ka77dy32Tz+ZJuoax+L/1zJnYjWuPMadh9Q8rSrLjqO+0jPghwHIXsvhuvyA7aDhXY6m/s/hKXi6xjxfsq7mhTxdLTWoI9ZefdF+tYR68msp1XjS+/r221Syk5GW+B0lJ+8nMoQROFc3ny0wrFXYw4A6n+vuZ75nIo5gNK2gXe/G7lck7vbfsDidNtrqBMGc7yrN10W4GmJONRDBdZNti8t1s/KB8E8MSfF9Wzu8fqKJXfDTpw/KvlWUU9JMzhA47/nWeHEvNE9bkyeshT+oWBHgj+gumT8o0ddIy2S8oj/Lw+e0M/nmZc0zN5lE/mYPT4w84S5d+/JGsPf0f&lt;/diagram&gt;&lt;/mxfile&gt;" style="background-color: rgb(255, 255, 255);"><defs><linearGradient x1="0%" y1="0%" x2="100%" y2="0%" id="mx-gradient-d5e8d4-1-fff4c3-1-e-0"><stop offset="0%" style="stop-color:#d5e8d4"/><stop offset="100%" style="stop-color:#FFF4C3"/></linearGradient></defs><g transform="translate(0.5,0.5)"><rect x="320" y="17" width="260" height="60" fill="none" stroke="#ff9999" stroke-dasharray="3 3" pointer-events="none"/><rect x="320" y="94" width="110" height="90" fill="none" stroke="#ff9999" stroke-dasharray="3 3" pointer-events="none"/><path d="M 30 81.5 C 6 81.5 0 101.5 19.2 105.5 C 0 114.3 21.6 133.5 37.2 125.5 C 48 141.5 84 141.5 96 125.5 C 120 125.5 120 109.5 105 101.5 C 120 85.5 96 69.5 75 77.5 C 60 65.5 36 65.5 30 81.5 Z" fill="#ffe6cc" stroke="#d79b00" stroke-miterlimit="10" pointer-events="none"/><g transform="translate(41.5,94.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="36" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 37px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">服务器</div></div></foreignObject><text x="18" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">服务器</text></switch></g><path d="M 280 118.67 Q 239.67 118.67 239.67 91.17 Q 239.67 63.67 199.67 63.67" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><ellipse cx="295" cy="96" rx="7.5" ry="7.5" fill="#f8cecc" stroke="#b85450" pointer-events="none"/><path d="M 295 104 L 295 129 M 295 109 L 280 109 M 295 109 L 310 109 M 295 129 L 280 149 M 295 129 L 310 149" fill="none" stroke="#b85450" stroke-miterlimit="10" pointer-events="none"/><g transform="translate(286.5,156.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="17" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; white-space: nowrap; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;background-color:#ffffff;">PC</div></div></foreignObject><text x="9" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">PC</text></switch></g><path d="M 150 63.67 Q 129.67 63.67 129.67 71.17 Q 129.67 78.67 100.2 78.67" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 94.95 78.67 L 101.95 75.17 L 100.2 78.67 L 101.95 82.17 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><rect x="150" y="49" width="50" height="30" fill="#ffffff" stroke="none" pointer-events="none"/><g transform="translate(150.5,57.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="48" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 48px; white-space: normal; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">远程控制</div></div></foreignObject><text x="24" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">远程控制</text></switch></g><path d="M 150 143.67 Q 129.67 143.67 129.67 127.42 Q 129.67 111.17 120.2 111.17" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 114.95 111.17 L 121.95 107.67 L 120.2 111.17 L 121.95 114.67 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 200 143.67 Q 239.67 143.67 239.67 136.17 Q 239.67 128.67 273.63 128.95" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 278.88 128.99 L 271.85 132.43 L 273.63 128.95 L 271.91 125.43 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><rect x="150" y="129" width="50" height="30" fill="#ffffff" stroke="none" pointer-events="none"/><g transform="translate(150.5,137.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="48" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 48px; white-space: normal; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">文件传输<br /></div></div></foreignObject><text x="24" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">文件传输&lt;br&gt;</text></switch></g><rect x="355.21" y="36.5" width="40" height="20" fill="#fff2cc" stroke="#d6b656" pointer-events="none"/><g transform="translate(370.5,39.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="8" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 10px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">R</div></div></foreignObject><text x="4" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">R</text></switch></g><path d="M 466.33 131.17 Q 431.33 131.17 431.33 88.67 Q 431.33 46.17 401.87 46.17" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 396.62 46.17 L 403.62 42.67 L 401.87 46.17 L 403.62 49.67 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 466 131.17 Q 430.5 131.17 430.5 144.92 Q 430.5 158.67 401.03 158.67" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 395.78 158.67 L 402.78 155.17 L 401.03 158.67 L 402.78 162.17 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 466 131.17 Q 430.5 131.17 430.5 174.92 Q 430.5 218.67 401.87 218.67" fill="none" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><path d="M 396.62 218.67 L 403.62 215.17 L 401.87 218.67 L 403.62 222.17 Z" fill="#000000" stroke="#000000" stroke-miterlimit="10" pointer-events="none"/><rect x="466" y="109" width="90" height="45" rx="18.45" ry="18.45" fill="#ffffff" stroke="#000000" pointer-events="none"/><g transform="translate(471.5,124.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="78" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 80px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Sublime Text 3</div></div></foreignObject><text x="39" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Sublime Text 3</text></switch></g><rect x="330" y="101.5" width="90" height="45" rx="18.45" ry="18.45" fill="#d5e8d4" stroke="#82b366" pointer-events="none"/><g transform="translate(356.5,117.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="36" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 36px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Conda<br /></div></div></foreignObject><text x="18" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Conda&lt;br&gt;</text></switch></g><path d="M 465.5 47 Q 429.67 47 401.87 46.32" fill="none" stroke="#d6b656" stroke-miterlimit="10" pointer-events="none"/><path d="M 396.62 46.19 L 403.7 42.87 L 401.87 46.32 L 403.53 49.86 Z" fill="#d6b656" stroke="#d6b656" stroke-miterlimit="10" pointer-events="none"/><path d="M 465.95 206.17 Q 429.67 206.17 429.67 126.17 Q 429.67 46.17 401.87 46.17" fill="none" stroke="#82b366" stroke-miterlimit="10" pointer-events="none"/><path d="M 396.62 46.17 L 403.62 42.67 L 401.87 46.17 L 403.62 49.67 Z" fill="#82b366" stroke="#82b366" stroke-miterlimit="10" pointer-events="none"/><path d="M 465.95 206.17 Q 430.5 206.17 430.5 187.42 Q 430.5 168.67 401.03 168.67" fill="none" stroke="#82b366" stroke-miterlimit="10" pointer-events="none"/><path d="M 395.78 168.67 L 402.78 165.17 L 401.03 168.67 L 402.78 172.17 Z" fill="#82b366" stroke="#82b366" stroke-miterlimit="10" pointer-events="none"/><rect x="465.95" y="184" width="90" height="45" rx="18.45" ry="18.45" fill="url(#mx-gradient-d5e8d4-1-fff4c3-1-e-0)" stroke="#82b366" pointer-events="none"/><g transform="translate(490.5,200.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="40" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 40px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Jupyter<br /></div></div></foreignObject><text x="20" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Jupyter&lt;br&gt;</text></switch></g><rect x="355.14" y="209" width="40" height="20" fill="#dae8fc" stroke="#6c8ebf" pointer-events="none"/><g transform="translate(361.5,212.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="26" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 26px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Java<br /></div></div></foreignObject><text x="13" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Java&lt;br&gt;</text></switch></g><rect x="355" y="154" width="40" height="20" fill="#d5e8d4" stroke="#82b366" pointer-events="none"/><g transform="translate(355.5,157.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="38" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 38px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Python<br /></div></div></foreignObject><text x="19" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Python&lt;br&gt;</text></switch></g><rect x="465.71" y="24" width="90" height="45" rx="18.45" ry="18.45" fill="#fff2cc" stroke="#d6b656" pointer-events="none"/><g transform="translate(490.5,40.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="40" height="12" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 42px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Rstudio<br /></div></div></foreignObject><text x="20" y="12" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">Rstudio&lt;br&gt;</text></switch></g><rect x="127.5" y="0" width="95" height="47" rx="13.63" ry="13.63" fill="#f5f5f5" stroke="#666666" pointer-events="none"/><g transform="translate(142.5,10.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="65" height="26" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 67px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Powershell/ <br />Terminal</div></div></foreignObject><text x="33" y="19" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">[Not supported by viewer]</text></switch></g><rect x="127.5" y="159" width="95" height="47" rx="13.63" ry="13.63" fill="#f5f5f5" stroke="#666666" pointer-events="none"/><g transform="translate(144.5,169.5)"><switch><foreignObject style="overflow:visible;" pointer-events="all" width="61" height="26" requiredFeatures="http://www.w3.org/TR/SVG11/feature#Extensibility"><div xmlns="http://www.w3.org/1999/xhtml" style="display: inline-block; font-size: 12px; font-family: Helvetica; color: rgb(0, 0, 0); line-height: 1.2; vertical-align: top; width: 61px; white-space: nowrap; word-wrap: normal; text-align: center;"><div xmlns="http://www.w3.org/1999/xhtml" style="display:inline-block;text-align:inherit;text-decoration:inherit;">Filezilla/<br />Cyberduck <br /></div></div></foreignObject><text x="31" y="19" fill="#000000" text-anchor="middle" font-size="12px" font-family="Helvetica">[Not supported by viewer]</text></switch></g></g></svg>)

  1. 与服务器连接

  2. 编译语言

    • R 3.5.1:先安装,再装Rstudio
    • Python 3.6:Conda顺带安装
    • Java:由于有些软件会用到,不是所有人都安了,所以也让大家装了
  3. 环境管理

  4. 代码编辑器/IDE

    • Jupyter: 以前叫 ipython notebook:支持Python,R等,代码+注释的编辑方式,使可读性强,适合教学用。
    • Sublime Text 3:轻量,免费,多种语言高亮支持,也能提供编译。需要自己进行进一步配置。个人很喜欢 ST3。不仅快,功能丰富,而且打开大的数据也不卡。但是,ST3有本事能让你用的得心应手,前提也是你得花时间配置。思考了下,认为这篇,不适合展开细讲,所以留一个坑吧。

1.3 安装

1.3.1 文件传输 Filezilla | Cyberduck

本来以为最没有问题的是这个部分,不过还是出了点小问题。

  • Filezilla 下载成了 Filezilla server
  • Cyberduck 连接的时候应该选择 SFTP 类型。

1.3.2 远程登录 Powershell | Terminal

Windows

  • Powershell Windows 8.1 之后自带,有就能直接运行 ssh 命令。
  • 没有可以下载,或者下 PuttyOpenssh
  • 不想安装可以在 CMD 里面使用 telnet 命令。

Mac

  • Terminal 自带。
  • 代码ssh -p 22 username@ip

登录信息

  • port 端口 -p
  • ip 地址
  • 用户名
  • 密码

让服务器说中文

  • 远程登录之后,打开家目录(当前目录/home/username)下的 .bash_profile
vi .bash_profile
  • i
  • 输入 export LANG=zh_CN.UTF-8
  • esc,再输入 :wq 回车。
  • 然后重新登录,或者运行。
source .bash_profile

1.3.3 语言编译器 R | Python

R

下载安装3.5.1,没有遇到报错 link

Python

装 Python 3,安装 conda 就自动装上。

Java

也是去官网下载安装,没有遇到报错,只是大,需要等。

1.3.4 环境管理 conda | Rstudio

用来管理和安装各种软件包和模块。

Conda for Python

  • Anaconda 和 Miniconda 都是在使用 Conda 命令来管理包(模块)和运行环境的。
  • 区别是Anaconda把常用的大量的包都预先安装好了。Anaconda有用户界面(GUI),Miniconda只是能够用命令行(Command line)来运行。
  • Anaconda 预装了 Jupyter Notebook,还能一起管理 Rstudio

看到这里是不是觉得那还装啥别的,就来Anaconda 了吧!实践告诉我,并不是。Anaconda有三个硬伤:

  1. 内存不够开起来慢,就这么说吧,拖家带口,跑不动。
  2. Anaconda没有提供最新的R环境。目前支持的是 R3.4.3 可是已经有一些包要求不是R3.5.1就不准装,目前,我随便搜了下,并不知道怎么在 Anaconda里面让R的核更新。
  3. 如果想自定义,里面的关系盘根错节,不知道怎么改。
    比如我自己下一个 R3.5.1 然后再修改依赖关系,但是我发现其实 bin 里面放的是一个 Wrapper,我不知道怎么改,即使我知道自己的新R在哪里,我尝试了各种简单的拖动,替换,并没有成功。

所以,我决定把 Anaconda 卸了,安装 miniconda,然后通过 Conda 来安装 Jupyter

安装过程
  1. 下载文件,例如 Miniconda3-latest-MacOSX-x86_64.sh
  2. 运行。

注意,这里是 .sh,双击以文件形式打开,运行是在 Terminal 中进入文件所在文件夹,然后运行的。

cd Download
bash ./Miniconda3-latest-MacOSX-x86_64.sh
conda 使用

通常就是知道自己需要安装的包的名字(例如:numpy),然后输入命令。运行后,首先会完成解析,确认,输入 y安装才会继续。解析返回的内容包括:

  • 将安装哪些依赖dependency(也就是相关的包)
  • 哪些会升版本
  • 那些需要降级版本

会要下很多很多东西,但是等就好。中间报错通常因为下载中断,再运行一次,会从断的地方继续。

conda install numpy
conda 频道 channel
  • 不同的 channels 放着不同的东西。
  • 添加频道
conda config --add channels defaults
conda config --add channels conda-forge
conda config --add channels bioconda
  • 生物信息常用 bioconda,里面包含 biopython 模块
conda install biopython

提高下载速度 mirror

  • 清华有anaconda的 镜像,按需求选择了几个需要的 channel。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/

Rstudio

安装 Rstudio 一般问题也不大,容易错的是:

  • 安装在含义中文的路径中,比如用户名,对后续使用有影响。
  • 没有安装 R 就装 Rstudio。

1.3.5 代码编辑IDE Jupyter | Sublime Text3

交互式开发环境 IDE interactive development enviroment: 意思就是你能在里面写代码,然后看到结果。还能辅助你管理包环境变量,文件等。

首先 Rstudio 也是IDE,但是它是 R 专用的 IDE。
下面追加安装的两个IDE能支持多种语言,特别是 Sublime Text 3,简直各种小能手。

Sublime Text 3

  • 安装没有出现过问题,注意版本要新。
  • ST3 能用各种你已经安装的 编译器(例如Python和R)来运行对应的代码文件(.py和.r)。
    在对应的打开文件中,按 Cmd + B,在 Tools -> Build System 选择合适的编译器,或者自动,ST编译代码,在下方显示结果。
  • Python 能输出图形,如果编译之后没有图,参考
  • R 目前没有直接出图,有需要安装 REPL 参考

Jupyter

  • 使用conda安装,
conda install jupyter

  • 推荐安装 nbextension插件,这样能有目录,高亮,帮助窗口等附件功能。
conda install -c conda-forge jupyter_contrib_nbextensions
  • 激活使用的插件,可以打开 notebook 之后勾选;或者使用代码。推荐打开help panel,table of content和highlighter。
jupyter nbextension enable highligher/main 
  • 运行 notebook:输入命令,会以当前的路径作为根目录,以默认浏览器打开一个页面(本地服务器)。
jupyter notebook

1.3.6 Jupyter notebook + R kernel

  • 因为我们已经安装的 R 现在就是要让 Jupyter notebook 找到R了。很简单,使用IRkernel
  • 有一个小坑。首先以下代码是 R 里面运行的,前面两行能在 R studio 运行成功,但是第三行一定要在 R 本身 运行!
  • 建议在 Terminl 中输入 R 运行,然后再运行下面的代码。
  • 结果会将你 当前使用的 R 的版本 作为 核(kernel)
  • 以后打开 Jupyter notebook 就能选择 R 作为核了。
install.packages('devtools')
devtools::install_github('IRkernel/IRkernel')
# or devtools::install_local('IRkernel-master.tar.gz')
IRkernel::installspec()  # to register the kernel in the current R installation

1.4 常见问题

1.4.1 不知道自己有没有安装成功

  • 首先要区分 命令 command程序 app exe。本质上 运行命令 运行的是 命令 指向的 程序命令 可以理解为放在 环境变量 指向的 位置 PATH中的 程序本身,或者 程序的超链接
  • 例如:R 本来装在 /Library/Frameworks/R.framework 中,但是在 /usr/local/bin/ 里有一个 R 的超链接,所以我们可以在任何地方 只输入 R 就运行程序。比较下面的代码:
    • 运行的是 R命令,通过 环境变量找到 R程序,然后打开。

$R

    * 运行的是 `当前路径下的R程序`,所以前面有 `./ `。如果所在路径没有 `R` 不能运行成功。
     ```
$./R
  • 因此,在命令行模式中,通常输入 程序 的名字就能知是否安装成功。例如输入Java,Python,R 或 Jupyter

1.4.2 安装程序或修改环境变量后没有生效

  • 例如安装了 miniconda 之后,conda 命令并没有马上被找到。因为其实有一条命令还没有生效。打开 .bash_profile
vi ~/.bash_profile

看到里面写着如下命令。它在每次登陆的时候生效,所以需要再登陆一次。

# added by Miniconda3 installer

export PATH="/Users/YOURNAME/miniconda3/bin:$PATH"

1.4.3 环境变量设置出错

环境变量是什么?

环境变量 = PATH 也就是路径。一个系统帮助我们找到要运行的程序的 路径

  • 虽然是一样的安装程序,但是经常就有人的机器,安装了之后还是不能运行。其实就是安装的过程没有完成添加 环境变量 PATH。我们可以自己添加环境变量。

  • 大家都很不明白什么是环境变量。请看以下 Windows 的例子。

  • 如果 blastn.exe 装在了 D:\Blast+ 中。直接在 CMD 中运行 blastn 是不会成功的,因为我们没有把 D:\Blast+设置为让系统帮我们找可执行文件的位置 =
    PATH 。

如何修改

  • Mac 中详细说明见上一条。以下代码仅为例子。
echo $PATH
vi ~/.bash_profile

# added by Miniconda3 installer

export PATH="/Users/YOURNAME/Blast+/bin:$PATH"

  • Windows 我的电脑,右键,属性,高级设置,环境变量,在原有的环境变量基础上加上
    ;C:\Blast+

  • Windows 10 才能逐条显示环境变量中的路径,能用浏览的方式加入新的。

  • Windows 命令行方式添加。

set PATH=%PATH%;D:\Blast+
echo %PATH%

1.4.4 下载错了位(32 vs 64)或版本

  • 如果不是从官网下载,常常已经不是最新的版本,有时候不能正常的支持所有的包。
  • 目前还有一些笔记本是32位的,但是一些软件最新的版本已经没有32位了,比如Blast+。解决的方法是下载稍微老一些的版本。

1.4.5 缺少管理员权限

  • 在图形界面安装,如果是因为没有管理员权限的问题,有时候是不会报错,只是一直安装不成功。
  • 如果在命令行界面,安装失败才能看到返回的错误信息。
  • Windows 可以用管理员权限打开 CMD。注意没有 sudo 命令。以下两个都是网上找的,没测试。来源
runas /noprofile /user:Administrator cmd 
ru
  • Mac 里面可以用 sudo 来运行。例如
sudo conda install pandas

2 总结

2.1 最小安装

  • Filezilla/Cyberduck
  • minicoda
  • R
  • Rstudio
  • Jupyter

2.2 跟不上进度的主要原因

  • 不能理解绝对路径和相对路径 = 因为找不到文件报错
  • 不习惯使用 table 补齐代码 = 输入错误
  • 不能理解变量的作用域 = R里面不懂如何使用$
  • 不知道 在不同语境下的含义,特别是在 R 里面 = 弄混变量和字符串
  • 不知道 [] () 使用时候的不同含义 = R里面的函数和内容提取
  • 不知道一般有哪几类错误
  • 关键是不看错误信息说什么,特别是信息长又是英语的时候,更别说分析问题怎么解决
  • 不知道怎么把大问题拆成小步骤,听指导的时候总是跳步骤。

有的学生会很积极的来上课,但一直跟不上,然后就一直问别人该怎么操作,发现代码运行出来,就很满意了,但是他们唯独不做的事情是理解问题和分析问题。也不在乎自己是不是获得了独立完成的能力。

以前我认为只要老师讲得够清楚就能解决问题。好像也不是这么回事。很多基础的概念和原理,很多人并不能按照我期待的理解。可能是每种语法还是需要一定的时间来记忆。知识也需要发酵。

比如,我希望大家从表格数据里提取一个列,做逻辑运算,再把结果添加到数据的新列里。需要使用 $ 提取内容,>做逻辑计算 , 最后通过 $ 把计算结果赋值 <- 给原来的 不存在的列,完成添新列。我发现,大家不能完成不是单纯的不记得使用哪个命令,重要的是不能把这个任务线性化,不能分割为最小的步骤。我会一直努力拆解,然后提醒。最后发现,真的要精确到每一步,才有可能准确理解。

df$z <- df$x > 3 读出这个代码里面的数据流向也是入门的一道坎。

另外,我还是容易不淡定,嗯。

posted @ 2018-07-21 18:34  Xeonilian  阅读(1698)  评论(0编辑  收藏  举报