JHU-R-编程笔记-全-
JHU R 编程笔记(全)
001:欢迎来到R编程环境 🚀

在本课程中,我们将一起探索R语言编程环境,并了解如何利用R进行高效的数据分析和工具开发。R不仅是一个强大的数据分析语言,还是一个出色的平台,用于构建工具、提升分析效率并与他人分享工作成果。
课程概述 📋
欢迎来到本课程!我是Roger Pang,约翰霍普金斯大学彭博公共卫生学院的生物统计学教授。我是Rickie Anderson,科罗拉多州立大学的环境流行病学助理教授。我们非常高兴能教授这门课程,因为R语言已经变得极其流行,基本上已成为进行复杂数据分析的实际标准语言。除了作为数据分析语言,R还是一个令人难以置信的平台,用于构建工具以提高数据分析效率,并与他人分享工作成果。
在接下来的内容中,我们将首先带大家了解R环境的基本构成。随后,我们将深入探讨如何将代码封装成函数,并将这些函数打包成可供分享的包。我们还将学习如何创建数据可视化图表。在本课程的第一部分,我们将重点介绍R语言的语法和结构,讨论用于获取和清理数据的工具,并进行初步的数据分析。此外,我们还将介绍一系列其他工具,这些工具将帮助你在专业领域不断进步,例如构建包和编写函数。
本课程会较快地介绍R的基础知识,因此最适合有一定R语言经验,或已掌握其他编程语言并希望学习R的学员。关于我们两位讲师:我的研究主要集中于开发用于环境健康问题的统计方法,我特别关注室内外空气污染暴露对健康的影响。我研究环境流行病学,并致力于探索与气候相关的灾害(如热浪和飓风)对健康的影响。
我们非常期待教授这门课程,并热切盼望看到你们能构建出怎样的成果。
课程内容结构 🗂️
上一节我们概述了本课程的目标和讲师背景,本节中我们来看看课程的具体内容安排。以下是本课程将涵盖的核心模块:
- R环境导览:初步认识R的编程界面和工作流程。
- R语法基础:学习R语言的基本语法和数据结构。
- 函数编写:掌握如何将代码模块化,封装成可重用的函数。核心概念可用代码描述为:
my_function <- function(arg1, arg2) { # 函数体 }。 - 包开发:了解如何将一组相关的函数和数据打包成R包,便于分享和管理。
- 数据获取与清理:介绍用于导入、整理和准备分析数据的工具与技术。
- 数据可视化:学习使用R创建清晰、有效的图形来展示数据。
总结与展望 🎯
本节课中,我们一起学习了本课程《Mastering Software Development in R》的引言部分。我们了解了R语言在数据分析和工具开发中的核心地位,明确了课程将涵盖从环境熟悉、语法基础到函数封装、包开发以及数据处理的完整路径。本课程适合有一定编程基础或R使用经验的学员,旨在帮助大家系统掌握用R进行软件开发的技能。
我们即将开启R编程的实践之旅,下一节将正式进入R编程环境,开始动手操作。
002:欢迎来到高级R编程 🚀

在本课程中,我们将学习如何编写函数来组织和复用R代码,使脚本更简洁、易读且易于修改。我们还将探讨面向对象编程、代码调试与性能分析,以及通过错误处理增强函数的健壮性。
概述
此时,你应该对编写R代码和在R中处理数据相当熟悉。
但你可能会注意到,你的R代码变得有些冗长,并且需要复制粘贴代码来重复某些操作。因此,现在是学习如何编写函数的好时机。
函数的作用
函数为组织和复用代码提供了一个系统,这能使脚本更短、更易读,并且在需要修改时更容易调整。
函数也是封装代码的一种方式,使其更易于与他人分享。通过函数,代码的所有细节都被打包,用户只需了解输入和输出即可。
本课程涵盖内容
除了介绍编写函数的机制,我们还将涵盖以下主题:
- 面向对象编程
- 代码调试与性能分析
- 通过错误处理使函数更健壮
课程预备知识
这是专项课程中的第二门课。如果你已完成第一门课程,或者拥有丰富的R语言使用经验,那么学习本课程将会感到最轻松。
感谢你选修本课程,我们期待看到你能构建出什么精彩的作品。
总结
本节课中,我们一起学习了高级R编程课程的概述和目标。我们了解到,函数是提升代码组织性、复用性和可分享性的关键工具。后续课程将深入讲解函数编写、面向对象编程及代码优化等具体技术。
003:欢迎来到构建 R 包

在本节课中,我们将要学习如何将您编写的 R 函数组织、打包并分享给他人使用。这是从编写代码到创建可复用、可维护工具的关键一步。
上一节我们介绍了如何将代码封装成函数。本节中,我们来看看如何将这些函数进一步组织成一个完整的 R 包。
将代码打包成 R 包,是促使他人真正使用您代码的有效方式。仅仅发送脚本或包含多个函数的文件是不够的,因为它们缺乏组织、文档和使用说明。R 包提供了一种机制,用于组织代码、编写文档、解释使用方法,使其对用户更加友好。这更多地是从用户角度出发,提供他们学习使用您代码所需的便利设施。

我同意。编写文档和整合函数的过程,也有助于理清您所创建的这一组函数的内在逻辑。它帮助您思考哪些是用户真正需要的函数,哪些只是起辅助作用的内部函数。
编写 R 包是编写函数本身的自然延伸。最初我们从一些代码开始,然后将其抽象为带有输入和输出的函数。现在,R 包是下一个自然层级,您将讨论一组用于完成特定任务的、可供用户调用的函数。
一旦您编写好一个包,通常希望分享它。在本课程中,我们将讨论如何使用 GitHub 来分享您的包,以及如何获取他人的包。
我们还将讨论质量控制,这对于让许多人使用您的包并保持其质量至关重要。我们将讨论测试和持续集成,以维护您的包。
由于本课程建立在编写代码和将代码封装成函数的基础上,因此对于已经学习过本专项前两门课程的人来说,会感觉最得心应手。
我们非常高兴大家对构建 R 包感兴趣,并有机会教授大家这项技能。这是一项非常重要的技能,我们非常期待看到您能构建出什么。

本节课中,我们一起学习了构建 R 包的重要性:它是分享代码、提供文档和确保质量的标准化方式。从函数到包,是代码可复用性和专业性的重要提升。
004:欢迎来到构建数据可视化工具 🎨

在本课程中,我们将学习数据分析中一个至关重要的环节:构建高质量的数据可视化图形。我们将首先介绍如何使用R语言中现有的强大工具(如GGplot)来创建图形,随后深入探讨如何构建自定义的图形扩展。
数据分析的一个重要组成部分是构建高质量的图形。在本课程的第一部分,我们将向您展示如何使用包括GGplot在内的现有工具在R中创建图形。课程的第二部分将深入挖掘,并向您展示如何构建自定义的图形扩展。
如果您已经完成了本系列专项课程的前两门课程,或者您已经拥有丰富的R语言编程经验,那么学习本课程将会感到最为轻松。

非常感谢您注册本课程。我们非常期待看到您能构建出怎样的成果。😊
课程总结
本节课中,我们一起学习了本课程的核心目标与结构。我们明确了数据分析中可视化的重要性,并概述了从使用现有工具(如GGplot)到开发自定义图形扩展的学习路径。同时,我们也了解了学习本课程所需的先验知识。接下来,我们将正式开启数据可视化工具构建之旅。
005:R 语言编程与数据科学工具开发|Mastering Software Development in R
课程编号:P5 - 顶点项目介绍 🎯

概述
在本节课中,我们将介绍顶点项目的目标与意义。通过本课程,您将学习如何整合之前学到的所有技能,构建一个完整的 R 语言软件包。
我们非常高兴您跟随我们完成了专项课程中的所有课程。
此时,您已经学习了如何编写 R 代码,以及如何将其封装为函数和软件包。
因此,我们认为此时每个人都具备了构建自己的 R 软件包所需的所有工具。
确实如此,我们认为这是一个非常激动人心的时刻,因为在顶点项目中,我们将运用所有技能来整合一个真正的产品,该产品可以发布供他人使用。
我们将处理数据,编写函数以操作数据,创建可视化图表,并将所有内容与教程和文档一起打包成软件包。
我们需要确保软件包通过所有适当的检查,成为一个连贯的、可供他人使用并通过 GitHub 分发的软件包。
因此,本项目将全面涵盖专项课程的广度,最终将产生一个非常有趣的成果。
😊
在 R 语言中工作的最大优点之一是它拥有一个强大的软件包开发者社区。
我从许多现有的软件包中受益匪浅,我相信您可能也有同样的体验。
我也享受编写自己的软件包的过程。
因此,我们真诚地希望我们已经为大家提供了足够的技能,使大家能够加入这个社区,并开始贡献自己的作品。
确实如此,恭喜您进入顶点项目阶段,我们非常期待看到您能构建出什么成果。
😊
总结
本节课中,我们一起学习了顶点项目的核心目标:整合 R 编程、函数封装、软件包开发、数据处理、可视化及文档编写等技能,构建一个可供社区使用的完整 R 软件包。我们鼓励您运用所学,积极参与 R 社区,贡献自己的作品。

浙公网安备 33010602011771号