摘要: 收集 根据数据来源及其格式,收集数据的步骤各不相同。 高级收集过程:获取数据(从互联网下载文件、抓取网页、查询 API 等),然后将该数据导入编程环境(例如 Jupyter Notebook)。 评估 评估数据的目的包括: 质量:内容问题。低质量数据也称为脏数据。 整洁度:使分析难易进行的问题。不整 阅读全文
posted @ 2018-11-23 02:33 凯撒鸡肉卷 阅读(317) 评论(0) 推荐(0)
摘要: 原文地址:https://datacarpentry.org/python-ecology-lesson/03-index-slice-subset/index.html Loading our data We will continue to use the surveys dataset tha 阅读全文
posted @ 2018-11-23 01:50 凯撒鸡肉卷 阅读(412) 评论(0) 推荐(0)
摘要: 原文地址:GitHub - jtleek/datasharing: The Leek group guide to data sharing https://github.com/jtleek/datasharing This is a guide for anyone who needs to s 阅读全文
posted @ 2018-11-23 01:08 凯撒鸡肉卷 阅读(163) 评论(0) 推荐(0)
摘要: 原文地址:https://simplystatistics.org/2016/02/17/non-tidy-data/ During the discussion that followed the ggplot2 posts from David and I last week we starte 阅读全文
posted @ 2018-11-23 01:05 凯撒鸡肉卷 阅读(177) 评论(0) 推荐(0)
摘要: 原文地址:https://cran.r-project.org/web/packages/tidyr/vignettes/tidy-data.html (This is an informal and code heavy version of the full tidy data paper. P 阅读全文
posted @ 2018-11-23 00:57 凯撒鸡肉卷 阅读(257) 评论(0) 推荐(0)