数据科学 - 随笔分类(第3页) - 绝不原创的飞龙

斯坦福 Stats60：21 世纪的统计学：第十章到第十四章

摘要：第十章：量化效应和设计研究原文：statsthinking21.github.io/statsthinking21-core-site/ci-effect-size-power.html 译者：飞龙协议：CC BY-NC-SA 4.0 在上一章中，我们讨论了如何使用数据来检验假设。这些方法提供了阅读全文

posted @ 2024-01-15 23:28 绝不原创的飞龙阅读(187) 评论(0) 推荐(0)

斯坦福 Stats60：21 世纪的统计学：第五章到第九章

摘要：第五章：将模型拟合到数据原文：statsthinking21.github.io/statsthinking21-core-site/fitting-models.html 译者：飞龙协议：CC BY-NC-SA 4.0 统计学中的一个基本活动是创建能够用少量数字总结数据的模型，从而提供数据的简阅读全文

posted @ 2024-01-15 23:25 绝不原创的飞龙阅读(137) 评论(0) 推荐(0)

斯坦福 Stats60：21 世纪的统计学：前言到第四章

摘要：前言原文：statsthinking21.github.io/statsthinking21-core-site/index.html 译者：飞龙协议：CC BY-NC-SA 4.0 这本书的目标是讲述统计学的故事，以及它如何被全球的研究人员所使用。这是一个与大多数统计学入门书籍中讲述的故事不同阅读全文

posted @ 2024-01-15 23:22 绝不原创的飞龙阅读(101) 评论(0) 推荐(0)

UCB Data100：数据科学的原理和技巧：第二十一章到第二十六章

摘要：二十一、SQL II 原文：SQL II 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果介绍过滤组的能力在 SQL 中执行数据清理和文本操作跨表连接数据在本讲座中，我们将继续上次的工作，介绍一些高级的 SQL 语法。首先，让我们加载上一堂课的数据库。 # Load the SQ 阅读全文

posted @ 2024-01-12 23:55 绝不原创的飞龙阅读(47) 评论(0) 推荐(0)

UCB Data100：数据科学的原理和技巧：第十六章到第二十章

摘要：十六、交叉验证和正则化 Cross Validation and Regularization 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果认识到需要验证和测试集来预览模型在未知数据上的表现应用交叉验证来选择模型超参数了解 L1 和 L2 正则化的概念基础在特征工程讲座结束时（阅读全文

posted @ 2024-01-12 23:49 绝不原创的飞龙阅读(86) 评论(0) 推荐(0)

UCB Data100：数据科学的原理和技巧：第十一章到第十五章

摘要：十一、恒定模型、损失和转换原文：Constant Model, Loss, and Transformations 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果推导出在 MSE 和 MAE 成本函数下恒定模型的最佳模型参数。评估 MSE 和 MAE 风险之间的差异。理解变量线性阅读全文

posted @ 2024-01-12 23:44 绝不原创的飞龙阅读(84) 评论(0) 推荐(0)

UCB Data100：数据科学的原理和技巧：第六章到第十章

摘要：六、正则表达式原文：Regular Expressions 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果了解 Python 字符串操作，pandas Series方法解析和创建正则表达式，使用参考表使用词汇（闭包、元字符、组等）描述正则表达式元字符这些内容在第 6 和第 7 阅读全文

posted @ 2024-01-12 23:34 绝不原创的飞龙阅读(76) 评论(0) 推荐(0)

UCB Data100：数据科学的原理和技巧：第一章到第五章

摘要：一、引言原文：Introduction 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果了解 Data 100 的总体目标了解数据科学生命周期的阶段数据科学是一个跨学科领域，具有各种应用，并且在解决具有挑战性的社会问题方面具有巨大潜力。通过建立数据科学技能，您可以赋予自己参与和引领阅读全文

posted @ 2024-01-12 23:28 绝不原创的飞龙阅读(89) 评论(0) 推荐(0)

解决 ChatGLM.CPP+clBlast 编译错误（也适用于SD.CPP）

摘要：首先安装 OpenCL 和 clblast： vcpkg install opencl clblast 下载GitHub 上的源码： git clone --recurse-submodules https://github.com/li-plus/chatglm.cpp cd chatglm.cp 阅读全文

posted @ 2023-09-18 15:14 绝不原创的飞龙阅读(122) 评论(0) 推荐(0)

Albert 源码解析：分组复用

摘要：```py class AlbertGroup(nn.Module): def __init__(self, config): super(AlbertGroup, self).__init__() self.inner_group_num = config.inner_group_num self 阅读全文

posted @ 2023-08-21 18:25 绝不原创的飞龙阅读(53) 评论(0) 推荐(0)

Bert Pytorch 源码分析：五、模型架构简图 REV1

摘要：## 注意力 ![在这里插入图片描述](https://img-blog.csdnimg.cn/abe43c5ca40948dfb3c195c4330b7ffa.jpeg#pic_center) ## FFN ![在这里插入图片描述](https://img-blog.csdnimg.cn/9f57 阅读全文

posted @ 2023-08-09 10:53 绝不原创的飞龙阅读(67) 评论(0) 推荐(0)

ApacheCN 数据科学译文集 20211109 更新

摘要：计算与推断思维一、数据科学二、因果和实验三、Python 编程四、数据类型五、表格六、可视化七、函数和表格八、随机性九、经验分布十、假设检验十一、估计十二、为什么均值重要十三、预测十四、回归的推断十五、分类十六、比较两个样本十七、更新预测利用 Python 进行数据分析 · 第 2 版第 1 阅读全文

posted @ 2021-11-13 18:56 绝不原创的飞龙阅读(30) 评论(0) 推荐(0)

龙哥盟

掠夺·扩张·投机·博弈

随笔分类 - 数据科学

公告