随笔分类 - 技术
摘要:如果您想对Airflow进行真正的试驾,您应该考虑设置一个真正的数据库后端并切换到LocalExecutor。 由于Airflow是使用优秀的SqlAlchemy库与其元数据进行交互而构建的,因此您应该能够使用任何支持作为SqlAlchemy后端的数据库后端。 我们建议使用MySQL或Postgre
阅读全文
摘要:操作器代表一个理想情况下是幂等的任务。 操作员确定DAG运行时实际执行的内容。 有关更多信息,请参阅Operators Concepts文档和Operators API Reference 。 BashOperator 模板 故障排除 找不到Jinja模板 PythonOperator 传递参数 模
阅读全文
摘要:第一次运行Airflow时,它会在$AIRFLOW_HOME目录中创建一个名为airflow.cfg的文件(默认情况下为~/airflow $AIRFLOW_HOME )。 此文件包含Airflow的配置,您可以对其进行编辑以更改任何设置。 您还可以使用以下格式设置带有环境变量的选项: $AIRFL
阅读全文
摘要:获得气流 安装最新稳定版Airflow的最简单方法是使用pip : 您还可以安装Airflow,支持s3或postgres等额外功能: 注意 GPL依赖 默认情况下,Apache Airflow的一个依赖项是拉入GPL库('unidecode')。 如果这是一个问题,您可以通过发出export SL
阅读全文
摘要:本教程将向您介绍一些基本的Airflow概念,对象及其在编写第一个管道时的用法。 示例管道定义 以下是基本管道定义的示例。 如果这看起来很复杂,请不要担心,下面将逐行说明。 阅读全文/改进本文
阅读全文
摘要:历史 Airflow于2014年10月由Airbnb的Maxime Beauchemin开始。 它是第一次提交的开源,并在2015年6月宣布正式加入Airbnb Github。 该项目于2016年3月加入了Apache Software Foundation的孵化计划。 提交者 @mistercru
阅读全文
摘要:安装快速而直接。 阅读全文/改进本文
阅读全文
摘要:仓库:https://github.com/apachecn/airflow-doc-zh 进度:https://github.com/apachecn/airflow-doc-zh/issues/1 贡献指南:https://github.com/apachecn/airflow-doc-zh/b
阅读全文
摘要:首页地址:www.apachecn.org 关于我们:www.apachecn.org/about 我们不是 Apache 的官方组织/机构/团体,只是 Apache 技术栈(以及 AI)的爱好者! Java 基础 Java 编程思想 Java Web 和大数据 Spark 中文文档 Storm 中
阅读全文
摘要:原文:Deep Learning 2: Part 1 Lesson 5 作者:Hiromi Suenaga 课程论坛 一,引言 没有足够的关于结构化深度学习的出版物,但它肯定出现在行业中: 结构化深度学习,作者:Kerem Turgutlu @datascience.com 你可以使用此工具从 Go
阅读全文
摘要:原文:Deep Learning 2: Part 1 Lesson 3 作者:Hiromi Suenaga 课程论坛 学生创建的有用材料: AWS 操作方法 TMUX 第 2 课总结 学习率查找器 PyTorch 学习率与批量大小 误差表面的平滑区域与泛化 5 分钟搞定卷积神经网络 解码 ResNe
阅读全文
摘要:原文:Deep Learning 2: Part 1 Lesson 2 作者:Hiromi Suenaga 论坛 笔记本 回顾上一课 [01:02] 我们使用 3 行代码来构建图像分类器。 为了训练模型,需要在PATH下以某种方式组织数据(在本例中为data/dogscats/ ): image i
阅读全文
摘要:原文:Deep Learning 2: Part 1 Lesson 1 作者:Hiromi Suenaga 课程论坛 入门 [0:00]: 为了训练神经网络,你肯定需要图形处理单元(GPU) - 特别是 NVIDIA GPU,因为它是唯一支持 CUDA(几乎所有深度学习库和从业者都使用的语言和框架)
阅读全文
摘要:Github 仓库:https://github.com/apachecn/prob140-textbook-zh 整体进度:https://github.com/apachecn/prob140-textbook-zh/issues/2 贡献指南:https://github.com/apache
阅读全文
摘要:GeeksForGeeks 是计算机科学百科,涵盖了所有计算机科学核心课程。 本项目的目标是翻译 GeeksForGeeks 站点内的一部分教程。 这些教程适用于: APCS 本科专业课 研究生考试 计算机三、四级 不适用于: ACM/OI CTF 大数据竞赛 高中信息技术 软考 由于工作量非常大,
阅读全文
摘要:基本介绍 感谢 @ApacheCN 组织 复现 Pytorch 中文网站 的原始模样,Pytorch 介绍  要搞事情 介绍 看到 @机器之心 及时发布的文章 Caffe2代码全部并入PyTorch:深度学习框架格局剧震  看的出来 FaceBook 的确要搞大事情: Facebook 主力支持
阅读全文
摘要:来源:https://it-ebooks.flygon.net/mooc/ 这里是我推荐的一些优秀公开课,我上过绝大部分。 编程 哈佛 CS50 MIT 6.001x UCB CS61a 主页 中文版教材 主页 中文版教材 数据结构·算法 斯坦福 CS106b UCB cs61b 普林斯顿 Algs
阅读全文
摘要:机器学习(英文):很坑,课程安排不合理。应该把5/6的时间用于讲各种模型,1/6的时间用于展示,否则根本学不到啥东西。容量方面差太多了,svm,决策树,gmm 根本就没讲到。 数据挖掘:大作业不能用python很恶心。缺少工程方面的讲解。其他还好。 人工智能:过度拘泥于课本,讲了一些曾经有用但现在被
阅读全文
摘要:面向(未来的)数据科学家的入门课来咯~ 前一半讲 Python 编程,后一半讲统计学基本概念并用 Python 模拟。 Github:https://github.com/Kivy-CN/data8-textbook-zh Gitee:https://gitee.com/wizardforcel/d
阅读全文
摘要:Scikit-Learn (Sklearn) 中文文档 0.19 scikit-learn 是基于 Python 语言的机器学习工具。 官网地址: scikit-learn(sklearn): http://scikit-learn.org中文文档: ApacheCN - scikit-learn(
阅读全文

浙公网安备 33010602011771号