随笔分类 -  云计算

使用kubebuilder开发自定义controller
摘要:目录 声明式API CRD开发 CRD定义 自动代码生成 generator.sh kubeuilder controller开发 CREAT DELETE GET UPDATE 声明式API 参考资料 声明式API概念是什么? 声明式API / 命令式API 各自的优缺点? 声明式:关注最终的期望 阅读全文

posted @ 2021-12-30 18:37 在苏州的城边 阅读(321) 评论(0) 推荐(0)

云原生调度常见场景及推介配置
摘要:背景 深度学习大致将涉及数据获取和处理、模型训练和演进、模型部署、模型评测四个阶段[1]。一个企业开始涉猎深度学习之初,因团队缺乏深度学习的相关经验和资源,通常,团队人员选择手工逐步完成上述步骤,以期快速满足项目发展期的即时需求。然而,不管深度学习专家具有多么专业的领域内知识,没有基础设施平台的支撑 阅读全文

posted @ 2021-07-20 15:06 在苏州的城边 阅读(170) 评论(0) 推荐(0)

volcano测试用例实验笔记(四)-spark
摘要:Spark简介 Spark是一款快速通用的大数据集群计算系统。它提供了Scala、Java、Python和R的高级api,以及一个支持用于数据分析的通用计算图的优化引擎。它还支持一组丰富的高级工具,包括用于SQL和DataFrames的Spark SQL、用于机器学习的MLlib、用于图形处理的Gr 阅读全文

posted @ 2021-07-20 15:02 在苏州的城边 阅读(383) 评论(0) 推荐(0)

volcano测试用例实验笔记(三)-kubeflow
摘要:Kubeflow简介 Kubernetes已经成为云原生应用编排、管理的事实标准, 越来越多的应用选择向Kubernetes迁移。人工智能和机器学习领域天然的包含大量的计算密集型任务,开发者非常愿意基于Kubernetes构建AI平台,充分利用Kubernetes提供的资源管理、应用编排、运维监控能 阅读全文

posted @ 2021-07-20 15:01 在苏州的城边 阅读(767) 评论(0) 推荐(0)

volcano测试用例实验笔记(二)-paddlepaddle
摘要:paddlepaddle简介 飞桨(PaddlePaddle)是百度于 2016 年 9 月开源的深度学习框架,旨在提供一款安全高效、灵活易用、可扩展的深度学习平台。 2018 年 10 月,飞桨团队发布 Paddle Fluid 1.0 版本,对神经网络描述、大规模分布式训练、高性能推理引擎等核心 阅读全文

posted @ 2021-07-20 15:00 在苏州的城边 阅读(173) 评论(0) 推荐(0)

volcano测试用例实验笔记(一)-flink
摘要:在CNCF:community bridge#1285Reading Material Update And Supplement的议题中,我们需要提供volcano支持北向框架的测试用例,这篇笔记主要用来记录实验环境的搭建和实验过程中踩的坑。 CCE环境部署 部署k8s(注意要分配公网ip) 安装 阅读全文

posted @ 2021-04-03 20:47 在苏州的城边 阅读(644) 评论(0) 推荐(0)

如何为开源项目提交pr
摘要:在CNCF:community bridge#1285Reading Material Update And Supplement 这个议题当中,更新扩充好的材料需要同步更新到volcano官网的官方文档上,这篇文章主要来记录如何为开源项目(volcano)提交pr,以达到我们将贡献的开源文档同步更 阅读全文

posted @ 2021-04-03 20:44 在苏州的城边 阅读(261) 评论(0) 推荐(0)

volcano之job plugins
摘要:K8s pod pod是kubernetes中可以创建和部署的最小也是最简单的单位。pod代表集群中运行的进程。 在k8s集群中,pod有两种使用方式 一个pod运行一个容器:单个容器的封装,但是k8手、管理的是pod而不是容器。这也是最常见的用法。 一个pod运行多个容器:一个pod中同时封装几个 阅读全文

posted @ 2021-03-30 21:42 在苏州的城边 阅读(630) 评论(0) 推荐(0)

volcano调度器源代码走读plugins篇
摘要:Gang 简介 Gang调度策略是volcano-scheduler的核心调度算法之一,它满足了调度过程中的“All or nothing”的调度需求,避免Pod的任意调度导致集群资源的浪费。具体算法是,观察Job下的Pod已调度数量是否满足了最小运行数量,当Job的最小运行数量得到满足时,为Job 阅读全文

posted @ 2021-03-16 22:17 在苏州的城边 阅读(1614) 评论(0) 推荐(0)

CNCF:community bridge#1285Reading Material Update And Supplement
摘要:CNCF是linux foundation下的子组织,都是推动开源的非盈利组织,关于linux foundation这个面向大学生的coding实训,后面我会继续做详细介绍,这里记录我作为春季赛季的实习生,参与的议题。 所有选题list: https://github.com/cncf/mentor 阅读全文

posted @ 2021-03-11 10:49 在苏州的城边 阅读(101) 评论(0) 推荐(0)

volcano调度器源代码走读actions篇
摘要:Enqueue Queues QueueMap jobsMap //扫描一遍job,初始化上面三个数据结构 For job in ssn.Jobs //过滤1 found := ssn.Queues[job.Queue] existed := queueMap[queue.UID] //过滤2 if 阅读全文

posted @ 2021-03-04 10:47 在苏州的城边 阅读(814) 评论(0) 推荐(0)

大数据与云计算基础概念
摘要:大数据与云计算学习路线:https://blog.csdn.net/qq_37187606/article/details/80669708 Hadoop: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。是一个高度可扩展的存储平台。它可以存储和分发横跨数百个并行操作的廉价服务器数 阅读全文

posted @ 2019-07-29 15:03 在苏州的城边 阅读(480) 评论(0) 推荐(0)

导航