1 2 3 4 5 ··· 48 下一页
摘要: 微信公众号:AutoML机器学习 MARSGGBO♥原创 如有意合作或学术讨论欢迎私戳联系~邮箱:marsggbo@foxmail.com 阅读全文
posted @ 2021-11-29 21:12 marsggbo 阅读(296) 评论(0) 推荐(0)
摘要: 论文: AutoML: Survey of the State-of-the-Art 下面这个网站会不断更新AutoML相关的论文,当然如果你的论文未被收录,你也可以手动上传你的论文让更多人看到: https://marsggbo.github.io/automl_a_survey_of_state 阅读全文
posted @ 2020-07-09 19:01 marsggbo 阅读(1483) 评论(1) 推荐(0)
摘要: 之前已经发过一篇文章来介绍我写的 "AutoML综述" ,最近把文章内容做了更新,所以这篇稍微细致地介绍一下。由于篇幅有限,下面介绍的方法中涉及到的细节感兴趣的可以移步到论文中查看。 论文地址:https://arxiv.org/abs/1908.00709 1. Introduction 以往的模 阅读全文
posted @ 2020-02-11 12:01 marsggbo 阅读(1876) 评论(0) 推荐(2)
摘要: 特大喜讯!!! 本专栏开通了同步更新的微信公众号【AutoML机器学习】,不常用知乎的小伙伴们欢迎关注,一起学习!!! 阅读全文
posted @ 2020-01-28 18:28 marsggbo 阅读(700) 评论(2) 推荐(1)
摘要: 做件好事,考四级的兄弟们一起共勉~~~ 链接:https://pan.baidu.com/s/1im4BDVZofZbT9f5PZtsxdA 密码:9i5h ​若链接失效请关注如下公众号,后台私信【计算机四级】即可获得更新链接。 微信公众号:AutoML机器学习 MARSGGBO♥原创 如有意合作或 阅读全文
posted @ 2018-03-08 10:54 marsggbo 阅读(4900) 评论(0) 推荐(0)
摘要: 第一章 神经网络与深度学习(Neural Network & Deeplearning) "DeepLearning.ai学习笔记(一)神经网络和深度学习 Week3浅层神经网络" "DeepLearning.ai学习笔记(一)神经网络和深度学习 Week4深层神经网络" 第二章 改善深层神经网络 阅读全文
posted @ 2017-09-03 20:44 marsggbo 阅读(10352) 评论(1) 推荐(2)
摘要: 因为是Jupyter Notebook的形式,所以不方便在博客中展示,具体可在我的github上查看。 github传送门 : "deeplearning.ai_JupyterNotebooks" 笔记传送门 : "DeepLearning.ai课程相关系列笔记" 微信公众号:AutoML机器学习 阅读全文
posted @ 2017-08-31 17:34 marsggbo 阅读(5964) 评论(0) 推荐(0)
摘要: 笔记总结,各章节主要内容已总结在标题之中 "Andrew Ng机器学习课程笔记–week1(机器学习简介&线性回归模型)" "Andrew Ng机器学习课程笔记 week2(多元线性回归&正规公式)" "Andrew Ng机器学习课程笔记 week3(逻辑回归&正则化参数)" "Andrew Ng机 阅读全文
posted @ 2017-08-25 18:28 marsggbo 阅读(5954) 评论(0) 推荐(3)
摘要: layout: post title: "延迟降47%!FineMoE如何用「细粒度」打破MoE推理的显存-延迟死局" date: 2026-05-14 tags: [LLM, MoE, 论文解读, 推理优化, Expert Offloading] Eurosys26 | FineMoE如何用「细粒 阅读全文
posted @ 2026-05-16 11:27 marsggbo 阅读(18) 评论(0) 推荐(0)
摘要: layout: post title: "LoRA fine-tune吞吐量提升1.96倍!LoRAFusion如何把内存带宽浪费和pipeline bubble一起干掉" date: 2026-05-14 tags: [LLM, LoRA, 训练优化, Kernel Fusion, 分布式训练, 阅读全文
posted @ 2026-05-16 11:27 marsggbo 阅读(4) 评论(0) 推荐(0)
摘要: layout: post title: "LLM 推理启动慢?华为用一个「可编程 Page Cache」把模型加载砍了 79%" date: 2026-05-14 tags: [LLM, 推理优化, 系统, 论文解读, FAST] LLM 推理启动慢?华为用一个「可编程 Page Cache」把模型 阅读全文
posted @ 2026-05-16 11:26 marsggbo 阅读(9) 评论(0) 推荐(0)
摘要: layout: post title: "KV Cache 的两层存储到底卡在哪?FAST'26 这篇论文给出了答案" date: 2026-05-14 tags: [LLM, KV Cache, 论文解读, 系统优化, FAST] KV Cache 的两层存储到底卡在哪?FAST'26 这篇论文给 阅读全文
posted @ 2026-05-16 11:26 marsggbo 阅读(14) 评论(0) 推荐(0)
摘要: 把 Dense LLM 变成 MoE 还能推理提速?NeurIPS 2024 Read-ME 做到了 原文:Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design 1. 前言 做 阅读全文
posted @ 2026-05-10 16:28 marsggbo 阅读(22) 评论(0) 推荐(0)
摘要: 说人话理解 EPIC:KV Cache 复用的「编译-链接」范式(附可运行代码复现) 原文:EPIC: Efficient Position-Independent Caching for Serving Large Language Models 1. 前言 你有没有想过,当你用 RAG 系统给 阅读全文
posted @ 2026-05-10 16:27 marsggbo 阅读(22) 评论(0) 推荐(0)
摘要: 今天想和大家聊聊这篇来自港科大的工作 —— Expert Streaming,最近在 arXiv 上出现,是少见的从芯片架构角度直接解决 MoE 推理内存瓶颈的硬核工作。 先交代下背景:MoE 火是真的火,DeepSeek、Qwen3 都在往 MoE 走,但我们自己跑的时候,却结结实实踩了个大坑 — 阅读全文
posted @ 2026-04-29 15:35 marsggbo 阅读(31) 评论(0) 推荐(0)
摘要: 原文:CacheSlide: Unlocking Cross Position-Aware KV Cache Reuse for Accelerating LLM Serving 1. 前言:两种方案都不够用 作为一个天天和 LLM 推理打交道的牛马,我对 KV Cache 这个话题有复杂感情——它 阅读全文
posted @ 2026-04-29 15:35 marsggbo 阅读(58) 评论(0) 推荐(0)
摘要: 原文:KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems(Duke / MIT / NVIDIA,OpenReview 投稿) 代码:https://githu 阅读全文
posted @ 2026-04-29 15:33 marsggbo 阅读(50) 评论(0) 推荐(0)
摘要: 原文:DroidSpeak: KV Cache Sharing for Cross-LLM Communication and Multi-LLM Serving 1. 前言:一个很自然但从没人解决过的问题 KV Cache 共享这件事,在单个模型的场景里已经做得很成熟了——vLLM 的 prefi 阅读全文
posted @ 2026-04-26 15:11 marsggbo 阅读(45) 评论(0) 推荐(0)
1 2 3 4 5 ··· 48 下一页