marsggbo

摘要：微信公众号：AutoML机器学习 MARSGGBO♥原创如有意合作或学术讨论欢迎私戳联系~邮箱:marsggbo@foxmail.com 阅读全文

posted @ 2021-11-29 21:12 marsggbo 阅读(296) 评论(0) 推荐(0)

[置顶] AutoML综述更新【AutoML：Survey of the State-of-the-Art】

摘要：论文: AutoML: Survey of the State-of-the-Art 下面这个网站会不断更新AutoML相关的论文，当然如果你的论文未被收录，你也可以手动上传你的论文让更多人看到： https://marsggbo.github.io/automl_a_survey_of_state 阅读全文

posted @ 2020-07-09 19:01 marsggbo 阅读(1483) 评论(1) 推荐(0)

[置顶] 【论文笔记系列】AutoML：A Survey of State-of-the-art （上）

摘要：之前已经发过一篇文章来介绍我写的 "AutoML综述" ，最近把文章内容做了更新，所以这篇稍微细致地介绍一下。由于篇幅有限，下面介绍的方法中涉及到的细节感兴趣的可以移步到论文中查看。论文地址：https://arxiv.org/abs/1908.00709 1. Introduction 以往的模阅读全文

posted @ 2020-02-11 12:01 marsggbo 阅读(1876) 评论(0) 推荐(2)

[置顶] 【AutoML机器学习】公众号推荐

摘要：特大喜讯！！！本专栏开通了同步更新的微信公众号【AutoML机器学习】，不常用知乎的小伙伴们欢迎关注，一起学习！！！阅读全文

posted @ 2020-01-28 18:28 marsggbo 阅读(700) 评论(2) 推荐(1)

[置顶] 计算机四级网络工程师等级考试题库软件---百度云分享

摘要：做件好事，考四级的兄弟们一起共勉~~~ 链接：https://pan.baidu.com/s/1im4BDVZofZbT9f5PZtsxdA 密码：9i5h 若链接失效请关注如下公众号，后台私信【计算机四级】即可获得更新链接。微信公众号：AutoML机器学习 MARSGGBO♥原创如有意合作或阅读全文

posted @ 2018-03-08 10:54 marsggbo 阅读(4900) 评论(0) 推荐(0)

[置顶] DeepLearning.ai学习笔记汇总

摘要：第一章神经网络与深度学习(Neural Network & Deeplearning) "DeepLearning.ai学习笔记（一）神经网络和深度学习 Week3浅层神经网络" "DeepLearning.ai学习笔记（一）神经网络和深度学习 Week4深层神经网络" 第二章改善深层神经网络阅读全文

posted @ 2017-09-03 20:44 marsggbo 阅读(10352) 评论(1) 推荐(2)

[置顶] Coursera深度学习(DeepLearning.ai)编程题&笔记

摘要：因为是Jupyter Notebook的形式，所以不方便在博客中展示，具体可在我的github上查看。 github传送门 : "deeplearning.ai_JupyterNotebooks" 笔记传送门： "DeepLearning.ai课程相关系列笔记" 微信公众号：AutoML机器学习阅读全文

posted @ 2017-08-31 17:34 marsggbo 阅读(5964) 评论(0) 推荐(0)

[置顶] Andrew Ng机器学习课程笔记--汇总

摘要：笔记总结，各章节主要内容已总结在标题之中 "Andrew Ng机器学习课程笔记–week1(机器学习简介&线性回归模型)" "Andrew Ng机器学习课程笔记 week2(多元线性回归&正规公式）" "Andrew Ng机器学习课程笔记 week3(逻辑回归&正则化参数)" "Andrew Ng机阅读全文

posted @ 2017-08-25 18:28 marsggbo 阅读(5954) 评论(0) 推荐(3)

2026年5月16日

Eurosys26 | FineMoE如何用「细粒度」打破MoE推理的显存-延迟死局

摘要： layout: post title: "延迟降47%！FineMoE如何用「细粒度」打破MoE推理的显存-延迟死局" date: 2026-05-14 tags: [LLM, MoE, 论文解读, 推理优化, Expert Offloading] Eurosys26 | FineMoE如何用「细粒阅读全文

posted @ 2026-05-16 11:27 marsggbo 阅读(18) 评论(0) 推荐(0)

LoRA fine-tune吞吐量提升1.96倍！LoRAFusion如何把内存带宽浪费和pipeline bubble一起干掉

摘要： layout: post title: "LoRA fine-tune吞吐量提升1.96倍！LoRAFusion如何把内存带宽浪费和pipeline bubble一起干掉" date: 2026-05-14 tags: [LLM, LoRA, 训练优化, Kernel Fusion, 分布式训练, 阅读全文

posted @ 2026-05-16 11:27 marsggbo 阅读(4) 评论(0) 推荐(0)

Fast26 | LLM 推理启动慢？华为用一个「可编程 Page Cache」把模型加载砍了 79%

摘要： layout: post title: "LLM 推理启动慢？华为用一个「可编程 Page Cache」把模型加载砍了 79%" date: 2026-05-14 tags: [LLM, 推理优化, 系统, 论文解读, FAST] LLM 推理启动慢？华为用一个「可编程 Page Cache」把模型阅读全文

posted @ 2026-05-16 11:26 marsggbo 阅读(9) 评论(0) 推荐(0)

KV Cache 的两层存储到底卡在哪？FAST'26 这篇论文给出了答案

摘要： layout: post title: "KV Cache 的两层存储到底卡在哪？FAST'26 这篇论文给出了答案" date: 2026-05-14 tags: [LLM, KV Cache, 论文解读, 系统优化, FAST] KV Cache 的两层存储到底卡在哪？FAST'26 这篇论文给阅读全文

posted @ 2026-05-16 11:26 marsggbo 阅读(14) 评论(0) 推荐(0)

2026年5月10日

NeurIPS24 | 把Dense LLM变身MoE还提速

摘要：把 Dense LLM 变成 MoE 还能推理提速？NeurIPS 2024 Read-ME 做到了原文：Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design 1. 前言做阅读全文

posted @ 2026-05-10 16:28 marsggbo 阅读(22) 评论(0) 推荐(0)

ICML25 | EPIC：KV Cache 复用的「编译-链接」范式（附可运行代码复现）

摘要：说人话理解 EPIC：KV Cache 复用的「编译-链接」范式（附可运行代码复现）原文：EPIC: Efficient Position-Independent Caching for Serving Large Language Models 1. 前言你有没有想过，当你用 RAG 系统给阅读全文

posted @ 2026-05-10 16:27 marsggbo 阅读(22) 评论(0) 推荐(0)

2026年4月29日

MoE 推理的内存墙，被一块多芯粒芯片打穿了？

摘要：今天想和大家聊聊这篇来自港科大的工作 —— Expert Streaming，最近在 arXiv 上出现，是少见的从芯片架构角度直接解决 MoE 推理内存瓶颈的硬核工作。先交代下背景：MoE 火是真的火，DeepSeek、Qwen3 都在往 MoE 走，但我们自己跑的时候，却结结实实踩了个大坑 — 阅读全文

posted @ 2026-04-29 15:35 marsggbo 阅读(31) 评论(0) 推荐(0)

KV Cache 复用的第三条路：FAST 2026 CacheSlide 是怎么解决 Agent 推理的位置漂移问题的

摘要：原文：CacheSlide: Unlocking Cross Position-Aware KV Cache Reuse for Accelerating LLM Serving 1. 前言：两种方案都不够用作为一个天天和 LLM 推理打交道的牛马，我对 KV Cache 这个话题有复杂感情——它阅读全文

posted @ 2026-04-29 15:35 marsggbo 阅读(58) 评论(0) 推荐(0)

KVCOMM：让多 Agent 系统的 KV Cache 真正“通起来”，TTFT 直接砍掉 7.8 倍

摘要：原文：KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems（Duke / MIT / NVIDIA，OpenReview 投稿）代码：https://githu 阅读全文

posted @ 2026-04-29 15:33 marsggbo 阅读(50) 评论(0) 推荐(0)

2026年4月26日

NSDI26 | DroidSpeak让不同 LLM 之间共享 KV Cache

摘要：原文：DroidSpeak: KV Cache Sharing for Cross-LLM Communication and Multi-LLM Serving 1. 前言：一个很自然但从没人解决过的问题 KV Cache 共享这件事，在单个模型的场景里已经做得很成熟了——vLLM 的 prefi 阅读全文

posted @ 2026-04-26 15:11 marsggbo 阅读(45) 评论(0) 推荐(0)

互道晚安，王者峡谷见

公告