会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
algoshimo
青青子衿,悠悠我心 但为君故,沉吟至今
博客园
首页
新随笔
联系
订阅
管理
2025年7月29日
morphserve
摘要: 现有服务框架和静态压缩技术不能适配负载的波动。服务框架全精度时违反slo(请求变慢或被丢弃),静态压缩在部署前固定,所以长期精度下降,不能在请求下降时恢复高精度 基于形态自适应,实时监控系统负载, 并根据内存压力动态调整模型组件(transformer层和KVC模块) workload变大 : 将部
阅读全文
posted @ 2025-07-29 22:49 拾墨、
阅读(8)
评论(0)
推荐(0)
2025年5月16日
vllm 整体架构
摘要: sample : 将脑子中的想法转变成真的语言 #examples/offline_inference/simple_profiling.py #LLM 类用于加载和执行模型,SamplingParams 用于设置采样参数 from vllm import LLM, SamplingParams #
阅读全文
posted @ 2025-05-16 23:33 拾墨、
阅读(169)
评论(0)
推荐(0)
2025年5月14日
自动微分
摘要: \(v_{-1} = x_1=2\) 自动微分最简单实现 : 自动微分本质是在计算的时候能自动求出梯度。所以每次两个函数进行运算的时候,重载那个运算符,完成自动计算梯度 import math class DualNumber: def __init__(self, val, grad): self
阅读全文
posted @ 2025-05-14 21:43 拾墨、
阅读(13)
评论(0)
推荐(0)
机器学习基本范式
摘要: 举例 : MNIST 识别手写数字 1. Hypothesis Class(我们选择的模型结构) ŷ = softmax(W · x + b) x = [0.0, 0.1, 0.8, ..., 0.0] ← 共 784 个数(784个像素点,原始图像根据每个像素点的亮度给每个像素点一个0-255的
阅读全文
posted @ 2025-05-14 11:09 拾墨、
阅读(33)
评论(0)
推荐(0)
2025年4月5日
pos如何从xpu中接受请求
摘要: server 将请求传给pos,pos接收的函数是pos_process int POSWorkspace::pos_process( uint64_t api_id, //客户端调用的api pos_client_uuid_t uuid, //客户端的uuid std::vector<POSAPI
阅读全文
posted @ 2025-04-05 23:54 拾墨、
阅读(14)
评论(0)
推荐(0)
2025年3月17日
phos 的 checkpoint
摘要: 我们继续追踪 pos_cli --dump --dir /root/ckpt --pid [your program pid] 的checkpoint阶段 phos的checkpoint在handle_dump函数(pos/cli/src/dump.cpp)中实现 函数开始阶段定义各种变量和初始化
阅读全文
posted @ 2025-03-17 14:19 拾墨、
阅读(29)
评论(0)
推荐(0)
2025年3月11日
pos_cli 命令是如何运行起来的
摘要: 追踪pos_cli --dump --dir /root/ckpt --pid [your program pid] 是如何运行的 pos_cli是通过mason,由sources包括的这些文件构建而来 #pos/cli/meson.build project_name = 'phoenix_os_
阅读全文
posted @ 2025-03-11 18:49 拾墨、
阅读(31)
评论(0)
推荐(0)
2024年12月23日
llm4sys
摘要: If At First You Don’t Succeed, Try, Try, Again...? Insights and LLM-informed Tooling for Detecting Retry Bugs in Software Systems (sosp24) https://dl.
阅读全文
posted @ 2024-12-23 01:11 拾墨、
阅读(29)
评论(0)
推荐(0)
2024年12月8日
Autoos
摘要: 论文链接 : https://openreview.net/pdf?id=Rp8R9C0Sth 论文github repo : https://github.com/xuewuyinhe/AutoOS 我与chatgpt关于这篇论文的对话(自用) : https://chatgpt.com/c/67
阅读全文
posted @ 2024-12-08 23:50 拾墨、
阅读(41)
评论(0)
推荐(0)
2024年11月2日
伙伴系统和slab分配器
摘要: 伙伴系统(buddy system) 当一个请求需要分配m个物理页,buddy system会寻找一个有\(2^n\)页的块(\(2^n-1 < m < 2^n\))分配给他。 我们使用一个空闲链表数组实现buddy system,其中a[i]代表块大小为\(2^i个页\)(每页为4kb) 假设我们
阅读全文
posted @ 2024-11-02 14:51 拾墨、
阅读(76)
评论(0)
推荐(0)
下一页
公告