摘要: 现有服务框架和静态压缩技术不能适配负载的波动。服务框架全精度时违反slo(请求变慢或被丢弃),静态压缩在部署前固定,所以长期精度下降,不能在请求下降时恢复高精度 基于形态自适应,实时监控系统负载, 并根据内存压力动态调整模型组件(transformer层和KVC模块) workload变大 : 将部 阅读全文
posted @ 2025-07-29 22:49 拾墨、 阅读(8) 评论(0) 推荐(0)
摘要: sample : 将脑子中的想法转变成真的语言 #examples/offline_inference/simple_profiling.py #LLM 类用于加载和执行模型,SamplingParams 用于设置采样参数 from vllm import LLM, SamplingParams # 阅读全文
posted @ 2025-05-16 23:33 拾墨、 阅读(169) 评论(0) 推荐(0)
摘要: \(v_{-1} = x_1=2\) 自动微分最简单实现 : 自动微分本质是在计算的时候能自动求出梯度。所以每次两个函数进行运算的时候,重载那个运算符,完成自动计算梯度 import math class DualNumber: def __init__(self, val, grad): self 阅读全文
posted @ 2025-05-14 21:43 拾墨、 阅读(13) 评论(0) 推荐(0)
摘要: 举例 : MNIST 识别手写数字 1. Hypothesis Class(我们选择的模型结构) ŷ = softmax(W · x + b) x = [0.0, 0.1, 0.8, ..., 0.0] ← 共 784 个数(784个像素点,原始图像根据每个像素点的亮度给每个像素点一个0-255的 阅读全文
posted @ 2025-05-14 11:09 拾墨、 阅读(33) 评论(0) 推荐(0)
摘要: server 将请求传给pos,pos接收的函数是pos_process int POSWorkspace::pos_process( uint64_t api_id, //客户端调用的api pos_client_uuid_t uuid, //客户端的uuid std::vector<POSAPI 阅读全文
posted @ 2025-04-05 23:54 拾墨、 阅读(14) 评论(0) 推荐(0)
摘要: 我们继续追踪 pos_cli --dump --dir /root/ckpt --pid [your program pid] 的checkpoint阶段 phos的checkpoint在handle_dump函数(pos/cli/src/dump.cpp)中实现 函数开始阶段定义各种变量和初始化 阅读全文
posted @ 2025-03-17 14:19 拾墨、 阅读(29) 评论(0) 推荐(0)
摘要: 追踪pos_cli --dump --dir /root/ckpt --pid [your program pid] 是如何运行的 pos_cli是通过mason,由sources包括的这些文件构建而来 #pos/cli/meson.build project_name = 'phoenix_os_ 阅读全文
posted @ 2025-03-11 18:49 拾墨、 阅读(31) 评论(0) 推荐(0)
摘要: If At First You Don’t Succeed, Try, Try, Again...? Insights and LLM-informed Tooling for Detecting Retry Bugs in Software Systems (sosp24) https://dl. 阅读全文
posted @ 2024-12-23 01:11 拾墨、 阅读(29) 评论(0) 推荐(0)
摘要: 论文链接 : https://openreview.net/pdf?id=Rp8R9C0Sth 论文github repo : https://github.com/xuewuyinhe/AutoOS 我与chatgpt关于这篇论文的对话(自用) : https://chatgpt.com/c/67 阅读全文
posted @ 2024-12-08 23:50 拾墨、 阅读(41) 评论(0) 推荐(0)
摘要: 伙伴系统(buddy system) 当一个请求需要分配m个物理页,buddy system会寻找一个有\(2^n\)页的块(\(2^n-1 < m < 2^n\))分配给他。 我们使用一个空闲链表数组实现buddy system,其中a[i]代表块大小为\(2^i个页\)(每页为4kb) 假设我们 阅读全文
posted @ 2024-11-02 14:51 拾墨、 阅读(76) 评论(0) 推荐(0)