08 2025 档案
摘要:夏天过去了,我什么也没有做成。 每天都有空,每天都没事做。 看似路千条,实则没一条路走得通。
阅读全文
摘要:本文包含多个mermaid示意图,有助于理解音频系统的设计思路、数据流向和各个组件之间的交互关系,可点击链接酌情查看。 整体架构:从硬件层到应用层的完整音频处理链路 数据流:音频数据的输入、处理、输出完整流程 状态机:应用的状态转换逻辑 任务交互:各个音频任务之间的协作关系 唤醒词检测:不同唤醒词检
阅读全文
摘要:在 xiaozhi-esp32 项目中,设备与服务器的通信是核心功能之一。为了实现灵活、可扩展的通信能力,项目通过抽象类 Protocol 定义了通信协议的通用接口,并基于不同的通信协议实现了不同的子类。 这里仅选取以基于 WebSocket 的 WebsocketProtocol 类为例,解析这两
阅读全文
摘要:结论: 在没激活任何 conda 环境时,pip install 装到哪取决于当前 shell 里 pip 指向的 Python(往往是系统 Python 或 conda base);激活别的环境后,这些包默认看不见。 在 conda 环境中,pip 与 pip3 没有任何区别,二者功能完全一致。
阅读全文
摘要:小智AI客户端的代码中存在以下这些task: 任务名称 入口函数 主要功能 优先级 栈大小 系统核心调度任务 Application::MainEventLoop() 系统核心调度任务 3 - audio_input AudioService::AudioInputTask() 音频输入处理 8 6
阅读全文
摘要:这两天阅读了小智ESP32客户端的main.cc、application.cc和application.h这三个文件,从这些文件可以看出系统大致的框架。 目录结构 xiaozhi-esp32/ ├── CMakeLists.txt # CMake构建配置 ├── docs/ # 文档目录 ├── m
阅读全文
摘要:一直区分不清楚熵、交叉熵、KL散度有什么区别和联系。 前几天特意理解了一下,记录下来,以后忘了方便再来复习。 熵(Entropy) 熵是单个概率分布的 “不确定性” 或 “混乱程度” 的度量。 对于离散随机变量X,假定其概率分布为 \(p(x)\),则它的熵定义为: \[H(p) = -\sum_{
阅读全文
摘要:最近像只没头苍蝇一样,没有了目标,做什么都是三心二意。 不能再这样下去了,感觉人生已经失控了。 从今天开始,每两天至少写一篇博客。 就写小智相关的吧,能派上用场的几率稍微大一点。
阅读全文
摘要:想象一下这样的场景:你买了一台小智AI设备,但是发现它只能显示简体中文。对于习惯使用繁体中文的用户来说,这就像买了一台只能显示英文的手机一样,使用起来很不方便。 具体问题: 设备收到LLM返回的简体中文消息,但用户希望看到繁体中文 用户的语音输入被显示为简体中文,但希望显示为繁体中文 系统提示信息都
阅读全文

浙公网安备 33010602011771号