入职前知识地图

一、大数据开发需要掌握的技能:离线开发

  1. Hadoop:理解 HDFS、YARN、MapReduce 原理,熟悉 Hive 使用和优化
  2. Spark:掌握 Spark Core、Spark SQL,熟悉 RDD、DataFrame/Dataset API、pyspark,了解执行计划和调优
  3. 数据仓库建模:掌握维度建模(星型模型、雪花模型)、事实表、维度表等概念,了解数据分层(ODS、DWD、DWS、ADS)。可参考《阿里巴巴大数据之路》
  4. 调度系统:了解一种调度工具(如 Airflow),能编写和维护 DAG
  5. 性能调优:执行计划分析、资源分配优化、存储格式选择、分区分桶、shuffle
  6. 数据治理:元数据管理、数据血缘追踪、数据质量监控
  7. ETL 处理、数据分析

二、算法岗位需要掌握的技能:

  1. 熟悉线性代数、概率论等核心理论,掌握梯度下降、动态规划等最优化理论;
  2. 掌握神经网络原理,前向反向传播、激活函数、正则化方法等;
  3. 掌握 CNN、RNN/LSTM、Transformer 等经典模型架构;
  4. 掌握 python、C++(可选)核心编程语言,熟练使用 pycharm、jupyter 等工具;
  5. 熟练使用 numpy、pandas、matplotlib、sklearn 等基础库;
  6. 熟练使用 pytorch、tensorflow 深度学习主流框架;
  7. 学习 PID、MPC、RL 等控制算法;

做雷达信号处理的关注 WiFi 通感一体,基于声波的 FMCW 处理
做硬件的关注行业低算力 AI 芯片,高主频类 AI 的 mcu 芯片的行业现状
做控制算法的关注 MPC, RL 等控制算法

周次主题方向天数每日核心内容(对应标题) 学习目标
第 1 周基础电路夯实(元件→电路图→PCB)掌握元件特性、电路图阅读、PCB 基础规则,建立电路思维
Day1 二极管 / 三极管原理(《二极管:模拟电路钥匙》《三极管过时了吗》)
Day2 MOS 管深度(《 PMOS/NMOS 区别 》《 芯片输入电容 》)低端驱动与高端驱动
Day3 电容 / 电感(《 电容种类 》《 电源纹波 》《电感突变》)
Day4 电路图 / 协议(《读懂电路图》《 UART vs I2C 》《单片机 I2C 通信》)
Day5 PCB 设计(《PCB 走线电流》《PCB 打样变迁》《高速 PCB 阻抗》)
第 2 周芯片与智能硬件(处理器→单片机→AI)理解芯片分工、单片机开发流程,接触 AI 硬件部署
Day6 处理器对比(《CPU/GPU/NPU 区别》《NPU 加速》《AI 芯片架构》)
Day7 单片机入门(《FreeRTOS 多线程》《Arduino 引脚》《esp32 优势》)
Day8 单片机进阶(《I2C 通信下》《LVGL 图形界面》《单片机避坑》)
Day9 AI 硬件(《YOLO 小相机》《单片机人脸识别》《YOLO 迁移学习》)
Day10 芯片实践(《电源芯片 1117》《MOS 理想二极管》《栅极电阻》)
第 3 周电机与电源(电机→电源原理→改造)掌握电机驱动、电源拓扑,学会电源设计与改造
Day11 电机基础(《步进电机顺滑》《无刷电机 FOC》《太阳能电池》)
Day12 电源原理(《开关电源》《反激电源》《LDO 优劣》)
Day13 电源转换(《升压 5V→12V》《DCDC vs LDO》《纹波测量》)
Day14 电源改造(《充电器原理》《220V→5V 无变压器》《太阳能充电》)
Day15 电源实践(《电源模块对比》《滤波纹波》《电容滤波》)
第 4 周实践与工具(工具→项目→调试)熟练工具使用,独立完成项目,解决实际问题,规划职业方向
Day16 示波器(《示波器选型》《带宽采样》《平板测电流》)
Day17 工具进阶(《电烙铁选择》《可调电源评测》《电子显微镜》)
Day18 制作项目(《平衡车制作》《移动电竞房》《键盘改造》)
Day19 实践技巧(《SMT 自制 vs 代工》《纹波调试》《3D 打印缺点》)
Day20 综合应用(《按键长 / 短按》《电子就业避坑》《硬件工具推荐》)

我的任务


"做硬件的关注行业低算力 AI 芯片,高主频类 AI 的 MCU 芯片的行业现状"

DeepSeek 建议:以下是追踪 TinyML 领域前沿成果的核心平台与资源,覆盖学术研究、工业界动态及开源社区,按优先级排序:

一、顶级学术会议/期刊(最新研究风向标)

  1. 会议论文

    • MLSys:系统级优化顶会(模型压缩/硬件协同设计)
    • IEEE AICAS(低功耗 AI 电路与系统)
    • ISCA/MICRO(芯片架构创新,如存算一体)
    • CVPR/ICCV-Edge AI Workshop(轻量 CV 模型)

    获取方式arXiv(搜索关键词 TinyMLEdge AIMCU NN)+ ACL Anthology(NLP 轻量化)

  2. 期刊

    • IEEE Journal on Emerging Topics in Computing(TinyML 专题)
    • ACM Transactions on Embedded Computing Systems(部署优化)

二、工业界技术发布平台

  1. 芯片厂商官网

  2. 开发者博客

    • TensorFlow Lite Micro官方博客(量化/算子优化更新)
    • Edge Impulse工程实践(端到端部署案例)
    • Arduino ML项目库(实际硬件性能数据)

三、开源社区与代码库(实战前沿)

  1. GitHub 趋势项目
仓库名 亮点 链接
TinyEngine MIT Han Lab 模型编译器(支持<128KB 内存) mit-han-lab/tinyengine
microTVM Apache TVM 的 MCU 部署后端 apache/tvm
TFLite-Micro-Arduino Arduino Nano 33 BLE Sense 部署模板 tensorflow/tflite-micro-arduino-examples
TinyMLPerf 边缘设备推理基准测试 mlcommons/tiny
  1. Kaggle 竞赛
    • 搜索关键字 "TinyML""Edge AI"(如 Low-Power Computer Vision Challenge

四、垂直媒体与行业联盟

  1. 资讯门户

  2. 标准组织


五、社交平台与活动

  1. Twitter/X 账号

    • @petewarden(TensorFlow Lite Micro 创始人)
    • @viksit(TinyML 社区 KOL)
    • @EdgeImpulse(工具链更新速报)
  2. 线下活动

    • TinyML Summit(年度峰会,官网视频存档
    • Embedded Vision Summit(工业级方案展示)

高效追踪策略

  1. 论文预警:在 Papers With Code 设置 TinyML 关键词订阅
  2. 代码监控:GitHub 关键词 topic:tinyml + stars:>100(过滤高价值项目)
  3. 聚合订阅

重点关注方向(2024 热点)

  • Transformer 轻量化(MobileViTv3, NanoGPT)
  • 神经拟态芯片部署(Intel Loihi 2 实践)
  • 安全联邦学习(TinyFL 框架)
  • 能量收集设备(无电池 TinyML 系统)

通过上述渠道,可系统性掌握从学术突破(如亚毫瓦芯片设计)到工程技巧(模型量化误差修正)的全链路进展。


智能语音交互芯片选型研发学习路径

一、行业认知建立学习路径(第 1 周,每日 1-2 小时)

学习阶段 学习内容 实践任务 参考来源
行业现状 智能家居语音交互市场趋势(万亿规模,20-25%年增长)及技术痛点(多设备协同、噪声抑制) 分析海尔智家 App 技术需求(无感交互、跨设备联动) 行业白皮书/海尔技术文档
芯片架构 端侧 AI 芯片核心指标:算力 (TOPS/GOPs)、能效比 (TOPS/W)、音频通路 (48kHz/32bit)、延迟 (ms 级) 对比炬芯 ATS323X( 100GOPS@6.4TOPS /W)与竞品参数 芯片 datasheet/评测报告
语音方案 低功耗设计(待机 0.1W)及噪声抑制技术(95%环境声屏蔽) Python 模拟双麦波束形成降噪算法 声学处理论文/开源项目
系统集成 空调场景语音方案架构(麦克风阵列→DSP 预处理→NPU 意图识别→空调控制) 用 C 语言实现串口协议模拟空调指令下发 海尔空调通信协议文档

二、关键技术深入与实践计划(第 2-4 周)

关键技术 1:端侧 AI 芯片架构与选型标准

学习重点

  • NPU/DSP 异构设计(如炬芯 ATS323X 的 NPU+HiFi5 DSP 架构)
  • 算力与能效评估(6.4TOPS/W 能效比 vs 空调功耗约束)
  • 接口扩展性(SPI/QSPI 屏驱集成、多麦克风支持)
  • 功能安全(车规级 ASIL-B 标准在家电的适用性)

实践计划

# 芯片选型评估模型示例
def chip_evaluation(throughput, power, cost, safety):
    score = 0.4*throughput + 0.3*(1/power) + 0.2*(1/cost) + 0.1*safety 
    return score

# 测试炬芯ATS323X vs 竞品
print("炬芯ATS323X评分:", chip_evaluation(100, 1.5, 8, 0.8))
print("竞品A评分:", chip_evaluation(120, 2.2, 6, 0.6))

关键技术2:低功耗语音处理与降噪算法

学习重点

  • 音频预处理链(AEC/AGC/ANS算法链)
  • 环境噪声抑制(人声分离95%效能)
  • 低功耗唤醒(0.1W待机技术)
  • 响应优化(打断响应≤340ms,对话延迟≤650ms)

实践计划

  1. 第1步:用Python实现基于RNN的VAD(语音活动检测)
  2. 第2步:在STM32开发板部署开源降噪库(如RNNoise)
  3. 第3步:测试不同信噪比(SNR)下的唤醒率

关键技术3:多模态交互与意图理解框架

学习重点

  • NLU与多模态融合(VLM视觉大模型+NLU语音)
  • 上下文理解(多设备联动逻辑)
  • 个性化适应(AI双系统分控技术)
  • 边缘优化(轻量化模型端侧部署策略)

实践计划

// 模拟空调指令理解框架
void parse_command(const char* text) {
    if(strstr(text, "调高温度")) set_temperature(+1);
    else if(strstr(text, "节能模式")) set_mode(ECO_MODE); 
    // 扩展:结合传感器数据(如OMS人员定位)
}

三、系统集成与选型实践(第3-4周)

1、 搭建模拟环境

  • 用树莓派+USB麦克风模拟空调控制板
  • 集成开源语音引擎(ESPHome-Respeaker Lite)

2、 关键场景测试

  • 高噪声环境(风扇声覆盖)下的唤醒率
  • 多指令并发("调至26度并开启节能")解析正确率

3、选型决策矩阵

指标 权重 炬芯 ATS323X 高通方案 芯驰 X9SP
算力密度 30% ★★★★☆ (100GOPS) ★★★★★ ★★★★☆
功耗 25% ★★★★★ (6.4TOPS/W) ★★★★☆ ★★★☆☆
多模态支持 20% ★★★☆☆ ★★★★★ ★★★★☆
成本 15% ★★★★☆ ★★★☆☆ ★★☆☆☆
开发周期 10% ★★★★★ (开源SDK) ★★★★☆ ★★★☆☆

四、学习资源推荐

1、硬件平台

  • 声网对话式 AI 开发套件(BK7258 芯片+全面开源)这个是基于网络计算的 AI 一套 700 元左右
  • Respeaker Lite(ESP32+XMOS,支持 Home Assistant)

2、算法库

  • 降噪:WebRTC AEC3、RNNoise
  • NLU:Rasa 开源框架、高通端侧 LLM 优化方案

3、行业报告

  • 金辑奖获奖方案(域控制器技术)
  • 智能家居落地案例(无感交互设计)

学习提示:从C语言切入芯片底层驱动开发(如麦克风I2S接口配置),再用Python构建算法仿真模型。重点培养芯片算力-功耗权衡评估能力多模态场景抽象能力

posted @ 2025-07-30 20:59  互联网虚拟人物  阅读(26)  评论(0)    收藏  举报