Ziy🐏の小窝

Loading...
摘要: 入门教学(虽然本人可能还算不上入门) 一、基础篇(下面两点可并行学习) 1、了解神经网络 首推台大李宏毅课程,李宏毅老师的课程偏理论部分,但是背后的数学逻辑讲解的很细致,可以挑着看,基础过完会对神经网络有一定的理解后可以挑后面的复杂神经网络看,尤其是Transformer。 了解完神经网络后可以看李 阅读全文
posted @ 2026-03-16 23:05 ziy_123 阅读(21) 评论(0) 推荐(0)
摘要: SmolVLM-500M模型部署思路 一、模型结构 详情见上篇博客 二、模型部署任务 初步打算FPGA做端侧加速,主体模型框架部署在PS端,权重数据部分固化在PL侧,其余部分仿真ps的ddr通过AXI总线传输。 任务一 部署PS侧框架,参考llama.cpp的demo,可以支持python/c语言等 阅读全文
posted @ 2026-03-12 17:01 ziy_123 阅读(10) 评论(0) 推荐(0)
摘要: SmolVLM-256M-Instruct 一、模型结构 视觉模型 (Vision Model): Idefics3VisionTransformer (一个类似 ViT 的结构),负责将输入图像编码成一系列视觉特征向量。 连接器 (Connector): Idefics3Connector (包含 阅读全文
posted @ 2026-03-09 16:17 ziy_123 阅读(8) 评论(0) 推荐(0)
摘要: 一、带宽怎么测 将之前的Block0的.bit和.hwh传输到开发板。 首先Jupyter执行以下命令可以打印block0.bit包含的IP有哪些。 from pynq import Overlay overlay = Overlay("block0.bit") print(overlay.ip_d 阅读全文
posted @ 2026-03-07 22:06 ziy_123 阅读(12) 评论(0) 推荐(0)
摘要: 参考链接 任意边缘设备部署大语言模型 一、部署模型 step.01:从github仓库下载llama.cpp项目源码 git clone https://github.com/ggml-org/llama.cpp step.02:编译llama.cpp项目源码 cmake -B build cmak 阅读全文
posted @ 2026-03-07 21:30 ziy_123 阅读(15) 评论(0) 推荐(1)
摘要: 参考链接 一、官网烧录ubuntu镜像,最好是Ubuntu Desktop 20.04.3 LTS 镜像下载选择zynq-ultrascale,找到zcu102,下载完成解压。 然后使用Win32DiskImage制作镜像写入到SD卡。 之后需要将开发板通过网口连接到电脑,需要修改对应网卡的子网掩码 阅读全文
posted @ 2026-03-05 21:01 ziy_123 阅读(45) 评论(0) 推荐(0)
摘要: Attention的IP核FPGA验证 1、创建工程,生成HLS对应IP核 添加ip代码文件 ./src文件夹下是注意力计算IP的所有的子模块,包括所需Softmax,layernorm等,全部添加到工程内,然后加入该目录下的文件./case/ATTN0.cpp。这个模块是第一层注意力机制模块对应的 阅读全文
posted @ 2026-01-07 14:56 ziy_123 阅读(76) 评论(0) 推荐(0)