摘要: 第 1 阶段:Embedding 和位置编码详解 概述 Transformer 模型的第一步是将离散的 token(例如,单词的索引)转换为密集的向量表示。这个过程包括两个关键部分: Embedding 层:将整数索引映射到高维向量 位置编码:添加位置信息,因为自注意力机制是排列不变的 为什么需要 阅读全文
posted @ 2025-12-11 10:06 云岛夜川川 阅读(22) 评论(0) 推荐(0)
摘要: 基础知识 一、NLP基础知识 1.词嵌入模型 2.序列模型 二、Transformer基础 见文章:https://zhuanlan.zhihu.com/p/338817680 面试:https://ai.feishu.cn/docx/YGS9dX0mUov1tvxf9cwcgfk5nQe?from 阅读全文
posted @ 2025-12-07 12:42 云岛夜川川 阅读(9) 评论(0) 推荐(0)
摘要: 扫描后的文档会直接保存为pdf在网盘,然后在网盘中打开该pdf文件,直接编辑就可以删除夸克水印(88vip) 阅读全文
posted @ 2025-05-21 10:06 云岛夜川川 阅读(569) 评论(0) 推荐(0)
摘要: 一 什么是RAG技术 RAG(retrieval Augmented generation) ,中文检索增强技术。因为LLM在生成答案的时候可能会胡说八道,缺少专业知识,RAG技术可以连通LLM与外部数据,使得LLM的generation 中的答案来源于外部资源,保证答案的准确性。 最早出自于202 阅读全文
posted @ 2025-04-16 22:03 云岛夜川川 阅读(598) 评论(0) 推荐(0)
摘要: 如何将 Mistral OCR 应用于您的下一个 RAG 模型 检索增强生成(RAG)系统已成为 AI 模型的重要组成部分,能够访问大量相关数据并提供更为全面和上下文敏感的响应。然而,它们的能力主要局限于数字文本,忽视了多模态格式中的有价值信息,例如扫描的文档、图像和手写笔记。Mistral OCR 阅读全文
posted @ 2025-04-14 18:22 云岛夜川川 阅读(183) 评论(0) 推荐(0)
摘要: 一,前言 当使用下面类似的代码时, 模型会自动下载或加载 ​​ • ​​先检查本地缓存​​ SentenceTransformer 首先检查本地缓存目录(如 ~/.cache/huggingface/transformers)是否已存在 embedding_model_name 指定的预训练模型。 阅读全文
posted @ 2025-04-08 17:06 云岛夜川川 阅读(1746) 评论(0) 推荐(0)
摘要: 修改密码 passwd 查看GPU状态 最常用的方法是使用NVIDIA自带的nvidia-smi工具。首先确保已经安装了NVIDIA驱动以及CUDA工具包(如果需要的话)。然后,你可以通过终端运行以下命令来查看GPU的状态: nvidia-smi 这将显示关于你的NVIDIA GPU的详细信息,包括 阅读全文
posted @ 2025-03-11 11:34 云岛夜川川 阅读(94) 评论(0) 推荐(0)
摘要: 论文标题: LogGzip: 基于无损压缩的日志解析 摘要: 对来自物联网(IoT)设备的复杂日志进行自动化分析,有助于故障诊断和系统状态监控。日志解析是此过程的第一步,它将原始日志转换为结构化数据。由于物联网系统日志的庞大规模和复杂结构,解析器必须有效地处理各种日志格式。监督学习解析器需要大量的人 阅读全文
posted @ 2025-02-20 17:38 云岛夜川川 阅读(367) 评论(0) 推荐(0)
摘要: LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models(可以) 代码链接:https://github.com/zeyang919/LibreLog 提出的Li 阅读全文
posted @ 2025-02-20 15:45 云岛夜川川 阅读(154) 评论(0) 推荐(0)
摘要: 代码链接:https://github.com/logpai/LILAC 模型框架: LILAC(Log parsIng framework using LLMs with Adaptive parsing Cache)是一个使用大型语言模型 (LLM) 结合自适应解析缓存的日志解析框架。该框架主要 阅读全文
posted @ 2025-02-20 15:15 云岛夜川川 阅读(350) 评论(0) 推荐(0)