云岛夜川川 - 博客园

2025年12月11日

摘要：第 1 阶段：Embedding 和位置编码详解概述 Transformer 模型的第一步是将离散的 token（例如，单词的索引）转换为密集的向量表示。这个过程包括两个关键部分： Embedding 层：将整数索引映射到高维向量位置编码：添加位置信息，因为自注意力机制是排列不变的为什么需要阅读全文

posted @ 2025-12-11 10:06 云岛夜川川阅读(22) 评论(0) 推荐(0)

2025年12月7日

大模型算法学习

摘要：基础知识一、NLP基础知识 1.词嵌入模型 2.序列模型二、Transformer基础见文章：https://zhuanlan.zhihu.com/p/338817680 面试：https://ai.feishu.cn/docx/YGS9dX0mUov1tvxf9cwcgfk5nQe?from 阅读全文

posted @ 2025-12-07 12:42 云岛夜川川阅读(9) 评论(0) 推荐(0)

2025年5月21日

夸克扫描生成的pdf去除水印

摘要：扫描后的文档会直接保存为pdf在网盘，然后在网盘中打开该pdf文件，直接编辑就可以删除夸克水印（88vip）阅读全文

posted @ 2025-05-21 10:06 云岛夜川川阅读(569) 评论(0) 推荐(0)

2025年4月16日

最全RAG技术详解

摘要：一什么是RAG技术 RAG（retrieval Augmented generation) ，中文检索增强技术。因为LLM在生成答案的时候可能会胡说八道，缺少专业知识，RAG技术可以连通LLM与外部数据，使得LLM的generation 中的答案来源于外部资源，保证答案的准确性。最早出自于202 阅读全文

posted @ 2025-04-16 22:03 云岛夜川川阅读(598) 评论(0) 推荐(0)

2025年4月14日

如何将 Mistral OCR 应用于RAG 模型

摘要：如何将 Mistral OCR 应用于您的下一个 RAG 模型检索增强生成（RAG）系统已成为 AI 模型的重要组成部分，能够访问大量相关数据并提供更为全面和上下文敏感的响应。然而，它们的能力主要局限于数字文本，忽视了多模态格式中的有价值信息，例如扫描的文档、图像和手写笔记。Mistral OCR 阅读全文

posted @ 2025-04-14 18:22 云岛夜川川阅读(183) 评论(0) 推荐(0)

2025年4月8日

解决hugging face 下载预训练模型方法

摘要：一，前言当使用下面类似的代码时，模型会自动下载或加载 • 先检查本地缓存 SentenceTransformer 首先检查本地缓存目录（如 ~/.cache/huggingface/transformers）是否已存在 embedding_model_name 指定的预训练模型。阅读全文

posted @ 2025-04-08 17:06 云岛夜川川阅读(1746) 评论(0) 推荐(0)

2025年3月11日

服务器常见操作及问题解决

摘要：修改密码 passwd 查看GPU状态最常用的方法是使用NVIDIA自带的nvidia-smi工具。首先确保已经安装了NVIDIA驱动以及CUDA工具包（如果需要的话）。然后，你可以通过终端运行以下命令来查看GPU的状态： nvidia-smi 这将显示关于你的NVIDIA GPU的详细信息，包括阅读全文

posted @ 2025-03-11 11:34 云岛夜川川阅读(94) 评论(0) 推荐(0)

2025年2月20日

论文阅读：2025-LogGzip: 基于无损压缩的日志解析

摘要：论文标题： LogGzip: 基于无损压缩的日志解析摘要：对来自物联网（IoT）设备的复杂日志进行自动化分析，有助于故障诊断和系统状态监控。日志解析是此过程的第一步，它将原始日志转换为结构化数据。由于物联网系统日志的庞大规模和复杂结构，解析器必须有效地处理各种日志格式。监督学习解析器需要大量的人阅读全文

posted @ 2025-02-20 17:38 云岛夜川川阅读(367) 评论(0) 推荐(0)

论文复现：LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models

摘要： LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models（可以）代码链接：https://github.com/zeyang919/LibreLog 提出的Li 阅读全文

posted @ 2025-02-20 15:45 云岛夜川川阅读(154) 评论(0) 推荐(0)

论文复现：LILAC: Log Parsing using LLMs with Adaptive Parsing Cache（LILAC：使用 LLM 和自适应解析缓存的日志解析）

摘要：代码链接：https://github.com/logpai/LILAC 模型框架： LILAC（Log parsIng framework using LLMs with Adaptive parsing Cache）是一个使用大型语言模型 (LLM) 结合自适应解析缓存的日志解析框架。该框架主要阅读全文

posted @ 2025-02-20 15:15 云岛夜川川阅读(350) 评论(0) 推荐(0)

iruan

公告