摘要: 项目代码解读 # 官方库 import os import shutil import time from datetime import datetime import logging import pickle from glob import glob from typing import L 阅读全文
posted @ 2024-06-24 08:01 H1S96 阅读(133) 评论(0) 推荐(0)
摘要: LoRA LORA是一种低资源微调大模型方法,出自论文LoRA: Low-Rank Adaptation of Large Language Models。 使用LORA,训练参数仅为整体参数的万分之一、GPU显存使用量减少2/3且不会引入额外的推理耗时。 自然语言处理的一个重要范式包括对一般领域数 阅读全文
posted @ 2024-05-31 14:44 H1S96 阅读(167) 评论(0) 推荐(0)
摘要: 指令微调 指令微调(Instruction Tuning)是指使用自然语言形式的数据对预训练后的大语言模型进行参数微调。 微调适用的场景 通常来说,适合微调的场景主要分为行业场景和通用场景 对于行业场景: 例如客服助手,智能写作辅导等需要专门的回答范式和预期的场景 例如智慧医生,智慧律师等需要更专业 阅读全文
posted @ 2024-05-31 14:43 H1S96 阅读(280) 评论(0) 推荐(0)
摘要: { "predict_bleu-4": 96.00244754098361, "predict_rouge-1": 97.58144262295083, "predict_rouge-2": 96.16612295081967, "predict_rouge-l": 96.6987229508196 阅读全文
posted @ 2024-05-31 14:42 H1S96 阅读(224) 评论(0) 推荐(0)
摘要: 本次创新项目实训自三月开始,在今天中期检查之后对项目工作进行了回顾,下文对这段工作作简要总结。 项目选题其实我是比较犹豫,因为LLM此前的了解只有ChatGPT这种基本成熟的模型,而且也只是简单调用,对源码,接口的使用基本是未知,以我对其他成员的了解,基本也大差不差。因此项目前景堪忧。 当我开始研究 阅读全文
posted @ 2024-05-31 14:37 H1S96 阅读(158) 评论(0) 推荐(0)
摘要: 1 什么是Embedding 在大模型中,"embedding"指的是将某种类型的输入数据(如文本、图像、声音等)转换成一个稠密的数值向量的过程。 这些向量通常包含较多维度,每一个维度代表输入数据的某种抽象特征或属性。 Embedding 的目的是将实际的输入转化为一种格式,使得计算机能够更有效地处 阅读全文
posted @ 2024-05-31 09:01 H1S96 阅读(183) 评论(0) 推荐(0)
摘要: 今天主要讲langchain向量知识库解析文档的相关内容。 文档解析逻辑 UnstructuredFileLoader word读取 按照mode="single"来整个文档加载,如下有1个page_content: from langchain.document_loaders import Un 阅读全文
posted @ 2024-05-31 09:00 H1S96 阅读(207) 评论(0) 推荐(0)
摘要: 文档问答过程大概分为以下5部分,在Langchain中都有体现。 上传解析文档 文档向量化、存储 文档召回 query向量化 文档问答 这次主要讲langchain在文档embedding以及构建faiss过程时是怎么实现的。 源码入口 langchain中对于文档embedding以及构建fais 阅读全文
posted @ 2024-05-31 09:00 H1S96 阅读(142) 评论(0) 推荐(0)
摘要: RAG 检索增强生成(Retrieval Augmented Generation),简称 RAG。它通过从数据源中检索信息来辅助大语言模型(Large Language Model, LLM)生成答案。简而言之,RAG 结合了搜索技术和大语言模型的提示词功能,即向模型提出问题,并以搜索算法找到的信 阅读全文
posted @ 2024-05-31 08:34 H1S96 阅读(407) 评论(0) 推荐(0)
摘要: 参数说明 def main( prompt_text: str, system_prompt: str, top_p: float = 0.8, temperature: float = 0.95, repetition_penalty: float = 1.0, max_new_tokens: i 阅读全文
posted @ 2024-05-31 08:33 H1S96 阅读(88) 评论(0) 推荐(0)