上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 43 下一页
摘要: Python | json文件和jsonl文件 JSON 文件是使用 JSON(JavaScript Object Notation)格式存储数据的文件。它是一种结构化的文本格式,使用键值对的方式表示数据。 JSON 文件通常包含一个根对象,可以包含多个嵌套的对象、数组和基本数据类型。 而 JSON 阅读全文
posted @ 2024-02-01 15:39 michaelchengjl 阅读(6318) 评论(0) 推荐(0)
摘要: 快速生成 AI 应用的框架对比:Gradio、Streamlit 和 Dash https://zhuanlan.zhihu.com/p/611828558 https://blog.csdn.net/sinat_26917383/article/details/127949670 阅读全文
posted @ 2023-12-28 12:18 michaelchengjl 阅读(1116) 评论(0) 推荐(0)
摘要: 不同解码策略 https://www.cnblogs.com/miners/p/14950681.html https://blog.csdn.net/taoqick/article/details/123897960 https://zhuanlan.zhihu.com/p/442557114 阅读全文
posted @ 2023-11-22 16:02 michaelchengjl 阅读(20) 评论(0) 推荐(0)
摘要: huggingface下载的.arrow数据集读取与使用说明 from datasets import load_from_disk from datasets import load_dataset dataset_cnn = load_dataset("ccdv/cnn_dailymail", 阅读全文
posted @ 2023-11-21 16:58 michaelchengjl 阅读(1369) 评论(0) 推荐(1)
摘要: NLP QA数据集 数据文档 背景描述 CNN/Daily Mail(简称CNN/DM)作为单文本摘要语料库,每篇摘要包含多个摘要句。数据集最初是从美国有限新闻网(CNN)和每日邮报网(Daily Mail)收集的约100万条新闻数据作为机器阅读理解语料库。后来进行简单改动,形成用于单文本生成式摘要 阅读全文
posted @ 2023-11-21 11:08 michaelchengjl 阅读(143) 评论(0) 推荐(0)
摘要: 大模型部署加速 https://zhuanlan.zhihu.com/p/659571962 https://github.com/internlm/lmdeploy https://github.com/InternLM/lmdeploy/blob/main/docs/zh_cn/kv_int8. 阅读全文
posted @ 2023-11-03 15:41 michaelchengjl 阅读(138) 评论(0) 推荐(0)
摘要: vLLM 部署大模型 https://github.com/vllm-project/vllm/tree/v0.2.0 https://vllm.readthedocs.io/en/latest/getting_started/installation.html https://vllm.readt 阅读全文
posted @ 2023-11-03 15:30 michaelchengjl 阅读(1090) 评论(0) 推荐(0)
摘要: LLM推理优化 https://blog.csdn.net/LF_AI/article/details/133054474?spm=1001.2014.3001.5502 阅读全文
posted @ 2023-11-03 15:27 michaelchengjl 阅读(28) 评论(0) 推荐(0)
摘要: Error loading wikitext data raise NotImplementedError(f"Loading a dataset cached in a {type(self._fs).name} is not supported.") QA I was trying to loa 阅读全文
posted @ 2023-11-01 17:09 michaelchengjl 阅读(521) 评论(0) 推荐(0)
摘要: # LoRA 简介 ## 简介 **LoRA,英文全称Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。** 如果想让一个预训练大语言模型能够执行特定领域内的任务,一般需要做 阅读全文
posted @ 2023-09-06 14:48 michaelchengjl 阅读(1398) 评论(0) 推荐(0)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 43 下一页