摘要: 一、大模型开发背景 1、大模型的工作原理 开始 用户输入 Prompt构建 迭代输出 终止符结束 2、大模型的固有缺陷 不具备知识出现幻觉、无法解决复杂逻辑任务、不擅长数学运算 如何解决大模型的固有缺陷:使用外接知识库给LLM提供知识、多个LLM协同各司其职、使用外接工具如计算器等 3、什么是大模型 阅读全文
posted @ 2024-08-23 19:41 无语了666 阅读(120) 评论(0) 推荐(0)
摘要: 一.大语言模型 1.大型语言模型(LLM)核心是注意力机制:通过注意力机制, Transformer能够聚焦于输入序列中的重要部分,类似于人类阅读时关注关键词。 Transformer模型通过将输入序列分解为一个个独立的token(例如单词或字符),并分别对每个token应用注意力机制,从而能够并行 阅读全文
posted @ 2024-08-08 11:07 无语了666 阅读(333) 评论(0) 推荐(0)
摘要: 一、梯度下降法 梯度下降法就是一种通过求目标函数的导数来寻找目标函数最小化的方法。梯度下降目的是找到目标函数最小化时的取值所对应的自变量的值,目的是为了找自变量X。 梯度:是一个矢量,其方向上的方向导数最大(意味着在这个方向上,函数的值增加最快。从图形上看,就是函数图形在某点最“陡峭”的方向)。其大 阅读全文
posted @ 2024-07-29 11:17 无语了666 阅读(123) 评论(0) 推荐(0)
摘要: Pandas主要有三种数据结构。 1)Series,带标签的一维数组。 2)Dataframe,带标签且大小可变的二维表格结构。 3)Panel,带标签且大小可变的三维数组。 本次主要总结的是pandas用于操作Dataframe的相关操作。 一、导入扩展库numpy和pandas,按照Python 阅读全文
posted @ 2024-07-22 09:39 无语了666 阅读(272) 评论(0) 推荐(0)
摘要: 一、python常用内置对象 1、常量与变量 常量即字面值无法改变的量,例如一个确定的数字、列表、字符串,如“Hello world”就是一个典型的字符串常量,变量是指值可以发生改变的量,在python中,不仅变量的值可以任意变化,变量的值也可以随时发生改变。这是因为python变量并不直接存储值, 阅读全文
posted @ 2024-07-17 16:02 无语了666 阅读(106) 评论(0) 推荐(0)