摘要: 切分粒度 基于词word的切分 基于字char的切分 基于subword的切分(主流切分方式) 常见模型对应的分词技术 分词方法 典型模型 BPE GPT, GPT-2, GPT-J, GPT-Neo, RoBERTa, BART, LLaMA, ChatGLM-6B, Baichuan WordP 阅读全文
posted @ 2024-07-24 12:55 Charlton_99ing 阅读(394) 评论(0) 推荐(1)
摘要: 几种设计prompt的策略 阅读全文
posted @ 2024-07-24 12:51 Charlton_99ing 阅读(123) 评论(0) 推荐(0)
摘要: 上传本地代码至github上的过程 本文主要用于记录通过将本地文件上传到github遇到的坑 注册github账号以及设置SSH key的过程就不再赘述 下面主要说明下本地文件上传到github上的过程。 首先需要先去需要上传文件的文件夹下 cd 该文件夹 初试化当前文件夹 通过git的初始化操作可 阅读全文
posted @ 2023-07-15 23:56 Charlton_99ing 阅读(59) 评论(0) 推荐(0)
摘要: 评价指标 首先在介绍二分类的评价指标之前,先介绍几个常见概念用于计算其中的accuracy,precision,recall,F1 TP、FP、FN、TN TP:True Positive,FP:False Positive,FN:False Negative,TN:True Negative 后面 阅读全文
posted @ 2023-07-03 23:16 Charlton_99ing 阅读(140) 评论(0) 推荐(0)
摘要: 鉴于算法考试中遇到了一道动态规划的题目,然而鉴于时间紧张使用了暴力求解,感觉没有掌握动态规划,然后在博客上记录下自己用动态规划解决这道算法题。 题目: 给定一串正数序列$a_{1}a_{2}...a_{n}$,其中序列中任意一个数均为正数。在该序列中找到最大的比值$a_{i}$/$a_{j}$,其中 阅读全文
posted @ 2023-02-25 19:33 Charlton_99ing 阅读(25) 评论(0) 推荐(0)
摘要: PRF评价指标: 精确率P:预测结果正类数量占全部结果的比率: P= $\frac{TP}{TP+FP}$ TP:预测为真且实际为真,FP为预测真实际为假。 召回率R:在所有正类样本中,能回想到的比例,正样本被找出来的比率: R=$\frac{TP}{TP+FN}$ FN预测为假实际为真。 $F_{ 阅读全文
posted @ 2022-10-15 17:12 Charlton_99ing 阅读(176) 评论(0) 推荐(0)
摘要: 标准神经网络的缺点 对于标准的神经网络而言,存在两个明显的问题。首先,由于对于不同的样本,输出可能会有不同的长度;其次文本的不同位置不可共享特征。 下图是循环神经网络的结构图,这种网络结构对于输入的每一项都借鉴了前面位置的信息用于输出。 每个单元的计算表达式如图所示。 不同的RNN网络结构 主要的模 阅读全文
posted @ 2022-10-13 16:03 Charlton_99ing 阅读(73) 评论(0) 推荐(0)
摘要: 全连接神经网络的含义 全连接神经网络级联多个变换来实现输入到输出的映射。(非线性操作是不可以被去掉,原因在于若网络中缺少了激活函数,全连接神经网络将变成一个线性分类器。) 常用的激活函数 sigmoid、relu、tanh、leaky relu。图像如下: 损失函数 softmax函数: softm 阅读全文
posted @ 2022-08-31 22:50 Charlton_99ing 阅读(655) 评论(0) 推荐(0)
摘要: 一、knn算法概述 knn首选是最简单的分类算法,其是有监督学习的分类算法之一。 二、knn算法过程 knn(k nearest neighbors k个最近的邻居):knn是当预测一个新的值x的时候,根据它距离k个点是什么类别来判断所属的类别。(具体理解见下图) 注意到k的选取和点的距离的计算方式 阅读全文
posted @ 2022-08-26 15:32 Charlton_99ing 阅读(489) 评论(0) 推荐(0)