会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
西西嘛呦
从自己能做到的开始,一件件来,缓慢而坚定地前进,尽力而为
博客园
首页
新随笔
联系
管理
随笔 - 1186
文章 - 22
评论 - 606
阅读 -
163万
[置顶]
【论文笔记】张航和李沐等提出:ResNeSt: Split-Attention Networks(ResNet改进版本)
摘要: github地址:https://github.com/zhanghang1989/ResNeSt 论文地址:https://hangzhang.org/files/resnest.pdf 2020.06.23 张航视频讲解ResNeSt:https://www.bilibili.com/video
阅读全文
posted @ 2020-04-18 22:27 西西嘛呦
阅读(24464)
评论(3)
推荐(8)
2023年6月28日
怎么让英文大语言模型支持中文?(三)进行指令微调
摘要: 前面已经讲过: 怎么让英文大语言模型支持中文?(一)构建中文tokenization 怎么让英文大语言模型支持中文?(二)继续预训练 这里是最后一部分了:怎么让英文大语言模型支持中文?(三)对预训练模型进行指令微调。 代码已上传到github: chinese_llm_sft Part1前言 在之前
阅读全文
posted @ 2023-06-28 10:58 西西嘛呦
阅读(1675)
评论(0)
推荐(1)
2023年6月25日
怎么让英文大预言模型支持中文?(二)继续预训练
摘要: 代码已上传到github: https://github.com/taishan1994/chinese_llm_pretrained Part1前言 前面我们已经讲过怎么构建中文领域的tokenization: https://zhuanlan.zhihu.com/p/639144223 接下来我
阅读全文
posted @ 2023-06-25 16:16 西西嘛呦
阅读(672)
评论(4)
推荐(0)
2023年6月24日
怎么让英文大预言模型支持中文?(一)构建自己的tokenization
摘要: 代码地址:https://github.com/taishan1994/sentencepiece_chinese_bpe Part1前言 目前,大语言模型呈爆发式的增长,其中,基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好,接下来本文将讲解如何去扩充vocab里
阅读全文
posted @ 2023-06-24 10:44 西西嘛呦
阅读(2254)
评论(0)
推荐(0)
2023年6月16日
anaconda和python之间的对应关系
摘要: 对应关系: https://docs.anaconda.com/free/anaconda/reference/packages/oldpkglists/ 国内下载地址: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 1
阅读全文
posted @ 2023-06-16 14:27 西西嘛呦
阅读(244)
评论(2)
推荐(0)
2023年5月4日
【python】linux下安装python的一般方法
摘要: 下载python 网址:https://mirrors.huaweicloud.com/python/ 这里以安装python3.7.1为例: wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1.tgz 编译和安装python pref
阅读全文
posted @ 2023-05-04 18:20 西西嘛呦
阅读(161)
评论(0)
推荐(0)
2023年4月26日
你还弄不清xxxForCausalLM和xxxForConditionalGeneration吗?
摘要: Part1基本介绍 大语言模型目前一发不可收拾,在使用的时候经常会看到transformers库的踪影,其中xxxCausalLM和xxxForConditionalGeneration会经常出现在我们的视野中,接下来我们就来聊聊transformers库中的一些基本任务。 这里以三类模型为例:be
阅读全文
posted @ 2023-04-26 16:36 西西嘛呦
阅读(806)
评论(0)
推荐(0)
2023年4月25日
LLM(大语言模型)解码时是怎么生成文本的?
摘要: Part1配置及参数 transformers==4.28.1 源码地址:transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (github.com) 文档地址:Generation (huggingfa
阅读全文
posted @ 2023-04-25 17:34 西西嘛呦
阅读(5387)
评论(0)
推荐(1)
2023年4月24日
【colab】怎么在colab打开github上的ipynb文件
摘要: 登录:https://colab.research.google.com/github/ 将github上的ipynb文件路径复制到框里面即可。
阅读全文
posted @ 2023-04-24 16:30 西西嘛呦
阅读(456)
评论(0)
推荐(0)
2023年4月23日
pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)
摘要: pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例) Part1知识准备 在PyTorch中加载预训练的模型时,通常的工作流程是这样的: my_model = ModelClass(...)state_dict =torch.load(checkpoint_file) 用简单的话
阅读全文
posted @ 2023-04-23 09:38 西西嘛呦
阅读(4464)
评论(0)
推荐(2)
2023年4月21日
GPT-NER:使用大型语言模型进行命名实体识别
摘要: 讲在前面,chatgpt出来的时候就想过将其利用在信息抽取方面,后续也发现了不少基于这种大语言模型的信息抽取的论文,比如之前收集过的: https://github.com/cocacola-lab/GPT4IEhttps://github.com/RidongHan/Evaluation-of-C
阅读全文
posted @ 2023-04-21 15:02 西西嘛呦
阅读(2605)
评论(0)
推荐(2)
下一页
公告
公众号名称:
西西嘛呦
DGL中文文档
pytorch_异构图注意力网络
pytorch_图注意力网络
pytorch_中文文本分类
pytorch_bert_中文文本分类
pytorch_bert_中文多标签分类
pytorch_bert_中文关系抽取
pytorch_bilstm_crf_中文命名实体识别
pytorch_bert_bilstm_crf_中文命名实体识别
pytorch_三元组抽取(命名实体识别+关系抽取)
pytorch_bert_中文事件抽取
pytorch_bert_中文实体链接
pytorch_三大特征提取器(cnn、rnn、transformer)
根据中文wiki训练词向量、字向量、拼音向量
sentence-bert文本相似度
中文笔画向量
pytorch_bert_指代消解
pytorch_bert_中文命名实体识别(三种基本架构:基于序列标注法、基于Span法、基于问答法)
tensorflow_bilstm_crf_中文命名实体识别
tensorflow_中文文本分类
点击查看更多>>>>>>
博客园总榜
昵称:
西西嘛呦
园龄:
6年9个月
粉丝:
310
关注:
4
+加关注
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
最新随笔
1.怎么让英文大语言模型支持中文?(三)进行指令微调
2.怎么让英文大预言模型支持中文?(二)继续预训练
3.怎么让英文大预言模型支持中文?(一)构建自己的tokenization
4.anaconda和python之间的对应关系
5.【python】linux下安装python的一般方法
6.你还弄不清xxxForCausalLM和xxxForConditionalGeneration吗?
7.LLM(大语言模型)解码时是怎么生成文本的?
8.【colab】怎么在colab打开github上的ipynb文件
9.pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)
10.GPT-NER:使用大型语言模型进行命名实体识别
我的标签
c++
(93)
自然语言处理
(85)
python
(83)
深度学习
(79)
go
(75)
java
(66)
springboot
(62)
django
(62)
论文
(55)
leetcode-python
(52)
更多
积分与排名
积分 - 1132341
排名 - 301
随笔分类
(1200)
C(30)
C++(92)
django(62)
docker(6)
go语言(74)
hadoop(25)
java(62)
js(23)
latex(7)
leetcode (python)(52)
linux(40)
maven(6)
mybatis(42)
mysql(6)
opencv(28)
pyspark(3)
python基础(31)
python模块(31)
python-设计模式(4)
python实现卷积神经网络(15)
python算法(48)
pytorch(28)
pytorch-ssd目标检测(5)
pytorch和tensorflow的爱恨情仇(5)
pytorch-猫狗数据集分类(16)
spring(37)
springboot(62)
springmvc(45)
ssm(17)
tensorflow(33)
工具仓库(13)
绘图(2)
机器学习(32)
机器学习实战(4)
激活函数(4)
计算机网络(5)
剑指offer (python)(6)
卷积骚操作(12)
论文仓库(21)
面经(4)
目标检测(7)
其它(15)
深度学习(15)
深度学习各种例子(4)
数据分析(3)
数据集(5)
数据增强(3)
图卷积网络(9)
文档仓库(7)
优化方法(1)
注意力机制(5)
自然语言处理(52)
自然语言处理-关系抽取(8)
自然语言处理-命名实体识别(11)
自然语言处理-文本分类(9)
自然语言处理-相关库的使用(4)
自然语言处理-知识图谱(4)
更多
阅读排行榜
1. Latex之给字符上加横线、波浪线、^等(49944)
2. latex之如何打出求和符号(39097)
3. 【论文笔记】张航和李沐等提出:ResNeSt: Split-Attention Networks(ResNet改进版本)(24464)
4. 完美解决-RuntimeError: CUDA error: device-side assert triggered(20688)
5. c语言之遍历数组的几种方式(16219)
6. ppt中如何快速绘制各种角度的平行四边形(14030)
7. E0144"const char *" 类型的值不能用于初始化 "char *" 类型的实体的三种解决方法(13602)
8. c语言之在函数内部改变数组的值从而影响外部数组的四种方式(13240)
9. 【猫狗数据集】使用预训练的resnet18模型(12475)
10. 使用Git上传文件到github(12010)
11. 【pytorch】改造resnet为全卷积神经网络以适应不同大小的输入(11135)
12. 【tensorflow2.x】对应的keras版本(11025)
13. c语言之获取数组中元素的几种方式(10629)
14. hugging face使用BertModel.from_pretrained()都发生了什么?(10607)
15. 如何将tensorflow1.x代码改写为pytorch代码(以图注意力网络(GAT)为例)(10248)
评论排行榜
1. 【pytorch-ssd目标检测】训练自己创建的数据集(185)
2. 【pytorch-ssd目标检测】可视化检测结果(60)
3. paddlepaddle目标检测之水果检测(yolov3_mobilenet_v1)(43)
4. 【pytorch-ssd目标检测】验证自己创建的数据集(32)
5. 【tensorflow2.0】损失函数losses(16)
6. 利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料)(11)
7. django实战(三)--删除和批量删除(11)
8. 【tensorflow2.0】处理结构化数据-titanic生存预测(10)
9. 【自然语言处理】使用朴素贝叶斯进行语种检测(10)
10. 基于SpERT的中文关系抽取(9)
推荐排行榜
1. 【论文笔记】张航和李沐等提出:ResNeSt: Split-Attention Networks(ResNet改进版本)(8)
2. transformer多头注意力的不同框架实现(tensorflow+pytorch)(7)
3. 关于torch.nn.LSTM()的输入和输出(5)
4. 【pytorch-ssd目标检测】训练自己创建的数据集(5)
5. E0144"const char *" 类型的值不能用于初始化 "char *" 类型的实体的三种解决方法(5)
6. c语言之在函数内部改变数组的值从而影响外部数组的四种方式(5)
7. 你有一份斗破苍穹词库,请查收(4)
8. 利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料)(4)
9. 如何将tensorflow1.x代码改写为pytorch代码(以图注意力网络(GAT)为例)(4)
10. python实现线性回归之lasso回归(4)
最新评论
1. Re:golang数据结构之环形队列
maxsize和实际长度都不一样,永远差一个看不出来么
--请叫我明哥i
2. Re:django-常见问题勘误
感谢,被第一个问题困扰了
--强哥不强
3. Re:基于bert_bilstm_crf的命名实体识别
谢谢!!
--阿呆想做大佬
4. Re:基于bert_bilstm_crf的命名实体识别
@阿呆想做大佬 用caserel或者globalpoint...
--西西嘛呦
5. Re:基于bert_bilstm_crf的命名实体识别
博主您好,看了您GitHub上BERT-Relation-Extraction项目 您在最后说该方法还是存在一些问题: 1.不能区分两个实体之间存在多个关系。 2.对于同类实体之间存在的关系不能有效的...
--阿呆想做大佬
点击右上角即可分享