从零开始配置Windows下基于BERT的Jupyter环境:解决常见报错,快速上手微调!
起因:预在jupyter笔记本中微调bert预训练模型,结果jupyter打开一直报错,环境信息有:python3.8,参考https://blog.csdn.net/xylnphn/article/details/139830541这位博主给出的信息,修改notebook和jupyter_server版本,前两天貌似没问题了,今天又开始一直报错,打开web端报错“500 : Internal Server Error”,感觉原先的环境应该是废了,重新搞一个环境吧,希望不要再在这上面耗费再多时间了。
以下是本篇博客的正文内容:
在自然语言处理的世界里,BERT 的威力众所周知,而 Jupyter Notebook 则是实验和开发的好帮手。当我们在虚拟环境中配置基于 BERT 的 Jupyter 环境时,可能会遇到一些棘手的报错,比如 IProgress not found 或者 jupyter-nbextension 缺失等问题。今天,我将带你一步步解决这些问题,快速配置好你的开发环境。
第一步:创建并激活虚拟环境
无论你用的是 Windows、macOS 还是 Linux,都需要先创建并激活一个专属的虚拟环境:
# 创建虚拟环境
python -m venv venv_bert
# 激活虚拟环境
# Windows
.\venv_bert\Scripts\activate
# macOS/Linux
source venv_bert/bin/activate
确保你安装的是 Python 3.9(BERT 和大多数依赖对这个版本兼容性良好)。
第二步:安装 Jupyter Notebook
Jupyter Notebook 是我们用于实验的主要工具。在虚拟环境中安装它:
pip install notebook
第三步:安装微调 BERT 所需的依赖
为了进行 BERT 的微调任务,安装以下关键依赖:
pip install transformers torch torchvision torchaudio scikit-learn pandas numpy matplotlib
pip install ipykernel
随后将虚拟环境注册为 Jupyter Notebook 的内核:
python -m ipykernel install --user --name=venv_bert --display-name "Python (venv_bert)"
第四步:解决 tqdm 报错 - IProgress not found
如果在运行时遇到以下警告:
TqdmWarning: IProgress not found. Please update jupyter and ipywidgets.
按以下步骤修复:
-
安装或升级
ipywidgets:pip install ipywidgets -
如果你使用的是 Jupyter Notebook,还需启用对应扩展:
jupyter nbextension enable --py widgetsnbextension如果
jupyter-nbextension命令不可用,可能是notebook版本较高。 -
为确保兼容,安装
notebook的 6.x 版本:pip install notebook<7
第五步:验证安装和环境配置
启动 Jupyter Notebook,打开一个新的 Notebook,然后测试以下代码片段:
from transformers import BertModel, BertTokenizer
from tqdm.notebook import tqdm
import torch
import time
# 测试 tqdm
for i in tqdm(range(5)):
time.sleep(0.5)
# 测试 BERT 模型
model_name = "bert-base-uncased"
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertModel.from_pretrained(model_name)
text = "Hello, how are you?"
inputs = tokenizer(text, return_tensors="pt")
outputs = model(**inputs)
print(outputs.last_hidden_state.shape)
如果一切正常运行,恭喜你,环境配置成功!
第六步:常见问题解决
-
jupyter-nbextension命令未找到:
如果运行jupyter nbextension enable --py widgetsnbextension报错Jupyter command 'jupyter-nbextension' not found,你可以尝试以下操作:pip install --upgrade notebook ipywidgets jupyter_contrib_nbextensions python -m jupyter nbextension enable --py widgetsnbextension -
安装小于 7 版本的
notebook:
如果需要回滚到旧版本的 Notebook,可以用以下命令:pip install notebook<7 -
安装特定版本的 PyTorch:
如果需要安装支持 GPU 的 PyTorch,建议参考 PyTorch 官网 的安装指南,选择与 CUDA 对应的版本。
总结
通过以上步骤,你已经成功配置了一个支持 BERT 微调的 Jupyter 环境。如果你遇到任何问题,可以参考本教程的步骤逐一排查。现在,快打开 Notebook,尽情探索 BERT 的强大威力吧!
觉得有帮助? 不妨分享给你的朋友,一起探讨更多有趣的 NLP 话题!
(声明:本博客由GPT辅助生成,有问题欢迎留言联系作者~)
浙公网安备 33010602011771号