从零开始配置Windows下基于BERT的Jupyter环境:解决常见报错,快速上手微调!

起因:预在jupyter笔记本中微调bert预训练模型,结果jupyter打开一直报错,环境信息有:python3.8,参考https://blog.csdn.net/xylnphn/article/details/139830541这位博主给出的信息,修改notebook和jupyter_server版本,前两天貌似没问题了,今天又开始一直报错,打开web端报错“500 : Internal Server Error”,感觉原先的环境应该是废了,重新搞一个环境吧,希望不要再在这上面耗费再多时间了。

以下是本篇博客的正文内容:
在自然语言处理的世界里,BERT 的威力众所周知,而 Jupyter Notebook 则是实验和开发的好帮手。当我们在虚拟环境中配置基于 BERT 的 Jupyter 环境时,可能会遇到一些棘手的报错,比如 IProgress not found 或者 jupyter-nbextension 缺失等问题。今天,我将带你一步步解决这些问题,快速配置好你的开发环境。


第一步:创建并激活虚拟环境

无论你用的是 Windows、macOS 还是 Linux,都需要先创建并激活一个专属的虚拟环境:

# 创建虚拟环境
python -m venv venv_bert

# 激活虚拟环境
# Windows
.\venv_bert\Scripts\activate

# macOS/Linux
source venv_bert/bin/activate

确保你安装的是 Python 3.9(BERT 和大多数依赖对这个版本兼容性良好)。


第二步:安装 Jupyter Notebook

Jupyter Notebook 是我们用于实验的主要工具。在虚拟环境中安装它:

pip install notebook

第三步:安装微调 BERT 所需的依赖

为了进行 BERT 的微调任务,安装以下关键依赖:

pip install transformers torch torchvision torchaudio scikit-learn pandas numpy matplotlib
pip install ipykernel

随后将虚拟环境注册为 Jupyter Notebook 的内核:

python -m ipykernel install --user --name=venv_bert --display-name "Python (venv_bert)"

第四步:解决 tqdm 报错 - IProgress not found

如果在运行时遇到以下警告:

TqdmWarning: IProgress not found. Please update jupyter and ipywidgets.

按以下步骤修复:

  1. 安装或升级 ipywidgets

    pip install ipywidgets
    
  2. 如果你使用的是 Jupyter Notebook,还需启用对应扩展:

    jupyter nbextension enable --py widgetsnbextension
    

    如果 jupyter-nbextension 命令不可用,可能是 notebook 版本较高。

  3. 为确保兼容,安装 notebook 的 6.x 版本:

    pip install notebook<7
    

第五步:验证安装和环境配置

启动 Jupyter Notebook,打开一个新的 Notebook,然后测试以下代码片段:

from transformers import BertModel, BertTokenizer
from tqdm.notebook import tqdm
import torch
import time

# 测试 tqdm
for i in tqdm(range(5)):
    time.sleep(0.5)

# 测试 BERT 模型
model_name = "bert-base-uncased"
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertModel.from_pretrained(model_name)

text = "Hello, how are you?"
inputs = tokenizer(text, return_tensors="pt")
outputs = model(**inputs)
print(outputs.last_hidden_state.shape)

如果一切正常运行,恭喜你,环境配置成功!


第六步:常见问题解决

  1. jupyter-nbextension 命令未找到:
    如果运行 jupyter nbextension enable --py widgetsnbextension 报错 Jupyter command 'jupyter-nbextension' not found,你可以尝试以下操作:

    pip install --upgrade notebook ipywidgets jupyter_contrib_nbextensions
    python -m jupyter nbextension enable --py widgetsnbextension
    
  2. 安装小于 7 版本的 notebook
    如果需要回滚到旧版本的 Notebook,可以用以下命令:

    pip install notebook<7
    
  3. 安装特定版本的 PyTorch:
    如果需要安装支持 GPU 的 PyTorch,建议参考 PyTorch 官网 的安装指南,选择与 CUDA 对应的版本。


总结

通过以上步骤,你已经成功配置了一个支持 BERT 微调的 Jupyter 环境。如果你遇到任何问题,可以参考本教程的步骤逐一排查。现在,快打开 Notebook,尽情探索 BERT 的强大威力吧!


觉得有帮助? 不妨分享给你的朋友,一起探讨更多有趣的 NLP 话题!
(声明:本博客由GPT辅助生成,有问题欢迎留言联系作者~)

posted @ 2024-12-11 11:24  wangpan0523  阅读(110)  评论(0)    收藏  举报