大模型编程python和工具安装等
背景和价值
数据分析2大语言python和R,最近几年越来越流行。
Python 安装
https://www.python.org/downloads/
版本
LangChain 0.1.16 的 官方依赖 Python 版本要求为 Python >=3.10
方法一:使用 pyenv(推荐)
pyenv
可以轻松管理多个 Python 版本。
-
安装 pyenv
brew update brew install pyenv
-
配置 Shell 环境
- 如果是 Bash(macOS Catalina 及之前):
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bash_profile echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bash_profile echo 'eval "$(pyenv init --path)"' >> ~/.bash_profile source ~/.bash_profile
- 如果是 Zsh(macOS Catalina 及之后):
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.zshrc echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.zshrc echo 'eval "$(pyenv init --path)"' >> ~/.zshrc source ~/.zshrc
- 如果是 Bash(macOS Catalina 及之前):
【注意】可能存在path被覆盖的情况。 通过 pyenv global xxx 切换版本无效。 解决办法就是把以上的脚本移到 .bash_profile 最后面。
-
安装 Python 3.11.6
pyenv install 3.11.6
-
设置全局默认版本
pyenv global 3.11.6
进入python虚拟环境后,使用以上命令是无效的。如果要在虚拟环境中指定python版本,要创建虚拟环境的时候就要切换好。
- 验证安装
python --version # 应显示 3.10
Anaconda 安装
Anaconda 是一个广泛用于数据科学、机器学习和大型项目开发的工具平台,它主要提供 Python/R 的包管理、环境隔离 和 依赖项自动解决 功能。
如果遇到性能问题,可通过更换镜像源、使用 mamba 或优化环境配置来提升效率。
安装版本 最新版本,或者次新版本
https://www.anaconda.com/download/success
https://repo.anaconda.com/archive/
(base) 是 Conda 的默认环境(也称为基础环境),并非用户手动创建的虚拟环境,而是 Conda 安装时自动生成的初始环境。
该环境包含 Conda 自身的核心工具(如 conda 命令行工具)和少量默认安装的包(如 Python 解释器,版本取决于安装 Conda 时的选择)。
所以MAC新创建窗口,前缀显示虚拟模拟的基础虚拟环境
(base) MacBook-Pro:~ xxx$
创建虚拟环境
1. 退出当前虚拟环境 (如果要重建需要这么做)
先退出虚拟环境和 conda 的 base
环境:
deactivate # 退出 langchain-env
2. 验证 pyenv 是否正常工作
确保在非虚拟环境下,pyenv
能正确切换版本:
pyenv local 3.11.6 # 设置当前目录的 Python 版本
python -V # 应输出 Python 3.11.6
which python # 路径应指向 ~/.pyenv/shims/python
3. 重新创建虚拟环境
如果需要在虚拟环境中使用 Python 3.11.6,必须基于该版本重新创建环境:
# 退出所有环境后,确保 pyenv 已切换到 3.11.6
pyenv local 3.11.6
# 创建新的虚拟环境. 创建虚拟环境后,在当前目录下会有 my-new-venv 目录
python -m venv my-new-venv
# 激活新环境。 在当前目录下执行该命令 (虚拟环境往上一级目录)
source my-new-venv/bin/activate
# 验证版本
python -V # 应显示 3.11.6
虚拟环境和 jupter绑定
https://www.cnblogs.com/aibi1/p/18779053
在虚拟环境中安装langchain 版本 0.1.16
pip3 install langchain==0.1.16
安装 opeanai 1.24.0
OpenAI 是一个由 OpenAI 官方维护的 Python SDK 库,用于开发者通过代码调用 OpenAI 提供的各类人工智能模型 API(如 GPT-3、GPT-4、DALL·E、Whisper 等)
在已经进入虚拟环境的基础上 (参考上一个步骤 )
pip install openai==1.24.0
安装或者升级pydantic
!pip install pydantic 或者 !pip install --upgrade pydantic
在jupter检验安装包的版本
import sys
print("python",sys.version) # 应显示虚拟环境中的 Python3 路径
import openai
print("openai",openai.__version__)
import langchain
print("langchain",langchain.__version__)
import importlib.metadata
try:
version = importlib.metadata.version("langchain-openai")
print(f"langchain-openai 版本: {version}")
except importlib.metadata.PackageNotFoundError:
print("未安装 langchain-openai")
import importlib.metadata
print(importlib.metadata.version("pydantic"))
jupyter 使用
Jupyter 是一个开源的 Web 应用,允许用户创建和共享包含实时代码、可视化图表、公式和文本的交互式文档(.ipynb 文件)。它支持 40+ 种编程语言(如 Python、R、Julia),但最常用于 Python 生态。
5. 优缺点分析
-
优点
- 交互式开发,适合快速实验。
- 可视化友好,降低理解门槛。
- 社区资源丰富,易于学习。
-
缺点
- 大规模训练需结合脚本或分布式框架(如 PyTorch Lightning)。
- 版本控制和协作不如传统 IDE 便捷,传统Python IDE推荐 Pycharm,Visual Studio Code。 如Hugging Face Trainer等
用法:安装好 python后,在命令行输入 jupyter notebook ,就可以启动jupyter
然后在右边的 New,Notebook, 在弹窗中选择python3
jupyter 使用虚拟环境
https://www.cnblogs.com/aibi1/p/18779053
jupyter 如何导入线上下载的.ipynb 文件?
将文件copy到jupyter常用的目录,在jupyter home页面,双击打开文件即可
安装 langchain-openai
!pip install langchain-openai==0.1.7
向量数据库安装 chromadb
chromadb 是轻量级向量数据
优势
极简API,5分钟上手,适合快速验证AI想法(如RAG应用)。
轻量级,无需额外服务,直接嵌入Python/JS代码。
与LangChain、LlamaIndex等AI工具链深度集成。
劣势
功能较基础,缺乏分布式和高级优化。
数据规模受限,不适合超大规模生产环境。
场景:初创项目、AI原型、轻量级语义搜索。
pip install chromadb