osnosn

  博客园 :: 首页 :: 博问 :: 闪存 :: :: 联系 :: 订阅 订阅 :: 管理 ::

Python3_pip3_安装支持包_mysql_pycurl_pdfplumber_camelot-py

转载注明来源: 本文链接 来自osnosn的博客,写于 2020-09-06.

pip3安装太慢,设置换源, 设置代理,参考 这篇文章

pip3 安装支持包

  • 如果安装某个包时出错,退出。(比如少装了库文件,少了命令支持。)
    当你补装库文件后。再次 pip3 install 会失败。
    • pip3 install --no-cache-dir xxxx 否则不会重新编译。
      或者删除缓存目录 rm -rf ~/.cache/pip/pip3 install xxxx

MySQLclient

  • 需要 pip3gcc
  • 需要 mysql_config 命令
    • 根据你已经安装的数据库,选装mariadb-connector-c-devel 或者 mysql-connector-c-devel
  • 需要 python3-devel
  • pip3 install mysqlclient
  • python3中使用: 推荐import MySQLdb 或者 底层库(不推荐)import _mysql
  • 这个包速度快些。(比pymysql快)
  • debian 中, 装apt install python3-mysqldb,就是mysqlclient。

PyMySQL

  • pip3 install PyMySQL
  • python3中使用: import pymysql
  • 这个包速度慢些。(比mysqlclient慢)

web client 访问, pycurl

  • python3 可以用 urllib, requests, pycurl 。
    其中 requests,pycurl 使用都比较方便。
    pycurl 功能和性能也更好。并且更通用,好多其他语言中都有 curl 的支持。
  • requests 需要 pysocks 才能使用 socks5 代理。
  • 如果用 pip3 install pycurl, 安装失败,centos需要 python-devel curl-devel。

pdfplumber 和 camelot-py

这两个包,都是用于提取pdf中的文本/表格。各有优缺点。
对于纯表格的pdf,pdfplumber表现更好点。
记录一下。这是在 uos 系统中,python3.7 下安装。

  • uos的py3版本比较低。
  • 先在root中,apt install python3-pip
  • 再在root中,apt install python3-socks 为了pip3 能支持 socks5 代理。
  • 下面切换到普通用户下。
  • pip3 install --upgrade pip 首先升级pip 自己。
    • 之前没升级pip自己,导致安装很多包的时候,各种错误。某包版本不匹配,某包找不到,某包安装失败....
  • 然后用 pip 装 pdfplumber 和 camelot-py。
  • 这两个包,都附带装了很多依赖,pdfplumber 比较大,camelot-py 更大。
    • pdfplumber 依赖有,Pillow Wand pdfminer.six (charset-normalizer cryptography)。
    • camelot-py 依赖有,chardet click numpy openpyxl pandas pdfminer.six PyPDF2 opencv-python 。
  • 在debian中安装 pdfplumber成功,安装后约占30MB, 使用也OK。

转载注明来源: 本文链接 https://www.cnblogs.com/osnosn/p/13636275.html 来自osnosn的博客.

posted on 2020-09-08 23:13  osnosn  阅读(987)  评论(0编辑  收藏  举报