dataframe写入mysql时候，对齐DataFrame的columns和SQL的字段名

在python中
sql=“xxxxxxxx”
cursor.execute(sql)
execute提交的是个字符串，所以考虑格式化字符串传参

insert into (%s,%s,%s,%s、、、、）values(%s,%s,%s、、、）
1
这样的结果就是当字段特别大的时候能累死，而且我又很懒
最重要的是当换个数据库的时候又废了

sql="insert into (%s,%s,%s,%s、、、、）values(%s,%s,%s、、、）"
1
都在引号里面，n个 %s 和一个 %s 也没什么区别吧！！！
所以我就想着把整个字段名和逗号一起拼接成一个字符串

import pymysql
import pandas as pd
import numpy as np
# 定义函数
def w_sql(sql_name,data,zd):
    connent = pymysql.connect(host='xxx', user='xxx', passwd='xxxx', db='xxxx', charset='xxx') #连接数据库
    cursor = connent.cursor()#创建游标
    for i in data.values:
        va=""
        for j in i:
            if pd.isnull(j):
                va=va+","+'null' #缺失值判断和转换
            else:
                va=va+","+"'"+str(j)+"'"
        sql="""insert ignore into %s (%s) values(%s)"""%(sql_name,zd[:-1],va[1:])
#         print(sql)
        cursor.execute(sql)
    connent.commit() #提交事务
    cursor.close()#关闭游标
    connent.close()#断开连接
    
#主程序
data=pd.read_excel("./test.xlsx")
sql_name='test'
zd=""
for j in data.columns:
    zd=zd+j+","
w_sql(sql_name,data,zd)

结果如下图，字段始终对齐，不受位置干扰，
【注意】
①ignore 是忽略主键重复，
最开始的版本是不设置主键，选取dataframe第一个元素在数据库里进行select，
版本二发现第一个元素不准，所以又read_sql_table读取整个数据库，对dataframe 进行布尔筛选
…
最终拼接了个主键，用ignore忽略重复——注意去除警告，否则多次运行就会一片红红火火

这里给出警告过滤的代码

# 警告过滤
# 可以通过调用filterwarnings()将规则添加到过滤器
# 并通过调用resetwarnings()将其重置为默认状态
# warnings.filterwarnings("ignore")
1
2
3
4
②因为是拼接的字符串所以数据库对应要设置为char/varchar

③commit的缩进位置
因为是dataframe一行行执行写入,最后循环完一整个dataframe统一commit
当数据量大的时候commit的位置很影响效率
connent.commit() #提交事务

原文链接：https://blog.csdn.net/qq_35866846/article/details/101712273

posted @ 2022-06-09 14:47 傻白甜++ 阅读(299) 评论(0) 收藏举报

刷新页面返回顶部

bobby

东方之东有日出，西方之西有海洋，东方西方漫游的渴望，再也不容许我彷徨。

dataframe写入mysql时候，对齐DataFrame的columns和SQL的字段名

公告