03 2022 档案

摘要:在做数据备份或导出数据的时候经常需要查询mysql的导出命令,特此记录下 1: 导出表数据到sql文件 备份数据 mysqldump -h 127.0.0.1 -uroot -p topickws t_e_keywords_google > t_e_keywords_google.sql topic 阅读全文
posted @ 2022-03-31 14:14 kakaok 阅读(4611) 评论(0) 推荐(0)
摘要:火车头的官方现在已支持python写插件,最开始按照官方文档安装了一个python3.8.8,调用插件总是报错,后面咨询客服说是版本太高,后面删除后python重新安装了一个python3.6,重新测试发现完美解决 贴一个写好的插件 # -*- coding: utf-8 -*- # @Author 阅读全文
posted @ 2022-03-17 11:16 kakaok 阅读(834) 评论(0) 推荐(0)
摘要:今天帮同事解析网页数据,分析源码后发现,网页展示的数据在页面定义的js变量里 这个变量里保存着上百条数据,整个对象也很大,最开始想着用python直接转成dict对象,返现怎么处理都报错,格式有问题,用了json.loads和simplejson.loads都不能解决,实在没招了,突然想到了node 阅读全文
posted @ 2022-03-16 19:17 kakaok 阅读(596) 评论(0) 推荐(0)
摘要:python里替换经常用replace函数,最近发现在清洗数据的时候用到replace有一些问题,后来发现是自己使用不当 比如 "a and a materials" 要把 'a' 'and' 清洗掉,用replace处理后变成"nd mterils" sp_list = string_input. 阅读全文
posted @ 2022-03-08 11:00 kakaok 阅读(92) 评论(0) 推荐(0)
摘要:最近需要清洗一批数据,涉及到好几个流程,以前的方式是所有数据处理完一步后再进行下一步,这种方式也能很好的完成需求。 最近发现了一个python的PipeLine库 fastcore 里面有个pipeline模块,正好满足我的需求 from fastcore.transform import Pipe 阅读全文
posted @ 2022-03-08 10:54 kakaok 阅读(545) 评论(0) 推荐(0)