摘要: Kettle是使用Java开发,开源的一款ETL工具,这里记录一下关于Kettle有关于数据库连接的问题 1、mysql版本需要注意区分,在mysql8.0的文档中官方已经给出,使用caching_sha2_password作为首选身份验证插件, 同时,官方也给出解决方案 kettle连接数据库问题 阅读全文
posted @ 2021-03-11 12:24 Jack船长1 阅读(3013) 评论(0) 推荐(0) 编辑
摘要: 基于真实环境下的数据爬取和结构化存储 存储使用的是mysql数据库 建议:在进行数据爬取时,获取的数据并不是结构化数据的情况下,建议使用字典来进行结构化处理。 第一步:获取目标网页的所有数据,并进行结构化处理,这里使用字典html_a来进行存储,注意html_a["bs"]用来表示某一条信息的状态 阅读全文
posted @ 2020-12-11 09:16 Jack船长1 阅读(318) 评论(0) 推荐(0) 编辑
摘要: python数据分析 pandas,numpy 先解决几个问题: 1、python的虚拟环境创建 如果有虚拟环境,点击选择"show all",进入后选择对应的虚拟环境即可,如果没有虚拟环境,选择Add,创建一个新的虚拟环境 选择Virtualenv Environment 继续选择New envi 阅读全文
posted @ 2020-12-10 17:03 Jack船长1 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 记录于2020.10.22 废话不多说直接上源码 1 #获取有缺口的图片 2 bigImg = Imgdict['bigImgName'] 3 smallImg = Imgdict['smallImgName'] 4 picture_big = self.get_HTML(bigImg) 5 byt 阅读全文
posted @ 2020-10-22 15:12 Jack船长1 阅读(732) 评论(0) 推荐(0) 编辑
摘要: 目标:使用Python编写爬虫,获取链家青岛站的房产信息,然后对爬取的房产信息进行分析。 环境:win10+python3.8+pycharm Python库: 1 import requests 2 import bs4 3 from bs4 import BeautifulSoup 4 impo 阅读全文
posted @ 2020-06-13 21:58 Jack船长1 阅读(638) 评论(0) 推荐(0) 编辑
摘要: 回文素数:一种既是回文数又是素数的数字 “回文”是指正读反读都能读通的句子,它是古今中外都有的一种修辞方式和文字游戏,如“我为人人,人人为我”等。在数学中也有这样一类数字有这样的特征,成为回文数 素数指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数。 1 i = 10 2 HuiWen 阅读全文
posted @ 2020-05-21 08:38 Jack船长1 阅读(5773) 评论(0) 推荐(0) 编辑
摘要: 利用Python爬虫爬取目标小说并保存到本地 小说地址:http://book.zongheng.com/showchapter/749819.html(目录地址) 通过小说目录获取小说所有章节对应的url地址,然后逐个访问解析得到每一章节小说的内容,最后保存到本地文件内 文章中的代码只是第一个版本 阅读全文
posted @ 2020-05-19 11:36 Jack船长1 阅读(1167) 评论(0) 推荐(0) 编辑
摘要: 通过Python开发一个基于控制台的名片管理系统,具体看下图以及相关代码。 cards_main.py文件中提供程序的入口 1 import cards_toolslx 2 3 while True: 4 # TODO 显示功能菜单 5 cards_toolslx.show_menu() 6 7 G 阅读全文
posted @ 2020-05-19 11:27 Jack船长1 阅读(511) 评论(0) 推荐(0) 编辑
摘要: 1 import requests 2 import time 3 import random 4 url = ['http://cq.srx123.com/', 5 'http://cq.srx123.com/article.php', 6 'http://cq.srx123.com/yszc.p 阅读全文
posted @ 2020-05-05 19:00 Jack船长1 阅读(973) 评论(0) 推荐(0) 编辑
摘要: 提供两个关于while循环和if判断的小例子 例1:由用户输入两个数字,计算两个数字的最大公约数 1 x = eval(input("请输入第一个数字:")) 2 y = eval(input("请输入第二个数字:")) 3 if x < y: 4 x,y = y,x 5 while x % y ! 阅读全文
posted @ 2020-03-28 21:01 Jack船长1 阅读(127) 评论(0) 推荐(0) 编辑