摘要:
读取后缀为 xls成功,后缀xlsx读取失败 import xlrd import xlwt from datetime import date,datetime def read_excel(): # 打开文件 workbook = xlrd.open_workbook(r'F:\demo.xls 阅读全文
posted @ 2025-03-19 22:15
钱塘江畔
阅读(12)
评论(0)
推荐(0)
摘要:
整体架构图 多个Producer可同时向同一主题发送消息 多个Producer可同时向同一主题同一分区发送消息 一个分区只会被一个消费组消费一次 精确一次Kafka Exactly Once 语义实现原理:幂等性与事务消息-CSDN博客 阅读全文
posted @ 2025-03-19 22:14
钱塘江畔
阅读(11)
评论(0)
推荐(0)
摘要:
https://blog.csdn.net/qq_28900249/article/details/90346599 阅读全文
posted @ 2025-03-19 22:12
钱塘江畔
阅读(10)
评论(0)
推荐(0)
摘要:
https://www.cnblogs.com/smartloli/p/9501887.html 阅读全文
posted @ 2025-03-19 22:10
钱塘江畔
阅读(6)
评论(0)
推荐(0)
摘要:
<!--mysql驱动包--> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.47</version> </dependency> System.out 阅读全文
posted @ 2025-03-19 22:09
钱塘江畔
阅读(9)
评论(0)
推荐(0)
摘要:
# 路径 + 通配符* 只读一层子文件夹 val lines: RDD[String] = sc.textFile("file:///E:/tmp/data/*") # 直接路径 报错, 无法识别子文件夹 val lines: RDD[String] = sc.textFile("file:///E 阅读全文
posted @ 2025-03-19 22:08
钱塘江畔
阅读(17)
评论(0)
推荐(0)
摘要:
# python算法库sklearn 官网 https://scikit-learn.org/stable/modules/generated/sklearn.cluster.MeanShift.html#sklearn.cluster.MeanShift # 使用 # 结果 ## 获取聚类点,及每 阅读全文
posted @ 2025-03-19 22:07
钱塘江畔
阅读(22)
评论(0)
推荐(0)
摘要:
难点一:采用re.compile解析html 难点二:动态ua和动态ip反爬 # -*- coding:utf-8 -*- import random from time import sleep from bs4 import BeautifulSoup # 网页解析,获取数据 import re 阅读全文
posted @ 2025-03-19 22:05
钱塘江畔
阅读(15)
评论(0)
推荐(0)
摘要:
# -*- coding=utf-8 -*- from impala.dbapi import connect as impylaConnect master_host='192.168.1.17' master_port=10000 master_authMechanism='PLAIN' mas 阅读全文
posted @ 2025-03-19 22:04
钱塘江畔
阅读(7)
评论(0)
推荐(0)
摘要:
Python3中6个标准数据类型: Number String List Tuple Set Dictionary 不可变:Number、String、Tuple 可 变: List、Set、Dictionary 判断变量的数据类型 type = type(var_name) print(type) 阅读全文
posted @ 2025-03-19 22:03
钱塘江畔
阅读(20)
评论(0)
推荐(0)

浙公网安备 33010602011771号