上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 37 下一页
摘要: 读取后缀为 xls成功,后缀xlsx读取失败 import xlrd import xlwt from datetime import date,datetime def read_excel(): # 打开文件 workbook = xlrd.open_workbook(r'F:\demo.xls 阅读全文
posted @ 2025-03-19 22:15 钱塘江畔 阅读(12) 评论(0) 推荐(0)
摘要: 整体架构图 多个Producer可同时向同一主题发送消息 多个Producer可同时向同一主题同一分区发送消息 一个分区只会被一个消费组消费一次 精确一次Kafka Exactly Once 语义实现原理:幂等性与事务消息-CSDN博客 阅读全文
posted @ 2025-03-19 22:14 钱塘江畔 阅读(11) 评论(0) 推荐(0)
摘要: https://blog.csdn.net/qq_28900249/article/details/90346599 阅读全文
posted @ 2025-03-19 22:12 钱塘江畔 阅读(10) 评论(0) 推荐(0)
摘要: https://www.cnblogs.com/smartloli/p/9501887.html 阅读全文
posted @ 2025-03-19 22:10 钱塘江畔 阅读(6) 评论(0) 推荐(0)
摘要: <!--mysql驱动包--> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.47</version> </dependency> System.out 阅读全文
posted @ 2025-03-19 22:09 钱塘江畔 阅读(9) 评论(0) 推荐(0)
摘要: # 路径 + 通配符* 只读一层子文件夹 val lines: RDD[String] = sc.textFile("file:///E:/tmp/data/*") # 直接路径 报错, 无法识别子文件夹 val lines: RDD[String] = sc.textFile("file:///E 阅读全文
posted @ 2025-03-19 22:08 钱塘江畔 阅读(17) 评论(0) 推荐(0)
摘要: # python算法库sklearn 官网 https://scikit-learn.org/stable/modules/generated/sklearn.cluster.MeanShift.html#sklearn.cluster.MeanShift # 使用 # 结果 ## 获取聚类点,及每 阅读全文
posted @ 2025-03-19 22:07 钱塘江畔 阅读(22) 评论(0) 推荐(0)
摘要: 难点一:采用re.compile解析html 难点二:动态ua和动态ip反爬 # -*- coding:utf-8 -*- import random from time import sleep from bs4 import BeautifulSoup # 网页解析,获取数据 import re 阅读全文
posted @ 2025-03-19 22:05 钱塘江畔 阅读(15) 评论(0) 推荐(0)
摘要: # -*- coding=utf-8 -*- from impala.dbapi import connect as impylaConnect master_host='192.168.1.17' master_port=10000 master_authMechanism='PLAIN' mas 阅读全文
posted @ 2025-03-19 22:04 钱塘江畔 阅读(7) 评论(0) 推荐(0)
摘要: Python3中6个标准数据类型: Number String List Tuple Set Dictionary 不可变:Number、String、Tuple 可 变: List、Set、Dictionary 判断变量的数据类型 type = type(var_name) print(type) 阅读全文
posted @ 2025-03-19 22:03 钱塘江畔 阅读(20) 评论(0) 推荐(0)
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 37 下一页