会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Jerry's Blog
THE WORLD COULD ALWAYS USE MORE HEROES
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
下一页
2021年8月10日
AWS Glue ETL Job 增量加载数据
摘要: 转载自:https://aws.amazon.com/blogs/big-data/load-data-incrementally-and-optimized-parquet-writer-with-aws-glue/ AWS Glue提供了一个无服务器环境来准备(提取和转换)和加载来自各种来源的大
阅读全文
posted @ 2021-08-10 09:31 Jerry-1
阅读(879)
评论(0)
推荐(0)
2021年8月5日
# Pyspark全角半角符号数据格式化转换UDF函数
摘要: Pyspark全角半角符号数据格式化转换UDF import findspark findspark.init() import pyspark from pyspark import SparkContext from pyspark.sql import SQLContext from pysp
阅读全文
posted @ 2021-08-05 10:14 Jerry-1
阅读(251)
评论(0)
推荐(0)
2021年7月19日
Pyspark DataFrame 字段|列数据[正则]替换 PySpark Replace Column Values in DataFrame
摘要: PySpark Replace Column Values in DataFrame Pyspark 字段|列数据[正则]替换 转载:[Reprint]: https://sparkbyexamples.com/pyspark/pyspark-replace-column-values/#:~:te
阅读全文
posted @ 2021-07-19 11:34 Jerry-1
阅读(1606)
评论(0)
推荐(0)
2021年7月15日
转载-ETL
摘要: ETL讲解(很详细!!!) 原文地址:https://www.cnblogs.com/yjd_hycf_space/p/7772722.html ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 E
阅读全文
posted @ 2021-07-15 14:30 Jerry-1
阅读(69)
评论(0)
推荐(0)
2020年11月2日
集群环境准备(Centos7)
摘要: 集群环境准备(Centos7) 1.三台虚拟机关闭防火墙 关闭防火墙,并禁止开机自启动 停止firewall systemctl stop firewalld.service 禁止firewall开机启动 systemctl disable firewalld.service 查看firewall状
阅读全文
posted @ 2020-11-02 10:00 Jerry-1
阅读(90)
评论(0)
推荐(0)
2020年10月22日
MySQL中的常见函数
摘要: MySQL中常见函数 字符串函数 *函数* *功能* CONCAT(s1,s2...sn) 字符串 s1,s2 等多个字符串合并为一个字符串 INSERT(s1,x,len,s2) 字符串 s2 替换 s1 的 x 位置开始长度为 len 的字符串 LOWER(s) 将字符串 s 的所有字母变成小写
阅读全文
posted @ 2020-10-22 19:46 Jerry-1
阅读(134)
评论(0)
推荐(0)
2020年10月9日
Hadoop-入门
摘要: Hadoop 1.1 什么是Hadoop Hadoop的概念: Apache™ Hadoop® 是一个开源的, 可靠的(reliable), 可扩展的(scalable)分布式计算框架 允许使用简单的编程模型跨计算机集群分布式处理大型数据集 可扩展: 从单个服务器扩展到数千台计算机,每台计算机都提供
阅读全文
posted @ 2020-10-09 11:33 Jerry-1
阅读(172)
评论(0)
推荐(0)
2020年7月24日
Elasticsearch Python API-Python Client
摘要: Elasticsearch -Python Client ,Python API API Documentation 所有API调用都尽可能接近地映射原始REST api,包括调用的必需参数和可选参数之间的区别。这意味着代码区分了位置参数和关键字参数。但是,我们建议在所有调用中都使用关键字参数,以确
阅读全文
posted @ 2020-07-24 16:22 Jerry-1
阅读(491)
评论(0)
推荐(0)
2020年7月16日
Windows10右下角网络标识突然消失,无法连接网络
摘要: 最近很多朋友遇到这个问题,经过Google和微软官方客服的回答,总结出以下几条命令,请依次执行,高概率修复问题! 一、按Windows+X键,选中WIndowsPowershell(管理员)打开 二、依次输入以下命令,请等待上一条命令执行结束后再执行下一个。 ipconfig /flushdns n
阅读全文
posted @ 2020-07-16 17:57 Jerry-1
阅读(604)
评论(0)
推荐(0)
2020年7月7日
为什么循环中使用i,j作为循环变量?
摘要: 今天又一次看到群里有人讨论这个问题,有人说是因为最开始国外程序员使用 for item in sth: pass item 表示变量,所以都沿用了i 我去Google查了查资料,发现并不是item的原因 在 Stack Overflow中看到一个回答: 意思为 i,j这种命名方式起源于数学,数学中的
阅读全文
posted @ 2020-07-07 12:42 Jerry-1
阅读(2919)
评论(0)
推荐(0)
1
2
3
4
下一页
公告