会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
花伤错零
静看落花落流水,坐遇晚风恰逢君
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
21
下一页
2024年2月16日
2.16总结
摘要: 第十九天 python爬虫学习 主要使用Urllib库 Urllib是Python中请求url连接的官方标准库,在Python2中主要为urllib和urllib2,在Python3中整合成了urllib。 主要包含以下4个模块 urllib.request:用于打开和阅读URL urllib.er
阅读全文
posted @ 2024-02-16 16:08 花伤错零
阅读(8)
评论(0)
推荐(0)
2024年2月7日
2.7总结
摘要: 第十八天 代码JDBC连接 Pycharm软件连接ThriftServer 通过yum命令安装依赖 yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel
阅读全文
posted @ 2024-02-07 18:27 花伤错零
阅读(14)
评论(0)
推荐(0)
2024年2月6日
2.6总结
摘要: 第十七天 第六章:Spark On Hive 6.1 原理 6.2 配置 6.3 在代码中集成
阅读全文
posted @ 2024-02-06 18:14 花伤错零
阅读(7)
评论(0)
推荐(0)
2024年2月5日
2.5总结
摘要: 第十六天 今日实验 # coding:utf8 from pyspark.sql import SparkSession from pyspark.sql.types import StructType, StringType, IntegerType import pandas as pd fro
阅读全文
posted @ 2024-02-05 19:42 花伤错零
阅读(12)
评论(0)
推荐(0)
2.4总结
摘要: 第十五天 今天继续进行了练习 # coding:utf8 from pyspark.sql import SparkSession from pyspark.sql.types import StructType, StringType, IntegerType import pandas as p
阅读全文
posted @ 2024-02-05 00:11 花伤错零
阅读(16)
评论(0)
推荐(0)
2024年2月2日
2.2总结
摘要: 第十四天 今天进行了sparksql练习 # coding:utf8 from pyspark.sql import SparkSession from pyspark.sql.types import StructType, StringType, IntegerType if __name__
阅读全文
posted @ 2024-02-02 21:17 花伤错零
阅读(11)
评论(0)
推荐(0)
2024年1月31日
1.31总结
摘要: 第十三天 基于RDD方式2-通过StructType对象 # coding:utf8 from pyspark.sql import SparkSession from pyspark.sql.types import StructType, StringType, IntegerType if _
阅读全文
posted @ 2024-01-31 19:09 花伤错零
阅读(12)
评论(0)
推荐(0)
2024年1月30日
1.30总结
摘要: 第十二天 第三章:DataFrame入门 3.1 DataFrame的组成 3.2 DataFrame的代码构建 基于RDD方式1-通过createDataFrame方法 # coding:utf8 from pyspark.sql import SparkSession if __name__ =
阅读全文
posted @ 2024-01-30 21:55 花伤错零
阅读(9)
评论(0)
推荐(0)
2024年1月27日
1.27总结
摘要: 第十一天 今天开始学习spark sql 第二章:SparkSQL概述 SparkSQL和Hive的异同 SparkSQL的数据抽象 SparkSQL数据抽象的发展 DataFrame数据抽象 SparkSession对象 SparkSQL HelloWorld # coding:utf8 # Sp
阅读全文
posted @ 2024-01-27 22:08 花伤错零
阅读(14)
评论(0)
推荐(0)
2024年1月25日
1.25总结
摘要: 第十天 实验5 Spark SQL 编程初级实践一、实验目的(1)通过实验掌握Spark SQL的基本编程方法。(2)熟悉RDD到DataFrame的转化方法。(3)熟悉利用Spark SQL管理来自不同数据源的数据。 二、实验平台操作系统:LinuxSpark版本:2.4.5scala版本:2.1
阅读全文
posted @ 2024-01-25 19:55 花伤错零
阅读(24)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
21
下一页
公告