2022 年 4月随笔档案 - 干了这瓶老干妈

pyspark中将数据从列表转换为字符串

摘要：初始的DataFrame： from pyspark.sql.types import StructType, StructField schema = StructType([StructField("uuid",IntegerType(),True),StructField("test_123" 阅读全文

posted @ 2022-04-26 13:52 干了这瓶老干妈阅读(246) 评论(0) 推荐(0)

Zeppelin中给spark添加第三方jar包

摘要：方法一：永久导入jar包在zeppelin的环境配置文件 "zeppelin-env.sh" 中添加以下内容： export SPARK_SUBMIT_OPTIONS="--jars /moudle/zeppelin-0.9.0/plugins/mysql-connector-java-8.0.2 阅读全文

posted @ 2022-04-24 19:18 干了这瓶老干妈阅读(482) 评论(0) 推荐(0)

Zeppelin返回503问题

摘要：遇到问题：启动zeppelin，登陆时遇到以下问题查看zeppelin日志，看到以下错误信息： Failed to delete temp dir /opt/module/zeppelin/webapps 解决方案：确保“webapps”文件夹的权限为755； “webapps”和子文件夹的所阅读全文

posted @ 2022-04-24 15:29 干了这瓶老干妈阅读(195) 评论(0) 推荐(0)

Spark ML 中逻辑回归算法的分类阈值设置说明

摘要：Spark中的分类算法中总有分类阈值这个参数。分类阈值用来调整预测的概率大小，算法会计算出每条预测数据属于哪个类别的概率p，将该条数据预测为p/t的最大值下表的类别（下标从0开始）。类别标签有几个值，也就是几个类别，阈值需要有几个值。如果是二分类，则分类阈值就有两个值，如果是三分类，则分类阈值就阅读全文

posted @ 2022-04-24 11:10 干了这瓶老干妈阅读(511) 评论(0) 推荐(0)

Pyhon3.7.*版本报错ModuleNotFoundError: No module named '_ctypes'解决方法

摘要：错误原因： Python3中有个内置模块叫ctypes，它是Python3的外部函数库模块，它提供兼容C语言的数据类型，并通过它调用Linux系统下的共享库(Shared library)，此模块需要使用CentOS7系统中外部函数库(Foreign function library)的开发链接库( 阅读全文

posted @ 2022-04-22 15:07 干了这瓶老干妈阅读(575) 评论(0) 推荐(0)

成长小港

04 2022 档案

公告