会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
16
下一页
2025年7月11日
Scala spark RDD 转 DataFrame 转 libsvm 稀疏矩阵 KMeans 聚类算法
摘要: package main.scala.Alg import main.scala.core.config.{sc, spark_session} import org.apache.spark.ml.linalg.Vectors import org.apache.spark.rdd.RDD imp
阅读全文
posted @ 2025-07-11 00:05 ARYOUOK
阅读(35)
评论(0)
推荐(0)
2025年7月1日
如何从mysql把大量数据迁移到hive中
摘要: 以下是基于实践总结的MySQL大数据量导入Hive的完整方案,涵盖工具选择、操作步骤及优化策略: 🔧 一、核心工具选择 Sqoop(推荐) 优势:Hadoop官方工具,支持增量导入、并行度控制、自动类型映射 适用场景:TB级数据迁移,需精细控制并行任务 sqoop import --connect
阅读全文
posted @ 2025-07-01 22:39 ARYOUOK
阅读(370)
评论(0)
推荐(0)
hive 创建外部表和内部表 如何指定 ORC/Parquet 存储方式
摘要: 在Hive中创建内部表和外部表时,可通过STORED AS子句指定ORC或Parquet列式存储格式,同时需区分两者的数据管理机制。以下是具体语法和场景说明: 一、内部表(Managed Table) 特点:Hive全权管理数据,删除表时会同时删除元数据和HDFS数据。创建语法(以ORC为例)
阅读全文
posted @ 2025-07-01 22:21 ARYOUOK
阅读(149)
评论(0)
推荐(0)
apache-hive-3.1.3-bin.tar.gz 安装教程,hive安装步骤
摘要: # 登录hadoo用户进行安装执行 su hadoop tar -zxvf hive.tar.gz export HIVE_HOME=/opt/hive-3.1.3 export PATH=$PATH:$HIVE_HOME/bin export HADOOP_HOME=/opt/hadoop-3.3
阅读全文
posted @ 2025-07-01 21:23 ARYOUOK
阅读(218)
评论(0)
推荐(0)
2025年6月26日
oracle 备份恢复 根据归档模式保留完整的重做历史日志,恢复(PITR) 至时间点
摘要: 以下是基于归档模式实现时间点恢复(PITR)的具体步骤和示例: 一、前置条件 启用归档模式 -- 检查当前模式 SELECT log_mode FROM v$database; -- 切换为归档模式(需重启) SHUTDOWN IMMEDIATE; STARTUP MOUNT; ALTER DATA
阅读全文
posted @ 2025-06-26 16:26 ARYOUOK
阅读(121)
评论(0)
推荐(0)
2025年6月21日
基于 CentOS 7 的 MySQL 8 二进制安装详细步骤
摘要: 以下是基于 CentOS 7 的 MySQL 8 二进制安装详细步骤: 📦 一、准备工作 卸载冲突组件 systemctl stop mariadb rpm -e --nodeps mariadb-server mariadb rm -rf /var/lib/mysql /etc/my.cn
阅读全文
posted @ 2025-06-21 22:35 ARYOUOK
阅读(176)
评论(0)
推荐(0)
2025年6月20日
centos7.9单机搭建Hadoop3.3.6详细步骤
摘要: 以下为CentOS 7.9单机部署Hadoop 3.3.6的详细步骤,整合多个权威来源的操作要点及注意事项: 📋 一、系统准备(root用户操作) 更新系统与基础工具 sudo yum update -y sudo yum install -y wget tar ssh rsync vim 创建专
阅读全文
posted @ 2025-06-20 20:35 ARYOUOK
阅读(159)
评论(0)
推荐(0)
2025年6月11日
谱聚类算法数学公式推导,谱聚类数学建模
摘要: 谱聚类的数学推导过程如下: 构造相似矩阵W和度矩阵D 相似矩阵W:通常使用高斯核函数计算数据点间的相似度\[W_{ij} = \exp\left(-\frac{\|x_i - x_j\|^2}{2\sigma^2}\right) \]其中\(\sigma\)为带宽参数 度矩阵D:对角矩阵,\(D_{
阅读全文
posted @ 2025-06-11 09:11 ARYOUOK
阅读(66)
评论(0)
推荐(0)
金融信贷风控中结合生命周期分层与谱聚类
摘要: 📌 一、生命周期分层阶段 定义生命周期标签 新客阶段:首次申请贷款≤30天,特征为低历史行为数据。 活跃阶段:稳定还款≥3期,特征为高频交易+低逾期率。 衰退阶段:最近1期逾期或还款金额下降50%。 流失阶段:连续3期无还款记录。 数据预处理 提取用户时间序列数据:放款日期、还款记录、交易频率等。
阅读全文
posted @ 2025-06-11 08:34 ARYOUOK
阅读(94)
评论(0)
推荐(0)
2025年5月23日
使用Oracle的DBMS_JOB包并行执行存储过程中独立插入任务的完整示例,Oracle并行执行独立任务程序
摘要: 一、关键实现说明: 每个DBMS_JOB.SUBMIT调用创建一个独立后台作业25 通过WHAT参数指定要执行的PL/SQL代码块5 NEXT_DATE设为SYSDATE使作业立即执行5 RUN方法强制立即启动作业实现并行5 需要COMMIT确保作业提交到作业队列5 监控方法: 1.查询USER_J
阅读全文
posted @ 2025-05-23 17:24 ARYOUOK
阅读(176)
评论(0)
推荐(0)
2025年5月21日
finereport使用js单元格单选框控件对应报表行号和列号具体位置,单元格赋值
摘要: ## finereport获取单元格控件对应列和行标,给对应单元格赋值 var c2value = contentPane.getWidgetsByName("p1").getValue(); var b2list = contentPane.getWidgetsByName("status");
阅读全文
posted @ 2025-05-21 22:42 ARYOUOK
阅读(120)
评论(0)
推荐(0)
2025年4月17日
sqoop从Oracle将表数据导入到hive
摘要: 一、环境配置 Sqoop安装 tar zxvf sqoop-1.4.7.tar.gz # 解压安装包:ml-citation{ref="2" data="citationList"} export SQOOP_HOME=/opt/sqoop-1.4.7 # 配置环境变量:ml-citation
阅读全文
posted @ 2025-04-17 10:33 ARYOUOK
阅读(205)
评论(0)
推荐(0)
2023年7月25日
springMVC Mybatis ssm整合 post请求json 响应json数据配置
摘要: 1、pom.xml <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>2.0.32</version> </dependency> 2、springmvc-config.xml
阅读全文
posted @ 2023-07-25 21:18 ARYOUOK
阅读(165)
评论(0)
推荐(0)
2023年7月24日
maven查看jar的pom引入来源
摘要: maven相关分享 maven仓库地址:https://mvnrepository.com/阿里仓库地址:https://developer.aliyun.com/mvn/search阿里仓库settings.xml配置:
阅读全文
posted @ 2023-07-24 21:01 ARYOUOK
阅读(46)
评论(0)
推荐(0)
2023年7月22日
解决idea tomcat 控制台乱码问题
摘要: idea配置: -Dfile.encoding=UTF-8
阅读全文
posted @ 2023-07-22 13:36 ARYOUOK
阅读(27)
评论(0)
推荐(0)
2023年7月13日
mysql触发器使用,触发器内不能有事物提交回滚,触发器做增量数据
摘要: -- ruoyi_base.system_dictdata definition CREATE TABLE `test_info` ( `id` int NOT NULL AUTO_INCREMENT, `dept_belong_id` varchar(256) DEFAULT NULL, `upd
阅读全文
posted @ 2023-07-13 20:35 ARYOUOK
阅读(47)
评论(0)
推荐(0)
2023年3月24日
python读取excel csv数据插入Oracle
摘要: from sqlalchemy import create_engine import pandas as pd import sqlalchemy.types as type from sqlalchemy.engine import Engine def connet_oracle(): ip_
阅读全文
posted @ 2023-03-24 09:20 ARYOUOK
阅读(437)
评论(0)
推荐(0)
python读取Oracle相关表生成sqlldr脚本文件
摘要: # -*- coding: utf-8 -*- import os import pandas as pd import cx_Oracle as cx # os.environ['path'] = r'D:\Program Files\plsql developer8.0\instantclien
阅读全文
posted @ 2023-03-24 09:15 ARYOUOK
阅读(118)
评论(0)
推荐(0)
python读取ddl生成sql建表语句
摘要: # 导入需要的库 import pandas as pd import os def read_ddl_create_tab_sql(file_path:str,table_name:str): df = pd.read_csv(file_path,sep='\|\@\|',index_col=0,
阅读全文
posted @ 2023-03-24 09:08 ARYOUOK
阅读(186)
评论(0)
推荐(0)
python读取linux服务下载数据文件
摘要: import paramiko # pip install cx_Oracle -i https://mirrors.aliyun.com/pypi/simple/ host = 'ip' port = 22 username = '账户' password = '密码' remote_path =
阅读全文
posted @ 2023-03-24 09:06 ARYOUOK
阅读(295)
评论(0)
推荐(0)
2022年11月22日
关于若依框架后台数据库中文乱码 MySQL8.0 中文乱码
摘要: -- 查看字符集编码设置为以下 show VARIABLES like 'CHARACTER%' set character_set_results = utf8mb4; character_set_client utf8mb4 character_set_connection utf8mb4 ch
阅读全文
posted @ 2022-11-22 22:17 ARYOUOK
阅读(2708)
评论(0)
推荐(0)
2022年11月4日
java:compilation failed:internal java compiler error java-source 1.5中不支持 try-with-resources
摘要: 具体参考:Error:java: Compilation failed: internal java compiler error 解决办法 - 程序猿的故事 - CSDN博客 1、查看项目的jdk(Ctrl+Alt+shift+S) File ->Project Structure->Projec
阅读全文
posted @ 2022-11-04 14:15 ARYOUOK
阅读(332)
评论(0)
推荐(0)
2022年10月26日
迪杰斯特拉算法(求最短路径)
摘要: 迪杰斯特拉算法用于查找图中某个顶点到其它所有顶点的最短路径,该算法既适用于无向加权图,也适用于有向加权图。注意,使用迪杰斯特拉算法查找最短路径时,必须保证图中所有边的权值为非负数,否则查找过程很容易出错。 一、迪杰斯特拉算法的实现思路 图 1 是一个无向加权图,我们就以此图为例,给大家讲解迪杰斯特拉
阅读全文
posted @ 2022-10-26 14:16 ARYOUOK
阅读(882)
评论(0)
推荐(0)
prim算法(普里姆算法)详解
摘要: 一、算法思想 了解了什么是最小生成树后,本节为您讲解如何用普里姆(prim)算法查找连通网(带权的连通图)中的最小生成树。 普里姆算法查找最小生成树的过程,采用了贪心算法的思想。对于包含 N 个顶点的连通网,普里姆算法每次从连通网中找出一个权值最小的边,这样的操作重复 N-1 次,由 N-1 条权值
阅读全文
posted @ 2022-10-26 13:55 ARYOUOK
阅读(1852)
评论(0)
推荐(0)
2022年9月22日
Process finished with exit code -1073740791 (0xC0000409) tensorflow显存不足
摘要: 显存问题: 1、这种情况需要去官网下载zlib的文件,http://www.winimage.com/zLibDll/zlib123dllx64.zip这是下载地址。 2、在解压后的文件夹 dll_x64 中找到 zlibwapi.dll 文件放到 C:\Program Files\NVIDIA G
阅读全文
posted @ 2022-09-22 14:17 ARYOUOK
阅读(385)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
16
下一页
公告