AIIsFuture - 博客园

2024年11月30日

企业级数据安全-CDH集群-dolphinscheduler海豚调度一站式数据安全技术实战2025

摘要：企业级数据安全-CDH集群-dolphinscheduler海豚调度一站式数据安全技术实战2025，为了配合集团上市数据审计要求，我们在公司内部升级了数据安全等级。一：CDH技术框架，这也是通用企业级的数据平台框架。 2024-11 月测试环境上 kerberos 认证 1.1 修改拷贝机器阅读全文

posted @ 2024-11-30 08:16 AIIsFuture 阅读(397) 评论(0) 推荐(0)

2024年3月10日

python酒店相似度推荐系统

摘要： import numpy as np import pandas as pd from nltk.corpus import stopwords from sklearn.metrics.pairwise import linear_kernel from sklearn.feature_extra 阅读全文

posted @ 2024-03-10 18:16 AIIsFuture 阅读(107) 评论(0) 推荐(0)

2024年2月6日

python音乐推荐系统

摘要： import pandas as pd import numpy as np import time import sqlite3 data_home = 'E:/python学习/项目/python推荐系统/Python实现音乐推荐系统/' 读取数据 triplet_dataset = pd.re 阅读全文

posted @ 2024-02-06 14:52 AIIsFuture 阅读(187) 评论(1) 推荐(0)

2024年2月3日

python随机森林进行气温预测

摘要：天气最高温度我们要完成三个任务随机森林建模 --》选择特征 - 》增加数据量和特征个数 --》找到最优的参数掌握机器学习里面2种经典的参数调节方法读数据 import pandas as pd data = pd.read_csv("temps.csv") data.head() ye 阅读全文

posted @ 2024-02-03 18:31 AIIsFuture 阅读(731) 评论(0) 推荐(0)

python信用卡欺诈检测

摘要：信用卡欺诈检测任务流程： 1、加载数据，观察问题 2、针对问题给出解决方案 3、数据集切分 4、评估方法对比 5、逻辑回归模型 6、建模结果分析 7、方案效果对比读取数据 import pandas as pd import matplotlib.pyplot as plt import num 阅读全文

posted @ 2024-02-03 09:46 AIIsFuture 阅读(221) 评论(0) 推荐(0)

2023年12月23日

2024数据治理新工作规划

摘要：回望2023年的数据治理工作，更多的事在公司内部满足控股集团对数据合规和安全的要求，我们发布了自己公司的数据分级分类管理办法和数据安全管理办法，那么2024年，我们希望做的就是数据治理工作的落地实现，不仅是为了满足集团对数据合规的要求，也是我们自身存在这些数据方便的痛点，需要合力的改进数据治理工作。阅读全文

posted @ 2023-12-23 10:14 AIIsFuture 阅读(312) 评论(0) 推荐(0)

2023年9月17日

新能源汽车adas数字化闭环系统的几点思考

摘要：数据闭环已经被大多数自动驾驶公司认为是提升自动驾驶能力的必经之路。主机厂，配置了自动驾驶硬件的车队采集通过规则及影子模式下的触发器筛选的数据，经过语义筛选后的数据被回传到云端。此后，工程师在云端用工具对数据做一些处理，再把处理好的数据放入数据集群，然后利用这些有效数据训练模型。模型训练好之后，工程师阅读全文

posted @ 2023-09-17 09:20 AIIsFuture 阅读(200) 评论(0) 推荐(0)

2023年2月21日

学习群里的 hive sql 问题

摘要：上周末在学习群里有小伙伴发了一个sql 应用，原始记录是这样的他希望把数据生成下面这样的如果是你，你会怎么做呢？？？有同学说要用笛卡尔积、也有说用自关联，其实、这个sql可以简单点 with temp as (select '2022-12-20' as date_time,'供应商A' 阅读全文

posted @ 2023-02-21 13:30 AIIsFuture 阅读(56) 评论(0) 推荐(0)

2023年1月3日

flink orc hive 2.1.1 源码bug处理

摘要：先说一下我们公司的线上集群配置： CDH6.3.1 , hive 2.1.1 ，由于公司是做车联网业务方向的，所以数据量很大，同事小A，在往集群写数据，发现写入的数据不能在hive表里查询，他写往另外一个hive3.1.2的集群，却可以，于是我们定位到肯定是CDH的 hive2.1.1有问题了，百阅读全文

posted @ 2023-01-03 11:30 AIIsFuture 阅读(106) 评论(0) 推荐(0)

2022年7月8日

Ambari HDP 大数据集群搭建

摘要：具体的搭建资料网上一大堆，我们直接看效果下一步，打算集成flink 玩玩阅读全文

posted @ 2022-07-08 13:41 AIIsFuture 阅读(154) 评论(0) 推荐(0)

AI Is Future

微信公众号：AI Is Future，深耕数字化、AI践行者

公告