会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
实习小生
博客园
首页
新随笔
联系
订阅
管理
[置顶]
Elasticsearch7和Elasticsearch8数据批量写入优化
摘要: Elasticsearch7和Elasticsearch8数据批量写入优化 背景 最近写的项目涉及了ES的检索,需要将大量的数据在短时间内写入到ES中,第一版的检索使用的是ES7,第二版添需要做语义检索,所以升级为了ES8 遇到的问题 写入速度极慢,一天最多百万级数据。 当前配置 JDK8 ES7(
阅读全文
posted @ 2024-01-26 01:19 实习小生
阅读(153)
评论(0)
推荐(0)
[置顶]
基于chunjun纯钧的增量数据同步问题排查【博客园-实习小生】
摘要: 基于chunjun纯钧的增量数据同步 目前我司的大数据平台使用的是flink技术栈,底层的连接器插件使用的是国产的chunjun插件,在使用chunjun的过程中也遇到了很多问题,本次记录下在SQL模式的情况下怎么支持增量的数据同步 chunjun的官网文档对增量同步已经做出了一定的说明 纯钧官方
阅读全文
posted @ 2023-04-12 14:40 实习小生
阅读(403)
评论(1)
推荐(2)
2025年9月19日
通过延时队列和mysql uodate原子性实现延迟任务
摘要: 通过延时队列和mysql uodate原子性实现延迟任务 背景:公司内部通过at群聊机器人来实现一些功能,例如:@机器人 查询 user 1 这个命令就是查询用户表 id为1的操作,后端对接了机器人,由后端来解析命令 再进行相应的操作。 新需求:延迟执行命令任务,例如:@机器人 延迟执行 1s/1m
阅读全文
posted @ 2025-09-19 10:25 实习小生
阅读(119)
评论(0)
推荐(1)
2025年8月14日
Elasticsearch拼音分词器使用指南
摘要: Elasticsearch拼音分词器使用指南 es的拼音分词器是在数据写入的时候将字段的数据转换为拼音 然后再进行分词。 如何使用 ** 索引结构 ** { "settings": { "index": { "analysis": { "analyzer": { "my_pinyin_analyze
阅读全文
posted @ 2025-08-14 18:56 实习小生
阅读(56)
评论(0)
推荐(0)
Elasticsearch嵌套类型nested使用指南
摘要: Elasticsearch嵌套类型nested使用指南 嵌套类型nested的特点 可以存储数组对象 每个对象独立存储为隐藏的子文档 嵌套类型nested和object类型的区别和应用场景 nested 每个对象独立存储为隐藏的子文档 适合存储数组 查询的时候有特定的语法 nested查询 且字段要
阅读全文
posted @ 2025-08-14 17:16 实习小生
阅读(215)
评论(0)
推荐(1)
2025年3月15日
ubuntu系统部署elasticsearch-7.17.28
摘要: ubuntu系统部署elasticsearch-7.17.28 下载 地址:https://www.elastic.co/downloads/past-releases/elasticsearch-7-17-28 解压 使用 tar -zxvf xxx.tar.gz 来解压 创建用户 useradd
阅读全文
posted @ 2025-03-15 15:35 实习小生
阅读(133)
评论(0)
推荐(0)
2024年12月7日
解析JDBC使用查询MySQL【非流式、流式、游标】
摘要: 解析JDBC使用游标查询MySQL 使用jdbc查询MySQL数据库,如果使用游标或者流式查询的话,则可以有效解决OOM的问题,否则MySQL驱动就会把数据集全部查询出来加载到内存里面,这样在大数据的情况下会OOM的 不同的查询方式 ResultsetRows 的实现是不一样的!!! 流式查询【每次
阅读全文
posted @ 2024-12-07 14:42 实习小生
阅读(273)
评论(0)
推荐(0)
2024年10月27日
windows安装MySQL8.4.3LTS
摘要: windows安装MySQL8.4.3LTS 第一步:下载压缩文件 https://dev.mysql.com/downloads/mysql/ 第二步:解压压缩包以及编写配置 my.ini配置 [mysqld] # skip_grant_tables # 设置3306端口 port=3306 #
阅读全文
posted @ 2024-10-27 16:07 实习小生
阅读(965)
评论(0)
推荐(0)
2024年10月21日
如何在服务器上通过ollama部署本地大模型
摘要: 如何在服务器上通过ollama部署本地大模型 第一步:下载离线的ollama安装包 curl -L https://ollama.com/download/ollama-linux-amd64.tgz -o ollama-linux-amd64.tgz 第二步:加压安装包到指定的目录 sudo ta
阅读全文
posted @ 2024-10-21 14:19 实习小生
阅读(3879)
评论(0)
推荐(0)
2024年10月17日
flink同步MySQL数据的时候出现内存溢出
摘要: flink同步MySQL数据的时候出现内存溢出 背景:需要将1000w的某类型数据同步到别的数据源里面,使用公司的大数据平台可以很快处理完毕,而且使用的内存只有很少很少量(公司的大数据平台的底层是flink,但是连接器使用的是chunjun开源产品),由于我个人想使用flink原生的连接器来尝试一下
阅读全文
posted @ 2024-10-17 14:17 实习小生
阅读(465)
评论(0)
推荐(3)
2024年5月21日
elasticsearch存储经纬度且按照范围进行查询
摘要: elasticsearch存储经纬度且按照范围进行查询 背景: 我在客户那边有很多舆情事件数据,数据里面包含的是有经纬度的,项目需求是用户在系统中输入一个地址,系统就可以查询到该地址100米 500米 1000米范围内的事件信息,当然了还可以输入事件的关键信息做模糊查询,所以我选择了使用es来存储引
阅读全文
posted @ 2024-05-21 17:18 实习小生
阅读(485)
评论(0)
推荐(0)
2024年4月15日
SSM使用自定义ConditionalOnProperty实现按需加载spring bean
摘要: SSM使用自定义ConditionalOnProperty实现按需加载spring bean 背景: 公司提供的系统框架是SSM架构,SSM架构是没有springboot的ConditionalOnProperty注解的,而我们的系统是在很多区县部署的,每个区县会有一些定制化需求,其中有一个类只在一
阅读全文
posted @ 2024-04-15 14:44 实习小生
阅读(77)
评论(0)
推荐(0)
下一页