会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
加琪的技术记事本
新的一年,虎虎生威,
博客园
首页
新随笔
联系
管理
上一页
1
2
3
4
5
6
7
8
···
24
下一页
2024年1月13日
从Bitcask存储模型谈超轻量级KV系统设计与实现
摘要: 本文从从Bitcask存储模型讲起,谈轻量级KV系统设计与实现。从来没有最好的K-V系统,只有最适合应用业务实际场景的系统,做任何的方案选择,要结合业务当前的实际情况综合权衡,有所取有所舍。
阅读全文
posted @ 2024-01-13 16:44 JadePeng
阅读(701)
评论(0)
推荐(1)
2024年1月6日
Rocksdb 离线生成sst文件并在线加载
摘要: 本文介绍如何离线生成sst并在线加载,提供一种用rocksdb建立分布式kv系统替换mongodb的思路
阅读全文
posted @ 2024-01-06 16:39 JadePeng
阅读(698)
评论(0)
推荐(0)
2023年12月13日
Hnswlib 介绍与入门使用
摘要: `Hnswlib`是一个强大的近邻搜索(ANN)库, 官方介绍 `Header-only C++ HNSW implementation with python bindings, insertions and updates`. 热门的向量数据库Milvus底层的ANN库之一就是`Hnswlib`, 为milvus提供HNSW检索。
阅读全文
posted @ 2023-12-13 13:00 JadePeng
阅读(4301)
评论(0)
推荐(0)
2023年10月31日
trafilatura 网页解析原理分析
摘要: Trafilatura是一个Python包和命令行工具,用于收集网络上的文本。其主要应用场景包括网络爬虫下载和网页解析等。 今天我们不讨论爬虫和抓取,主要看他的数据解析是如何做的。
阅读全文
posted @ 2023-10-31 21:38 JadePeng
阅读(3232)
评论(0)
推荐(1)
2023年9月21日
使用代理中转服务,解决selenium 使用短时效代理避免重启
摘要: selenium 配置代理需要在启动的时候配置,如果代理失效或者不可用,切换需要重启,可以使用搭建一个代理中转服务,让selenium连接固定的中转服务,中转服务选择可用的代理。
阅读全文
posted @ 2023-09-21 14:44 JadePeng
阅读(278)
评论(0)
推荐(0)
2023年9月4日
【开源】java版本BertTokenizer以及使用onnxruntime推理
摘要: 开源java版本bertTokenizer
阅读全文
posted @ 2023-09-04 15:43 JadePeng
阅读(1374)
评论(0)
推荐(0)
2023年7月11日
JAVA 和python 多网卡情况下获取正确的IP地址
摘要: 要获取内网地址,可以尝试连接到10.255.255.255:1。如果连接成功,获取本地套接字的地址信息就是当前的内网IP。 python实现: ```python import socket def extract_ip(): st = socket.socket(socket.AF_INET, s
阅读全文
posted @ 2023-07-11 13:45 JadePeng
阅读(502)
评论(0)
推荐(0)
2023年2月15日
AI集群通信中的软硬件介绍
摘要: 计算机网络通信中最重要两个衡量指标主要是 带宽 和 延迟。分布式训练中需要传输大量的网络模型参数,网络通信至关重要。 AI集群通信实现方式 AI集群是由多台包含CPU、内存、GPU的服务器组成,需要考虑机器内通信和机器间通信。 机器内通信通常包括共享内存、PCIe、NVLink等方式,机器间主要通过
阅读全文
posted @ 2023-02-15 18:06 JadePeng
阅读(633)
评论(0)
推荐(0)
分布式AI集群服务器架构
摘要: ChatGPT的推出,人工智能正式进入大模型时代。要训练一个chatgpt这样的大模型,需要分布式AI集群的支持。 深度学习迎来大模型 Open AI的GPT-3模型,使用512张V100,需要训练7个月。现在的大模型训练,离不开分布式训练,通过分布式训练来加速训练过程,减少耗时。 分布式并行架构
阅读全文
posted @ 2023-02-15 18:05 JadePeng
阅读(647)
评论(0)
推荐(0)
2022年12月7日
[转]Transformers使用
摘要: [Transformers](https://huggingface.co/docs/transformers/index) 是由 [Hugging Face](https://huggingface.co/) 开发的一个 NLP 包,支持加载目前绝大部分的预训练模型。随着 BERT、GPT 等大规模语言模型的兴起,越来越多的公司和研究者采用 Transformers 库来构建 NLP 应用。
阅读全文
posted @ 2022-12-07 16:51 JadePeng
阅读(184)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
24
下一页
公告