会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
仙守
最美的不是下雨天,是曾与你躲过雨的屋檐!
博客园
首页
新随笔
联系
订阅
管理
[置顶]
简介
摘要: 引言 2015年05月25日。之前在csdn写博客,可是csdn经常进不去,所以转战博客园,就用了一键博客搬家功能,其中诺有版面问题,请来这边:http://blog.csdn.net/shouhuxianjian $\color{red}{【自然语言处理】}$ 0 引言 NLP之引言 1 词向量
阅读全文
posted @ 2015-05-25 22:55 仙守
阅读(2054)
评论(0)
推荐(1)
2025年9月3日
基于docker构建es集群
摘要: 首先,假定有三台机器,分别是elasticsearch_node1,elasticsearch_node2,elasticsearch_node3,将他们ip和域名写入/etc/hosts. 然后基于docker.1ms.run/elasticsearch:7.17.18镜像进行操作 一、先将ip和
阅读全文
posted @ 2025-09-03 17:20 仙守
阅读(10)
评论(0)
推荐(0)
2025年6月19日
在es中进行update+upsert
摘要: 在es中如何做到当一个文档存在,则向某个字段追加内容,如果文档不存在则新建文档 1 USER 给es index操作的时候,如果是同一个id那会执行覆盖操作,那其中某个字段能追加操作而不是覆盖吗 ASSISTANT 在 Elasticsearch 中,如果你使用相同的 _id 执行索引操作(如 in
阅读全文
posted @ 2025-06-19 19:06 仙守
阅读(301)
评论(0)
推荐(0)
2025年4月22日
milvus遍历查询全部数据
摘要: 目录1. 使用Python客户端进行遍历查询2. 使用Milvus的RESTful API进行查询3. 分页查询以减少数据传输量4.pymilvus新版通过迭代器而不是query(expr='') 在Milvus中,如果你想遍历查询全部数据,你可以使用Milvus的搜索API来完成这个任务。Milv
阅读全文
posted @ 2025-04-22 14:47 仙守
阅读(813)
评论(0)
推荐(0)
2024年7月15日
简单剖析qwen-agent回答是怎么获取tool的
摘要: openai是一家伟大的公司(虽然是closedai),当他们提出agent的概念后,就很神奇。之前通过langchain的langgraph进行写demo,就很好奇,他是怎么基于我的话自动去识别这句话是大模型的闲聊,那句话是大模型去调用tool 1.现象 1.和大模型打招呼,大模型知道回答,这没啥
阅读全文
posted @ 2024-07-15 17:34 仙守
阅读(1112)
评论(0)
推荐(0)
2024年6月18日
一个中转代码,底层调用openai,上层模拟openai
摘要: openai的调用api几乎成为了实质性的大模型社区的调用标准,你看不论是阿里的灵积,智谱,together,vllm,ollama,fastchat等都支持openai的调用方式,所以这也是大势所趋, 有时候我们想做个中间层,底层调用大模型,上层提供业务服务,特别是许多公司的多节点的agent,如
阅读全文
posted @ 2024-06-18 11:36 仙守
阅读(453)
评论(0)
推荐(0)
2024年5月8日
一个小工具识别哪个docker占用gpu
摘要: 我们经常会为了组内谁在占用某块gpu卡而不使用 烦恼,通过简单的代码就能快速识别到这块卡上面的进程是哪个容器的。 下面的代码会给出如下图这样的结果 #! /miniconda3/bin/python # -*- coding: utf-8 -*- import psutil import subpr
阅读全文
posted @ 2024-05-08 09:06 仙守
阅读(112)
评论(0)
推荐(0)
2023年2月7日
NLP之预训练语言模型BERT
摘要: 1引言 通常来说,在NLP领域的很多场景中模型最后所做的基本上都是一个分类任务,虽然表面上看起来不是。例如:文本蕴含任务其实就是将两个序列拼接在一起,然后预测其所属的类别;基于神经网络的序列生成模型(翻译、文本生成等)本质就是预测词表中下一个最有可能出现的词,此时的分类类别就是词表的大小。 对于问答
阅读全文
posted @ 2023-02-07 17:32 仙守
阅读(632)
评论(0)
推荐(0)
2023年2月3日
NLP之预训练语言模型GPT
摘要: 1引言 在自然语言处理领域中,预训练模型通常指代的是预训练语言模型。广义上的预训练语言模型可以泛指提前经过大规模数据训练的语言模型,包括早期的以Word2vec、GloVe为代表的静态词向量模型,以及基于上下文建模的CoVe、ELMo等动态词向量模型。 在2018年,以GPT和BERT为代表的基于深
阅读全文
posted @ 2023-02-03 13:47 仙守
阅读(811)
评论(0)
推荐(0)
2023年1月29日
NLP之引言
摘要: 转到了NLP组,算是到了一个新的领域,其实很久之前就想接触NLP了,觉得无头绪,无从下手,很多都是碎片化,过时等资料。看了《ChatGPT对自然语言处理带来什么冲击》,其中以书本为锚点,介绍了NLP的发展史 1自然语言发展史 | 阶段 | 书籍 | 出版年 | | | | | | 第一代统计学习 |
阅读全文
posted @ 2023-01-29 13:58 仙守
阅读(376)
评论(0)
推荐(0)
2022年11月29日
[推荐系统]粗排之FSCD
摘要: 1 引言 众所周知: 召回阶段需要尽可能覆盖用户感兴趣的各种类型物品; 粗排模型要求计算快, 精排模型要求计算准确, 重排考虑业务规则、多样性等。 在粗排用的最广泛的就是DSSM双塔模型,其会将用户特征、广告特征分别用两个shallow-dnn的结构计算,得到embedding,线上serving时
阅读全文
posted @ 2022-11-29 15:22 仙守
阅读(720)
评论(0)
推荐(0)
下一页
公告