仙守 - 博客园

[置顶] 简介

摘要：引言 2015年05月25日。之前在csdn写博客，可是csdn经常进不去，所以转战博客园，就用了一键博客搬家功能,其中诺有版面问题，请来这边：http://blog.csdn.net/shouhuxianjian $\color{red}{【自然语言处理】}$ 0 引言 NLP之引言 1 词向量阅读全文

posted @ 2015-05-25 22:55 仙守阅读(2062) 评论(0) 推荐(1)

2025年11月24日

vscode密钥从windows连接远程linux

摘要：目录1 下载2 ssh插件3 windows本机的配置4 获取ssh的密钥文件5 远程linux的执行部分 windows作为本地机器，远程linux作为开发机器， 1 下载去微软官网下载vscode的windows本地版 2 ssh插件 vscode下载remote-ssh插件 3 window 阅读全文

posted @ 2025-11-24 16:54 仙守阅读(57) 评论(0) 推荐(0)

2025年9月3日

基于docker构建es集群

摘要：首先,假定有三台机器，分别是elasticsearch_node1,elasticsearch_node2,elasticsearch_node3，将他们ip和域名写入/etc/hosts. 然后基于docker.1ms.run/elasticsearch:7.17.18镜像进行操作一、先将ip和阅读全文

posted @ 2025-09-03 17:20 仙守阅读(25) 评论(0) 推荐(0)

2025年6月19日

在es中进行update+upsert

摘要：在es中如何做到当一个文档存在，则向某个字段追加内容，如果文档不存在则新建文档 1 USER 给es index操作的时候，如果是同一个id那会执行覆盖操作，那其中某个字段能追加操作而不是覆盖吗 ASSISTANT 在 Elasticsearch 中，如果你使用相同的 _id 执行索引操作（如 in 阅读全文

posted @ 2025-06-19 19:06 仙守阅读(488) 评论(0) 推荐(0)

2025年4月22日

milvus遍历查询全部数据

摘要：目录1. 使用Python客户端进行遍历查询2. 使用Milvus的RESTful API进行查询3. 分页查询以减少数据传输量4.pymilvus新版通过迭代器而不是query(expr='') 在Milvus中，如果你想遍历查询全部数据，你可以使用Milvus的搜索API来完成这个任务。Milv 阅读全文

posted @ 2025-04-22 14:47 仙守阅读(1083) 评论(0) 推荐(0)

2024年7月15日

简单剖析qwen-agent回答是怎么获取tool的

摘要： openai是一家伟大的公司（虽然是closedai），当他们提出agent的概念后，就很神奇。之前通过langchain的langgraph进行写demo，就很好奇，他是怎么基于我的话自动去识别这句话是大模型的闲聊，那句话是大模型去调用tool 1.现象 1.和大模型打招呼，大模型知道回答，这没啥阅读全文

posted @ 2024-07-15 17:34 仙守阅读(1223) 评论(0) 推荐(0)

2024年6月18日

一个中转代码，底层调用openai，上层模拟openai

摘要： openai的调用api几乎成为了实质性的大模型社区的调用标准，你看不论是阿里的灵积，智谱，together，vllm，ollama，fastchat等都支持openai的调用方式，所以这也是大势所趋，有时候我们想做个中间层，底层调用大模型，上层提供业务服务，特别是许多公司的多节点的agent，如阅读全文

posted @ 2024-06-18 11:36 仙守阅读(481) 评论(0) 推荐(0)

2024年5月8日

一个小工具识别哪个docker占用gpu

摘要：我们经常会为了组内谁在占用某块gpu卡而不使用烦恼，通过简单的代码就能快速识别到这块卡上面的进程是哪个容器的。下面的代码会给出如下图这样的结果 #! /miniconda3/bin/python # -*- coding: utf-8 -*- import psutil import subpr 阅读全文

posted @ 2024-05-08 09:06 仙守阅读(129) 评论(0) 推荐(0)

2023年2月7日

NLP之预训练语言模型BERT

摘要： 1引言通常来说，在NLP领域的很多场景中模型最后所做的基本上都是一个分类任务，虽然表面上看起来不是。例如：文本蕴含任务其实就是将两个序列拼接在一起，然后预测其所属的类别；基于神经网络的序列生成模型（翻译、文本生成等）本质就是预测词表中下一个最有可能出现的词，此时的分类类别就是词表的大小。对于问答阅读全文

posted @ 2023-02-07 17:32 仙守阅读(662) 评论(0) 推荐(0)

2023年2月3日

NLP之预训练语言模型GPT

摘要： 1引言在自然语言处理领域中，预训练模型通常指代的是预训练语言模型。广义上的预训练语言模型可以泛指提前经过大规模数据训练的语言模型，包括早期的以Word2vec、GloVe为代表的静态词向量模型，以及基于上下文建模的CoVe、ELMo等动态词向量模型。在2018年，以GPT和BERT为代表的基于深阅读全文

posted @ 2023-02-03 13:47 仙守阅读(840) 评论(0) 推荐(0)

2023年1月29日

NLP之引言

摘要：转到了NLP组，算是到了一个新的领域，其实很久之前就想接触NLP了，觉得无头绪，无从下手，很多都是碎片化，过时等资料。看了《ChatGPT对自然语言处理带来什么冲击》,其中以书本为锚点，介绍了NLP的发展史 1自然语言发展史 | 阶段 | 书籍 | 出版年 | | | | | | 第一代统计学习 | 阅读全文

posted @ 2023-01-29 13:58 仙守阅读(390) 评论(0) 推荐(0)

仙守

最美的不是下雨天,是曾与你躲过雨的屋檐!

公告