2026年1月19日

摘要: 对于大部分文字工作者来说,wps/word仍然是人们熟悉且普遍擅长的编辑工具,那么就不可避免错别字的问题。这里从对现有校对工具的观察出发,并基于大语言模型开展实践探索。一、现有校对工具观察(一)黑马校对应该说,黑马校对给我最深刻的映像就是,直到2025年年末,“金山-黑马校对”仍然保持了10年前的风 阅读全文
posted @ 2026-01-19 20:38 jsxyhelu 阅读(10) 评论(0) 推荐(0)

2026年1月18日

摘要: 我想构建的程序,应该是如下的: ①私域场景,也就是说,使用本地部署的大模型; ②不要离开word/wps等工具,采用将大语言模型嵌入的方式; ③需要代码开源,能够自主控制全流程。 下面,我会利用vibeCoding的方法,开展探索实践。 暂时取名叫做GOWordAgent,首先立足在windows中实现。 里程碑①在word中插入侧边栏和顶栏;(ok) 里程碑②在侧边栏中集成AI对话;(ok) 里程碑③右侧能够读取正文的内容; 里程碑④添加审阅的功能 阅读全文
posted @ 2026-01-18 08:58 jsxyhelu 阅读(18) 评论(0) 推荐(0)

2024年5月21日

摘要: 一、原生向量代码,自己计算距离 import numpy as npfrom numpy import dotfrom numpy.linalg import normfrom sentence_transformers import SentenceTransformermodel = Sente 阅读全文
posted @ 2024-05-21 17:57 jsxyhelu 阅读(85) 评论(0) 推荐(0)

2024年4月26日

摘要: 因为涉及到体能训练成绩,所以接触到了很多表格,触发了对表格数据的思考:图表也是重要的数据来源,应该如何来进行处理?图表的数据不仅关系它本身,而且也和表格形式相关,此外还和背景材料相关。首先从一个比较干净的表格开始,它本身是可以编辑的pdf.鉴于chatglm3不带pdf处理、llama3目前还没有看 阅读全文
posted @ 2024-04-26 07:14 jsxyhelu 阅读(301) 评论(0) 推荐(0)

2024年4月25日

摘要: 有别于广为人知的Sobel、Canny等一阶算法,基于Hessian矩阵能够得到图像二阶结果,这将帮助我们深入分析图像本质。 Hessian矩阵在图像处理中有着广泛的应用:其中在图像分割领域,包括边缘检测、纹理分析等;在图像增强领域,包括边缘增强、边缘消除等。 本文从Hessian矩阵定义出发,通过清晰简洁的数学推导和讲解实现公式到C++代码的转化。为了帮助深入理解Hessian矩阵在图像处理中的能力,我们将详细讲解和实现经典的“血管增强”算法(Frangi算法) 阅读全文
posted @ 2024-04-25 14:03 jsxyhelu 阅读(1030) 评论(0) 推荐(2)

2024年4月24日

摘要: vLLM 是一个快速且易于使用的库,用于进行大型语言模型(LLM)的推理和服务。这里通过运行实际的例子,来和传统原始方法进行比较。初步结论是vllm没有体现出明显优势。 阅读全文
posted @ 2024-04-24 14:18 jsxyhelu 阅读(5162) 评论(0) 推荐(0)

2024年4月14日

摘要: 分析输入信息的类别,目前是一个闭集、但是要按照开集的方式来进行分析;名称越乱越好,让系统自己来进行划分。必须首先考虑传统的方法;优先考虑数据结构的构建;强化监控机制的构建、首先进行认知和技术积累。一、数据情况找到了清华大学整理的关于体育的新闻,每篇一个新闻,第一行是标题,而后是内容。基于现有工具,直 阅读全文
posted @ 2024-04-14 16:50 jsxyhelu 阅读(71) 评论(0) 推荐(0)

2024年4月10日

摘要: 一、基本chain from langchain_core.output_parsers import StrOutputParser from langchain_core.prompts import ChatPromptTemplate from langchain_community.llm 阅读全文
posted @ 2024-04-10 20:15 jsxyhelu 阅读(52) 评论(0) 推荐(0)

2024年1月24日

摘要: 一、和chatglm3通信,基于chromadbimport jsonimport requestsimport osfrom pdfminer.high_level import extract_pagesfrom pdfminer.layout import LTTextContainerimp 阅读全文
posted @ 2024-01-24 07:03 jsxyhelu 阅读(298) 评论(0) 推荐(0)
摘要: embeded模型基于m3e。 一、原生向量代码,自己计算距离 import numpy as np from numpy import dot from numpy.linalg import norm from sentence_transformers import SentenceTrans 阅读全文
posted @ 2024-01-24 07:00 jsxyhelu 阅读(82) 评论(0) 推荐(0)

导航