摘要: class SOPFilterAgent: def init(self, sop_description: str): """ 初始化SOP过滤Agent Args: sop_description: 完整的SOP描述文本 """ self.sop_description = sop_descrip 阅读全文
posted @ 2025-09-15 21:36 SherryJiang 阅读(16) 评论(0) 推荐(0)
摘要: 以下是针对条数不同的source和target数据,使用LLM判断两列是否可以直接映射的完整实现方案: 核心实现代码 import pandas as pd from langchain.chat_models import ChatOpenAI from langchain.prompts imp 阅读全文
posted @ 2025-09-04 18:43 SherryJiang 阅读(19) 评论(0) 推荐(0)
摘要: 先删除空列,然后找出两个DataFrame之间的列映射关系。 import pandas as pd import numpy as np from typing import Dict, List, Optional def remove_empty_columns(df: pd.DataFram 阅读全文
posted @ 2025-08-21 21:50 SherryJiang 阅读(19) 评论(0) 推荐(0)
摘要: 以下是针对两个字符串列表(String类型的List)计算相似度并判定是否为Direct Mapping的完整解决方案: 一、计算两列字符串列表相似度的5种核心方法 简单词法相似度 from collections import Counter import numpy as np def lexi 阅读全文
posted @ 2025-07-28 12:40 SherryJiang 阅读(18) 评论(0) 推荐(0)
摘要: 以下是针对多类型混合Excel报告的跨类型统一列映射系统实现方案,能够处理同一文件中包含多种type数据的情况,并找出满足所有type定义的direct mapping列: 系统架构设计 graph TD A[Client Excel] --> B[按type分组数据] B --> C1[Type1 阅读全文
posted @ 2025-07-24 11:52 SherryJiang 阅读(34) 评论(0) 推荐(0)
摘要: 以下是一个完整的解决方案,包含映射流程说明和可执行代码,用于实现跨类型direct column mapping: 映射流程 graph TD A[加载Excel报告] --> B[按type分组数据] B --> C[预处理列名] C --> D[为每个预定义列A-F寻找匹配] D --> E[列 阅读全文
posted @ 2025-07-24 11:50 SherryJiang 阅读(18) 评论(0) 推荐(0)
摘要: Excel列直接映射工具 下面是一个使用LangChain实现的Excel列直接映射工具,它会逐个处理源文件中的列,尝试找到与目标文件中直接对应的列。 import pandas as pd from langchain.agents import AgentType, initialize_age 阅读全文
posted @ 2025-07-09 11:09 SherryJiang 阅读(64) 评论(0) 推荐(0)
摘要: 有一个excel文件source A,包含了不同的20个列的业务数据,还有一个excel文件target column definition B,包含了10个目标列的定义,如列名,描述,要求数据格式,注释,值提取建议等。如何利用langchin实现从source 文件A中,每次读取一列数据,尝试将这 阅读全文
posted @ 2025-06-11 12:34 SherryJiang 阅读(56) 评论(0) 推荐(0)