AI - 随笔分类(第3页) - VipSoft

HanLP — Aho-Corasick DoubleArrayTire 算法 ACDAT - 基于双数组字典树的AC自动机

摘要：双数组字典树能在O(1)（1是模式串长度）时间内高速完成单串匹配，并且内存消耗可控，然而软肋在于多模式匹配。如果要匹配多个模式串，必须先实现前缀查询，然后频繁截取文本后缀才可多匹配。比如 ushers、shers、hers…这样一份文本要回退扫描多遍，性能较低。既然 AC 自动机的goto表本身就是阅读全文

posted @ 2023-11-06 12:32 VipSoft 阅读(810) 评论(0) 推荐(1)

数据统计分析 — 概述

摘要：数据分析是利用数学、统计学理论相结合的科学统计分析方法、对 Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析，从中提取有价值的信息并开成结论进行展示的过程数据分析主要内容现状分析：分析已经发生了什么原因分析：分析为什么会出现这种现状预测分析：预测未来可能发生什么数据阅读全文

posted @ 2023-10-24 17:44 VipSoft 阅读(105) 评论(0) 推荐(0)

数据统计分析 — 数据可视化

摘要：统计表统计表是反映统计资料的表格,它一般由四个主要部分组成，即表头、行标题、列标题和数据资料。设计和使用统计表要注意的几点：首先，要合理安排统计表的结构。由于强调的问题不同，行标题和列标题可以互换，但应使统计表的横竖长度比例适当，避免出现过高或过宽的表格形式其次，表头一般应包括表号、总标题和阅读全文

posted @ 2023-10-23 16:33 VipSoft 阅读(688) 评论(0) 推荐(0)

HanLP — 双数组字典树 (Double-array Trie) 实现原理 -- 代码 + 图文，看不懂你来打我

摘要：目录Trie 字典树双数组Trie树构建字符编码计算规则构建 Base Array、Check Array处理字典首字处理字典二层字处理字典三层字处理字典四层字叶子节点处理核心代码完整代码学习HanLP时，碰到了双数组字典树（Double-Array Trie）的概念，网上找了好多贴子，花了好阅读全文

posted @ 2023-10-19 15:17 VipSoft 阅读(2927) 评论(6) 推荐(2)

Pandas 读取 Excel 斜着读

摘要：读取 Excel 斜着读数据 import pandas as pd def read_sideling(direction, sheet_name, row_start, col_start, gap): """ 斜着读数据 :param sheet_name: :param direction: 阅读全文

posted @ 2023-10-17 09:04 VipSoft 阅读(49) 评论(0) 推荐(0)

Pandas 读取Eexcel - 间隔N行，读取某列数据

摘要：间隔N行，读取某列数据 import pandas as pd def read_vertical(sheet_name, col_idx, gap): """ 竖着读数据， :param sheet_name: 第几个 sheet :param col_idx: 第几列，从 0 开始 :param 阅读全文

posted @ 2023-10-16 17:00 VipSoft 阅读(135) 评论(0) 推荐(0)

在线问诊 Python、FastAPI、Neo4j — 提供咨询接口服务

摘要：目录构建服务层接口路由层PostMan 调用采用 Fast API 搭建服务接口： https://www.cnblogs.com/vipsoft/p/17684079.html Fast API 文档：https://fastapi.tiangolo.com/zh/ 构建服务层 qa_servi 阅读全文

posted @ 2023-10-11 12:27 VipSoft 阅读(616) 评论(0) 推荐(2)

在线问诊 Python、FastAPI、Neo4j — 问题咨询

摘要：目录查出节点拼接节点属性测试结果问答演示通过节点关系，找出对应的节点，获取节点属性值，并拼接成想要的结果。接上节生成的CQL # 输入 question_class = {'args': {'看东西有时候清楚有时候不清楚': ['symptom']}, 'question_types': ['s 阅读全文

posted @ 2023-10-10 12:37 VipSoft 阅读(612) 评论(0) 推荐(1)

Python 获取控制台输入的值

摘要：获取控制台输入参数 if __name__ == '__main__': while 1: question = input('用户:') answer = "你的问题是：" + question print('VipQA', answer) 阅读全文

posted @ 2023-10-09 14:00 VipSoft 阅读(26) 评论(0) 推荐(0)

在线问诊 Python、FastAPI、Neo4j — 生成 Cypher 语句

摘要：目录构建节点字典构建Cypher CQL语句Test 这边只是为了测试，演示效果和思路，实际应用中，可以通过NLP构建CQL 接上一篇的问题分类 question = "请问最近看东西有时候清楚有时候不清楚是怎么回事" # 最终输出 data = {'args': {'看东西有时候清楚有时候不清楚' 阅读全文

posted @ 2023-09-28 09:00 VipSoft 阅读(534) 评论(0) 推荐(1)

在线问诊 Python、FastAPI、Neo4j — 构建问题分类器

摘要：目录构建字典数据构建 Trie 字典树按实体组装字典问题分析将问题进行分析，和系统已有的分类进行关联构建字典数据将构建的知识图片字典化，用于后面对问题的解析，下图为症状的字典，其它字典同理构建 Trie 字典树将建字典数据，组装集合 cur_dir = '/'.join(os.path. 阅读全文

posted @ 2023-09-27 08:55 VipSoft 阅读(554) 评论(0) 推荐(1)

Aho-Corasick 算法 AC自动机实现

摘要：敏感词过滤在社区发帖、网站检索、短信发送等场景下是很常见的需求，尤其是在高并发场景下如何实现敏感词过滤，都对过滤算法提出了更高的性能要求，Ahocorasick算法能够实现毫秒级的万字过滤匹配，能够很好的满足各种场景下的敏感词过滤需求。 Aho-Corasick算法通过将模式串预处理为确定有限状态自阅读全文

posted @ 2023-09-26 08:51 VipSoft 阅读(2403) 评论(2) 推荐(3)

Trie字典树

摘要：Aho-Corasick 算法 AC自动机实现：https://www.cnblogs.com/vipsoft/p/17722761.html 双数组Trie树 (Double-array Trie)：https://www.cnblogs.com/vipsoft/p/17774393.html T 阅读全文

posted @ 2023-09-25 12:25 VipSoft 阅读(819) 评论(0) 推荐(3)

在线问诊 Python、FastAPI、Neo4j — 创建节点关系

摘要：目录关系：症状-检查关系：疾病-症状代码重构 relationship_data.csv 症状,检查,疾病,药品,宜吃,忌吃 "上下楼梯疼,不能久站,感觉有点肿","膝关节核磁","右膝髌上囊及关节腔少量积液","扶他林","西红柿,香蕉","辣椒,大蒜" "眼睛胀痛,干涩,畏光,眼胀,眼痛,看东西阅读全文

posted @ 2023-09-22 11:38 VipSoft 阅读(117) 评论(0) 推荐(0)

在线问诊 Python、FastAPI、Neo4j — 创建饮食节点

摘要：目录饮食数据创建节点根据疾病、症状，判断出哪些饮食不能吃，哪些建议多吃饮食数据 foods_data.csv 建议值用“”引起来。避免中间有，号造成误识别饮食 "辣椒" "大蒜" "芥末" "海鲜" "胡萝卜" "核桃仁" "菠菜" "西红柿" "香蕉" 创建节点重构代码，将 def exe 阅读全文

posted @ 2023-09-21 08:53 VipSoft 阅读(115) 评论(0) 推荐(1)

在线问诊 Python、FastAPI、Neo4j — 创建疾病节点

摘要：目录疾病数据创建节点根据检查结果、医生的临床经验得出疾病疾病数据 disease_data.csv 建议值用“”引起来。避免中间有，号造成误识别疾病 "干眼" "右膝髌上囊及关节腔少量积液" 创建节点 import logging import pandas as pd from utils. 阅读全文

posted @ 2023-09-20 13:51 VipSoft 阅读(177) 评论(0) 推荐(0)

在线问诊 Python、FastAPI、Neo4j — 创建检查节点

摘要：目录检查数据创建节点根据不同的症状，会建议做些相对应的检验、检查检查数据 examine_data.csv 建议值用“”引起来。避免中间有，号造成误识别检查 "膝关节核磁" "眼睛酸胀" "视力" "砂眼" "辨色力" "角膜" "眼底" 创建节点参考创建药品节点。 import log 阅读全文

posted @ 2023-09-19 14:26 VipSoft 阅读(104) 评论(0) 推荐(0)

创建一个基本的FastAPI应用程序

摘要：Python 搭建 FastAPI 项目要生成FastAPI项目的代码，你可以使用FastAPI的脚手架工具来快速创建一个基本的FastAPI应用程序。以下是创建一个新的FastAPI项目的步骤：安装FastAPI和cookiecutter。你可以使用pip来安装它们： pip install 阅读全文

posted @ 2023-09-18 08:17 VipSoft 阅读(168) 评论(0) 推荐(0)

在线问诊 Python、FastAPI、Neo4j — 创建症状节点

摘要：目录症状数据创建节点附学习电子病历中，患者主诉对应的相关检查，得出的诊断以及最后的用药情况。症状一般可以从主诉中提取。症状数据 symptom_data.csv CSV 中，没有直接一行一个症状，主要想后面将症状 => 疾病做关联，最后会在一个 Excel 中表达所以每行实际对应一个症病，阅读全文

posted @ 2023-09-14 10:47 VipSoft 阅读(572) 评论(0) 推荐(1)

在线问诊 Python、FastAPI、Neo4j — 创建药品节点

摘要：目录前提条件创建节点 Demo准备数据创建药品标签节点在线问诊 Python、FastAPI、Neo4j — 创建节点 Neo4j 节点的标签可以理解为 Java 中的实体。根据常规流程：首先有什么症状，做哪些对应的检查，根据检查诊断什么疾病，需要用什么药物治疗，服药期间要注意哪些饮食，需要做哪阅读全文

posted @ 2023-09-12 16:22 VipSoft 阅读(756) 评论(0) 推荐(1)

随笔分类 - AI

公告