3.18组会

蒋老师讲话:学科交叉融合
vcworld:“白盒”虚拟细胞,预测过程可读且分步,知识支撑下的机制推断(而非纯监督学习)
生物知识库检索(针对新查询:这个药物是否会影响这个基因,检索药物或基因这些机制相似的历史案例作为证据。相似度考虑基于LLM(大语言模型)的语义相似度和基于知识图谱路径或拓扑关系的结构相似度。正反两种案例,即相似并且会影响/相似并且不会影响都找)->LLM上下文增强(把检索到的局部知识图谱读懂,翻译成可解释文本)->规则化机制表达->基因表达预测(输出预测标签以及文本解释)
在genetak数据集上工作,包含348种药物扰动的5个不同细胞系,作为检索的证据托举
开放世界生物知识图谱的构建:整合多个开放知识库。图谱不是越大越好
构造了CoT(思维链)prompt,组织成推理题,类似于生物学家的思考方式
不仅能预测是否影响,还能预测向哪个方向影响
benchmark(基准测试)两个指标:模型判断准确性和LLM推理鲁棒性(不能放弃推断)
deepwiki:解析并总结github项目文件。把网址里的github替换成deepwiki

posted @ 2026-03-18 19:51  flipside  阅读(2)  评论(0)    收藏  举报