摘要:
“幻觉”和“蒸馏” 特性幻觉蒸馏 英文 Hallucination Distillation (Knowledge Distillation) 核心比喻 凭空想象(通常指产生错误信息,在蛋白质设计中指创造性生成)。 知识提纯与转移(从大模型转移到小模型)。 主要目的 生成新内容(无论是错误的文本还是 阅读全文
posted @ 2026-01-16 09:30
计算之道
阅读(6)
评论(0)
推荐(0)
|
摘要:
“幻觉”和“蒸馏” 特性幻觉蒸馏 英文 Hallucination Distillation (Knowledge Distillation) 核心比喻 凭空想象(通常指产生错误信息,在蛋白质设计中指创造性生成)。 知识提纯与转移(从大模型转移到小模型)。 主要目的 生成新内容(无论是错误的文本还是 阅读全文
posted @ 2026-01-16 09:30
计算之道
阅读(6)
评论(0)
推荐(0)
摘要:
最简单的例子:原始数据(1000个样本) ↓ ├── 训练验证集(800个样本,80%) │ │ │ ├── 第一步:五折交叉验证找最佳参数 │ │ │ └── 第二步:用最佳参数在整个800个样本上重新训练 │ └── 测试集(200个样本,20%) │ └── 第三步:训练完成后预测一次 1. 阅读全文
posted @ 2025-12-28 11:00
计算之道
阅读(45)
评论(0)
推荐(0)
摘要:
举例: 如下图1所示,已知小明到家时带着一只娃娃,请问他更有可能乘坐了公交还是地铁? 图1 图2 图3 图4 如图2所示,正方形面积为小明回家方式的所有可能(100%),黄色为公交(P(X)=20%),绿色为地铁(P(Y)=80%)。 如图3-4所示,深黄色面积为通过公交并且抓到娃娃的概率(P(W| 阅读全文
posted @ 2025-09-24 16:45
计算之道
阅读(46)
评论(0)
推荐(0)
摘要:
普通人若要验证生成的蛋白质序列或结构,是否满足他们的需求,还需要进行昂贵的实验。因此对比来看,蛋白设计比图像和文本的生成的验证更困难。这些模型的好坏取决于它们的训练数据、模型架构等。特别是关于功能映射,仍是当今蛋白质工程中最难的挑战,即使是最大最复杂的模型也无法克服这一挑战。事实上,虽然机器学习已经 阅读全文
posted @ 2025-09-11 16:37
计算之道
阅读(18)
评论(0)
推荐(0)
摘要:
1、机器学习的核心学习范式 (Core Learning Paradigms) 监督学习 (Supervised Learning):模型从带有标签的训练数据中学习映射关系(如输入->输出)。主要用于分类和回归任务。 例子:垃圾邮件识别(输入邮件内容,输出是/不是垃圾邮件)、房价预测。 无监督学习 阅读全文
posted @ 2025-09-02 14:45
计算之道
阅读(115)
评论(0)
推荐(0)
摘要:
在安装了PRODIGY: 蛋白-蛋白/蛋白-小分子结合能预测工具 后,发现电脑上的colabfold无法使用,报错如下: mrc3@wanglab-node3:test$ bash Run_colabfold.sh Traceback (most recent call last): File "/ 阅读全文
posted @ 2025-08-11 15:59
计算之道
阅读(40)
评论(0)
推荐(0)
摘要:
在线使用 网址: https://rascar.science.uu.nl/prodigy/ 本地使用 1. 一步安装 pip install prodigy-prot 2. 运行 (1)以AF2预测的复合物结构为例,PDB文件中包含AB两条链。 prodigy 000.pdb --selectio 阅读全文
posted @ 2025-08-11 10:14
计算之道
阅读(251)
评论(0)
推荐(0)
摘要:
ML很重要的一点是避免数据泄露的风险: 1、数据预处理造成数据泄露 在数据标准化(如StandardScaler)的时候,如果直接对所有数据(训练集+验证集/测试集)统一计算均值/方差并标准化,训练过程会隐式利用测试集分布信息,导致模型评估结果被高估,失去真实性。 通用防泄露原则: 🔒 黄金法 阅读全文
posted @ 2025-07-17 17:48
计算之道
阅读(25)
评论(0)
推荐(0)
摘要:
最近使用conda 突然出现了这个问题: Error while loading conda entry point: conda-libmamba-solver (No module named 'libmambapy.bindings') 网上看了很多方法,尝试后都没有解决。 最后,在执行以下命 阅读全文
posted @ 2025-06-03 16:44
计算之道
阅读(1086)
评论(0)
推荐(0)
摘要:
2026.1.17更新: 可以直接使用命令行工具(推荐,高效) 需要安装 bcif 或 gemmi 工具。它们处理mmCIF文件非常专业。 安装 gemmi (一个强大的晶体学工具): macOS (使用Homebrew): brew install gemmi Linux (Ubuntu/Debi 阅读全文
posted @ 2025-05-18 15:05
计算之道
阅读(1162)
评论(0)
推荐(0)
|