会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
ylifs
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2025年12月2日
Nat Commun | DNA大语言模型“大阅兵”:一项全面的基准研究为基因组学任务导航
摘要: 引言 近年来,以GPT-4为代表的基础模型(Foundation Models),或称大语言模型(LLMs),通过在海量文本数据上进行自监督预训练,学会了理解和生成人类语言的强大能力,并彻底改变了自然语言处理领域。这一成功范式迅速启发了其他科学领域的研究者。如果将DNA序列——这段由A, T, C,
阅读全文
posted @ 2025-12-02 19:48 ylifs
阅读(36)
评论(0)
推荐(0)
2025年11月25日
服务器代码执行三板斧
摘要: conda activate evo2 cd ~/evo2_contrast_enhanced/notebooks/clinvar/utils CUDA_VISIBLE_DEVICES=1,2 python evo2run.py 根据需要修改 或者是nohup conda activate evo2
阅读全文
posted @ 2025-11-25 19:06 ylifs
阅读(5)
评论(0)
推荐(0)
从基因组里面按照染色体和索引提取基因序列
摘要: 简单而言就是 pos要少一位数 pos=row["pos"]-1 seq = genome[chrom][pos] from pyensembl import EnsemblRelease from pyfaidx import Fasta ensembl = EnsemblRelease(110)
阅读全文
posted @ 2025-11-25 18:28 ylifs
阅读(6)
评论(0)
推荐(0)
Miniconda+Vscode安装避雷
摘要: 版本选择 https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Windows-x86_64.exe 直接选择最新版本即可。 自动配置环境变量 一点要选择Just me才能自动配置环境变量!! 重装前要删除
阅读全文
posted @ 2025-11-25 16:26 ylifs
阅读(7)
评论(0)
推荐(0)
2025年11月23日
论文里面的正体、斜体、加粗
摘要: 核心记忆口诀:“正常叙述用正体,特殊对象用斜体,标题重点可加粗” 一、什么时候用 正体 ? 正体就是默认字体,是论文的“正文”。 简单说:除了下面提到的“特殊情况”,其他所有文字都用正体。 必须用正体的常见情况: 论文的绝大部分文字:摘要、引言、章节正文、结论、致谢等。 单位符号:kg(千克)、s(
阅读全文
posted @ 2025-11-23 23:14 ylifs
阅读(177)
评论(0)
推荐(0)
2025年11月18日
通过SSH转发端口
摘要: 情景 存在一个Linux服务器,只开放22端口。通过ssh转发将服务转发到中转服务器。 命令 ssh -L 0.0.0.0:8888:localhost:80 liuyang@172.24.52.208 -p 22 nohup sudo autossh -M 0 -o "ServerAliveInt
阅读全文
posted @ 2025-11-18 15:37 ylifs
阅读(13)
评论(0)
推荐(0)
重构print函数使打印内容输出到日志文件
摘要: import builtins import sys # 保存原始的print函数 original_print = print # 重写print函数 def new_print(*args, **kwargs): # 调用原始print函数输出到控制台 original_print(*args,
阅读全文
posted @ 2025-11-18 15:21 ylifs
阅读(6)
评论(0)
推荐(0)
2025年11月13日
LucaOne架构
摘要: https://github1s.com/lucaone/LucaOne/blob/master/src/models/lucaone_gplm.py LucaOne模型架构详解 LucaOne是一个统一的基因-蛋白质多模态基础模型,其架构设计体现了对生物序列本质的深刻理解。模型的核心目标是打破基因
阅读全文
posted @ 2025-11-13 20:55 ylifs
阅读(19)
评论(0)
推荐(0)
LucaOne模型的词汇表系统
摘要: https://github1s.com/lucaone/LucaOne/blob/master/src/models/alphabet.py#L1-L205 通过定义词汇表,就能输入蛋白质或者DNA。 这段代码定义了 LucaOne模型的词汇表系统(Alphabet类),是模型处理不同生物分子序列
阅读全文
posted @ 2025-11-13 20:41 ylifs
阅读(8)
评论(0)
推荐(0)
2025年11月3日
Python线程锁
摘要: 多线程用于IO、网络请求等地方,只要不是CPU密集型,都可以直接使用多线程。 线程锁在代码中发挥着关键的保护作用,让我详细解释它的工作原理: 锁的作用机制 1. 基本工作原理 with lock: if ensp_id in ensp_to_seq: return True 执行流程: 线程A进入w
阅读全文
posted @ 2025-11-03 20:37 ylifs
阅读(15)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告