通过计算的方法识别预测DNA上的增强子,准确率最高可达99.69%。Hi-Enhancer
通过计算的方法识别预测DNA上的增强子,准确率可达99.69%。
摘要
动机:
基因表达在细胞功能中起着至关重要的作用,增强子可以精确调节基因表达。因此,准确预测DNA上的增强子尤为重要。然而,现有的预测方法准确性低或依赖于固定的多个表观遗传信号,这可能并不总是可用的。
结果:
我们提出了一个两阶段框架,通过灵活组合多种表观遗传信号来准确预测增强子。在第一阶段,我们设计了一个混合KAN模型,该模型整合了各种基础分类器的结果,并采用Kolmogorov-Arnold网络(KAN)作为元分类器,基于多个表观遗传信号的灵活组合来预测增强子。在第二阶段,我们开发了一个堆叠自动模型,该模型使用DNABERT-2提取序列特征,并基于堆叠策略和AutoGluon框架定位增强子。当使用五个表观遗传信号时,混合KAN模型的准确率达到99.69±0.11%。在跨细胞系预测中,准确率大于或等于93.72%。在高斯噪声下,它仍然保持98.74±0.03%的精度。在第二阶段,堆叠自动模型的准确率为80.50%,优于现有的17种方法。结果表明,我们的模型可以灵活地用于利用多种表观遗传信号的组合来预测和定位增强子。
可用性和实现:
源代码可在https://github.com/emanlee/Hi-Enhancer和https://doi.org/10.6084/m9.figshare.29262158.v1.
论文的全文,免费下载:https://pubmed.ncbi.nlm.nih.gov/40796339/
预测增强子,增强子预测 Hi-Enhancer
https://pubmed.ncbi.nlm.nih.gov/40796339/
https://scholar.google.com/scholar?cluster=4355371431508655155&hl=en&as_sdt=0,5
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaf441/8232719
https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Enhancers+prediction+Hi-Enhancer&btnG=
https://www.google.com/search?q=Enhancer+prediction+Hi-Enhancer

浙公网安备 33010602011771号