新多模态框架助力蛋白质设计，AI引领生物科技新潮流

2025年4月3日 241

采集

在生物科技领域，人工智能的应用正快速推动蛋白质的发现与设计。近日，加州大学伯克利分校（UC Berkeley）与加州理工学院(Caltech)的研究团队联合开发了一种名为 ProteinDT 的新型多模态框架，旨在利用文本描述来辅助蛋白质设计。这一创新方法不仅结合了蛋白质的序列和结构信息，还整合了大量以文本形式存在的生物知识，开启了蛋白质设计的新篇章。

ProteinDT 的工作流程分为三个主要步骤。首先，研究团队利用 “对比性语言 - 蛋白质预训练”（ProteinCLAP）方法，将文本描述与蛋白质序列进行对齐。这一过程借助于来自 UniProt 数据库的41.1万个文本 - 蛋白质对，采用对比学习技术，确保不同模态间的有效融合。

新多模态框架助力蛋白质设计，AI引领生物科技新潮流插图

图源备注：图片由AI生成，图片授权服务商Midjourney

接下来，ProteinDT 的 “Facilitator” 模型从文本中生成蛋白质序列的表征，通过高斯分布估计条件分布，以实现精准生成。而最后一个环节则是解码器，它作为条件生成模型，根据前一步的表征信息生成最终的蛋白质序列。

为验证这一框架的有效性，研究团队设计了三项下游任务。首先是文本生成蛋白质任务，通过输入目标蛋白质特性的文本描述，ProteinDT 能生成相关的蛋白质序列，其准确率超过90%。其次是零样本文本引导的蛋白质编辑任务，通过两种方法对已有序列进行编辑，无论是潜在空间插值法还是潜在优化法，都能有效注入文本信息，提升蛋白质生成的质量。最后，团队还评估了 ProteinCLAP 的学习表征稳健性与泛化能力，相较于其他六种前沿方法，ProteinDT 在多项基准测试中表现优异。

这一研究不仅为蛋白质设计开辟了新的思路，也展示了文本数据与生物分子设计结合的巨大潜力，未来有望进一步推动生物医学和药物开发的进步。

Comments | NOTHING

空空如也！

新多模态框架助力蛋白质设计，AI引领生物科技新潮流

OpenAI 计划将与微软收入分成比例大幅降低，预计新增 500 亿美元收入

甲骨文公司股价飙升 27%，人工智能未来收入大幅增长

豆包视频生成模型Seedance 1.0 pro上线首尾帧能力

月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级

欧盟推出11亿美元计划推动人工智能自主权

Canva 推出全新 “创意操作系统”，全面升级数字营销工具

新多模态框架助力蛋白质设计，AI引领生物科技新潮流

OpenAI 计划将与微软收入分成比例大幅降低，预计新增 500 亿美元收入

甲骨文公司股价飙升 27%，人工智能未来收入大幅增长

豆包视频生成模型Seedance 1.0 pro上线首尾帧能力

​月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级

欧盟推出11亿美元计划推动人工智能自主权

Canva 推出全新 “创意操作系统”，全面升级数字营销工具

月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级