科研进展

实验室成功训练首个多模态材料语言大模型

发布时间:2024-10-24 09:35

【字体:      】

24年初,实验室和上海交通大学共同发布了首个针对材料化学领域的百亿参数级专业化大语言模型(Large Languages Model)——ChemDFM。通过引入海量材料和化学基础知识,学习并掌握相关专有语言与表达,该模型以130亿的参数量在大多数材料化学相关专业能力上完成了对通用大模型GPT-4.0的超越。

针对通用大语言模型无法理解材料多模态数据的难题,苏州实验室前沿材料部在材料化学领域大语言模型(ChemDFM)的基础上,于24年底成功构建了能够应用于各种材料化学任务的多模态材料化学通用大模型(ChemDFM-X)。ChemDFM以文本模态为主。ChemDFM-X则构建了多模态材料通用智能系统,能够理解不同类型的材料专业数据,包括文本、SMILES、二维分子结构、三维分子构象、分子或反应图片、质谱图等非文本形式的数据。模型支持质谱分析、反应预测和分子性质预测等十余种材料与化学任务。该模型采用了团队首创的“独立编码器+统一解码器”的架构设计,突破了大模型理解多模态材料数据的关键技术,多项性能上远超仅利用单一模态的大模型。

以上模型已于Neurips等会议开源发布,部分成果发表于Science China Information Sciences等刊物。团队正在开发ChemDFM-R,进一步提高大模型的逻辑思维能力,并与具体材料体系结合,全面赋能材料智能化研发。

苏州实验室