刘庆峰介绍,大模型的研发过程,需要可以支撑千亿参数规模的大模型并行训练的算力和框架,还需要几千张卡同时连续运行。基于此,系统架构以及并行训练的集群能力成为国内大模型研发的关键。
此次发布的星火一体机,是科大讯飞与华为在AI算力、大模型的合作落地之一,将面向行业、企业客户,提供基于专用数据的自主可控私有化大模型。据了解,星火一体机基于华为鲲鹏CPU+昇腾GPU,另外联合华为存储和网络提供整机柜方案。
科大讯飞表示,星火一体机的训练和推理一体化部署,可用于问答系统、对话生成、知识图谱构建、智能推荐等领域的应用,具备大模型预训练、多模态理解与生成、多任务学习和迁移等能力。
就在此前的7月份,科大讯飞公布讯飞星火将与昇腾AI联合,打造基于中国自主创新的通用智能新底座。一方面,讯飞星火认知大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;另一方面,以昇腾AI为核心,软硬件协同优化,构建算力集中、性能优越、供给稳定、数据安全的大模型训练集群。
刘庆峰解释,华为跟科大讯飞共同在昇腾AI的软硬件平台和软件的支撑工具上,把高算力AI芯片、高性能的算子库、多卡高速互联以及分布式存储结合起来,针对人工智能所需要的最重要的算子库进行甄别和打磨。在此基础上,架构科大讯飞的训练和数据闭环全流程设计,以及训练和推理一体化设计的自研大模型训练平台,中间是支持大规模的异构算力兼容,也支持混合云架构易拓展,使得所有产品架构在安全可控的平台上。
目前,讯飞星火大模型拥有130亿、650亿和1750亿3个版本的模型参数可选。围绕星火大模型,科大讯飞正在构建开发者生态,目前有4000多个助手开发者团队加入星火平台。刘庆峰预测,讯飞星火大模型预计将于今年10月24日全面超越ChatGPT,明年上半年将正式对标GPT-4。