盘古大模型是面向B端行业的大模型,包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构。
超千亿参数的中文预训练大模型,它利用大量数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。最新发布的718B深度思考模型采用稀疏高效的MOE新架构,探索不同专家异构方式,昇腾亲和设计在超节点带宽通信优势明显,718B深度思考模型增加多语言、推理类数据,达到国内模型第一梯队。
基于海量图像、视频构筑的视觉基础模型,利用少量数据微调即可实现特定任务。最新发布的视觉MOE大模型,具有30B大参数量,支持多类型范图像生成。
融合语言和视觉等多模态信息,实现图像理解、图像生成、视频生成等应用;最新发布的世界模型动态生成可交互、可漫游的数字空间。
面向结构化任务基于triplet transformer 统一架构在预训练阶段完成跨模型通用知识学习,支持基于用户的结构化数据,针对跨领域下游任务进行微调,从而实现对事物发展趋势、状态类别等进行量化预测的大模型。
科学计算大模型致力于将人工智能与科学研究深度融合,为气象、生物医药、化学材料等前沿领域打造高精度模型,助力科研突破,赋能产业升级与创新发展。
盘古大模型服务包含盘古基础大模型、盘古行业大模型与ModelArts Studio工具链平台,盘古基础大模型提供NLP、多模态、CV、预测、科学计算五大盘古基础模型与三方模型的模型服务,盘古行业大模型提供基于盘古基础大模型训练的行业大模型,涉及金融、政府、油气、矿山、电力、制造、交通、医学等行业领域。ModelArts Studio是一站式大模型工具链平台,支持百模千态,打造数据、模型、应用三引擎的大模型开发平台。盘古大模型服务将提供有竞争力的基础模型和适配行业的L1大模型,更提供易用、好用的工具链平台,成为行业首选的大模型供应商。
数据是大模型训练的基础,为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分,具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据发布和管理等功能。
该工具链能够高效收集和处理各种格式的数据,满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力,对原始数据进行优化,确保其质量和一致性。同时,数据工程工具链还提供强大的数据存储和管理能力,为大模型训练提供高质量的数据支撑。
模型开发工具链是盘古大模型服务的核心组件,提供从模型创建到部署的一站式解决方案。
该工具链具备模型训练、压缩、部署、评测、推理等功能,通过高效的推理性能和跨平台迁移工具,模型开发工具链能够保障模型在不同环境中的高效应用。
Agent应用开发工具链是盘古大模型平台的关键模块,支持提示词工程和智能Agent应用创建。该工具链提供提示词设计和管理工具,优化大模型的输入提示,提升输出的准确性和相关性。通过可视化编排工具,应用开发工具链加速大模型应用的开发,满足复杂业务需求。
数字员工、证件审核、智慧城市、智慧配煤、气象预报