行业资讯
-
信创模盒大模型推理引擎XC-LLM发布
2026-01-07
近日,信创模盒 Model Hub XC正式发布自研产品——信创模盒大模型推理引擎XC-LLM,致力于为国产化算力环境提供一套通用、高效、稳定的大模型服务基础平台。该产品围绕模型加载、资源调度、内存与显存协同管理等核心环节进行系统优化,助力大模型在多样化的国产芯片与异构算力环境中实现规模化落地。作为面向信创场景打造的新一代推理基础设施,XC-LLM旨在显著提升大模型在实际业务中的部署效率与服务稳定性。它不仅支持主流大模型的即开即用与灵活部署,还具备高并发处理、动态批处理与精细化调度能力,并配备完备的可观测与诊断工具,确保服务在真实生产环境中的可靠运行。在当前普遍面临的资源受限、多模型共存的业务场景中,XC-LLM展现出其独特的技术价值。通过内存与显存的智能协同管理,该引擎能够在有限算力条件下有效提升模型部署密度,降低成本的同时保障服务体验。本次发布的XC-LLM仅揭晓其部分核心能力,更多面向性能极致优化、场景深度适配的增强功能,将在后续版本中逐步释放。信创模盒将持续推进该产品在国产软硬件生态中的集成与优化,助力企业构建更高效、更经济的大模型服务基础设施。
关于信创模盒Model Hub XC 信创模盒Model Hub XC是面向信创算力生态的AI模型与工具平台,兼具社区和服务的功能,致力于推动国产硬件平台上的人工智能创新与落地,提供涵盖模型训练、推理到部署的全流程解决方案。信息来源:本文转载自“中国安防行业网”。版权归属原作者,本平台转载仅为行业信息传播,不保证其准确性。如有异议,请联系我们。