首页 > 新闻 > 英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

时间：2025-02-07 09:40:13 来源：互联网

“近日，DeepSeek发布Janus Pro模型，其超强性能和高精度引起业界关注。英特尔® Gaudi 2D AI加速器现已针对该模型进行优化，这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化，有效满足行业应用对于推理算力的需求，为AI应用的落地和规模化发展提供强有力的支持。

”

近日，DeepSeek发布Janus Pro模型，其超强性能和高精度引起业界关注。英特尔® Gaudi 2D AI加速器现已针对该模型进行优化，这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化，有效满足行业应用对于推理算力的需求，为AI应用的落地和规模化发展提供强有力的支持。

作为一款创新性的 AIGC模型，DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构，突破了传统AIGC模型依赖多路径视觉编码的限制，实现了理解与生成任务的一体化支持。在此基础上，Janus Pro通过优化训练策略和扩展模型规模，显著提升了文生图等功能的性能与稳定性，并提供了10亿参数和70亿参数两个版本，在性能与精度上展现了较强的竞争力。

图片来源：https://github.com/deepseek-ai/Janus/blob/main/images/teaser_januspro.png

在Janus Pro统一的Transformer架构下，文生图模型的吞吐量高低已经从依赖加速器的高算力向充分利用HBM内存高带宽和大容量转换。英特尔^®Gaudi 2D凭借 2.45TB/秒的高带宽和 96GB HBM 大容量内存，为 Janus Pro 模型提供了强大的计算支持，使其在生图批处理任务中，随着批量大小（Batch Size）的增加，吞吐性能得到显著提升，大幅缩短任务处理时间。

与此同时，结合英特尔Optimum-Habana 框架的优化，英特尔^®Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率，仅需约 10 秒即可生成16张高质量的图片，性能表现卓越。而且，开发者仅需调整数行代码，即可实现这一结果，极大降低了开发门槛和迁移成本，为 AI 应用的高效部署提供便利。

图片来源：利用英特尔Gaudi 2D AI加速器运行DeepSeek Janus-Pro-7B模型生成

此外，DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持，能够为客户创造更好的总体拥有成本（TCO），推动AI的普惠。

一直以来，英特尔始终秉承开放的态度，并通过软硬件相结合的方式推动AI应用落地。目前，英特尔丰富的AI产品组合，包括英特尔^®至强^®处理器、英特尔^®酷睿™ Ultra处理器和英特尔锐炫™显卡等，已经针对业界超过500个开源AI模型提供支持，广泛涵盖DeepSeek、Llama 3.1和通义千问等。同时，英特尔深耕开放生态，不仅以开放生态系统软件实现针对性优化，也通过打造企业AI开放平台（OPEA）为这些模型提供支持。

关于英特尔

英特尔（NASDAQ: INTC）作为行业引领者，创造改变世界的技术，推动全球进步并让生活丰富多彩。在摩尔定律的启迪下，我们不断致力于推进半导体设计与制造，帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备，我们释放数据潜能，助力商业和社会变得更美好。如需了解英特尔创新的更多信息，请访问英特尔中国新闻中心intel.cn/content/www/cn/zh/newsroom以及官方网站intel.cn。

声明：本网站原创内容，如需转载，请注明出处；本网站转载的内容（文章、图片、视频）等资料版权归原网站所有。如我们采用了您不宜公开的文章或图片，未能及时和您确认，避免给双方造成不必要的经济损失，请电邮联系我们，以便迅速采取适当处理措施；欢迎投稿，邮箱： editors@eccn.com。

分享到：

[上一篇：] 西门子获评 IDC MarketScape 制造执行系统领导厂商

[下一篇：] 2024财年：博世直面市场环境挑战