中国电子技术网

设为首页 网站地图 加入收藏

 
 
  • 首页 > 新闻 > 借助 Tensor Core GPU、LLM和适用于RTX PC 和工作站的工具,NVIDIA为数百万用户带来生成式AI

借助 Tensor Core GPU、LLM和适用于RTX PC 和工作站的工具,NVIDIA为数百万用户带来生成式AI

关键词:NVIDIA生成式AI

时间:2024-01-09 15:02:48      来源:互联网

NVIDIA发布具有高性能生成式AI功能的GeForce RTX™ SUPER桌面端GPU,来自OEM合作伙伴的全新AI笔记本电脑,及面向开发者和消费者的全新NVIDIA RTX™加速的AI应用和工具。

全新 GeForce RTX SUPER GPU、各大OEM的AI笔记本电脑为领先的AI平台带来 RTX 加速

NVIDIA发布具有高性能生成式AI功能的GeForce RTX™ SUPER桌面端GPU,来自OEM合作伙伴的全新AI笔记本电脑,及面向开发者和消费者的全新NVIDIA RTX™加速的AI应用和工具。

数十年来,NVIDIA在PC领域一直处于领军地位,现已有超1亿RTX GPU在推动着AI PC时代的发展,NVIDIA正通过提供工具以提升PC上的生成式 AI体验:NVIDIA TensorRT™加速用于文本生成图像工作流的热门Stable Diffusion XL模型、NVIDIA RTX Remix与生成式AI纹理工具、NVIDIA ACE微服务以及更多使用DLSS 3帧生成技术(Frame Generation)的游戏。

此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一个开源库,可加速和优化最新大语言模型 (LLMs) 的推理性能,现已支持更多面向PC的预优化模型。本月,NVIDIA发布由TRT-LLM加速的Chat with RTX技术Demo,让AI爱好者能与他们的笔记、文档和其他内容进行交互。

NVIDIA创始人兼首席执行官黄仁勋表示:"生成式AI是计算史上最重要的平台转变,它将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户基础,为开发者和玩家提供保证,让他们尽享生成式AI的魔力。”

在 PC 上本地运行生成式AI对于隐私、延迟和成本敏感型应用至关重要。但这需要大量AI系统安装基础,以及合适的开发者工具来调优PC平台的AI模型。

为满足这些需求,NVIDIA正通过其整个技术栈提供创新,推动新体验,并在现已支持超过 500 款NVIDIA RTX游戏和应用的AI PC基础上更进一步。

RTX AI PC 和工作站

NVIDIA RTX GPU能以最高性能运行各种应用,充分释放 PC上生成式AI的潜力。RTX GPU 中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能。

今天在 CES 发布的全新 GeForce RTX 40 SUPER 系列GPU包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。在AI工作负载方面,GeForce RTX 4080 SUPER 生成视频的速度比 RTX 3080 Ti 快 1.5 倍,生成图像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提供最高可达 836 AI TOPS,在游戏、创作和日常工作等方面提供革命性的AI性能。

包括宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 笔记本电脑,为用户带来开箱即用的生成式 AI体验。与使用NPU相比,RTX AI笔记本电脑的性能可提升 20-60 倍。

配备RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS™,用于简化、安全的生成式AI和数据科学开发。每台NVIDIA A800 40GB Active GPU都包含为期三年的NVIDIA AI Enterprise许可证,为AI和数据科学提供理想的工作站开发平台。

用于构建AI模型的全新 PC 开发者工具

为帮助开发者使用 PC 级的性能和显存快速创建、测试和定制预训练生成式 AI 模型和 LLM,NVIDIA于近期发布统一、易用的工具包NVIDIA AI Workbench。

AI Workbench 将于本月底推出测试版,提供对Hugging Face、GitHub 和 NVIDIA NGC™ 等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协作和迁移项目。

项目可扩展到数据中心、公有云或 NVIDIA DGX™ Cloud等任何地方,然后再回到PC 或工作站上的本地 RTX 系统进行推理和轻量定制。

NVIDIA通过与惠普的合作,将 NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和软件开发工具包)集成到惠普AI Studio中,这是一个集成化的数据科学平台,从而简化AI模型的开发。这将使用户能跨 PC 和云轻松搜索、导入和部署优化后的模型。

为PC使用场景构建AI模型之后,开发者可使用NVIDIA TensorRT 对其进行优化,以充分利用 RTX GPU 的Tensor Core。

最近,NVIDIA通过TensorRT-LLM for Windows将TensorRT扩展到基于文本的应用,TensorRT-LLM for Windows是一个用于加速LLM的开源库。TensorRT-LLM 最新更新现已发布,将Phi-2加入不断增长的 PC 预优化模型列表,与其他backend相比,推理速度提升5倍。

RTX 加速生成式AI为全新 PC 体验提供动力

在CES 2024上,NVIDIA及其开发者合作伙伴发布全新生成式AI驱动的 PC 应用和服务,包括:

NVIDIA RTX Remix,用于创建令人惊叹的经典游戏 RTX 重制版的平台。测试版将于本月底发布,提供生成式AI工具,可将经典游戏中的基本纹理转化物理精准的4K高精度材质。

NVIDIA ACE 微服务,包括生成式AI驱动的语音和动画模型,使开发者能为游戏添加智能、动态的虚拟数字人物。

TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM,这是两种最热门的Stable Diffusion加速方法。与之前最快的实现相比,TensorRT 将这两种方法的性能提升 60%。Stable Diffusion WebUI TensorRT扩展的更新版现在也已发布,包括 SDXL、SDXL Turbo、LCM-LoRA加速以及优化的 LoRA支持。

NVIDIA DLSS 3 支持帧生成技术(Frame Generation),可利用AI将帧率提高到原生渲染的 4 倍,将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中,包括《地平线:西之绝境》(Horizon Forbidden West)、Pax Dei和《龙之信条 2》(Dragon’s Dogma 2)。

NVIDIA技术Demo "Chat with RTX"将于本月晚些时候发布,让AI爱好者使用名为 " 检索增强生成retrieval-augmented generation(RAG)"的热门技术,轻松地将PC LLM连接到自己的数据。该Demo由 TensorRT-LLM 加速,使用户快速与自己的笔记、文档和其他内容进行交互。作为开源参考项目,开发者可轻松地在自己的应用中实现相同的功能。

欢迎参加 NVIDIA在美国拉斯维加斯举行的CES 2024,进一步了解生成式AI的最新突破。

关于NVIDIA

自1993年成立以来,NVIDIA (NASDAQ: NVDA) 一直是加速计算领域的先驱。NVIDIA 1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形,开启了现代AI时代,正在推动跨市场的工业数字化。NVIDIA现在是一家全栈计算公司,其数据中心规模的解决方案正在重塑整个行业。更多信息,请访问https://nvidianews.nvidia.com/

  • 分享到:

 

猜你喜欢

  • 主 题:安森美数字助听芯片的创新
  • 时 间:2024.05.09
  • 公 司:安森美

  • 主 题:IO-Link 技术介绍及相关设计解决方案
  • 时 间:2024.05.22
  • 公 司:ADI & Arrow