英伟达SIGGRAPH大会-AI时代的先锋图形技术纪要-韭研公社

登录注册

英伟达SIGGRAPH大会-AI时代的先锋图形技术纪要

金融民工1990

长线持有

2023-08-09 20:48:21

1）GH200

为了满足生成式 AI 不断增长的需求，数据中心需要具有特殊需求的加速计算平台。全新的 GH200 GraceHopper Superchip 平台提供了卓越的内存技术和带宽，用世界上最快的内存HBM3e来提升处理器。

HBM3e 内存比当前 HBM3 快 50%，提供总共 10TB/秒的组合带宽，使新平台能够运行比之前版本大 3.5 倍的模型，同时通过快 3 倍的内存带宽提高性能。

包括一台具有144个Arm Neoverse内核、8 PB的AI性能和282GB最新HBM3e内存技术的服务器。

新平台使用Grace Hopper Superchip，它可以通过NVIDIA NVLink ™与Superchip连接，使它们能够共同部署用于生成AI的巨型模型。

预计将在 2024 年第二季度交付基于该平台的系统。

2）Hugging Face：

Hugging Face允许开发人员使用开源资源，构建、训练和部署最先进的 AI 模型，目前包括超过 15,000 个组织使用 Hugging Face，其社区共享了超过 250,000 个模型和 50,000 个数据集。

未来几个月内将推出NVIDIADGX Cloud 与 Hugging Face 的集成：提供“训练集群即服务”的新服务，以简化企业新的自定义生成人工智能模型的创建。

Hugging Face加速大规模模型的开发和定制：DGX Cloud与Hugging Face的集成将一键访问NVIDIA的多节点AI超级计算平台。有了DGX Cloud，Hugging Face用户将能够连接到NVIDIA AI超级计算，提供所需的软件和基础设施，用独特的数据快速训练和调整基础模型，以推动新一波企业LLM开发。

NVIDIA DGX Cloud加速大规模模型的开发和定制：DGX Cloud的每个instance都具有八个NVIDIA H100或A100 80GB Tensor Core GPU，每个节点总共有640GB的GPU内存。NVIDIA Networking提供了一种高性能、低延迟的结构，确保工作负载可以跨互连系统集群进行扩展，以满足高级人工智能工作负载的性能要求。

3）AI workbench

英伟达今日推出AI workbench，是一个统一、易于使用的工具包，允许开发人员在PC或工作站上快速创建、测试和自定义预先训练的生成人工智能模型，然后将其扩展到几乎任何数据中心、公共云或NVIDIA DGX™ Cloud。借助 NVIDIA AI Workbench，开发人员只需点击几下即可自定义和运行生成式 AI，允许开发人员使用自定义数据从 Hugging Face、GitHub 和NVIDIA NGC ™ 等流行存储库自定义模型、框架、软件开发，并整合到一个统一的开发人员工具包中。

许多领先的 AI 基础设施提供商，包括Dell Technologies、Hewlett Packard Enterprise、HP Inc.、Lambda、Lenovo和 Supermicro，正在采用 AI Workbench，拥有基于 Windows 或 Linux 的NVIDIA RTX™ PC 或工作站的开发人员还能够在本地 RTX 系统上启动、测试和微调企业级生成式 AI 项目，并轻松访问数据中心和云计算资源，以根据需要进行扩展。

为了进一步加速生成式 AI 的采用，NVIDIA发布了最新版本的企业软件平台NVIDIA AI Enterprise 4.0。它为企业提供采用生成式人工智能所需的工具，同时还提供可靠生产部署所需的安全性和 API 稳定性。NVIDIA AI Enterprise 支持的有助于简化生成式 AI 部署的软件和工具包括：

NVIDIA NeMo ™，一个用于构建、定制和部署大型语言模型的云原生框架。借助NeMo，NVIDIA AI Enterprise 为创建和自定义 LLM 应用程序提供端到端支持。

NVIDIA Triton™ 管理服务，有助于自动化和优化生产部署。它允许企业在Kubernetes 中自动部署多个NVIDIA Triton 推理服务器实例，并进行模型编排，以实现可扩展 AI 的高效运行。

NVIDIA Base Command Manager Essentials集群管理软件，可帮助企业在数据中心、多云和混合云环境中最大限度地提高 AI 服务器的性能和利用率。

NVIDIA AI Enterprise 软件可让用户跨云、数据中心和边缘构建和运行支持 NVIDIA AI 的解决方案，经认证可在主流 NVIDIA 认证系统™、NVIDIA DGX 系统、所有主要云平台和新发布的 NVIDIA RTX 上运行工作站。

4）OVX服务器

NVIDIA 宣布推出配备全新 NVIDIA® L40S GPU 的 NVIDIA OVX™ 服务器。这些服务器旨在加速计算密集型应用程序，包括使用 NVIDIA Omniverse™ 平台的 AI 训练和推理、3D 设计和可视化、视频处理以及工业数字化。

NVIDIA L40S GPU 是一款功能强大的数据中心处理器，可为生成型 AI 工作负载（例如文本、图像和视频生成、聊天机器人、游戏开发、产品设计和医疗保健应用）提供高性能。

新的 GPU 可为每台服务器提供多达 8 个 NVIDIA L40S GPU，每个 GPU 配备 48GB 内存。它基于 NVIDIA Ada Lovelace GPU 架构，包括第四代 Tensor Core 和 FP8 Transformer Engine，可提供超过 1.45 petaflops 的张量处理能力。与 NVIDIA A100 Tensor Core GPU 相比，L40S 的生成式 AI 推理性能提高了 1.2 倍，复杂 AI 工作负载的训练性能提高了 1.7 倍。

NVIDIA L40S GPU 还包括 142 个第三代 RT 核心，可提供 212 teraflops 的光线追踪性能，使其成为实时渲染、产品设计和 3D 内容创建等高保真专业可视化工作流程的理想选择。此外，它还具有 18,176 个 CUDA® 内核，提供近 5 倍于 NVIDIA A100 GPU 的单精度浮点 (FP32) 性能，可加速工程和科学模拟的复杂计算和数据密集型分析。

5）NVIDIA RTX工作站

全新 NVIDIA RTX 5000、RTX4500 和 RTX 4000 桌面 GPU 采用最新的 NVIDIA Ada Lovelace 架构技术，包括：

NVIDIA CUDA® 内核：与上一代相比，单精度浮点吞吐量高达 2 倍。

第三代 RT core：吞吐量高达上一代的 2 倍，能够同时运行具有着色或降噪功能的光线追踪。

第四代 Tensor Core：AI 训练性能比上一代快 2 倍，并扩展了对 FP8 数据格式的支持。

DLSS 3：借助 AI 的力量，将实时图形的真实感和交互性提升到新的水平。

更大的GPU显存：RTX 4000提供20GBGDDR6显存；RTX 4500 提供 24GB GDDR6 显存；RTX 5000 拥有 32GB GDDR6 内存，全部支持错误代码校正，可通过大型 3D 模型、渲染图像、模拟和 AI 数据集进行无错误计算。

扩展现实功能：支持高分辨率增强现实和虚拟现实设备，以提供创建令人惊叹的 AR、VR 和混合现实内容所需的高性能图形。

6）OpenUSD

OpenUSD 是一个 3D 框架，可实现软件工具和数据类型之间的互操作性，以构建虚拟世界。NVIDIA 正在通过NVIDIA Omniverse ™ 以及新的技术组合和云应用程序编程接口 (API)推进 OpenUSD 的开发。

NVIDIA宣布了由NVIDIA构建的四个新的Omniverse Cloud API，供开发人员更无缝地实现和部署OpenUSD应用程序。

ChatUSD——为开发人员提供的大型语言模型（LLM）副本，可以回答USD知识问题或生成Python USD代码脚本。ChatUSD使用NVIDIA的USD函数和Python USD代码片段进行了微调。

RunUSD——一个云API，检查上传文件与OpenUSD版本的兼容性，并使用Omniverse cloud生成渲染，将OpenUSD文件转换为渲染图像，目前可供NVIDIA OpenUSD开发人员计划的开发人员使用。

DeepSearch——LLM代理，可以进行大量未标记的数据库进行快速语义搜索。

USD-GDN发布器——一项一键服务，使企业和软件制造商能够从基于Omniverse的应用程序实时传输到web浏览器和移动设备。

7）Ominiverse

Omniverse 是一个OpenUSD 原生软件平台，用于跨 3D 工具和应用程序进行连接、描述和模拟，其更新加速了虚拟世界和工业数字化高级工作流程的创建。Cesium、Convai、MoveAI、SideFX Houdini 和 WonderDynamics 现已通过 OpenUSD 连接到Omniverse。

主要亮点包括Omniverse Kit（用于开发本机 OpenUSD 应用程序和扩展的引擎）、空间计算功能的改进以及生态拓展。

Omniverse Kit改进：新的Omniverse Kit ExtensionRegistry是一个用于访问、共享和管理Omniverse扩展的中央存储库，让开发人员可以轻松地打开和关闭应用程序中的功能，从而比以往任何时候都更容易地从NVIDIA提供的600多个Omniverse核心扩展构建自定义应用程序。

空间计算功能改进：新的扩展现实（XR）开发工具允许用户在基于Omniverse的应用程序中原生构建空间计算选项，让用户可以灵活地体验他们的3D项目和虚拟世界。

生态拓展：1）Adobe和NVIDIA宣布计划在Omniverse中提供Adobe Firefly作为API，使开发人员和创作者能够增强他们的设计流程。2）Wonder Dynamics通过其人工智能平台Wonder Studio连接到Omniverse，并提供OpenUSD导出支持，该平台可自动将计算机生成的角色动画、灯光和合成为真人场景。OpenUSD导出将使艺术家能够生成和导出完整的3D场景。3）BMW使用Omniverse将其全球约30家工厂网络数字化，使用Omniverse模拟新的电动汽车生产线，给工厂的位置编号。