AWS 宣布具有 EC2 UltraClusters 功能的 Amazon EC2 P4d 实例全面上市-ESG跨境

AWS 宣布具有 EC2 UltraClusters 功能的 Amazon EC2 P4d 实例全面上市

2020-11-19

1233

AWS 宣布具有 EC2 UltraClusters 功能的 Amazon EC2 P4d 实例全面上市

西雅图--今天，Amazon.com 公司（纳斯达克股票代码：AMZN）旗下的 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Elastic Compute Cloud (Amazon EC2) P4d 实例，这是下一代的与上一代 P3 实例相比，GPU 驱动的实例为机器学习训练和高性能计算 (HPC) 工作负载提供 3 倍更快的性能、高达 60% 的成本以及 2.5 倍的 GPU 内存。 P4d 实例具有 8 个 NVIDIA A100 Tensor Core GPU 和 400 Gbps 的网络带宽（比 P3 实例多 16 倍）。使用具有 AWS 的 Elastic Fabric Adapter (EFA) 和 NVIDIA GPUDirect RDMA（远程直接内存访问）的 P4d 实例，客户能够创建具有 EC2 UltraClusters 功能的 P4d 实例。借助 EC2 UltraClusters，客户可以将 P4d 实例扩展到超过 4,000 个 A100 GPU（是任何其他云提供商的两倍），方法是利用 AWS 设计的与 Amazon FSx 集成的非阻塞 PB 级网络基础设施实现 Lustre 高性能存储，提供按需访问超级计算级性能，以加速机器学习训练和 HPC。要开始使用 P4d 实例，请访问：

AWS 宣布推出由具有 UltraClusters 功能的 NVIDIA A100 GPU 提供支持的 EC2 P4d 实例，用于机器学习训练和 HPC。

数据科学家和工程师通过创建更大、更复杂的模型来继续突破机器学习的界限，这些模型为广泛的用例提供更高的预测精度，包括自动驾驶汽车的感知模型训练、自然语言处理、图像分类、对象检测和预测分析。针对大量数据训练这些复杂模型是一项计算、网络和存储密集型任务，通常需要数天或数周时间。客户不仅希望缩短训练模型的时间，而且还希望降低总体训练支出。总的来说，长训练时间和高成本限制了客户训练模型的频率，这意味着机器学习的开发和创新速度较慢。

P4d 实例性能的提高可将机器学习模型的训练时间缩短多达 3 倍（将训练时间从几天缩短到几小时），额外的 GPU 内存可帮助客户训练更大、更复杂的模型。随着数据变得越来越丰富，客户正在训练具有数百万甚至数十亿参数的模型，例如用于文档摘要和问答的自然语言处理、自动驾驶汽车的对象检测和分类、大规模内容审核的图像分类、推荐电子商务网站的引擎和智能搜索引擎的排名算法——所有这些都需要增加网络吞吐量和 GPU 内存。 P4d 实例在一个 EC2 实例中配备 8 个 NVIDIA A100 Tensor Core GPU，能够实现高达 2.5 petaflops 的混合精度性能和 320 GB 的高带宽 GPU 内存。 P4d 实例是业内首个通过 Elastic Fabric Adapter (EFA) 和 NVIDIA GPUDirect RDMA 网络接口提供 400 Gbps 网络带宽的实例，可在服务器之间实现 GPU 之间的直接通信，从而降低延迟并提高扩展效率，有助于消除跨多个服务器的扩展瓶颈-node 分布式工作负载。每个 P4d 实例还提供 96 个 Intel Xeon Scalable (Cascade Lake) vCPU、1.1 TB 系统内存和 8 TB 本地 NVMe 存储，以减少单节点训练时间。通过将上一代 P3 实例的性能提高一倍以上，P4d 实例可以将训练机器学习模型的成本降低多达 60%，从而为客户提供比昂贵且不灵活的本地系统更高的效率。 HPC 客户还将受益于 P4d 提高的处理性能和 GPU 内存，适用于地震分析、药物发现、DNA 测序、材料科学以及金融和保险风险建模等要求苛刻的工作负载。

P4d 实例还基于 AWS Nitro 系统构建，AWS 设计的硬件和软件使 AWS 能够向客户提供越来越广泛的 EC2 实例和配置选择，同时提供与裸机无法区分的性能，提供快速存储和网络，并确保更安全的多租户。 P4d 实例将网络功能卸载到专用 Nitro 卡上，从而加速多个 P4d 实例之间的数据传输。 Nitro 卡还支持 EFA 和 GPUDirect，这允许 GPU 之间的直接跨服务器通信，从而促进 P4d 实例的 EC2 UltraCluster 之间的更低延迟和更好的扩展性能。这些 Nitro 支持的功能使客户能够在 EC2 UltraClusters 中启动 P4d，并按需和可扩展地访问 4,000 多个 GPU，以实现超级计算机级性能。

“我们的客户使用 AWS 服务构建、训练和部署机器学习应用程序的速度非常快。与此同时，我们从这些客户那里听说，他们想要一种成本更低的方式来训练他们的大型机器学习模型，”AWS EC2 副总裁 Dave Brown 说。 “现在，借助由 NVIDIA 最新 A100 GPU 和 PB 级网络提供支持的 P4d 实例的 EC2 UltraClusters，我们正在为几乎所有人提供超级计算级性能，同时将训练机器学习模型的时间缩短 3 倍，并降低成本与上一代实例相比，最多可训练 60%。”

客户可以使用 AWS Deep Learning Containers 在 P4d 实例上运行容器化应用程序，其中包含适用于 Amazon Elastic Kubernetes Service (Amazon EKS) 或 Amazon Elastic Container Service (Amazon ECS) 的库。为了获得更全面的托管体验，客户可以通过 Amazon SageMaker 使用 P4d 实例，从而为开发人员和数据科学家提供快速构建、训练和部署机器学习模型的能力。 HPC 客户可以利用带有 P4d 实例的 AWS Batch 和 AWS ParallelCluster 来帮助高效地编排作业和集群。 P4d 实例支持所有主要的机器学习框架，包括 TensorFlow、PyTorch 和 Apache MXNet，让客户可以灵活地选择最适合其应用程序的框架。 P4d 实例已在美国东部（弗吉尼亚北部）和美国西部（俄勒冈）推出，并计划很快在其他区域推出。 P4d 实例可以按需购买、使用 Savings Plans、使用预留实例或作为 Spot 实例购买。

GE Healthcare 是 GE 价值 167 亿美元的医疗保健业务。作为全球领先的医疗技术和数字解决方案创新者，GE Healthcare 使临床医生能够在其 Edison 智能平台的支持下，通过智能设备、数据分析、应用程序和服务做出更快、更明智的决策。 “在 GE Healthcare，我们为临床医生提供工具，帮助他们汇总数据、将 AI 和分析应用于该数据，并发现可改善患者结果、提高效率和消除错误的见解，”人工智能副总裁兼总经理 Karley Yoder 说。 GE医疗。 “我们的医学成像设备会产生大量数据，需要我们的数据科学家处理。使用以前的 GPU 集群，训练复杂的 AI 模型（例如 Progressive GAN）需要数天时间才能进行模拟并查看结果。使用新的 P4d 实例将处理时间从几天缩短到几小时。我们发现，在训练具有各种图像大小的模型时速度提高了两到三倍，同时通过增加批量大小实现了更好的性能，并通过更快的模型开发周期实现了更高的生产力。”

丰田研究院 (TRI) 成立于 2015 年，致力于为丰田开发自动驾驶、机器人和其他人体放大技术。 “在 TRI，我们正在努力打造一个人人都可以自由行动的未来，”TRI 基础设施工程技术主管 Mike Garrison 说。 “上一代 P3 实例帮助我们将机器学习模型的训练时间从几天缩短到几小时，我们期待使用 P4d 实例，因为额外的 GPU 内存和更高效的浮点格式将使我们的机器学习团队能够训练更多以更快的速度完成复杂模型。”

怡安是一家全球领先的专业服务公司，提供广泛的风险、退休和健康解决方案。 Aon PathWise 是一种基于 GPU 且可扩展的 HPC 风险管理解决方案，保险公司和再保险公司、银行和养老基金可以使用它来应对当今的关键挑战，例如对冲策略测试、监管和经济预测以及预算编制。 “Aon PathWise 允许（再）保险公司和养老基金使用下一代技术，以快速解决当今的关键保险挑战，例如对冲策略测试、监管和经济预测以及预算编制，”PathWise 总裁兼首席执行官 Peter Phillips 说。 “通过使用具有 2.5 petaflops 混合精度性能的 AWS P4d 实例，我们能够在不损失性能的情况下为客户提供两倍的成本降低，并且可以为最苛刻的要求提供 2.5 倍的速度提升计算。速度很重要，借助 AWS 的新实例，我们继续让客户满意。”

Rad AI 由放射科和人工智能专家组成，构建的产品可最大限度地提高放射科医师的工作效率，最终使医疗保健更广泛地获得并改善患者的治疗效果。 “在 Rad AI，我们的使命是为每个人增加医疗保健的可及性和质量。 Rad AI 专注于医学成像工作流程，可以节省放射科医生的时间、减少倦怠并提高准确性，”Rad AI 联合创始人 Doktor Gurson 说。 “我们使用人工智能来自动化放射学工作流程并帮助简化放射学报告。借助新的 EC2 P4d 实例，我们看到了比上一代 P3 实例更快的推理速度和 2.4 倍的模型训练速度和更高的准确度。这允许更快、更准确的诊断，以及更多地获得我们在美国的客户提供的高质量放射服务。”

OmniSci 是加速分析的先驱。 OmniSci 平台用于商业和政府部门，以发现超出主流分析工具限制的数据洞察力。 “在 OmniSci，我们正在努力打造一个数据科学和分析融合以打破和融合数据孤岛的未来。客户正在利用他们的海量数据，其中可能包括位置和时间，通过时空数据的精细可视化，不仅可以全面了解正在发生的事情，还可以了解何时何地。我们的技术可以看到森林和树木，”OmniSci 美国公共部门副总裁 Ray Falcione 说。 “通过使用 P4d 实例，与上一代 GPU 实例相比，我们能够显着降低部署平台的成本，从而使我们能够经济高效地扩展海量数据集。 A100 的网络改进提高了我们扩展到数十亿行数据的效率，并使我们的客户能够更快地收集洞察力。”

Zenotech Ltd 正在通过使用 HPC 云重新定义在线工程，提供按需许可模型以及利用 GPU 带来的极致性能优势。 “在 Zenotech，我们正在开发工具，使设计师能够创造出更高效、更环保的产品。我们跨行业开展工作，我们的工具通过使用大规模仿真提供更深入的产品性能洞察力，”Zenotech 董事兼联合创始人 Jamil Appa 说。 “与上一代 GPU 相比，使用 P4d 实例使我们能够将模拟运行时间减少 65%。这种加速大大缩短了我们解决问题的时间，使我们的客户能够比以前更快地将设计推向市场或进行更高保真度的仿真。”

关于亚马逊网络服务

14 年来，Amazon Web Services 一直是世界上最全面、应用最广泛的云平台。 AWS 为计算、存储、数据库、网络、分析、机器人、机器学习和人工智能 (AI)、物联网 (IoT)、移动、安全、混合、虚拟和增强现实（VR 和 AR）提供超过 175 项功能齐全的服务)、媒体和应用程序开发、部署和管理，来自 24 个地理区域内的 77 个可用区 (AZ)，并宣布计划在印度尼西亚、日本、西班牙和瑞士再增加 12 个可用区和四个 AWS 区域。数以百万计的客户（包括发展最快的初创公司、最大的企业和领先的政府机构）信任 AWS 来支持他们的基础设施、变得更加敏捷并降低成本。

关于亚马逊

亚马逊遵循四项原则：以客户为中心而非以竞争对手为中心、对发明的热情、对卓越运营的承诺以及长期思考。客户评论、一键购物、个性化推荐、Prime、亚马逊物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板电脑、Fire TV、亚马逊 Echo 和 Alexa 是亚马逊率先推出的一些产品和服务。

点击咨询现在有哪些新兴平台值得关注 >>>

特别声明：以上文章内容仅代表作者本人观点，不代表ESG跨境电商观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与ESG跨境电商联系。