• 首页
  • 粮食
  • 蔬菜
  • 果品
  • 水产
  • 酒水
  • 饮料
  • 茶叶
  • 畜禽
  • 食用油
  • 资讯
logo
  • 首页>
  • 水产 >
  • 正文

天天实时:Amazon EC2 Inf2实例正式可用 助力更低成本、更高性能的生成式AI推理

2023-04-21 15:08:31 来源:亚马逊云科技

深度学习(DL)的创新,特别是大语言模型(LLM)的快速发展,已经席卷了整个行业。深度学习模型的参数已从数百万增加到数十亿,为我们呈现了越来越多激动人心的新能力。它们正在催生新的应用,如生成式AI或医疗保健和生命科学的高级研究。亚马逊云科技一直在芯片、服务器、数据中心互连和软件服务等多个方面创新,加速深度学习工作负载的大规模应用。

亚马逊云科技在2022 re:Invent 全球大会上,以其最新的自研机器学习推理芯片Amazon Inferentia2为基础,发布了Amazon EC2 Inf2系列实例的预览版。Amazon EC2 Inf2类型实例专门针对全球大规模运行高性能深度学习推理应用程序,为部署在EC2上的生成式AI应用提供最佳性价比,其中包含 GPT-J或开放式预训练Transformer(OPT)语言模型。

现在,亚马逊云科技宣布Amazon EC2 Inf2实例正式可用!


【资料图】

Inf2实例是Amazon EC2上首个推理优化的实例,支持可扩展的分布式推理,可实现多个inferentia2芯片之间的超高速连接。用户可以在Inf2实例中跨多个芯片高效部署具有数千亿个参数的模型。与Amazon EC2 Inf1实例相比,Inf2实例的吞吐量提高4倍,延迟降低10倍。

新Inf2实例的亮点

Inf2实例目前有四种可用实例类型,最高扩展至12个Amazon Inferentia2芯片和192个vCPU配置。在BF16或FP16数据类型下,它们能够提供2.3 petaFLOPS的综合计算能力,并具有芯片间超高速NeuronLink互连的功能。NeuronLink可在多个Inferentia2芯片上扩展大模型,避免通信瓶颈,实现更高性能的推理。

每个Inferentia2芯片内有32 GB的高带宽内存(HBM),最高配置的 Inf2 实例可提供高达384 GB的共享加速器内存,总内存带宽为9.8 TB/s。对于需要大内存支持的的大型语言模型而言,这种带宽对于支持模型推理尤为重要。

基于专门为深度学习工作负载而构建的 Amazon Inferentia2芯片的 Amazon EC2 Inf2,相比同类实例,单位功率性能高出了50%。

Amazon Inferentia2的创新之处

与亚马逊自研机器学习训练芯片 Amazon Trainium类似,每个Amazon Inferentia2芯片都配有两个经过优化的NeuronCore-v2引擎、高带宽内存(HBM)堆栈和专用的集体计算引擎,以便在执行多加速器推理时实现计算与通信的并行。

每个NeuronCore-v2都有专为深度学习算法构建的标量、向量和张量三种引擎,其中张量引擎针对矩阵运算进行了优化;标量引擎针对ReLU(修正线性单元)函数等元素性操作进行了优化;向量引擎针对批处理规范化或池化等非元素向量运算进行了优化。

以下是Amazon Inferentia2芯片和服务器硬件其他创新总结:

数据类型——Amazon Inferentia2 支持多种数据类型,包括 FP32、TF32、BF16、FP16 和 UINT8,用户可以为工作负载选择最合适的数据类型。它还支持新的可配置 FP8(cFP8) 数据类型,该数据类型特别适用于大模型,因为它减少了模型的内存占用和 I/O 要求。

动态执行和动态输入形状——Amazon Inferentia2 具有支持动态执行的嵌入式通用数字信号处理器 (DSP),因此无需在主机上展开或执行控制流运算符。Amazon Inferentia2 还支持动态输入形状,这些形状对于具有未知输入张量大小的模型(例如处理文本的模型)至关重要。

自定义运算符——Amazon Inferentia2支持用C++语言编写的自定义运算符。Neuron自定义C++运算符使用户能够编写在NeuronCore上天然运行的C++自定义运算符。用户可以使用标准的 PyTorch自定义运算符编程接口将 CPU 自定义运算符迁移到 Neuron 并实现新的实验运算符,所有这些都无需对 NeuronCore 硬件有任何深入了解。

NeuronLink v2——Inf2实例是Amazon EC2类型中首个将 NeuronLink V2 用于推理优化的实例,NeuronLink v2 为Inferentia2芯片间的提供超高速连接,加强分布式推理性能。NeuronLink v2使用all-reduce等聚合通信(CC)运算符,将高性能推理管道扩展到所有的推理芯片上。

新Inf2实例现已可用

用户可在亚马逊云科技美东(俄亥俄州)和美东(北弗吉尼亚州)地区启动Inf2实例,以按需、预留和竞价实例或Savings Plan方式调用。用户仅需为其实际使用的服务付费。如需了解更多相关信息,请访问Amazon EC2定价网站。

Inf2实例可使用亚马逊云科技深度学习镜像进行部署,并可通过Amazon SageMaker、Amazon Elastic Kubernetes Service(Amazon EKS)、Amazon Elastic Container Service(Amazon ECS)和Amazon ParallelCluster等托管服务调用。

关键词:

    为您推荐

  • 天天实时:Amazon EC2 Inf2实例正式可用 助力更低成本、更高性能的生成式AI推理

    水产2023-04-21
  • 热资讯!PICO 4 Pro正式发售,开启VR眼动/面部追踪新篇章 环球即时

    水产2023-04-21
  • 内蒙古通辽市科尔沁左翼后旗气象台解除寒潮蓝色预警【IV级/一般】

    水产2023-04-21
  • 中国石化广东石油开展2023年教育帮扶调研和爱心助学活动-环球快讯

    水产2023-04-21
  • 我区制修订166项地方标准

    水产2023-04-21
  • 美国“星舰”火箭升空后爆炸|今日看点

    水产2023-04-21
  • 钟薛高上新半个月,追问三个关键问题 看点

    水产2023-04-21
  • 世界今头条!表白被拒绝怎么办?

    水产2023-04-21
  • 轮胎厂开工率小降 节前存走低预期 动态

    水产2023-04-21
  • 金至尊铂金多少钱一克(2023年04月21日)参考价格

    水产2023-04-21
  • 电连技术董秘回复:目前6G的行业标准尚未明确,公司将跟踪6G相关标准和技术的进展情况 世界快播报

    水产2023-04-21
  • 今天最新消息 15日至18日西安新增阳性感染者54例 现有高风险区26个 天天快消息

    水产2023-04-21
  • 焦点快看:派能科技跌6.5% 某券商在其高位喊买入

    水产2023-04-21
  • 全球速读:万兴科技涨停 三个交易日机构净卖出1.07亿元

    水产2023-04-21
  • 钓鲫鱼视频_钓鲫鱼

    水产2023-04-21
  • 环球消息!眼角打出血?詹姆斯,不慌!

    水产2023-04-21
  • 双倍浪漫!22日两场美丽天象将上演|环球看热讯

    水产2023-04-21
  • 走西口的西口指什么在哪里(走西口的西口指什么地方)-环球时讯

    水产2023-04-21
  • 日语手写输入法在线使用_日语手写输入法在线-世界观天下

    水产2023-04-21
  • 补时绝平1-1!中超冠军终于“破蛋”,2万人狂欢,国安创耻辱纪录-世界新资讯

    水产2023-04-21

果品

  • 吃一颗杨梅等于吃10条虫子? 专家提醒:这些说法对不对?
  • 北京2022年冬奥会、冬残奥会奖牌“同心”正式发布
  • 冬奥故事会丨一图了解冬奥会历届奖牌
  • 同心筑梦向未来——写在北京冬奥会开幕倒计时100天之际
  • 外交部:美国针对亚裔仇恨犯罪数字令人痛心

蔬菜

  • 说好“一梯一户”却成了“两梯两户”,买方能否解除合同?
  • 更高水平开放合作助力中国东盟经贸发展迎新机遇
  • 9被告人犯侵犯著作权罪被判刑罚
  • 玉渊谭天丨中美再通话,“建设性”很重要
  • 环球时报社评:中美经贸需要建设性对话
  • 俄媒:莫斯科扩大新冠感染新疗法试点范围
  • 冰雪之约 中国之邀 | 追赶的勇气
  • 中国第20批赴黎维和建筑工兵分队完成“VA-2”道路排水系统修缮任务
  • 中国常驻联合国代表团举办恢复联合国合法席位50周年图片展
  • 美专家认为三大原因导致美国供应链危机

Copyright   2015-2022 大西洋食品网 版权所有  备案号:沪ICP备2020036824号-2   联系邮箱: 562 66 29@qq.com