性能超英伟达!英特尔宣布首款云端AI芯开始商用

发布时间:2019-11-14 00:00
作者:
来源:hqew
阅读量:1288

据engadget报道,北京时间今日凌晨,英特尔在旧金山举行2019人工智能峰会,正式推出面向训练和推理的两款Nervana 神经网络处理器,并揭晓了新一代 Movidius Myriad 视觉处理单元。

性能超英伟达!英特尔宣布首款云端AI芯开始商用

  据悉,两款Neurana神经网络处理器包括面向训练的NNP-T1000和面向推理的NNP-I1000。这也是英特尔在2016年收购Nervana Systems和Movidius Ltd.两家机器学习公司后开发出来的芯片。会上,英特尔宣告两款芯片正式开始商用交付。

  其中,NNP-T采用台积电16nm制程工艺,拥有270亿个晶体管,硅片总面积达680平方毫米。英特尔在8月份的预告中曾说,NNP-T1000每秒可以处理多达119万亿次的操作。

  另外,基于10nm Ice Lake处理器架构的NNP-I1000在ResNet50上的评估效率可达4.8 TOPs/W,英特尔称其是同类芯片中能效最高的芯片。

  与此同时,英特尔还表示,Facebook和百度等公司已经迫不及待地要部署这两款Nervana芯片。Facebook人工智能主管Misha Smelyanskiy称,这些芯片是加速人工智能工作的关键,比如每天处理60亿个翻译。

  值得一提的是,对于下一代Movidius视觉处理单元,英特尔更是自信的将其和英伟达产品做出比较。

  据说,这款代号为Keem Bay的视觉处理单元能提供的Tops推理量是英伟达Xavier的4倍,在充分利用的情况下,该芯片可帮助客户获得50%的额外性能。而这款新一代的视觉处理单元将于2020年上半年上市,还需耐心等待。


(备注:文章来源于网络,信息仅供参考,不代表本网站观点,如有侵权请联系删除!)

在线留言询价

相关阅读
英特尔组建日本芯片制造自动化团队
英特尔2nm芯片量产计划推迟至2025年下半年
  据业界近日指出,位于美国亚利桑那州的英特尔Fab52晶圆厂原计划于2024年年底开始商业化生产2nm制程芯片,但现在看来,该工厂可能无法按时实现这一目标。预计该工厂将推迟量产2nm制程芯片,最早可能要到2025年下半年才能实现。  4月15日,英特尔发布全球十大建设项目回顾,包括美国、爱尔兰、以色列和德国的新晶圆厂,以及马来西亚和波兰的封装和测试设施。此前,美国商务部正式确认英特尔将获得85亿美元的补贴。  英特尔官方表示,Fab52工厂和Fab62工厂的混凝土上层结构已经完工。2023年12月,施工团队完成了Fab52工厂的一个重要里程碑,即混凝土层浇筑,作为工厂地基。到目前为止,施工人员共浇筑了43万立方米混凝土,相当于填满了132个奥林匹克规格的游泳池。  此外,施工团队也已开始在Fab52工厂安装自动化物料处理系统(AMHS),以提升物资运输效率。  据悉,台积电位于亚利桑那州的晶圆厂于2021年6月开工,2022年12月完成首批设备安装。然而,最新的进展表明,该工厂的外部建设尚未完成,因此2024年投产的预期恐无法达成。台积电已将在美工厂量产4nm芯片的计划推迟至2025年上半年,这给英特尔带来了追赶的契机。  英特尔在4月财报电话会议上表示,该公司“5年4个节点”的路线图仍在按计划进行,Intel 3工艺已经达到“生产就绪”阶段,下一个节点Intel 20A仍计划于2024年如期推出。
2024-04-23 11:30 阅读量:353
英特尔拟推出中国特供版Gaudi3AI芯片
  据悉,继此前正式公布新一代AI加速芯片 Gaudi 3 之后,英特尔拟另准备针对中国市场推出“特供版”Gaudi 3,包括名为HL-328的OAM相容夹层卡(Mezzanine Card )和名为HL-388的PCle加速卡两种硬件形态。  报道指出,英特尔在其Gaudi 3白皮书中披露了上述信息,其中HL-328将于6月24日推出,HL-388将于9月24日推出。根据英特尔公布的资料显示,Gaudi 3在FP16/BF16上可以达到1835 TFLOPS,相比英伟达H100在大模型训练方面快40%、推理能效高50%。  具体硬件规格方面,中国特供版的Gaudi 3与原版相比,具有相同的96MB SRAM片上存储,128GB HBM2e高带宽存储,带宽为3.7TB/s,拥有PCIe 5.0 x16介面和解码标准。但由于美国对于AI芯片的出口管制规则限制,使得这类高性能AI的综合运算性能(TPP)需要低于4800才能出口到中国,这意味中国特供版的Gaudi 3的16bit性能不能超过150 TFLOPS。  显然,中国特供版的Gaudi 3 需要大幅降低AI性能,才能合规出口到中国。因此中国特供版Gaudi 3 需要大幅削减内核数量(原版拥有8个矩阵数学引擎和64个张量内核)和工作频率,最终可能需要其AI性能降低约92%才能符合美国的出口管制要求。  由于中国特供版Gaudi 3 AI性能的降低,这也将使得其TDP(热设计功耗)大幅降低。根据曝光的资料显示,中国特供版Gaudi 3的OAM卡和PCIe卡的TDP均为450瓦,而原版PCIe卡(HL-338)的TDP高达600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高达900瓦。  可以预见的是,英特尔专为中国市场推出的“特供版”Gaudi 3的OAM兼容夹层卡(HL-328)和PCle加速卡(HL-388)的AI性能将会与英伟达针对中国市场推出的AI加速卡H20相当,它具有 148 TFLOPS 的 FP16/ BF16 性能,略低于 150 TFLOPS 的限制。但是,在HBM容量及带宽上,英特尔中国特供版Gaudi 3将低于英伟达H20,这也使得其在与英伟达H20的竞争当中可能将处于劣势,当然具体也要看定价是否有优势。
2024-04-16 09:43 阅读量:227
英特尔发布新款AI芯片Gaudi 3 Q2开始供货
  英特尔重磅发布了英特尔至强6处理器的全新品牌,推出英特尔Gaudi 3加速器,以高性能、开放性和灵活性助力企业推进生成式AI创新,并发布了涵盖全新开放、可扩展系统,下一代产品和一系列战略合作的全栈解决方案,以加速生成式AI落地。  其中,英特尔Gaudi 3加速器将会是英特尔对抗英伟达的利器。英特尔CEO基辛格也对此寄予厚望。企业希望将生成式AI从试验阶段扩展到应用阶段。因此,他们需要基于诸如英特尔Gaudi 3 AI加速器这样的高性能、经济实用、节能的处理器所打造的可快速部署的解决方案。并且,Gaudi 3还能满足复杂性、成本效益、碎片化、数据可靠性和合规性等需求。  英特尔表示,英特尔Gaudi 3 AI加速器将为AI系统提供动力,该AI系统可通过以太网的通用标准连接多达数万个加速器。与上一代产品相比,英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,以及1.5倍的内存带宽提升。该加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。  英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。此外,在Llama 7B、70B和Falcon 180B大型语言模型(LLM)的推理吞吐量和能效方面也展现了出色性能。英特尔Gaudi 3加速器提供开放的、基于社区的软件和行业标准以太网网络,允许企业灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。  对于Gaudi 3 芯片,英特尔在此前的新闻通气会上称该产品的能效是英伟达芯片的两倍多,运行 AI 模型的速度是英伟达 H100 GPU芯片的1.5倍。  Intel Gaudi 3将于今年第2季开始提供给OEM厂商, 包括戴尔、慧与、联想和美超微等。
2024-04-11 10:31 阅读量:308
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
RB751G-40T2R ROHM Semiconductor
BD71847AMWV-E2 ROHM Semiconductor
TL431ACLPR Texas Instruments
CDZVT2R20B ROHM Semiconductor
MC33074DR2G onsemi
型号 品牌 抢购
TPS63050YFFR Texas Instruments
IPZ40N04S5L4R8ATMA1 Infineon Technologies
ESR03EZPJ151 ROHM Semiconductor
BP3621 ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
BU33JA2MNVX-CTL ROHM Semiconductor
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360微信服务号 AMEYA360微信服务号
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。