当前位置:首页 >  科技 >  IT业界 >  正文

英特尔oneAPI 2023工具包正式上线,帮助开发者利用英特尔硬件的先进功能

 2022-12-20 17:28  来源: 互联网   我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

为进一步帮助开发者利用英特尔硬件的先进功能,近日,英特尔宣布英特尔® oneAPI工具包的2023年版本已在英特尔®开发者云平台(Intel® Developer Cloud)上线,并正在通过现有的渠道推送。

新的oneAPI 2023工具包支持即将推出的第四代英特尔®至强®可扩展处理器、英特尔®至强® CPU Max 系列和英特尔®数据中心GPU,包括Flex系列和新的Max系列。这些工具可提升性能和生产力,并增加了对新的Codeplay1插件的支持,使开发者能更容易地为那些非英特尔的GPU架构编写SYCL代码。这些基于标准的工具提供了硬件方面的选择,也让在跨架构系统上运行的高性能应用的开发变得更加轻松。

英特尔oneAPI 2023工具包包括一套完整的最新编译器、库、分析和移植工具,以及优化后的AI和机器学习框架,让开发者能为oneAPI支持的CPU、GPU和FPGA构建高性能、跨架构的应用。开发者可使用这些工具快速实现性能目标,并通过单个代码库节省时间,从而将更多时间用于创新。

新版本的oneAPI工具包可帮助开发者利用英特尔硬件的先进功能:

· 第4代英特尔至强可扩展处理器和至强CPU Max系列,内置英特尔®高级矩阵扩展(英特尔® AMX)、Quick Assist 技术(QAT)、英特尔®AVX-512、bfloat16 及更多。

· 英特尔®数据中心GPU,包括内置基于硬件的AV1编码器的Flex系列,以及Max系列。Max系列提供灵活数据类型的支持,内置英特尔® Xe矩阵扩展(英特尔®XMX)、矢量化引擎(vector engine)、英特尔®Xe-Link互联扩展和其它功能。

oneAPI 2023工具包具有先进的软件性能:

· 英特尔® Fortran编译器(Intel® Fortran Compiler)提供了完整的 Fortran 语言直至 Fortran 2018标准的支持,并扩展了对 OpenMP GPU 分流的支持,加快了符合标准的应用程序的开发。

· 英特尔® oneAPI数学内核库(oneMKL)包含OpenMP 分流能力的扩展,提高了可移植性。

· 英特尔® oneAPI 深度神经网络库(oneDNN) 支持第四代英特尔至强处理器和Max系列CPU处理器的高级深度学习功能,包括英特尔®AMX、英特尔®AVX-512、VNNI 和 bfloat16。

通过丰富的SYCL支持,以及代码迁移和分析工具的强化,让面向多架构系统的代码开发变得更轻松,进而提高开发者的生产力。

· 英特尔®oneAPI DPC++C++编译器增加了Codeplay为英伟达和AMD GPU开发的新插件的支持,以简化SYCL代码的编写,并提高代码面向这些处理器架构的可移植性。这提供了一个统一的构建环境,并整合了工具,以提高跨平台生产力。作为该解决方案的一部分,英特尔和Codeplay将为英伟达GPU的oneAPI插件开始提供商业化的优先支持(priority support)。

· 基于开源 SYCLomatic的英特尔® DPC++ 兼容性工具增加了100多个新的CUDA APIs支持,让从CUDA到SYCL的代码迁移变得更容易。

· 用户可以使用英特尔®VTune™ Profiler识别大规模MPI应用中的不均衡问题。

· 英特尔® Advisor为英特尔数据中心GPU Max系列添加了自动化roofline分析,以识别内存、缓存或计算瓶颈,确认其原因并进行优先处理,同时提供可操作的建议,以优化从CPU到GPU 的工作负载分流中的重复数据传输成本。

48%4的开发者面向使用多种处理器的异构系统进行开发,因此需要更高效的跨架构编程来应对现实工作负载日益扩大的范围和规模。结合使用oneAPI 的开放、统一的编程模型与英特尔基于标准的多架构工具,开发者能够在CPU和加速器的硬件、性能、生产力和代码可移植性方面自由地进行选择。相反,为专有编程模型(如 CUDA)编写的代码,缺乏面向其它硬件的可移植性,让开发实践变得孤立,将企业困于一个封闭的生态系统中。

此外, 开放生态系统也在继续扩大对oneAPI的使用,新的oneAPI卓越中心正在陆续成立。剑桥大学Open Zettascale 实验室正致力于将重要的百万兆级的备选代码(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。该中心还提供课程和研讨会,由专家讲授oneAPI使用方法和工具,用于编译和移植代码以及优化性能。目前,在全球总共已经建立了30个oneAPI卓越中心。

*可前往英特尔新闻发布室了解更多产品性能具体细节

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
英特尔

相关文章

  • 首次部署英特尔Max系列GPU,极光超算将推动人工智能实现突破性进展

    阿贡国家实验室和英特尔于近日宣布,Aurora超级计算机的10,624个刀片的安装已经完成,该系统将于2023年晚些时候上线。该机器使用数万个XeonMax“SapphireRapids”处理器,配备HBM2E内存以及数以万计的数据中心GPUMax“PonteVecchio”计算GPU可实现超过2F

    标签:
    英特尔
  • 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

    英特尔研究院宣布与BlockadeLabs合作发布LDM3D(LatentDiffusionModelfor3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusionprocess)生成深度图(depthmap)的模型,进而生成逼真的、沉浸式

    标签:
    英特尔
  • 英特尔锐炫:驱动持续进步,尽展硬件潜力

    发布之初,英特尔锐炫A770和A750显卡就已展现出不错的实力。几个月过去,它们已然成长为同价位最好的显卡之一。AMD和英伟达微弱的代际改进,再加上较高的价格,让用户很难在1500至2500元左右价位找到一款满意的显卡,不过英特尔锐炫显卡悄悄地填补了这一空白。虽然锐炫A770和A750没有主打旗舰级

    标签:
    英特尔
  • 英特尔锐炫Pro图形显卡发布新品,集丰富的内容创作功能于一身

    英特尔推出两款全新英特尔锐炫Pro图形显卡;搭载英特尔锐炫ProA40图形显卡的系统现已出货。全新发布:英特尔今日宣布英特尔锐炫™ProA系列专业级图形显卡新增两款产品——英特尔锐炫™ProA60和ProA60M。上述两款产品的性能在现有英特尔锐炫Pro系列的基础上更进一步,为专业级工作站用户精心设

    标签:
    英特尔
  • 英特尔发布全新量子芯片Tunnel Falls,硅自选量子比特有望更快实现量产

    今天,英特尔发布包含12个硅自旋量子比特(siliconspinqubit)的全新量子芯片TunnelFalls,继续探索量子实用性,以解决重大难题。TunnelFalls是英特尔迄今为止研发的最先进的硅自旋量子比特芯片,利用了英特尔数十年来积累的晶体管设计和制造能力。在英特尔的晶圆厂里,Tunne

    标签:
    英特尔

热门排行

信息推荐