当前位置:首页 >  科技 >  IT业界 >  正文

英特尔为开发者开源宝藏工具,加速跨架构编程

 2022-05-24 16:28  来源: 互联网   我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

英特尔发布了一项开源工具,该工具可通过名为SYCLomatic的项目,将代码迁移至SYCL1,这有助于开发者更轻松地将CUDA代码迁移到SYCL和C++,从而加速面向异构架构的跨架构编程。这个开源项目能让开发社区共同协作,以推动SYCL标准的采用,这是将开发者从单个厂商的封闭生态系统中解放出来的关键一步。

英特尔oneAPI专家James Reinders表示:“使用SYCL将代码迁移至C++,为代码提供了更强的ISO C++一致性,支持多家供应商以缓解供应商锁定问题,并且支持多种架构,为充分运用新的硬件创新提供灵活性。SYCLomatic是一个可实现大部分工作自动化的宝藏工具,让开发者能更多地关注定制化调优,而不是迁移代码。”

在硬件创新为计算带来多样化异构架构的同时,软件开发也已经变得越来越复杂,很难充分释放CPU和加速器的价值。如今的开发者及其团队普遍缺乏时间、金钱和资源,以适应代码的重写和测试,为这些不同的架构提升应用的性能。开发者正在寻求开放替代方案,以提升时间价值。英特尔正在提供一种更简单、更快捷的方式,让开发者进行硬件选择。

SYCL是一种基于C++的Khronos Group标准,它扩展了C++功能以支持多种架构和非共享内存的配置。为启动该项目,英特尔开源了其DPC++兼容性工具背后的技术,以进一步提升迁移能力,生成更多基于SYCL的应用。跨架构重复利用代码简化了开发工作,减少了持续维护代码所需的时间和成本。

利用带有LLVM差异化的Apache 2.0许可证,托管在GitHub上的SYCLomatic项目为开发者提供了一个社区,让他们能做出贡献并提供反馈,以进一步开放跨CPU、GPU和FPGA的异构开发。

SYCLomatic协助开发者将CUDA代码迁移到SYCL,通常可以将90-95%的CUDA代码自动迁移到SYCL代码2。开发人员仅需手动编程剩余的工作,然后对特定架构进行定制化调优,达到所需的性能级别,便可完成这一过程。

研究机构及英特尔客户已成功地使用英特尔® DPC++兼容性工具,该工具采用与SYCLomatic相同的技术,能将CUDA代码迁移到多个厂商架构上的SYCL(或Data Parallel C++,oneAPI的SYCL实现)。这些案例包括斯德哥尔摩大学的GROMACS 20223、柏林祖思研究所(ZIB)的easyWave、三星Medison和Bittware(更多案例请访问oneAPI DevSummit)。许多客户也正在测试当前和即将推出的基于英特尔® Xe架构GPU的代码,包括阿贡国家实验室的极光(Aurora)超级计算机、莱布尼茨超级计算中心(LRZ)、GE医疗等。

SYCLomatic 是一个GitHub项目。GitHub门户网站拥有一个“contributing.md”指南,描述了向项目提供技术贡献的步骤,以确保最大程度的便捷。鼓励开发人员使用该工具,提供反馈并做出贡献,以推动该工具的发展。

HACC(硬件/混合加速宇宙学代码)、宇宙物理学和先进计算(anl.gov)的Steve(Esteban)Rangel表示:“CRK-HACC是一个正在开发的N体宇宙学模拟代码。为了给极光(Aurora)超级计算机做好准备,英特尔DPC++兼容性工具能让我们将20多个核心快速迁移到SYCL。由于当前版本的代码迁移工具不支持迁移到仿函数,我们编写了一个简单的clang工具来重构生成的SYCL源代码,以满足我们的需求。通过开源SYCLomatic项目,我们计划整合此前的工作,以获得更强大的解决方案,并助力让仿函数成为可用迁移选项的一部分。”

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
英特尔
编程软件

相关文章

  • 首次部署英特尔Max系列GPU,极光超算将推动人工智能实现突破性进展

    阿贡国家实验室和英特尔于近日宣布,Aurora超级计算机的10,624个刀片的安装已经完成,该系统将于2023年晚些时候上线。该机器使用数万个XeonMax“SapphireRapids”处理器,配备HBM2E内存以及数以万计的数据中心GPUMax“PonteVecchio”计算GPU可实现超过2F

    标签:
    英特尔
  • 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

    英特尔研究院宣布与BlockadeLabs合作发布LDM3D(LatentDiffusionModelfor3D)模型,这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程(diffusionprocess)生成深度图(depthmap)的模型,进而生成逼真的、沉浸式

    标签:
    英特尔
  • 英特尔锐炫:驱动持续进步,尽展硬件潜力

    发布之初,英特尔锐炫A770和A750显卡就已展现出不错的实力。几个月过去,它们已然成长为同价位最好的显卡之一。AMD和英伟达微弱的代际改进,再加上较高的价格,让用户很难在1500至2500元左右价位找到一款满意的显卡,不过英特尔锐炫显卡悄悄地填补了这一空白。虽然锐炫A770和A750没有主打旗舰级

    标签:
    英特尔
  • 英特尔锐炫Pro图形显卡发布新品,集丰富的内容创作功能于一身

    英特尔推出两款全新英特尔锐炫Pro图形显卡;搭载英特尔锐炫ProA40图形显卡的系统现已出货。全新发布:英特尔今日宣布英特尔锐炫™ProA系列专业级图形显卡新增两款产品——英特尔锐炫™ProA60和ProA60M。上述两款产品的性能在现有英特尔锐炫Pro系列的基础上更进一步,为专业级工作站用户精心设

    标签:
    英特尔
  • 英特尔发布全新量子芯片Tunnel Falls,硅自选量子比特有望更快实现量产

    今天,英特尔发布包含12个硅自旋量子比特(siliconspinqubit)的全新量子芯片TunnelFalls,继续探索量子实用性,以解决重大难题。TunnelFalls是英特尔迄今为止研发的最先进的硅自旋量子比特芯片,利用了英特尔数十年来积累的晶体管设计和制造能力。在英特尔的晶圆厂里,Tunne

    标签:
    英特尔

信息推荐