1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

CPU上跑AI?从推荐系统的演进看CPU的崛起

 2024-04-16 14:13  来源:互联网  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

在信息和数据极度繁荣的当下,人工智能正在通过各种方式影响着人类生活。其中,AI推荐系统作为互联网时代最关键的伴生技术之一,正在帮助人类梳理着各种纷繁杂乱的信息,让资源实现更精准的调配,让一切变得井然有序。

推荐系统:数字营销的重要引擎

当你到一座旅游城市,不知道当地有什么美食时,AI推荐系统在手机上的本地生活平台会为你列出当地所有美食;

当你在线上购物,不知道时下有哪些新款式衣服时,AI推荐系统在电商平台上又会为你列出应季又适合你的衣服。

对于企业而言,AI推荐系统更为重要,在浩渺的商业世界里,AI推荐系统就像一条秩序链,通过这条秩序链,数以千万计的企业得以找到分布在全球各地最需要他们产品的用户。

上海市人工智能行业协会秘书长钟俊浩指出:“随着人工智能技术的迅速发展及软硬件进步,我们正步入一个AI技术广泛应用并深刻影响各行各业的新时代,与此同时,如今电商、个性化广告等诸多商业场景背后都在以AI推荐系统作为依托,AI推荐系统已经是人工智能技术在商业领域最为成熟的应用之一。”

数字营销就是使用了AI推荐系统的一个主要场景, 作为国内领先的商业数字营销平台,阿里妈妈就在用AI推荐系统为企业提供全链路的营销解决方案。

阿里妈妈的使命是“让天下没有难做的营销”,通过自研的数字营销平台,阿里妈妈每年都在为各行各业的商家和品牌解决一系列营销和广告投放问题,通过精准营销帮助商家将产品推广到最需要他们的消费者面前,从而帮助企业实现他们应有的价值。

为了将海量商品与消费者进行更加精准的匹配,阿里妈妈的AI推荐算法和模型在过往几年里一直在不断升级迭代,与此同时,日益复杂的AI模型也使得AI推荐系统对硬件算力的需求越来越高。

“线上购物已经很普遍,实际上,每次用户在线上浏览商品都会涉及百亿量级的浮点运算”,阿里妈妈软件工程师刘征宇解释称。

由此带来的是日益增长的算力需求和有限算力供给之间的矛盾,这一矛盾也成了像阿里妈妈这样基于人工智能技术开展数字营销业务的企业的一大痛点。

要解决这一痛点,最直接的方法就是增加AI算力、优化AI算法。尤其是AI算力的提升,是数字营销业务不断升级迭代最重要的保障。

是挑战也是机遇,最适合的才是最好的

<iframe src="https://icon.zhiding.cn/swf/videoPlayer-new.html?Id=1951_4c6cba191ed082853f06c31ed021cc88&width=640&height=360" width="640" height="360" frameborder="0" data-mce-fragment="1"></iframe>

大模型的出现,让GPU呼声越来越高,似乎GPU在一夜之间成了人工智能技术在算力上的唯一选择。

其实不然,在数字营销这样实际商业应用场景中,GPU不仅不是唯一选择,甚至也可能不是最优解。

实际上,人工智能技术对于算力的强需求主要来自于AI训练和AI推理两方面。而要想将人工智能技术转化为各行各业的生产力,帮助各行各业提升生产效率,最关键的是AI推理。

钟俊浩也做过解析:“在大模型深入产业的这一年里,越来越多行业开始关注AI推理,而如何将CPU发挥到极致,加速AI推理,并推动其产业落地就成了关键问题。”

某些硬件厂商对于推荐系统、语音识别、图像识别、基因测序这样传统的AI应用,在CPU上已经做了大量的优化。特别是在执行AI推理任务时,经过优化的大模型在CPU上已经可以实现高效执行。 

英特尔数据中心和人工智能集团至强生态赋能事业部(中国)总经理李亚东就指出:“当模型很大,涉及到需要跨异构平台计算时,使用CPU速度反而更快,效率也更高。”

2023年12月,英特尔在国内正式发布了第五代至强<sup>®</sup> 可扩展处理器,它从多方面提升了硬件算力,包括频率,功耗,LLC缓存,内存带宽和延迟都有明显的改进。

最关键的是它内置的英特尔<sup>®</sup> 高级矩阵扩展(英特尔<sup>®</sup> AMX技术),特别针对深度学习模型最常见的矩阵乘法运算优化,支持BF16(训练/推理)和INT8(推理)等常见数据类型。

英特尔<sup>®</sup> AMX位于每个CPU内核上并靠近系统内存,可减少数据传输延迟、提高数据传输带宽,并且同步降低实际使用上的复杂性。

实际上,在目前AI推荐系统面临的硬件算力挑战中,CPU已经成了解决AI推理计算需求的核心算力。

据刘征宇透露:“阿里妈妈在选择以第五代英特尔<sup>®</sup> 至强<sup>®</sup> 可扩展处理器作为算力平台,使用英特尔<sup>®</sup> AMX和AVX-512优化后,针对广告推荐模型,性能相比第四代至强<sup>®</sup> 可扩展处理器有了明显提升,在满足SLA的前提下,吞吐量提升(达)1.52倍。”

基于此,阿里妈妈通过不断提升算力和优化算法,使得整个营销链条更加丝滑,也更加智能高效。

除了硬件创新,英特尔在软件方面也在持续发力,以确保现有的AI框架和应用能够充分发挥出硬件潜力。

英特尔不仅持续为主流开源框架PyTorch、TensorFlow等贡献力量,还提供了多种针对CPU平台的优化插件,如IPEX(Intel<sup>®</sup> Extension for PyTorch)、ITEX(Intel<sup>®</sup> Extension for TensorFlow)等,同时提供了诸如xFT(xFasterTransformer)、OpenVINO™ 工具套件等多种优化工具。

“最适合的,才是最好的,我们现在最需要的不是无限高的算力,而是拥有足够算力的超能战士。”刘征宇进一步解释称。

同样, CPU平台广泛部署、易于获取,便于应用和优化,能兼顾通用计算又能做推理加速,且不用为此导入异构带来的各种复杂性,自然就会收获高效的应用表现、落地速度和更强的成本竞争力。

以阿里妈妈所在的数字营销应用场景为例,无论是矩阵乘法这样计算密集型的AI运算,还是数据查询这样访存密集型的AI运算,都离不开CPU的参与。

即便是在CPU-GPU协同应用场景中,GPU这样协处理器的算力发挥作用,也非常依赖CPU的处理速度。

用CPU加速AI落地,未来可期,大有可为

如果说2023年是大模型技术爆发的一年,那么,2024年就是大模型深入产业应用的关键年。不论是大模型还是传统的AI技术,要想得到落地,做到“快、好、省”才是关键。

CPU能确保整个系统的稳定运行、各组件的高效通信协作,并最终推进任务的顺利执行。

除了热门的AI推理和训练,一条AI流水线中还包括数据预处理、后处理等可能需要CPU通用处理能力的环节。在这些环节中,CPU具备的通用性和灵活性,能够适应各种不同的计算场景,适应广泛的应用需求。

第五代至强<sup>®</sup> 可扩展处理器充分考虑到这些需求,内置了诸如英特尔<sup>®</sup> 数据流加速器(英特尔<sup>®</sup> DSA)来主攻数据存储与传输;英特尔<sup>®</sup> 存内分析加速器 (英特尔<sup>®</sup> IAA)来针对数据库和数据分析加速;英特尔<sup>®</sup> 数据保护与压缩加速技术(英特尔<sup>®</sup> QAT)来加速数据压缩、对称和非对称数据加密解密,提高CPU效率和整体系统性能。

李亚东还指出:“从企业长远发展来看,CPU在稳定性、安全性等方面的表现值得信赖,这对于保护企业数据和客户隐私至关重要。第五代至强<sup>®</sup> 可扩展处理器内置的英特尔<sup>®</sup> SGX和TDX,可以为企业分别提供更强、更易用的应用隔离能力和虚拟机层面的隔离和保密性,为现有应用提供了一条更简便的向可信执行环境迁移的路径。”

未来英特尔数据中心产品组合,预计可以覆盖通用计算与AI加速,实现从数据预处理、到模型训练与优化,再到部署与推理的AI“全管线”加速。

CPU不仅是老伙伴,还是新变量,随着新一代CPU在各方面性能的不断提升,CPU也正在成为为千行万业企业智能化转型提供源源不断动力的心脏。

正如钟俊浩所说:“持续创新和进化的CPU,在全新技术周期下,成为一代又一代科学家留给新时代最好的礼物。”

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 讯飞会议耳机登上《新闻联播》,助力AI+办公新潮流全球加速普及

    据4月18日《新闻联播》报道,国务院总理李强在第135届中国进出口商品交易会(广交会)期间,对包括讯飞会议耳机在内的智能硬件出海情况表示关心。生成式AI会议助手,让工作效率翻倍近年来,随着文字、语音、图像等处理能力跃迁,大模型摇身变为“助理”走入办公室和会议室,结合传统软硬件,使得办公和会议智能化。

  • 清华团队国产“Sora”火了 可一键生成1080p高清视频

    近日,生数科技联合清华大学发布了视频大模型「Vidu」,其强大功能引起了全网关注。该模型支持一键生成长达16秒、分辨率达1080p的高清视频内容,画面效果接近Sora。据悉,Vidu生成的视频画面流畅,细节丰富,逻辑连贯,呈现出高度接近真实世界的效果,并且几乎不会出现穿模、鬼影、运动不符合现实规律的

  • 从汽车到汽车机器人,不用再等100年

    ©自象限原创编辑丨程心20世纪50年代开始,世界所有的汽车公司都竞相开发操作简单,功能齐全的理想家庭用车。1950年,全球汽车总产量首次超过一千万辆。价格低廉、驾驶方便、油耗低的百姓汽车广受大众青睐。但从1888年,奔驰生产出世界上第一辆可供售的汽车至1950年,整整经历了60年,家用汽车才开始走向

    标签:
    智能机器人
  • 为何海尔智家能够做到“换新不厌旧”?

    在繁忙的城市角落,张先生的小公寓里藏着一个宝贝——一台20年前的海尔老式彩电。这台电视见证了他的拼搏、快乐和岁月的流转。虽然他对新科技并不感冒,但他的儿子小张对此却充满了好奇和热情。小张在线上看到以旧换新活动的同时,说服了张先生,并在手机上下单预约上门服务。没多久,服务人员便上门拆走旧家电,安装调试

    标签:
    海尔智家
  • 也谈谈AI洗稿

    前几天腾讯发了个公告称:平台巡查发现有些MCN和作者发布大量“AI洗稿”内容。并宣称要对“AI洗稿”行为进行打击,同时鼓励合理运用AI技术。其实我是想借此机会,给大家说说“AI洗稿”这件事,隐秘在黑暗角落里的赚钱行为。“洗稿”就是把别人的文章用AI工具修改润色一下或调整段落,然后再发到自媒体平台上,

    标签:
    ai智能
  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居
  • 李彦宏新目标,押注AI原生应用

    文/道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上表述了对未来AI人工智能发展的新一轮展望。自OpenAI发布ChatGPT大模型后,这股AI人工智能

    标签:
    李彦宏
  • AI算力竞赛加速散热技术变革,液冷方案获行业青睐

    进入AIGC时代,智算中心规模日渐庞大,服务器能耗与日俱增。如何降低智算中心能耗已成为国家和地方政府关注的焦点。工信部数据显示,2022年全国数据中心总耗电量约2700亿千瓦时。当前,大部分数据中心仍主要采用风冷散热技术,在单柜密度、PUE值方面已愈发难以满足行业发展及绿色节能方面的要求,而冷板式液

  • 中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布

    “你好,新应用!”站在大模型落地元年,是时候喊出这句话了。从软件APP、智能终端乃至具身智能等等,AIGC开始席卷一切。大模型玩家、互联网巨头、终端厂商、垂直场景玩家纷纷入场,办公、创作、营销、教育、医疗领域相继被渗透……一个万亿市场,正在酝酿。站在浪潮起点,当下发展究竟如何了?机遇在哪?挑战如何?

  • 标准引领促转型 提升新质生产力——2024数字教育标准创新应用研讨会召开

    4月14日,以“标准引领促转型,提升新质生产力”为主题,由全国信息技术标准化技术委员会教育技术分技术委员会主办,锐捷网络承办的2024数字教育标准创新应用研讨会暨《高等学校数字校园建设规范(试行)》(以下简称《规范》)优秀及典型应用案例的颁奖活动在福州举办。本次会议聚焦赋能新质生产力和高校教育数字化

编辑推荐