1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

人工智能落地关键:流式推理引擎介绍及对比

 2020-06-24 14:47  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

DarwinML Inference:

DarwinML Inference流式推理引擎是为人工智能平台量身定做的商业化产品。

对于数据科学家而言,它的接口抽象,贴近其思维。不限定底层人工智能框架,给其足够的自由度。对于复杂的模型,支持DAG形式的工作流和数据流同图定义,一目了然且方便后续运营商部署和弹性伸缩。

对于运营商而言,它采用成熟软件栈和微服务架构,从单机到超大规模集群弹性伸缩。它不挑硬件,支持从嵌入式设备、台式机、大型服务器、云端虚拟机和容器乃至商业集群的各种新老硬件平台。它支持对接模型编译、小型化等优化加速技术,提升模型的适应度,提高单位资源的产出。自动批量功能能充分发挥人工智能模型批量计算和底层硬件向量加速的功能,即成倍提升系统吞吐量,又不增加数据科学家和运营商的成本。

对于用户而言,它提供丰富的接入接口,包括通用RESTful到高性能的RPC,支持从Python和Java的SDK。对于低延迟的场景,能提供毫秒级的相应。对于高并发的场景,支持线性在线自动扩容。

MetaFlow:

MetaFlow是Netflix开源的一款旨在帮助数据科学家开发管理其项目的Python库。他侧重于减轻数据科学家在开发、管理数据科学项目时,对非数据科学类其他工程领域的技能要求与投入。使之能关注于数据科学领域。

对于数据科学家而言,MetaFlow提供的编程规范和接口,将人工智能模型及相关处理的流程以工作流的形式组织起来,其他的事情,都由其后端运营商负责。

对于运营商而言,MetaFlow深度集成Amazon AWS,且是当前唯一支持的运营商,对于需要商用甚至调试的场景,都需要自己在AWS里面操作,完成存储、计算、通讯等适配,才能实现人工智能模型的服务化,对接终端用户。此外,MetaFlow里面的工作流,不处理数据流,完全依赖AWS。

对于终端用户而言,MetaFlow只提供了client,用以在python代码级别发起工作流调用。对于商用而言,相对缺少更加便捷丰富的接入方式。

AirFlow:

AirFlow是Airbnb开源的一款工作流系统,它基础功能简单,通过插件的形式支持各种语言和执行端。

对于数据科学家而言,它不是一款专门为期设计系统,需要引用一系列列插件、甚至是开发一些插件,才能完成与数据科学家及其人工智能模型应用的对接。和MetaFlow一样,它的工作流也只是涵盖业务层逻辑,不处理数据流,它通过插件支持各主流云平台,例AWS、Azure、GCP等,也有着和MetaFlow相同的问题,对数据科学家不太友好,比MetaFlow糟糕的是,它的集成相对MetaFlow来说要晦涩且难用。

对运营商而言,AirFlow更像是一个相对专业的底层工作流管理平台,但对于人工智能推理服务,他不是专业的,缺少直接、简单、易用的东西,比MetaFlow更为不及。

对于终端用户而言,AirFlow提供比较丰富的访问接口,相对更友好。

MLFlow:

MLFlow是有Databricks开源的一款机器学习生命周期管理平台,推理服务是其功能之一。

对于数据科学家而言,MLFlow是一个比较简单易用的机器学习平台,在推理服务环节,支持将同平台的模型导出为其标准的格式,例如Python Function、Scikit-learn、pyTorch、Tensorflow等,通过其部署工具,在支持的运行平台服务化。对比其他的推理引擎,其主要的弱势是模型从概念上不是基于工作流的,在构建复杂的中大型模型推理服务的时候,需要数据科学家自己解决工作流的问题。此外,同MetaFlow和AirFlow一样,他也不解决数据流的问题,需要数据科学家结合运营商的运行平台自己解决。

对于运营商而言,MLFlow支持4种部署方式,本地单机部署、Azure、Amazon SageMaker、Apache Spark UDF,但只有本地单机部署支持多种格式,其他云端、集群部署都只支持Python Function格式。这提高了商业化运行时,对数据科学家建模时的格式要求,削弱了MLFlow在建模阶段的优势。

对于终端用户而言,MLFlow只提供了RESTFul接口,在要求大流量、高性能、低延时的场景,还是缺少一些其他的选择。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
人工智能

相关文章

  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达