1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

垂直行业大模型“封神”背后,AI数据服务走入“深水区”

 2023-09-26 13:33  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

文 | 智能相对论

作者 | 沈浪

由ChatGPT掀起的这股大模型浪潮,从通用领域席卷垂直领域。现阶段,越来越多的行业都在开发专用垂直细分赛道的大模型产品,以加速AI应用的场景化落地进程。

譬如,在电商领域,平台和商家正在利用大模型重塑各个零售环节。如智能导购,可基于消费者的海量消费数据为其提供商品推荐、商品挑选攻略、行程建议等。同时,大模型还能理解海量商品的详情数据,快速生成电商运营需要的商品主图、营销海报、详情页等等。

除此之外,电商垂类大模型在智能客服、供应链优化等场景上也都能基于海量数据的深度学习,快速掌握特定的售前售后话术、供应链订单处理等,全方位革新电商领域的零售模式和消费体验。

随着应用成果的落地,垂直行业大模型的价值正在释放,数字生产力持续提升。而作为人工智能三驾马车之一的数据要素也在这个时刻被提上新的战略高度——不难发现,垂直行业大模型的价值释放离不开海量数据的支持。

对应的,上游的AI数据服务商已经针对数据层面提出了新的解决方案。在2023年中国国际服务贸易交易会期间,国内头部AI数据服务厂商云测数据在去年发布的“AI工程化的数据解决方案”基础上全面升级,重点面向垂直行业大模型提出了全生命周期的AI数据解决方案,为大模型应用落地提供关键支撑。

以大模型应用为支点,在大量市场场景需求的撬动下,人工智能产业链上下游的板块正在迎来全新变革,数据层面的升级已经跃然纸上。

大模型应用“封神”的背后,是什么样的AI数据服务在支持?

大模型的爆发加速了人工智能的应用进程,同时也对整个算法产业链带来了新的挑战。在数据层面,过去生产数据、收集数据、加工数据、存储数据等流程就不再适用当前的市场需求,或者说无法高效地、很好地解决新出现的问题。

下游的AI应用融入大模型技术进行全新升级,上游的AI数据服务也同样面临着变革。那么,什么样的AI数据服务才是垂直行业大模型场景下需要的、适用的?

一、标准化

垂直行业大模型技术成果涌现的背后,对应是AI数据需求大幅增长。如何满足大幅增长的场景化数据需求,首要不是盲目扩大数据生产,而是提高AI数据的通用性、易用性,也就是标准化的问题,避免AI数据服务做“无用功”,保证数据的真实、有效、易用是满足垂直行业大模型爆发式增长需求的关键。

譬如,在智能网联汽车行业,《智能网联汽车激光雷达点云数据标注要求及方法》(T/CSAE 213-2021)、《智能网联汽车场景数据图像标注要求与方法》(T/CSAE 212-2021)等团体标准的发布,就为智能网联汽车的研发和测试提供了一套切实可行的场景数据点云标注方法,很好地推动了智能网联汽车的研发和测试。

其中最直观的感受则在于,过去AI数据服务行业各企业对图像标注的要求与方法都各不相同,标注结果文件各异,严重影响后续数据的统一使用。随着相关标准的发布,对标注流程和标注结果的保存形式都进行了规范,进而提升标注数据的通用性。

而在这个过程中,行业TOP地位的厂商往往都是标准的引领者,促使其在接下来的市场规范中获得了更大的话语权和主动权。譬如,以上智能网联汽车场景数据的两大标准,背后都有云测数据的参与。

这家头部AI数据服务商在参与标准制定,为行业攻陷自家经验和技术能力的同时,也更快、更好地掌握了数据标注相关场景的标准化,并应用到自家的产品和解决方案中。其中,基于对行业标准化的理解,云测数据发布的面向垂直行业大模型AI数据解决方案不仅能提供大规模感知数据能力,还能智驾企业减少数据采集周期,提升数据标注效率,降本增效,助力相关企业在数据层面实现研发领跑。

二、工程化

随着大模型技术的融入,人工智能应用进程正持续加速,而在供给端,AI数据服务也面临着数据生产、收集、处理、加工、存储等全生命周期流程的升级,从而才能满足AI数据的大幅度增长需求。简单来说,对应AI工程化的大趋势,AI数据服务也迎来了工程化的深度升级。

这里,云测数据发布的“面向垂直行业大模型AI数据解决方案”呈现出来的结果就是一条相对清晰的路径——通过丰富的数据标注工具、成熟的API集成能力、高效的数据闭环,加上人员管理及项目管理体系以及安全交付软硬件支持的方式,云测数据在保证数据隐私安全的环境下,对垂直行业大模型所需的海量数据实现了全生命周期管理。

更直观来说,对应AI数据服务的各个流程环节,云测数据都能提供对应的工具、技术能力、管理体系,好似成熟的制造生产线一般,一步步地完成数据从无到有的生产,从粗糙到精细的加工等目标,以供下游的垂直行业大模型用于预训练。

以基础的数据标注为例,云测数据目前提供了相对全面的平台工具模块,包括了点云融合跟踪、OCR文字转写、视频标注、语音转写、语音切割、文本判断、文本生成等等,充分满足行业垂直大模型的多模态数据标注需求。

三、场景化

今年以来,市场的焦点从通用大模型转向了垂直行业大模型,其背后是对技术应用落地的追求,同时也释放了一个足以撬动整条人工智能产业链的趋势——场景化。在AI数据服务领域,厂商不再盲目追求广泛的海量数据,而是针对某一特定领域或场景的有效数据。

场景的聚焦是加速垂直行业大模型落地的关键,同时也意味着更高要求的AI数据服务。以智能网联汽车为例,云测数据为其提供的AI数据解决方案目前就包括三部分,分别为基础数据库、定制化数据采集和标注服务以及包括数据采集标注、数据管理的全方位数据工具链。

简单来说,随着场景化趋势的发展,AI数据服务的定制化将越来越深入,不仅要针对某一特定行业或场景提供专业服务,还有可能聚焦某一公司或某一技术模块提供高度定制化数据服务。

同时,基于场景化的AI数据需求也远超常规,随着行业大模型的持续升级,场景的细分也会越来越精细,对应的数据需求更加严格。在与「智能相对论」的交流中,云测数据总经理贾宇航就提到,在智能网联汽车领域,为满足相关场景的丰富性,云测数据可以需要提供包含数据采集、数据生产、平台工具在内的AI数据服务,从而满足相关大模型的预训练需求。

总的来说,对应人工智能产业链上下游的关系,AI数据服务需要服务于垂直行业大模型的需求。现阶段,垂直行业大模型加速落地,需要更多、更有效、更精准的场景数据,AI数据服务的升级有迹可循。

AI数据服务走入“深水区”,头部厂商如何继续保持引领?

市场趋势的变化往往最先被行业TOP厂商所感知和反馈。在AI数据服务领域,云测数据提出“面向垂直行业大模型AI数据解决方案”,站在下半年垂直行业大模型进一步爆发的节点上将继续引领AI数据服务行业。

那么,只是纯粹的进场快,就能实现行业引领吗?显然不是。

结合垂直行业大模型发展的市场需求,云测数据的“面向垂直行业大模型AI数据解决方案”所呈现出来的更关键的价值在于其背后三大思维。

一、聚焦赛道,重视价值回归

垂直行业大模型的爆发式增长让“百模大战”愈演愈烈,各行各业都在做相应的大模型产品,呈现出来的市场机会很多,但是对应的AI数据服务需求也在升级。这就意味着不能用通用思维来做垂直行业大模型的AI数据服务,也很难有能力把所有行业都覆盖。

那么,在这个过程,厂商就需要有所取舍。目前,云测数据“面向垂直行业大模型AI数据服务解决方案”主要落地在零售电商、金融保险、智能网联汽车等领域。而这些都是云测数据从创立之初就聚焦深耕的行业,具备相应的数据积累、行业知识、项目经验以及客户资源等。

在云测数据总经理贾宇航看来,云测数据做垂直行业大模型的AI数据服务,首要的关键点是价值考量。

一方面,要做就先做有积累、有基础的领域——基于这个思路,云测数据在提供场景化数据采集方案的同时,也会在微调任务后对应行业需求提供专业的评测体系和服务,让AI数据服务更有价值。

另一方面,尽管垂直行业大模型很火,但商业化落地程度仍具有局限性。对于云测数据而言,结合过去的服务经验、项目经验筛选有市场需求的领域深耕,是对企业自身发展的负责,避免在过热的市场环境中迷失自我,失去发展价值。

二、纵横升级,强化基本功

垂直行业大模型应用落地是一个纵横能力协同的过程。云测数据总经理贾宇航将这一过程理解为“搭积木”,横向强化底座能力,有一个稳定的基础,纵向深耕场景化,对应不同的行业进行微调、优化,给出专业的解决方案。

具体来看,云测数据基于AI工程化的数据服务升级,在横向上就构建了一套包括数据可视化、扩展工具模块、数据权限管理体系等在内的AI数据服务解决方案,应对大模型预训练本身所需要的数据需求。

纵向上则针对不同的场景,基于行业理解提供专精解决方案,比如对应智能网联汽车研发与测试所需要的车外环境感知、车内智能座舱、人体动作识别等,满足垂直行业大模型的进阶需求。

三、坚守底线,规避行业敏感点

且不说数据领域本身就敏感,作为建立在海量数据之上的垂直行业大模型应用对数据的需求就非常严格,数据安全是一方面,数据的独特性、权威性、有效性则是另一方面。

对此,云测数据作为行业TOP企业始终将数据隐私安全放在业务开展的首位。云测数据总经理贾宇航表示,为了确保垂直行业大模型用于训练的数据合法合规,云测数据都会与企业客户签订数据授权协议。同时,云测数据在过去多年的发展中也会建立具备自由版权的数据集,以帮助更多行业客户去获取更多的高质量数据。此外,云测数据更是一家满足ISO27001和ISO27701标准的AI数据服务厂商,并先后获得ISO9001、ISO20000、CMMI3等相关认证。

结语

AI数据作为生产资料,是推动整个AI行业发展的必要一环,也是人工智能商业化的主要驱动力之一。换句话来说,高质量的数据决定了AI的落地程度也不为过。云测数据总经理贾宇航曾提出类似的观点。

而垂直行业大模型的爆发式增长,也就意味着AI数据需求的澎湃发展。围绕高质量数据为需求,垂直行业大模型的落地才有真正意义的基础。这是AI数据服务厂商的机会,也是人工智能产业突破发展的关键。

*本文图片均来源于网络

#智能相对论 Focusing on智能新产业新服务,这是智能的服务NO.239深度解读

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
大模型

相关文章

  • ChatGPT降温背后:大模型发展迎来真正转折点?

    作为目前AI领域的“神级产品”,ChatGPT的诞生,即吹响了AI革命的号角,随后包括谷歌、微软、Meta在内的国外科技公司,以及百度、华为、阿里、商汤科技、360、科大讯飞等在内的国内大厂,纷纷在短时间内推出了自家大模型产品。但这场空前繁荣能持续多久,始终是投资市场的一大关注点,尤其是近期网页版C

    标签:
    大模型
  • deepin官宣正式接入大模型,多款自研应用迎智能化升级

    今天我们向大家正式官宣deepin已实现大模型能力接入多款自研应用软件实现智能化升级统信软件高级副总经理、CTO张磊表示:“目前UOSAI实现了国内外主流大模型的能力接入,并封装成deepin的AI底层公共能力;同时,我们也将把UOSAI逐步开源给第三方应用,让更多应用可以在deepin上直接调用大

    标签:
    大模型
  • 云天励飞李爱军谈大模型时代边缘计算芯片突围 新一代芯片闪耀全球AI芯片峰会

    9月14日至15日,智一科技旗下芯东西与智猩猩联合主办的2023全球AI芯片峰会(GACS2023)在深圳市南山区举行。云天励飞副总裁、芯片业务线总经理李爱军出席峰会并发表演讲。李爱军在演讲中提到,全球边缘计算市场规模在不断扩大,但边缘计算场景仍面临着场景众多、算力需求碎片化、芯片平台种类多、商业闭

    标签:
    大模型
  • AI 如何赋能优质直播内容创作?

    图片|电影《机械姬》剧照‍‍‍‍‍‍‍‍‍‍‍©自象限原创作者丨周乾优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。直播行业

  • AI如何赋能优质直播内容创作?

    ©自象限原创作者丨周乾优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。直播行业线上化程度高,且内容质量直接决定其价值创造,这

  • 吐槽3家知名的AI智能体

    我花了2天时间,把松松最近1年的爆款文案+关键词+情绪+口头禅整理出来,4000多字的Prompt,都是一点点打出来的,再投喂到AI大模型里。使用的平台包括:通义千问、文心一言、智谱清言。接下来我吐槽下这3家AI模型的创建指令(Prompt)的体验:(注,本文只说指令功能,不说其他)(1)智谱清言智

    标签:
    ai智能
  • 解密Kimi:大模型应用当红顶流是如何练成的?

    抛开营销战,或许在中国也可以探索新的大模型应用聚合方式、供给方式以及商业利润分配的方式,对大模型公司来说,这将是一个新议题。

    标签:
    大模型
  • 讯飞会议耳机登上《新闻联播》,助力AI+办公新潮流全球加速普及

    据4月18日《新闻联播》报道,国务院总理李强在第135届中国进出口商品交易会(广交会)期间,对包括讯飞会议耳机在内的智能硬件出海情况表示关心。生成式AI会议助手,让工作效率翻倍近年来,随着文字、语音、图像等处理能力跃迁,大模型摇身变为“助理”走入办公室和会议室,结合传统软硬件,使得办公和会议智能化。

  • 清华团队国产“Sora”火了 可一键生成1080p高清视频

    近日,生数科技联合清华大学发布了视频大模型「Vidu」,其强大功能引起了全网关注。该模型支持一键生成长达16秒、分辨率达1080p的高清视频内容,画面效果接近Sora。据悉,Vidu生成的视频画面流畅,细节丰富,逻辑连贯,呈现出高度接近真实世界的效果,并且几乎不会出现穿模、鬼影、运动不符合现实规律的

  • 从汽车到汽车机器人,不用再等100年

    ©自象限原创编辑丨程心20世纪50年代开始,世界所有的汽车公司都竞相开发操作简单,功能齐全的理想家庭用车。1950年,全球汽车总产量首次超过一千万辆。价格低廉、驾驶方便、油耗低的百姓汽车广受大众青睐。但从1888年,奔驰生产出世界上第一辆可供售的汽车至1950年,整整经历了60年,家用汽车才开始走向

    标签:
    智能机器人
  • 为何海尔智家能够做到“换新不厌旧”?

    在繁忙的城市角落,张先生的小公寓里藏着一个宝贝——一台20年前的海尔老式彩电。这台电视见证了他的拼搏、快乐和岁月的流转。虽然他对新科技并不感冒,但他的儿子小张对此却充满了好奇和热情。小张在线上看到以旧换新活动的同时,说服了张先生,并在手机上下单预约上门服务。没多久,服务人员便上门拆走旧家电,安装调试

    标签:
    海尔智家
  • 也谈谈AI洗稿

    前几天腾讯发了个公告称:平台巡查发现有些MCN和作者发布大量“AI洗稿”内容。并宣称要对“AI洗稿”行为进行打击,同时鼓励合理运用AI技术。其实我是想借此机会,给大家说说“AI洗稿”这件事,隐秘在黑暗角落里的赚钱行为。“洗稿”就是把别人的文章用AI工具修改润色一下或调整段落,然后再发到自媒体平台上,

    标签:
    ai智能
  • 竞逐智能家居大模型:美的“蓄力”,海尔“疾行”

    随着ChatGPT火热出圈,AI大模型便成为了各行各业必争的高地。

    标签:
    智能家居

编辑推荐