1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

全球之领先经验 中国式发展速度,澳鹏立足中国 服务AI机器学习

 2019-11-06 16:18  来源:互联网  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

澳鹏(Appen)全球高级副总裁,大中国区总经理 田小鹏 博士 在AIIA 2019 人工智能开发者大会 主旨演讲

搭载AI顺风车 AI数据服务攀新高

2018年,中国的人工智能行业融资规模已达3,832亿人民币,无论融资总额还是融资次数均排名世界第一。2019 年的政府工作报告中还明确提出将深化人工智能研发应用,打造工业互联网平台,拓展智能,为制造业转型升级赋能。

紧随人工智能的大规模落地,由此引发人工智能数据需求的爆发式增长。尽管如此,来自艾瑞咨询2019年的研究报告指出,目前需求方在选择数据服务时往往会遇到数据安全、采标能力、数据质量、管理能力、服务能力等痛点。对于数据安全,需求方希望基础数据服务商有明确具体的安全管理流程,对数据传输、存储,以及结项后的数据销毁等环节比较重视。在采标能力方面,需求方算法越来越贴近业务,希望数据服务商对于自动驾驶、工业等有一定门槛的领域有采集能力,并且能理解客户意图,配合标注,甚至可以提出标注建议;根据市场反应,大多数数据服务公司首次交付项目时,数据的准确率普遍偏低,都需要一到两次的返工,故需求方对无效数据少、准确率高的公司更加青睐。对于执行效率,一般AI基础数据服务商都能在项目周期内完成,但管理能力较弱的公司很难在兼顾多个项目时做到精力集中、高质量地服务客户,同时执行团队的素养与信誉也是重要影响因素。服务意识是一项软实力,需要AI基础数据服务商能够积极配合、快速响应需求方要求。

数据作为 AI 算法的重要基石,如何为机器学习算法训练、优化提供数据采集、标注等高质量的服务,成为人工智能热潮中必不可少的一环,这也是澳鹏(Appen)致力于赋能中国 AI 企业,不断追逐的创新之路。2019年10月14日,国际领先的人工智能数据及机器学习数据服务供应商澳鹏(Appen)投资200万美金建立的澳鹏(Appen)中国·首个数据服务交付中心暨澳鹏科技(无锡)有限公司宣布正式开业,这标志着澳鹏(Appen)将立足中国,全面布局中国AI 数据服务产业,服务AI 机器学习,把中国AI数据服务引领入一个崭新的时代。

强强联手 打造端到端训练数据解决方案

澳鹏(Appen)作为全球领先的人工智能数据服务提供商,主要价值体现在拥有成熟的数据工程管理方法论和技术辅助保证稳定的高质量交付;AI 数据平台具备优良的用户体验和领先机器学习辅助标注技术;可大大提升数据标注和工程效率;规模化的私有化和众包数据标注,能使工程人员快速响应顾客的交付需求。这也是澳鹏(Appen)之所以能够为全球高科技、汽车、消费电子、电子商务、金融服务、医疗健康及科研机构等行业提供高质量、高效的 、安全的数据服务的关键所在。

2018年,澳鹏(Appen)投资3亿美金收购美国Figure Eight 数据标注平台,Figure Eight是一流的机器学习软件平台,使用自动化工具将未经标记的文本、图像、音频和视频数据转换为高质量的人工智能训练数据。此次收购,可谓强强联手,Figure Eight(此前名为CrowdFlower)于2007年创立于旧金山,在人工智能生态系统中发挥了关键性作用,仅2018年就提供了3.25亿条人工评判的数据。Figure Eight发布了包括机器学习辅助数据标记和视频目标追踪在内的多种不同的创新性能力,增强其平台性能。这些创新性能力用于打造高质量训练数据集比单靠人工标记能够提速多达50倍。

澳鹏(Appen)高效的云管理平台与可扩展升级、经验丰富的多语种众包资源,再加上Figure Eight具有机器辅助标注功能,面向客户的创新性SaaS平台。从而可打造独一无二的端到端训练数据解决方案。整合后的业务将主要定位于满足机器学习和人工智能技术开发过程中对训练数据日益增长的数量、品质和速度方面的要求。此举进一步增强了澳鹏(Appen)公司在数据收集、标注、翻译、转述等领域产品平台的高效化和自动化。

鼎力中国人工智能产业发展 争当顶尖AI数据服务公司

随着大型科技公司、银行和其他机构尝试利用人工智能来改善其产品和服务,也催生这一行业正迅速成为一个繁荣产业。人工智能发展带动了为机器学习和人工智能平台开发高质量的人工标注数据行业的蓬勃发展,尤其在自动驾驶领域,其广泛使用的AI深度学习算法,需要大量训练样本进行不断的算法优化,这些训练样本就是被标注过的原始数据。澳鹏(Appen)全球高级副总裁,中国总经理田小鹏说:“每个人都在试图减少对数据的依赖,因为数据是昂贵的,而且处理起来也很复杂,但人工智能对语言数据的胃口并没有减弱的迹象。相反,尽管存在这些挑战,包括深度学习在内的有效技术越来越依赖于大量数据,这一点是无可辩驳的。”

虽然一般情况下“数据越多越好”,但客户准确地知道他们在寻找什么更为重要。通常来说,收集数据的数量取决于你的预算,所以在收集所需要的数据时一定要非常小心。收集数据不仅成本高昂,收集信息也很复杂,处理起来也很复杂。语音数据的多样性、技术考虑以及所需的大量招聘工作等因素都导致了这种复杂性。澳鹏(Appen)全球高级副总裁,中国总经理田小鹏表示:“澳鹏(Appen)深刻理解中国在未来将是世界上最大的人工智能市场,中国具备丰富的人工智能应用场景、中国客户快速响应和成本竞争的要求,同时对知识产权注重、数据安全的保护,让中国市场成为澳鹏(Appen)未来发展的重要战略区域。澳鹏(Appen)总部授权澳鹏中国实现独立自主商业管理、经营和面向中国市场的数据服务产品/平台研发。借助澳鹏(Appen)公司的优秀的产品、服务和运营经验为中国人工智能的相关行业的产业化、智能化,国际化以及本地人才的培育贡献力量。”

澳鹏(Appen)全球高级副总裁,大中国区总经理 田小鹏 博士

来自艾瑞2019的研究报告指出,单纯依据客户各个项目的诉求进行数据采集和标注属于被动执行,主观能动性低、行业边界有限,各家公司的产品和服务趋于同质化、竞争呈胶着状态,制约着AI基础数据服务的发展。通过对需求方的研究,发现除安全性、质量、效率等核心关注点之外,越来越多的需求方对数据服务公司产生了主动服务的需求,希望数据公司能够更懂算法技术、更懂需求场景,甚至能参与到算法的研发中来,给出数据采标方面的优化建议,这也为数据服务商形成差异化竞争带来了契机,尤其是在AI落地阶段,在垂直场景中能够形成一套集调研、咨询、设计、采集、标注为一体的AI基础数据整体解决办法,将在收入和业务边界上实现突破。

这也正是位于澳大利亚悉尼,澳大利亚证券交易所上市公司(ASX:APX),在世界各地设有分支机构的澳鹏(Appen)能在这一领域成为世界领头羊,为世界前十大科技公司中的八家青睐之缘由所在。澳鹏(Appen)就是成功地通过其超过100万名经严格验证的全球众包资源群体——覆盖130多个国家超过180种语言——支持公司的全球客户。展望未来,澳鹏(Appen)全球高级副总裁,中国总经理田小鹏表示:由于高质量的的数据获取聚焦难,越来越多AI公司期望用大量未标注的数据通过机器自学后,形成数据模型,然后再对数据进行分类、标注。这种趋势下整个市场未来对需要标注的数据量会减少,但同时所呈现的AI场景日趋增多。如何用更先进有效的技术通过选取少量数据样本进行标注、训练模型,反馈信息,再选取少量数据样本标注、训练,这种主动学习的策略也将会被采纳。未来也将有越来越多的模拟数据用于机器学习模型训练。澳鹏(Appen)将持续不断创新,以全球领先经验,中国发展速度,力争成为顶尖的AI数据服务公司,服务AI 机器学习,为中国人工智能产业的发展不懈努力。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
ai技术
ai智能

相关文章

  • 汇聚中国AI顶尖力量 云天励飞参与华为AI大模型联合创新

    2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队

    标签:
    ai技术
  • 用友大易:迈入AI招聘2.0时代,让人力资源回归本质

    这几个月来,以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后,AI仿佛已经沉寂了很久,ChatGPT的横空出世就如同一束耀眼的光芒,让AI这个名词重回C位。过去在AI1.0时代,主要通过训练模型来实现图像识别、声音识别、语言处理等特

    标签:
    ai技术
  • 新发布的PaaS2.0,能否助力涂鸦智能再起飞?

    文:互联网江湖作者:志刚2023年的IoT需要一个新故事。6月29日,涂鸦智能在开发者大会上,发布了企业级战略PaaS2.0,希望通过一个平台+四大开发服务,建立起IoT生态。对于这场发布会,市场的态度是积极的。美东时间6月29日收盘,涂鸦智能美股股价上涨5.6%,来到1.87美元/股。近日股价稳定

    标签:
    ai技术
  • 大模型难掩AI制药的悲伤:越过山丘,无人等候

    美团曾经的二号人物王慧文对标OpenAI的创业项目光年之外,以20亿卖给美团,再度引发市场对大模型的热议。

    标签:
    ai技术
  • 拾起王慧文的AI梦,美团冲向“光年之外”?

    2020年底,王慧文在朋友圈写下这句话时,外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是,一个曾经多次创业,正值壮年的互联网老将心中的创业热情是难以熄灭的。

    标签:
    ai技术
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达
  • AI视频生成赛道“分野”:小厂重产品,大厂重生态

    AI视频生成赛道“分野”:小厂重产品,大厂重生态

  • 数据库进入“内存自由”时代!阿里云PolarDB发布全球首个CXL数据库服务器

    技术的进步永无止境,继创下TPC-C性能&性价比双冠之后,阿里云PolarDB云原生数据库再度实现关键突破。9月24日杭州云栖大会上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技术的PolarDB数据库专用服务器。在原有RDMA网络的基础上,Polar

  • 为AI时代云服务器量身定制 阿里云操作系统Alinux 4重磅发布

    2025年9月24日,在杭州举办的云栖大会上,阿里云正式发布全新一代服务器操作系统AlibabaCloudLinux4(简称Alinux4)。Alinux4基于Linux6.6内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS

  • 阿里云重磅发布AI安全护栏 五项安全能力护航AI安全

    9月24日,杭州云栖大会技术主论坛上,阿里云重磅发布AI安全护栏,提供五项核心安全能力,护航AI安全。一方面为客户提供融入AIAgent开发全链路的原生安全防护,另一方面持续用AI赋能安全产品智能化升级,打造Agentic-SOC安全运营,提升安全威胁检测和响应效率。在过去的一年,AIAgent正在

  • 魔搭社区国际版上线,并发布科学智能专区与AIGC创作引擎

    9月24日,魔搭社区举办了“全球协作•科学突破•创意无限”的专题论坛,并发布魔搭社区国际版、科学智能专区与AIGC创作引擎FlowBench,旨在连接全球开发者、加速科研范式创新、赋能创意表达。自2022年11月初成立至今,魔搭社区已成长为中国最大AI开源社区,其模型数量已突破10万,服务了全球20

  • 七连发!阿里多款重磅发布亮相云栖大会

    9月24日,2025云栖大会现场,阿里云CTO周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过G

  • 阿里云扩建全球基础设施,将新增巴西、法国和荷兰数据中心

    9月24日,阿里云在云栖大会上宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心,以便更好服务全球客户日益增长的AI和云计算需求。目前,阿里云在全球29个地区运营91个可用区,是中国最大、亚太第一的云服务商

编辑推荐