DataVisor维择科技创始人兼CEO谢映莲近日在《福布斯》上发表了她对大数据发展的见解,她认为推动下一次大数据浪潮的动力不是“集中数据”,而是“集中智能”的能力。“集中智能”指运用有效的工具优化企业各部门的工作流程,运用先进的特征工程直接从原始数据中获取智能见解并输出有预见性的决策。
▽以下为原文译文
数据对现代数字经济的运作至关重要。但是,仅有数据并不能自动转换为可操作的智能能力,也不会自动推动数字经济繁荣发展。想要在全球数字经济中取得成功,除数据外,还需要先进的操作工具和解决方案,从而大规模获得可行的智能见解。
当前,不少企业仍停留在用大量集中式的数据驱动企业发展的阶段,但是,从数据安全和隐私保护等角度出发,我们应该从“集中数据”向“集中智能”过渡。
2015年,IBM指出:“当今世界90%的数据是在过去两年中创建的。”回头看这段数字化之路,我们提升了数据解释、创建数据图表、图形和可视化效果的能力,同时也增强了数据分析能力。为了在企业级利用这些能力,我们还开发了集中式数据分析方法使企业和机构能够受益。
如今,AI和机器学习等变革性技术快速崛起,智能能力也随之变得异常复杂,同时,“集中数据”和“集中智能”之间出现了沟壑。在“集中数据”阶段,我们仍在进行可视化的数据管理和数据分析解释,努力找出趋势并尝试理解它们。当我们进入到“集中智能”阶段时,意味着数据不仅停留在解释阶段,“集中智能”能够预测性地创建可行的智能见解,并有效采取大规模实时的行动。重要的是,可操作的智能位于系统内部,它是集中式的。
什么是集中式?集中式不是一个新概念。数据规模和复杂性的快速增长使企业难以管理自己的信息。因此,企业往往朝着集中团队、工具和流程的方向去发展。表面上看,集中式代表了企业对大数据增长趋势的积极应对。不少企业在实现降本增效的路上努力,并取得了不同程度的成功。但实际上,还有一些企业停留在只“集中数据”而不是“集中智能”的阶段,而“集中数据”的成本和效率收益仍然有限。
鉴于当今数字经济的需求,数据安全的压力和用户体验的竞争都在不断增加。大数据智能已成为当代最有价值的商品。但对于大多数企业而言,“集中智能”仍然是一个遥不可及的目标,主要原因是许多企业普遍缺乏先进的特征工程的能力。特征工程对于构建智能系统至关重要。特征能从大数据中发掘出的可行见解,这些见解转换为智能来供AI算法使用,也就是说,通过特征来释放出大数据的力量。
那么,为什么先进的特征工程尚未得到广泛的应用呢?因为特征工程必须手动完成,这是一个复杂且耗时的工作。在迎接各类业务挑战时,需要大量有效特征去应对,这是个很难克服的困难。
实时生成高质量的特征需要大量专业领域的知识,来自专家丰富的经验能够支持特征工程输出特征的价值、适用性、相关性,并且还能对操作进行有效优化。除此之外许多因素影响着特征工程的质量和效率,比如,在准备好生产就绪的代码之前,数据科学团队和特征工程团队需要详细沟通;复杂特征的创建需要考虑可扩展性;大规模获取智能见解也需要耗费大量内存等。先进的算法带来了巨大的复杂性,对数千个数据点进行实时全面分析,在流程上仍需进行大量优化。
如果一个系统仍旧依赖于手动操作,该系统是无法真正实现智能的。对于企业来说,要提高模型性能、提升效率、优化灵活性并采取实时行动是至关重要的,同时,企业内不同团队的能力和独立性也非常重要。这意味着:自动化和定制之间的平衡将很关键。
如果某个领域的专业知识可以被应用在处理特定业务问题上,那就意味着一些标准化特征也有机会被应用在自动化模型的构建。通过自动化的能力,直接从原始数据中获得新特征。比如,在欺诈检测领域中,影响检测精度的关键特征是IP地址,如果能从原始数据的一个IP地址中自动提取可用特征,那自动化能力、准确性和效率都将大大提高。
先进的特征工程本质上是“集中智能”在实践中的体现。因为它代表了一种高效、大规模地从大量众多来源的原始数据中集中提取可操作的智能见解的能力,并且这些智能见解能够实时对其他诸多领域产生积极影响。
重塑企业的大数据系统,既是纵向的过程,也是横向的过程。纵向角度来看,“集中智能”的目标是使组织中的每个团队都能利用数据做出贡献,并获取智能见解。横向角度看,“集中智能”需要在所有相关用例和业务场景中实现集中智能风控的目标。
先进的实时特征工程能推进企业的现代化进程,加速并优化企业的风控模式,从而确保更安全,更高效,更繁荣的数字经济发展。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
7月6日,2023中国国际数字和软件服务交易会在大连开幕。本届主题为“数字创新、融合发展”。商务部、科技部、贸促会和辽宁省人民政府主办,大连市人民政府和商务部外贸发展事务局承办。6日-9日展会期间,将中国计算机学会东北论坛、华为开发者大会2023大连分会场等40余个专业论坛,以及产业合作、人才交流、
7月2日,“2023全球数字经济大会人工智能高峰论坛”在北京举办,循环智能(RecurrentAI)获得两项重要成果:携手“自如”联合开发的大模型应用项目获评“北京市通用人工智能大模型行业应用典型场景案例”;成功入选“北京市通用人工智能产业创新伙伴计划第二批成员”,并且在现场与创新伙伴计划的“数据伙
为实现数字经济建设,2020年6月12日,新加坡、新西兰、智利三个亚太国家主导签署了《数字经济伙伴关系协定》(简称:DEPA)。毅佰联合公会认为:该协议,率先为全球数字经济制度提供了模板,体现出了新加坡等国家对于数字经济的开放价值理念及发展诉求。早在2006年,新加坡就推出了“智慧城市2015”发展
来源福州晚报青年兴则民族兴,技能强则国家强。6月7日,由全国总工会、福建省人民政府主办,中国职工技术协会、福建省总工会、福州市人民政府承办,福州市总工会协办的“全国职工数字化应用技术技能大赛决赛”,在福州海峡国际会展中心拉开战幕。来自全国各地的32支代表队、近300名参赛选手将展开激烈角逐。这是全国
把脉中国数据智能化
2023年,几乎可以被定义为中国互联网公司的“大模型元年”。ChatGPT的全球爆红,彻底点燃国内的大模型赛道,曾经的“创业英雄”、如今的商业领袖们亲自下场,接连发布生成式人工智能产品与大模型布局。大模型火了,沉寂许久的互联网行业又有了新的“战事”。同时,大模型的快速发展也改变了云市场的现状,企业对
近日,数字化市场研究咨询机构爱分析发布了《2022爱分析·数据智能厂商全景报告》,爱分析从技术研发能力、服务客户数量、收入规模等维度对厂商进行了全面专业的评估
2022年11月18日,首个国家级大数据产业创新赛事——2022第一届中国大数据大赛圆满落幕。工业和信息化部信息技术发展司数字经济推进处处长张建伦,中国电子技术标准化研究院副院长孙文龙出席颁奖典礼并致辞
2022年11月17日,在厦门市工业和信息化局的指导下,以“数据确权”为主题的2022数据资产(厦门)论坛在厦门成功举办。本次论坛以“数据确权”为主题,由厦门市互联网域名应用服务产业协会和构信网(公信.中国)联合主办
近日,国内知名数字化市场研究咨询机构爱分析正式发布《2022爱分析·信创厂商全景报告》(以下简称“报告”)。报告综合考虑企业关注度、行业落地进展等因素,遴选出在信创市场中具备成熟解决方案和落地能力的厂商。
10月31日下午,由数博会执委会主办、数据观(北京)传媒科技有限公司承办、贵阳大数据交易所协办的第四期数博思享会“实践先行观公共数据价值与应用”活动成功举办。
近日,由中国国际数字经济博览会组委会主办,中国电子技术标准化研究院、河北省工业和信息化厅承办的“第一届中国大数据大赛”(简称大数据大赛)正式启动。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台。
广州光点信息科技有限公司自主研发的数据中台产品GI大数据中台V2.0产品是国内率先推出符合新创标准的中台产品,基于“大数据+AI”等技术全新打造,集数据采集、融合、治理、服务、管理为一体的旗舰平台