智能分析平台之「AI预测引擎」

2019-04-15 12:08 来源：A5专栏我来投稿撤稿纠错

观远数据已经帮助联合利华、百威英博等多家500强客户实施需求预测，有大量的零售领域数据预测经验。我们看到，500强企业之所以愿意花上百万，甚至大几百万来做AI预测项目，是基于其庞大的业务体量来评估ROI后作出的选择：

一方面，高质量的数据预测确实需要专业的数据科学家和分析人员深入了解业务场景，不断迭代优化预测模型，经过长时间的锤炼才能获得；

另一方面，业务规模足够大时，一点点的预测准确度的提升都能给企业带来巨额的利润回报。

但同时，我们也意识到，不是任何企业都有这个资金实力去做此类高质量的数据预测的，并且在业务需求上也可能仅仅是想做一些初步预测来为决策提供参考。那么如何满足这类客户的预测需求，同时又能给他们提供比一般方法更优秀的预测结果呢？

这一篇我们就给大家讲讲观远数据为入门级数据分析人员准备的零售数据「AI预测引擎」。

AI预测引擎概述

了解过观远产品的朋友们都知道，观远数据在BI平台里面内置了Smart ETL智能数据处理模块。该模块基于Spark大数据计算引擎开发，提供拖拽式、图形化的数据流开发方式，使得一般业务人员也能做专业的数据分析处理。一般的ETL过程整理主要做的是数据的清洗、转换、关联、加载等操作，那观远的Smart ETL何以称之为智能呢？这是因为Smart ETL中除了支持Spark本身自带的函数之外，还支持自定义的UDF、UDAF函数开发，具有非常强大的智能算子扩展能力。

举个例子，如果你想挖掘商品间的潜在联系，开拓更多销售机会，你就可以使用Smart ETL内置的“关联性挖掘”这个智能算子来快速实现商品销售关联分析。

而「AI预测引擎」则是另一个重要的智能算子。你可以用它来做各种级别的销售预测，大到门店，小到品类，甚至SKU。有了可靠的销售预测的数据，商品层面，对于鲜食类商品，可以做更为客观的订货量评估，降低报废风险的同时把握更多销售机会；对于大众消费商品，可以提供更为精准的动销天数估算，指导商品订货、补货、配货。另一方面，销售预测也可以用来指导人员排班，以及提供更为合理的销售进度评估。

「AI预测引擎」智能算子

在观远Smart ETL中，用户仅需要拖入一个「AI预测引擎」算子，接入事先预处理好的历史数据，然后简单配置日期字段、预测指标，以及指标聚合维度（日/周/月/季度/年）和预测周期数，便可开始预测。预测结果可以输出到数据集进行下一步的展示分析与决策支持。

「AI预测引擎」节点配置

观远数据的「AI预测引擎」主要适用于零售企业的销售预测或需求预测。上图所示只是一个极简模式的预测算子，但即便配置如此简单，对零售行业门店级别（以超市数据为例）的日商预测平均准确度达到83%（MAPE≈17.65%），个别门店接近90%；而细化到单门店单品类（鲜肉类）的日商预测，准确度达到84%。而在这个基础上，我们还能提供更多配置项，添加诸如天气情况、促销活动、品类级别的日期特征等外部信息，进一步提升数据预测的准确度；同时也可以提供多门店、多品类的批量预测。

架构解密

为什么如此简单的操作，便能实现还不错的销售数据预测呢？

这是因为架构层面观远数据将预测算法封装成Spark UDF函数，有机地融合进Smart ETL，成为一个可点选配置的智能算子；算法层则采用了先进的算法，并将观远数据多年沉淀的零售行业预测经验转化为相应日期特征优化配置后预置进算法包里。

如此一来，看似简单的时序预测，其实已经包含影响零售行业销售数据的周期性特征、节假日特征以及节前节后特征，这样的预测自然是要比一般时序预测方法准确度提升不少了。

未来，我们还会根据不同品类的消费特征，分别给予不同的品类特征日历，进一步提升品类甚至SKU级别的预测准确度。同时，还可以增加天气作为额外特征，这样对于一些极端天气情况下的销售预测也会进一步提升准确度了。

算法解密

具体到算法层面，为什么观远的AI智能预测算法能够比市面上通用的预测算法在预测准确度上再提升一个层级呢？

首先我们来看一般时序预测工具中常用的ARIMA模型(Autoregressive Integrated Moving Average Model）。它是一种结合自回归与移动平均方法进行预测的模型，要求时序数据是稳定的，或者通过差分化后是稳定的，一般来说很难符合现实数据的情况。与之类似的还有GARCH模型等传统时序方法，大都只能进行单变量的建模，局限性较大。

近年来涌现出更多复杂时序模型，以便解决实际业务中的复杂情况。例如比较有代表性的TBATS的预测模型，结合了Box-Cox转换，趋势拟合，ARMA建模，周期性分析等复杂技术手段来进行建模预测。它实际上是一种状态空间模型（State Space Model）的算法实现，类似的还有隐马尔可夫模型，RNN等也都属于此类。这类模型主要限制是参数繁多，计算量大，在大规模时序预测时往往需要花费很大的计算成本实现。

那零售行业现实状况是怎样的呢？我们不妨先来看看零售数据本身具有的一些特征：

趋势特征：一般销售数据在一个比较长期的时间范围内，具有整体增长或下滑的趋势特征。

周期特征：销售数据具有明显的周期性和季节性。

非规律性的节假日特征：节假日及节假日前后对销售数据有显著影响。

各类外部因素影响：促销活动、天气、搜索指数、销售指标等因素也会显著影响销售数据。

数据稀疏性：一般零售行业的SKU，门店等维度的组合会非常巨大，但每个组合中的时序数据数量往往比较有限。

基于直观的理解，我们就可以发现简单的ARIMA模型与复杂的状态空间模型对于零售数据的预测都有一定的局限之处。而观远数据则是根据具体的业务数据情况，结合使用高效的广义累加模型和状态空间模型，统筹考虑零售时序数据的趋势性、周期性，并加入对节假日及促销、天气等可预测波动因素的分析，给出综合预测结果，可以说这是一个专门为零售预测而生的算法模型！

预测结果呈现

观远数据对预测数据呈现做了定向优化，对实际数据与预测数据进行了颜色和线型的区分，并添加了预测数据的置信区间，提供时间轴的缩略展示。

「AI预测引擎」数据展示

小结

本文给大家介绍了集成在观远BI平台内的「AI预测引擎」功能的架构设计与算法实现方案。事实上，观远数据提供的「AI预测引擎」解决方案不仅仅是引入了先进的AI预测算法，更是将多年沉淀的、符合本土日历特征的零售数据预测经验预置进了算法模型里面，同时结合BI平台，给出了数据接入、整理、预测到展现的端到端整体解决方案。有兴趣了解更多的朋友赶快联系我们试用哦！

下一篇我们将给大家介绍更多观远数据在AI领域的落地案例与应用效果，欢迎持续关注！

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai技术; ai智能; ai预测地震余震

汇聚中国AI顶尖力量云天励飞参与华为AI大模型联合创新

2023年7月6日,第六届世界人工智能大会(WAIC2023)在上海开幕,“人工智能大模型”是本届大会的备受瞩目的话题,据悉,在昇腾AI大模型的创新研发中,华为联手26家行业领军企业,组建了一支协同创新的“AI明星队”,云天励飞作为中国人工智能企业的杰出代表,和互联网大厂、运营商、科研院所等优秀团队

标签：

ai技术
用友大易：迈入AI招聘2.0时代，让人力资源回归本质

这几个月来，以ChatGPT为代表的生成式AI展现出的能力令世界惊叹。自从2016年AlphaGo战胜李世石掀起了一波AI浪潮后，AI仿佛已经沉寂了很久，ChatGPT的横空出世就如同一束耀眼的光芒，让AI这个名词重回C位。过去在AI1.0时代，主要通过训练模型来实现图像识别、声音识别、语言处理等特

标签：

ai技术
新发布的PaaS2.0，能否助力涂鸦智能再起飞？

文：互联网江湖作者：志刚2023年的IoT需要一个新故事。6月29日，涂鸦智能在开发者大会上，发布了企业级战略PaaS2.0，希望通过一个平台+四大开发服务，建立起IoT生态。对于这场发布会，市场的态度是积极的。美东时间6月29日收盘，涂鸦智能美股股价上涨5.6%，来到1.87美元/股。近日股价稳定

标签：

ai技术
大模型难掩AI制药的悲伤：越过山丘，无人等候

美团曾经的二号人物王慧文对标OpenAI的创业项目光年之外，以20亿卖给美团，再度引发市场对大模型的热议。

标签：

ai技术
拾起王慧文的AI梦，美团冲向“光年之外”？

2020年底，王慧文在朋友圈写下这句话时，外界本以为这位伴随中国互联网发展而持续创业20年的人物即将告别创业舞台。但是，一个曾经多次创业，正值壮年的互联网老将心中的创业热情是难以熄灭的。

标签：

ai技术

Manus官网突现“地区不可用”提示，中国区业务战略性调整引关注

四个月前邀请码炒至10万元，如今官网变灰、社交账号清空，这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日，打开Manus官网的用户发现一则突兀提示：“Manus在你所在的地区不可用”。而就在不久前，这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时，Manus官方微博和小红书

标签：

ai智能
摩尔线程估值超 250 亿，「中国英伟达」冲刺科创板

文/十界来源/节点财经一场围绕算力自主的竞赛，正在科创板上演。近日，国产全功能GPU厂商摩尔线程递交科创板招股书，拟募资约80亿人民币，成为今年上半年科创板拟募资规模最大的冲刺者，也打响了“国产英伟达”上市的第一枪。据招股书显示，摩尔线程自2020年成立以来，主营全功能GPU芯片的研发与销售，以自主
百川智能高管集体跑路!王小川的医疗AI还能赢吗?

“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻，百川智能的联合创始人离职，这是王小川入局AI的第一道大坎。接下的成败非常关键：(1)拿下河北(2)学习科大讯飞百川智能离职高端概览：(1)2025年7月10日，百川智能技术联合创始人谢剑将离职。他是百川只能的

标签：

人工智能

ai智能
百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

百度AI团队今日正式推出PaddleOCR3.1版本，以突破性的多语言组合识别（MultilingualCompositionPerception,MCP）技术为核心，彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别，为全球化企业、跨境业务及多元文化场

标签：

ai智能

ai技术
宇树科技加速冲刺科创板IPO，人形机器人龙头估值飙至120亿元

“宇树已形成硬件、算法、场景联动的业务飞轮，自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日，据每日经济新闻从宇树科技投资方处获悉，国内人形机器人领军企业宇树科技（UnitreeRobotics）已明确计划于科创板IPO，预计

标签：

宇树科技
OpenAI推出GPT-5：AI大统一时代的到来？

推理与多模态的终极融合，将彻底终结用户在不同模型间切换的烦恼。7月7日，OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型，特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”，为用户提供前所未有的统一体验。OpenAI开发者体验负

标签：

chatgpt

中小AI企业，没有“高考”资格

高考一结束，忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉，去年高考期间，大模型的成绩才勉强过一本线，今年集体晋升985。据悉，豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎，中小AI创企的处境却日益尴尬

标签：

ai智能
大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

文/二风来源/节点财经每年高考成绩放榜后，数千万考生和家长将迎来另一场硬仗——填报志愿。今年，这一领域迎来了AI的全面介入，多家互联网大厂和教育公司纷纷推出智能志愿填报产品，为考生提供院校和专业选择建议。据艾媒咨询数据，2023年中国高考志愿填报市场付费规模约9.5亿元，近九成考生愿意借助志愿填报服

标签：

大模型
苹果AI掉队？现在唱衰或许还为时过早

苹果还没从WWDC25的“群嘲”中走出，又迎来了一次新的痛击。据路透社报道，21日，苹果公司遭到股东集体起诉，被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间，导致iPhone销量受影响、股价下滑，构成证券欺诈。在这份诉讼中，库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃

标签：

苹果公司

ai智能
DeepSeek、豆包向左，盘古大模型向右

华为的盘古大模型终于推出新版本了。6月20日华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线，盘古大模型5.5同步发布。不过，当前国内的AI大模型竞争可谓是相当激烈，华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从

标签：

deepseek

豆包ai

盘古大模型

加载更多

智能分析平台之「AI预测引擎」

相关文章

汇聚中国AI顶尖力量云天励飞参与华为AI大模型联合创新

用友大易：迈入AI招聘2.0时代，让人力资源回归本质

新发布的PaaS2.0，能否助力涂鸦智能再起飞？

大模型难掩AI制药的悲伤：越过山丘，无人等候

拾起王慧文的AI梦，美团冲向“光年之外”？

Manus官网突现“地区不可用”提示，中国区业务战略性调整引关注

摩尔线程估值超 250 亿，「中国英伟达」冲刺科创板

百川智能高管集体跑路!王小川的医疗AI还能赢吗?

百度智能云PaddleOCR 3.1正式发布：关键能力支持MCP

宇树科技加速冲刺科创板IPO，人形机器人龙头估值飙至120亿元

OpenAI推出GPT-5：AI大统一时代的到来？

中小AI企业，没有“高考”资格

大模型抢滩高考志愿填报，能否顶替「张雪峰」们？

苹果AI掉队？现在唱衰或许还为时过早

DeepSeek、豆包向左，盘古大模型向右

热门排行

编辑推荐