做网站最低多少钱,网络设计方案书中内容很多,包头企业网站制作,wap网站用什么开发随着人工智能技术的不断发展#xff0c;智能预测已经成为各个领域的重要应用之一。现在#xff0c;智能预测技术已经广泛应用于金融、零售、医疗、能源等领域#xff0c;为企业和个人提供决策支持。
智能预测技术通过分析大量的数据#xff0c;利用机器学习和深度学习算法…随着人工智能技术的不断发展智能预测已经成为各个领域的重要应用之一。现在智能预测技术已经广泛应用于金融、零售、医疗、能源等领域为企业和个人提供决策支持。
智能预测技术通过分析大量的数据利用机器学习和深度学习算法构建模型对未来的趋势和事件进行预测。由于智能预测技术的准确性和可靠性不断提高各个领域都在积极探索和应用智能预测技术以获得更好的决策效果和效益。
本文通过一个零售行业销售预测的实战案例来介绍永洪科技的数据变换操作节点和LightGBM算法以帮助广大用户了解和学习整个数据处理和模型训练、预测、评估的全过程。
中国零售业是国家经济的重要支柱之一其在2021年的社会消费品全年零售总额达到了440823亿元同比增长12.5%。尽管线上零售业务正在迅速发展但线下零售仍然占据了巨大的份额。
随着数字化转型的推进企业可以利用人工智能技术实现更精细化的运营从而提高零售店的销量和效益。永洪的深度分析功能是一种非常有用的工具可以帮助企业更好地预测零售店的销量情况从而制定更精准的销售策略和运营计划。今天我们就通过永洪科技的深度分析功能教您预测零售店的销量情况。
我们以一个在7个欧洲国家经营着3000多家药店的连锁企业为例通过构建模型可以帮助它的门店经理提前至多六周预测每日的销售额。需要有两张数据表分别为各个门店的信息数据和从所有门店汇总来的历史销售信息详细字段描述如下表。门店的销售情况受到许多因素的影响包括促销、竞争、学校和国家假日、季节性和地区这个可以根据您的实际情况修改。 字段名称 字段描述 数据类型 Store 门店的唯一Id 数值型 StoreType 区分4种不同的商店模式 文本型 Assortment 描述门店分类级别 文本型 CompetitionDistance 到最近的竞争对手门店的距离以米为单位 数值型 CompetitionOpenSinceMonth 最近的竞争对手门店的大概开店月份 数值型 CompetitionOpenSinceYear 最近的竞争对手门店的大概开店年份 数值型 Promo2SinceWeek 该店开始参与促销活动的日历周 数值型 Promo2SinceYear 该店开始参与促销活动的年份 数值型 PromoInterval 连续时间间隔的促销活动活动重新启动的月份。 文本型 Promo2 门店有无持续不断的促销活动 数值型
表1门店信息字段描述 字段名称 字段描述 数据类型 Store 门店的唯一Id 数值型 DayOfWeek 一周的周几 数值型 Date 日期 数值型 Sales 当天的营业额 数值型 Open 门店当天是否营业 布尔型 Promo 门店当天是否有促销活动 布尔型 SchoolHoliday 是否受公立学校停课影响 布尔型 StateHoliday 是否国家假日 文本型
表2 销售信息字段描述
对于这种预测的场景我们一般会将其抽象为一个回归问题LightGBM算法在实际工程项目中对类别型特征的处理非常适合一些金融数据或多因素影响的销量数据建模场景所以我们选择LightGBM回归。
首先要分析数据然后对数据进行预处理永洪科技的深度分析功能提供了几十种数据变换节点采用了可视化的操作方式通过鼠标拖拽即可完成流程的搭建。选中商店数据节点在右侧的数据探索可以查看对字段的统计分析结果。以下使用的数据处理节点为根据此数据分析选择的不代表所有场景都需要使用这些节点需要根据数据情况选择。 选择CompetitionDistance字段在统计中缺失值数量显示存在3个缺失值且各个门店差别较大最小20最大75860故而使用缺失值填充节点处理。 又通过数据分布直方图可知存在数据倾斜所以需要进行对数变换。为了知道促销距今有多少周还需要将Promo2SinceYear和Promo2SinceWeek字段的信息合并处理为Promo2Weeks字段因为销量和促销的时间相关。使用计算列节点新建对数变换和Promo2Weeks计算列。 因为上述计算过程会出现缺失值故需要将其填充否则空值无法分析。 对于销售信息数据我们从数据探索的盒须图中可以看出Sales字段存在明显偏离其它数据的值。 所以先使用过滤节点过滤偏离数据运行后发现此数据并没有参加促销因为促销才更能影响销量故将其判断为异常值过滤掉且不需要未营业时的商店销售数据因为此数据对销量判断没有意义故将未营业时数据过滤。 接下来从日期特征提取年、月、日特征为了后续可以精细的按月判断促销。 因为需要将商店数据中的PromoInterval字段与销售信息中的Month字段结合判断销售记录是否在促销期间发生所以我们通过联接节点将两个数据合并在一起。 如果想预测商品销量的话是不是促销月是很重要的信息所以通过计算列节点新建名称为是否为促销月的数据。 最后使用过滤节点将最后48天的数据即过滤大于等于2015年6月14日的数据划分为测试集其它为训练集即过滤小于2015年6月14日的数据。至此数据预处理流程结束。 之后我们在训练集过滤节点后接LightGBM回归节点并调整其配置参数如果不是很了解参数也可以选择自动调参特征列字段为Promo2Weeks-Fill Null Value、PromoInterval等目标列选择Sales。 测试集过滤和LightGBM回归节点后接模型应用节点此流程是为了将训练完成的模型用于测试集所以模型应用节点的自变量需要和模型的特征列一致可以直接复制粘贴字段。因变量需要在选择列中新建变量命名为predict。 模型应用后接回归性能评估用各种指标比较真实值和预测值的差距。最后通过连接图片视图、表格视图或数据集视图查看结果。
运行实验后可以在模型应用结果中查看预测值。除此之外我们还可以查看在测试集上预测的销售额和测试集中样本的实际销售额的对比图评估预测准确性。 本案例是一个常用的预测场景可以大致总结为以下过程此流程为机器学习的通用流程。 也可以查看和了解更多内置案例精准的预测不仅能帮助企业提前制定规划也可以帮企业降低风险。在数字化转型的大潮中让我们一起携手前行。