江油市建设局网站,电商创业新手怎么做,网站改造,wordpress 哪些网站吗3 本节根据Netessine等人#xff08;2002年#xff09;和Bassok等人#xff08;1999年#xff09;对我们解决的容量规划问题进行了正式描述。考虑一家以pi#xff08;I1#xff0c;…#xff0c;I#xff09;的单价提供I服务的公司。在每个计划周期t∈{1#xff0c;……3 本节根据Netessine等人2002年和Bassok等人1999年对我们解决的容量规划问题进行了正式描述。考虑一家以piI1…I的单价提供I服务的公司。在每个计划周期t∈{1…t}例如一周中的每一天中对每个服务i的需求是不确定的我们将其建模为由Di t表示的随机变量。Di T的I×T分布是未知的但该公司可以访问一组数据SN{d1x1…dnxN}其中包含需求d NdN1…d NT∈d⊆R I×T的最新历史观测值其中每日需求d NTdnt1…dntI以及向量~xN∈X \8838R p表示的特征的相应观测值。例如这些特征描述了季节性日、月、周、季、天气条件和其他可预测需求的独立可观察变量。为了提供各种服务i公司使用不同的资源j1。。。一、 我们称之为服务线。 1服务i由服务线ji提供但也可以由任何服务线j≤i提供尽管单位利润较低。因此存在服务线的层次结构其中j1是最灵活的服务线因为它可以提供所有服务i1。。。一、 当服务需求未知时公司必须在T期规划期的第一个阶段之前确定服务线的容量。在我们的背景下能力是一周的人员配置水平即T5在一周的每一天T都是恒定的。我们用qq1…qI表示在规划期的每个周期t∈{1……t}中可用的恒定容量用fj表示每单位容量j的固定成本。除此固定成本外我们假设使用一单位容量j时产生的可变成本vj。在每个时期t公司首先观察该时期的需求然后将实现的需求dtdt1…dtI分配给给定的产能q。公司因未满足服务需求i而产生单位罚款成本ci并在使用服务线j满足服务需求时实现单位贡献边际aij。贡献边际定义为aijpi−vjci我们假设ji时aii≥aij当服务线ji时满足类型i的需求更有利可图如果服务线ji时需求得到升级和满足则利润更低。公司的目标是确定假设实现的需求dT在每个周期T中最优地分配给服务线j则T期规划范围最大化预期利润。设yij表示一旦观察到需求服务线j所完成的服务量i。公司的产能规划问题可由以下两阶段随机优化问题表示 1 该公式与Netessine等人2002提出的公式在一个小方面有所不同尽管出于可处理性的原因他们在第2阶段假设了一个单周期分配问题但在给定第1阶段确定的容量q的情况下我们对在每个周期t∈{1…t}中独立做出的多个分配决策进行建模。由于第2阶段的连续分配决策是独立的我们还可以证明利润函数∏q是凹的。 提案1。1中定义的利润函数∏q在q中共同凹。 2在大多数实际情况下给定XX的非平稳、依赖于特征的需求D的分布是未知的传统的方法是首先估计条件分布然后解决问题1。
4 规范分析方法 与先估计需求D的特征相关的多变量分布然后解决问题1的传统方法不同规定性分析方法直接规定了当给定新的特征向量x时使损失最小化的最优决策q~x。 在容量规划问题中损失函数可以定义为 2
其中∏qd表示与需求实际化d下的产能决策q相关的利润∏*dmaxq∏ qd是事后最优利润。该定义确保L~qd≥0。 提案2。损失函数Lqd在q中是联合凸的。 已经提出了两种方法来解决确定qx的规定性分析问题。第一种方法是通过从函数空间F中选择一个函数来最小化真实风险Rq·该函数被定义为X×D的联合分布上的预期损失我们假设该函数空间是Banach空间从而定义了一个范数并且方程3中存在最小值函数~q:X→ Q其从特征空间X映射到决策空间Q 3
知道这样一个函数q·就可以为特征向量x∈x的每个新观测值确定容量决策qx∈q。第二种方法通过求解 4
对于每个新的~x。 由于既不知道X×D的联合概率分布也不知道D的条件概率分布给定XX3和4不能直接求解。然而对于能够访问由需求和特征的历史观察组成的数据集SN的决策者可以推导出3和4的规定性分析方法。ERM的成熟机器学习原理提出可以使用最小化经验风险RNq·的函数~q ERM·来规定能力而不是真实风险R~q参见BK和BR 5
BK提出了基于局部学习技术的ERM方法的许多替代方案这些方法采用从特征中导出一些权重wnx∈[01]的常见形式并“针对数据的重新加权优化决策[q]”BK第11页如6所示 6
在最一般的术语中该方法近似于4可以被视为SAAwSAA的加权形式。权重函数wn·可以被认为是一个相似函数因此它与kERM方法中使用的内核函数K··有很强的相似性我们将在第4.2节中看到。显然wSAA方法的性能取决于相似函数的选择。BK基于k近邻回归、核回归、局部线性回归、回归树和随机森林构建了许多权重函数。 我们事先不知道ERM方法或wSAA方法是否更适合我们的特定容量规划问题我们无法就其性能差异提出任何索赔。BK提出了许多支持本地学习方法的论点并描述了应用于OR/MS问题的ERM方法的局限性。我们表明ERM方法适用于解决3中所述的规定性分析问题并且它还具有一些特性包括外推能力、通用近似特性和性能保证这可能使它成为一个具有类似吸引力的选择。
4.1基于问题6的加权样本平均近似方法 我们将容量规划问题的wSAA方法表述为 7
我们忽略了∏*d因为它与~q无关。 提案3。wSAA方法的目标函数在~q中是联合凸的。 对于任何给定的权重函数wn~x≥0wSAA方法7是一个线性程序。 使用BK中给出的结果我们展示了我们的特定wSAA方法对于与BK相同的权重函数类的渐近最优性3即基于k近邻kNN、递归核方法和局部线性方法的权重函数见G.1节中的命题10。 显然函数qx的渐近最优性是规定分析方法的理想性质。然而这些wSAA方法的收敛速度可能容易受到维度的诅咒也就是说它可能随着特征向量x的维数p呈指数下降。我们无法证明任意分布XD的这种情况因为无法导出~q wSAA~X收敛速度的一般表达式Györfi等人2002。 然而我们可以证明对于特定类别的分布和一般损失函数单个较低的收敛速度4在p中呈指数下降。 提案4。假设QDR并且从分布~XD∈PlC绘制出数据集SN iid。对于损失函数Lqd|q−d|2q wSAA的单个较低收敛率如下 8
命题4指出我们通常不能期望q wSAA~x的收敛速度快于N−2l1 2lp后者在p上呈指数下降详见Györfi等人2002。因此在具有大量特征p的大数据系统中收敛可能会很慢并且达到一定性能水平所需的观测值N可能会很高。 因此在我们的问题背景下在需求数据的历史观测数量相对较少的情况下我们不能期望有超过N≈260个相关观测假设一个观测描述了一周而五年以上的数据不再相关并且特征的数量p可能较大收敛可能较慢并且渐近最优性的性质似乎具有有限的实际相关性。BK报告的仅具有三个特征的程式化设置的实验结果表明他们的wSAA方法在超过104次观察后收敛到完全信息最优。 对于观测值明显较少的情况如我们的情况渐近最优性的性质不允许对方法的性能进行推断。 在BK的数值实验中基于随机森林的权重函数无法显示wSAA的渐近最优性导致了最佳性能。与可以显示渐近最优性的权重函数相反见命题10随机森林权重函数是从数据中学习的隐含地识别了最相关的特征子集因此可以提供更好的相似性度量尤其是在历史观测数量较少的情况下。基于这些考虑和BK给出的数值结果我们建议使用BK引入的随机森林权重函数 9
对于具有L棵树和Rlx的随机林树L的终端节点包含x。9中的分子捕获特征向量x和xn被分配给树l中的相同终端节点而分母捕获~x的终端节点中的训练样本数。权重wn RF~x被计算为随机森林中所有L棵树的该分数的平均值。该定义确保了权重的归一化使得P n wn RF~x1。 通过设计wSAA方法规定了可行的解决方案因为它们依赖于对~x的每个新实例在可行集Q上的重新优化。虽然这显然是一个有吸引力的房产但在我们的环境中它可能会有负面影响因为需求可能会有强烈的负面或积极的趋势。假设标量值需求实现和容量决策我们可以证明q wSAA~x限于单个需求实现dnn1…n的最优解的凸组合-参见第G.1节中的命题11因此它在过去可能是最优的可行解之间进行插值。然而在需求出现积极或消极趋势的情况下插值可能会导致处方不如基于允许外推的方法的处方更多说明和讨论请参见第G.2节。正如我们在下面讨论的与wSAA相比ERM方法允许外推但不能保证可行的解决方案。
6
本节将wSAA和kERM应用于物流服务提供商的能力规划问题。我们使用历史需求数据和案例公司成本参数的实际值来证明这些方法的适用性并将其性能与两种传统的两步方法和不包含特征数据的传统SAA方法进行比较。为了阐明方法性能的潜在驱动因素并产生超出案例公司特定参数设置的见解我们提供了额外的数值分析结果其中我们改变了模型的外生成本参数同时保持了案例公司的历史需求和特征数据。这些分析的结果为这些方法的性能驱动因素提供了见解并使我们能够评估其稳健性。 6.1 我们的研究灵感来自于我们与德国一家物流服务提供商的合作该服务提供商收集、分拣和递送邮件信件、包裹、报纸、广告材料等。我们专注于大约15名员工在公司主要设施中进行的分拣操作。该公司平均每天收到约175000件物品这些物品是手动分拣服务线3、半自动分拣服务线路2或全自动分拣1。虽然每个服务线都有足够的分拣机容量但这些机器的操作和手动分拣需要一定的人员配置即容量。 三条服务线的劳动力成本和所需技能水平不同因为全自动分拣机的操作需要高技能员工而半自动和手动分拣的技能要求较低。由于服务线1的员工也可以运营服务线2和3服务线2的员工也可运营服务线3因此公司有一个升级选项如第3节所述。每周公司必须确定下一周每条生产线的人员配置水平产能这将导致每条服务线每天的固定和恒定产能t1…t5。第t天到达的需求由指定服务线的员工处理而超过指定服务线员工能力的需求可以“升级”为更昂贵的服务线员工。如果有必要所有在t天到达的物品都必须在当天结束前处理加班不仅在工资方面成本高昂而且由于其对员工挽留的负面影响这也是非常不可取的。该公司面临劳动力供应的严重短缺因此他们希望限制加班以保持员工满意度。 过去该公司采用相对简单的方法来进行产能决策。根据历史需求他们获得了不同邮件数量的估计值将这些转换为单个工作日的容量需求作为每周容量计划的基础。这一过程主要是以人工方式进行的并强烈依赖于规划者以往的经验和专业知识该公司没有使用复杂的工具进行预测或产能规划。临时产能调整通过转换或重新安排班次或招聘额外临时工经常发生。 利用公司提供的信息我们获得了公司收入和成本的估计值表1。每项分类的收入约为0.1欧元。每个工人的全额成本为每小时15欧元至40欧元具体取决于技能设置和其他因素。与公司一起我们定义了每项未分类项目0.05欧元的罚款成本以反映加班对员工满意度的负面影响。9我们还假设产能使用成本vj0因为计划产能是固定的必须在整个星期内支付。 因为它类似于第3节中描述的产能规划问题我们可以采用传统的两步方法即估计多变量需求分布和求解两阶段随机优化模型如1所述以确定接下来一周三条生产线的“最佳”产能。这种方法的实际困难主要源于第1节所述的多变量需求分布的估计。我们通过对案例公司需求数据的一些描述性分析来支持第1节中的论点。图1a描绘了2014年至2017年所有三条生产线的每日需求换算为所需工时。我们观察了这三个时间序列表明需求是非平稳的。更详细的分析表明时间序列包含不同频率的季节性叠加第B节三条生产线的日需求变化差异很大。为了突出这些每日需求的变化图1b描绘了去趋势化和去季节化的时间使用TBATS模型获得的系列详见B节。 在这四年中三条服务线每日需求的变异系数CV从中等到低从服务线2的CV20.25到服务线1的CV10.17不等。整个时间段内的相关系数CC相对较低所有三种服务线组合的相关系数约为0.18。尽管在所有观察中CV和CC都是低到中等的但在较短的时间段内我们观察到了显著的变化见B节但我们不知道它们是随机发生的还是可以通过某些特征来解释。对该公司专家的采访表明其中一些变化可能是可预测的。例如在每年的第50周和第51周服务线1和3的需求通常高度相关因为大量的年终商务邮件服务线1和私人假日邮件服务线路3到达。另一方面由于私人邮件增加临近公共假期往往会导致负相关而商业邮件减少因为企业员工往往在这段时间休假。我们期望有许多这样的关系并且在适当的特征下它们可能是可预测的。 然而很难将这些关系结合到多变量需求分布的估计中这说明了需要能够隐式结合特征相关分布的规定性方法。 6.2需求数据和特征工程 案例公司向我们提供了一个历史数据集其中包含2014年至2017年期间每一天每一条服务线i的邮件数量需求数据以解决我们描述的规划问题。根据这些历史数据我们构建了一个数据集SN{d1x1…dNxN}其中需求矩阵dn以工时为单位N209周特征向量~xN∈R162。 作为特征向量~xn的元素我们首先构建了描述观察到的需求的时间维度的基于日期的特征。特别是我们使用了年份号以及包含特定星期的一年中的半年、季度和月份作为特征。周数也可能是一个相关的特征因为我们从与专家的访谈中了解到在临近年底的几周内需求量很高见第6.1节。我们将滞后需求例如一年前同一周内每条服务线的需求量纳入第二组特征以说明时间序列的连续性。第三组特征编码了公共假日的信息这些信息也已知会影响需求见第6.1节。我们构建了公共假日指标和相关指标例如如果公共假日是在感兴趣的一周之前或之后的几天。我们的分析中包括的162个特征的详细描述及其重要性分析见第C节。 6.3评估程序 我们将生成的数据集SN分为N157周的训练数据2014-2016年和52周的测试数据2017年以便于进行样本外性能评估。由于特征的数量pN我们面临一个高维问题。我们评估并比较了以下方法的处方性能1。kERM通过用随机森林内核13求解12来估计处方函数11并为测试周期的每一周规定容量决策。 2.wSAA用测试期间每周的随机森林权重9求解7。 3.SAA通过求解wn~x1/N的7来估计训练数据集的SAA处方。 4.SVR-SEO10使用随机森林核13训练支持向量回归模型估计样本残差的CV和CC并预测多变量需求分布 5.ARIMA-SEO10训练ARIMA时间序列模型估计样本残差的CV和CC并预测测试期间每周的多变量需求分布。 按照与SVR-SEO相同的步骤求解1。 我们通过在测试期间的每一天解决问题1的第二阶段确定了所有规定产能决策的最大可实现利润总利润为所有周的每周利润之和。我们还计算了测试期间的事后最优利润∏*d因此我们可以报告所有方法的最优利润∆∏abs∏*d−∏~qd的绝对差距。