目录1 MA、ARIMA模型1.1 自回归(AR)模型1.1.1 AR模型的性质1.1.2 何时使用AR模型1.2 移动平均模型MA1.2.1 MA模型定义1.2.2 MA模型的性质1.2.3 何时使用MA模型1.3 ARIMA1.3.1 ARIMA模型定义ARIMA模型的组成部分ARIMA模型的表示ARIMA模型的应用参数选择2 一指数平滑2.1 指数平滑公式2.2 适用场景2.3 一指数平滑与自回归模型的主要区别3 二指数平滑3.1 二指数平滑的原理参数解释应用步骤4 三指数平滑4.1 三指数平滑的基本概念水平分量Level趋势分量Trend季节性分量Seasonality三指数平滑的公式预测公式使用场景4.2 ARIMA模型与三指数平滑的区别4.2.1 选择建议1 MA、ARIMA模型1.1 自回归(AR)模型如果数据是平稳的并且没有明显的趋势或季节性同时呈现出自相关性那么AR模型就非常适用。此外AR模型在短期预测任务中尤其有效因为它能够基于近期的数据做出预测。在实际应用中您还需要根据具体情况进行适当的预处理比如数据平稳性检验和参数选择等。有时我会结合AR模型的性质对预测结果进行微调后处理操作。假设有一个时间序列 {}其中 是在时间点 的观测值。一个 阶的自回归模型记作 AR(p)可以表示为1−12−2⋯−yt​μϕ1​yt−1​ϕ2​yt−2​⋯ϕp​yt−p​ϵt​其中 是在时间点 的观测值。 是序列的均值。1,2,…,ϕ1​,ϕ2​,…,ϕp​ 是模型的参数表示过去 个时刻观测值的权重。 是模型的阶数即模型中考虑了多少个过去的观测值。是白噪声序列通常假定为均值为0、方差为 2 的随机变量。1.1.1 AR模型的性质平稳性一个AR模型是平稳的当且仅当所有模型参数的特征根都在单位圆之外。换句话说如果模型参数的特征方程 ()1−1−22−⋯−0ϕ(z)1−ϕ1​z−ϕ2​z2−⋯−ϕp​zp0 的所有根的模都大于1则模型是平稳的。预测AR模型的一个重要应用是预测未来值。一旦模型参数被估计出来就可以使用最近的观测值来预测未来的值。参数估计AR模型的参数通常使用最小二乘法或极大似然估计法来估计。1.1.2 何时使用AR模型平稳数据AR模型适用于平稳的时间序列数据即数据的统计特性均值、方差等不随时间改变。短期预测由于AR模型依赖于最近的观测值因此它在短期预测中表现良好。无明显趋势或季节性如果时间序列没有明显的长期趋势或季节性模式AR模型可能是合适的选择。数据呈现自相关性如果时间序列显示出自相关性即当前时刻的值与过去时刻的值之间存在线性关系那么AR模型可以很好地捕捉这种关系。1.2 移动平均模型MA移动平均Moving Average, MA模型是时间序列分析中另一种重要的工具它与自回归AR模型一起构成了时间序列建模的基础。MA模型假设当前时刻的值与过去一段时间内的误差项也称为扰动项或白噪声项有关这里的“误差项”是指模型在每个时间点上对实际观测值与预期值之间的差异。这种模型主要用于捕捉序列中的随机波动并且通常用于短期预测。白噪声序列是一种特殊的随机过程在时间序列分析中经常被提及。白噪声序列具有以下几个重要特征独立性白噪声序列中的每个观测值都是相互独立的。均值白噪声序列的均值为零。方差白噪声序列具有常数方差通常表示为 2。无自相关性白噪声序列在不同时间点上的观测值之间不存在自相关性1.2.1 MA模型定义一个 阶的移动平均模型记作 MA(q)可以表示为1−12−2⋯−yt​μϵt​θ1​ϵt−1​θ2​ϵt−2​⋯θq​ϵt−q​其中 是在时间点 的观测值。 是序列的均值。​ 是在时间点 的白噪声误差项通常假定为均值为0、方差为 2的随机变量。1,2,…,θ1​,θ2​,…,θq​ 是模型的参数表示过去 个时刻误差项的权重。 是模型的阶数即模型中考虑了多少个过去的误差项。1.2.2 MA模型的性质平稳性MA模型总是平稳的因为它的定义不依赖于过去的观测值而是依赖于白噪声序列后者是平稳的。预测MA模型的预测是基于最近的误差项因此它在短期预测中表现良好。参数估计MA模型的参数通常使用极大似然估计法来估计。1.2.3 何时使用MA模型短期预测由于MA模型依赖于最近的误差项因此它在短期预测中表现良好。平稳数据MA模型适用于平稳的时间序列数据即数据的统计特性均值、方差等不随时间改变。随机波动如果时间序列主要由随机波动组成而没有明显的趋势或季节性模式MA模型可能是合适的选择。数据呈现短期相关性如果时间序列显示出短期的相关性即当前时刻的值与过去几个时刻的误差项有关那么MA模型可以很好地捕捉这种关系。1.3 ARIMAARIMAAutoregressive Integrated Moving Average自回归积分滑动平均模型是时间序列分析中一种非常强大的工具它可以用来预测具有趋势和季节性的数据。ARIMA模型结合了自回归AR、差分I、移动平均MA三种模型的特性因此可以处理非平稳数据。1.3.1 ARIMA模型定义ARIMA模型的形式化定义如下其中x​ 是在时间点 的观测值。 是常数项可以理解为序列的均值。1,2,…,ϕ1​,ϕ2​,…,ϕp​ 是自回归模型的参数。1,2,…,θ1​,θ2​,…,θq​ 是移动平均模型的参数(残差项)。ϵt​ 是白噪声序列通常假定为均值为0、方差为 2σ2 的随机变量。ARIMA模型的组成部分自回归部分 (AR)这部分表示当前时刻的观测值与过去若干个时刻的观测值之间的关系。差分部分 (I)这部分通过差分来使序列变得平稳。如果序列是非平稳的通常需要对其进行一次或多次差分处理。移动平均部分 (MA)这部分表示当前时刻的观测值与过去一段时间内的误差项之间的关系。ARIMA模型的表示ARIMA模型通常用 (,,) 来表示其中 表示自回归部分的阶数。 表示差分的阶数。 表示移动平均部分的阶数。ARIMA模型的应用非平稳数据ARIMA模型适用于非平稳数据的分析通过差分操作可以使序列变得平稳。短期预测ARIMA模型可以很好地用于短期预测尤其是当数据表现出趋势和季节性时。复杂数据ARIMA模型可以处理包含趋势和季节性成分的时间序列数据。多变量时间序列ARIMA模型也可以扩展到多变量时间序列分析中如VARIMA模型。参数选择在建立ARIMA模型之前需要确定模型的参数 (,,)(p,d,q)。这通常通过以下步骤完成平稳性检验使用Augmented Dickey-Fuller (ADF) 测试或KPSS测试来检查序列是否平稳。差分如果序列是非平稳的通过差分操作使其变得平稳。差分的阶数 d 即为需要差分的次数。自相关函数 (ACF) 和偏自相关函数 (PACF) 图通过ACF和PACF图来确定 p 和 q 的值。对于AR部分PACF图会在 p 个滞后期后逐渐衰减到零。对于MA部分ACF图会在 q 个滞后期后逐渐衰减到零。ARIMA 的核心局限只能捕捉线性关系无法建模非线性模式需用 SARIMA、Prophet 或 LSTM单变量模型不能利用外部协变量需用 SARIMAX长期预测能力差多步预测迅速退化为均值回归对异常值敏感一个极端值可能严重影响参数估计假设残差为白噪声若残差仍有结构说明模型未充分提取信息四种基础时间序列模型的应用与结果分析【AR、MA、ARMA、ARIMA】-CSDN博客2 一指数平滑指数平滑Simple Exponential Smoothing, SES也称为简单指数平滑法是一种常用的时间序列预测方法。这种方法特别适用于没有明显趋势或季节性模式的数据集。一指数平滑的核心思想是对时间序列的历史数据进行加权平均其中较新的观测值被赋予更大的权重而较旧的观测值则被赋予较小的权重。2.1 指数平滑公式一指数平滑的计算公式如下其中^1​ 是在时间点 1的预测值。 是在时间点 的实际观测值。^是在时间点 的预测值。 是平滑系数也称为平滑因子取值范围通常是 01。平滑系数 平滑系数 α 控制着新数据对预测值的影响程度如果 接近 1则最近的观测值对预测值影响较大这意味着预测值会快速跟踪实际数据的变化。如果 接近 0则预测值更依赖于历史数据对新数据的变化反应较慢。初始化在一指数平滑中需要确定初始预测值 ^1​通常采用的方法有将 1 作为 ^1 的值。使用序列的平均值。使用其他合理的方法进行估计。一指数平滑的步骤初始化选择初始预测值 ^1​ 和平滑系数 。更新预测值对于每个时间点 基于当前观测值 和之前的预测值 ^更新预测值 ^1。预测使用最新的预测值 ^​ 预测下一个时间点 1的值。2.2 适用场景一指数平滑适用于以下情况数据不包含明显的趋势或季节性模式。最近的观测值比早期的观测值更重要。需要快速响应数据变化的情况。优点简单易用。计算量小。能够快速适应数据的变化。缺点当数据包含趋势或季节性时效果不佳。过度依赖平滑系数的选择不同的 α 值可能导致显著不同的预测结果。2.3 一指数平滑与自回归模型的主要区别模型假设一指数平滑假设当前时刻的预测值与最近的观测值相关并且随着观测值越久远其影响越小。自回归模型假设当前时刻的值与过去若干个时刻的值存在线性关系。参数一指数平滑只有一个参数即平滑系数 α。自回归模型有 p 个参数即自回归系数 1,2,…,ϕ1​,ϕ2​,…,ϕp​。适用场景一指数平滑适用于平稳的时间序列数据且数据中没有明显的趋势或季节性。自回归模型适用于捕捉时间序列中的自相关性适用于数据中存在趋势或季节性但通过差分处理可以变得平稳的情况。预测一指数平滑更适合短期预测因为它依赖于最近的观测值。自回归模型可以用于短期和中期预测因为它考虑了过去的观测值。计算复杂度一指数平滑计算简单只需要一个平滑系数。自回归模型计算相对复杂需要估计多个参数。https://zhuanlan.zhihu.com/p/333220443 二指数平滑二指数平滑Double Exponential Smoothing, DES也称为霍尔特方法Holts method是一种用于时间序列预测的技术主要用于处理具有线性趋势的时间序列数据。该方法通过应用两个平滑过程来捕捉序列中的趋势成分一个用于平滑水平类似于一指数平滑另一个用于平滑趋势。3.1 二指数平滑的原理二指数平滑模型由两个部分组成水平分量level component和平滑趋势分量trend component。这些分量分别用平滑系数来调整。公式假设 是在时间点 的实际观测值我们定义两个状态变量 代表时间点 的水平分量。 代表时间点 的趋势分量。对于给定的平滑系数 和 其中 0,1二指数平滑的更新规则如下水平分量的更新公式趋势分量的更新公式预测值可以通过水平分量和趋势分量的组合得出其中ℎ 表示预测步长即从时间点 到未来时间点 ℎ。^ℎ∣ 表示基于时间点 的信息对未来时间点 ℎ的预测值。参数解释平滑系数决定了当前观测值对水平分量的影响程度。较大的 α 值使得模型更加敏感于近期的变化。平滑系数决定了当前水平分量的变化对趋势分量的影响程度。较大的 β 值使得模型对趋势变化更敏感。应用步骤初始化选择初始值 0 和 0。这通常可以通过观察序列的前几个值来估算。更新水平分量和趋势分量根据上述公式更新 和 ​。预测使用水平分量和趋势分量的组合进行未来值的预测。让我们计算前几个周期的水平项 lt​ 和趋势项 bt​对于第一个周期 1t11⋅1(1−)⋅00.2⋅50(1−0.2)⋅5050l1​α⋅y1​(1−α)⋅l0​0.2⋅50(1−0.2)⋅50501⋅(1−0)(1−)⋅00.1⋅(50−50)(1−0.1)⋅55b1​β⋅(l1​−l0​)(1−β)⋅b0​0.1⋅(50−50)(1−0.1)⋅55对于第二个周期 2t22⋅2(1−)⋅(11)0.2⋅55(1−0.2)⋅(505)54l2​α⋅y2​(1−α)⋅(l1​b1​)0.2⋅55(1−0.2)⋅(505)542⋅(2−1)(1−)⋅10.1⋅(54−50)(1−0.1)⋅55.4b2​β⋅(l2​−l1​)(1−β)⋅b1​0.1⋅(54−50)(1−0.1)⋅55.4第三个周期 (3t3):3⋅3(1−)⋅(22)l3​α⋅y3​(1−α)⋅(l2​b2​)30.2⋅60(1−0.2)⋅(545.4)l3​0.2⋅60(1−0.2)⋅(545.4)3120.8⋅59.4l3​120.8⋅59.431247.52l3​1247.52359.52l3​59.523⋅(3−2)(1−)⋅2b3​β⋅(l3​−l2​)(1−β)⋅b2​30.1⋅(59.52−54)(1−0.1)⋅5.4b3​0.1⋅(59.52−54)(1−0.1)⋅5.430.1⋅5.520.9⋅5.4b3​0.1⋅5.520.9⋅5.430.5524.86b3​0.5524.8635.412b3​5.412第12个周期的计算4 三指数平滑三指数平滑Triple Exponential Smoothing也称为Holt-Winters方法是一种广泛应用于时间序列分析和预测的方法。这种方法适用于具有趋势和季节性模式的时间序列数据。4.1 三指数平滑的基本概念三指数平滑方法包括三个组成部分水平分量Level、趋势分量Trend和季节性分量Seasonality。每个分量都通过指数平滑的方式进行更新。水平分量Level水平分量 lt​ 表示时间序列在给定时间点的平滑值。它是预测的基础。趋势分量Trend趋势分量 bt​ 描述了时间序列中的趋势变化率。季节性分量Seasonality季节性分量 st​ 捕获了数据中的周期性模式例如年度销售周期等。三指数平滑的公式三指数平滑的更新公式通常如下其中是实际观测值。​ 是水平分量。​ 是趋势分量。​ 是季节性分量。 是季节长度例如如果数据按月度收集且每年有一个完整的周期则 12。、 和 分别是水平、趋势和季节性分量的平滑参数取值范围为 [0, 1]。预测公式使用场景三指数平滑方法适用于以下场景时间序列数据具有明显的趋势和/或季节性。需要预测未来一段时间内的数据。数据集足够大以识别出趋势和季节性模式。对于短期预测非常有效但对于长期预测可能不太准确。假设我们有10个观测值并且我们想要预测第15个值。这意味着我们需要计算到第10个周期的所有分量并使用这些分量来预测第11到第15个周期的值。首先我们需要知道是否有季节性。如果没有季节性我们将使用双指数平滑不考虑季节性分量。如果有季节性我们需要知道季节的长度 。如果当前值不存在使用预测值进行填充1 如果没有季节性2 如果有季节性4.2 ARIMA模型与三指数平滑的区别ARIMA模型的特点适用范围: 适用于非平稳时间序列。参数: 包括自回归阶数(p)、差分阶数(d)、移动平均阶数(q)。灵活性: 可以捕捉复杂的动态关系。建模过程: 需要确定p、d、q的值通常通过自相关函数ACF和偏自相关函数PACF图来辅助确定。季节性: 可以扩展为季节性ARIMASARIMA模型来处理季节性数据。三指数平滑的特点三指数平滑是一种专门针对具有趋势和季节性的时间序列数据的预测方法。适用范围: 适用于具有趋势和/或季节性的平稳时间序列。参数: 包括水平平滑因子α、趋势平滑因子β和季节性平滑因子γ。简单性: 相对于ARIMA模型来说更加直观和易于实现。建模过程: 不需要显式的差分步骤通过平滑因子来调整模型的敏感度。季节性: 可以处理季节性数据。模型复杂度:ARIMA模型可以捕捉更复杂的动态关系而三指数平滑更侧重于趋势和季节性的平滑处理。适用范围:ARIMA模型适用于非平稳时间序列而三指数平滑适用于具有趋势和/或季节性的平稳时间序列。参数数量:ARIMA模型通常有更多的参数p、d、q而三指数平滑则主要依赖于平滑因子α、β、γ。模型选择:在选择ARIMA模型时需要确定p、d、q的值而在三指数平滑中主要是选择合适的平滑因子。计算复杂度:ARIMA模型通常需要更多的计算资源特别是当参数较多时。解释性:三指数平滑模型更容易理解和解释因为它直接反映了数据的趋势和季节性特征。4.2.1 选择建议如果数据具有明显的趋势和季节性并且是平稳的可以考虑使用三指数平滑。如果数据是非平稳的或者需要建模更复杂的动态关系可以考虑使用ARIMA模型。如果数据同时具有趋势、季节性和非平稳性可以考虑使用季节性ARIMA模型。