Deepseek帮我生成了分析预测报告

人人都是产品经理

2025-03-19 07:26:33

0次阅读

随着人工智能技术的飞速发展，AI工具在数据分析和预测领域的应用越来越广泛。本文作者通过实际操作，展示了如何利用DeepSeek这一AI工具，仅用31天的假订单量数据，成功预测未来7天的订单量。

Deepseek+数据分析师，这个组合有点王炸。

数据分析师、商业分析师常处理的经营情况分析、产品迭代分析、市场调研、规模预测等等这些工作，在deep seek的帮助下，一个人就是一个团队，大大提高了效率。以下是一个数据分析场景：未来趋势预测。

什么场景下会用到时间序列分析

每年年末或年初，做预算规划或目标设定时，会根据历史基线、增长速度等给下一年定个目标值。
或者需要根据季节性、周期性特点，以及短期内的销售情况，对未来库存进行预估，更及时地进行备货调整。
或者未来想开拓一个新业务，预估未来市场有多大潜力空间。
又或者在推荐等模型优化时将预测值作为输入特征。

……

Deepseek生成的时间序列分析报告

抱着好奇心态，看看到底deep seek能解放我双手多少，我给了它31天的假订单量数据，让它帮我预测未来7天的订单量。经过几轮对话达到了基本要求，内容如下：

时间序列模型原理

适用于中短期

移动平均

看公式很容易理解，间隔为n的时间窗口内的平均值，该值可作为T+1的预估值，适用场景通常为趋势稳定的数据，如果数据有周期性，会出现预测峰谷值同实际错位的情况。

简单指数平滑

y^为预测值，y为实际值，α为平滑系数，范围（0，1），α越大近期更敏，感适合波动较大的数据，反之越平滑适合稳定趋势。T+1的预测值，为t天实际值和预测值的加权所得。

Holt-Winters

包含水平平滑、趋势平滑、季节性平滑。

水平平滑

趋势平滑

季节性平滑

几个参数：

St：当前季节分
m：季节周期（如m=12为以月为周期，12个月为一个循环）
α、β、γ分别为水平、趋势、季节性平滑参数，范围（0，1）
h：步长，预测是跨几个步长进行预测，一般是1
k=(h-1)/m+1

有点抽象，举个例子说明，假如如下对应每个季度的商品销售量，现在想要预测2025Q1(t=9)的销量

假设参数设定：α=0.3（水平） β=0.2（趋势） γ=0.1（季节性），季节周期：m=4

初始化预测参数：

l4=（100+120+140+160）/4=130，即前4个季度的平均值，
b4=平均季度增长=（120-100）+（140-120）+（160-140）/3=6.67s1=100-130=-30，
s2=120-130=-10，s3=140-130=10，s4=160-130=30

预测2024Q1(t=5)：y5预估=l4+b4+s5-4=130+6.67-30=106.67，实际y5=120更新预测参数，即t=5对应的预估值，

l5=0.3（120+30）+0.7（130+6.67）=140.67
b5=0.2（140.67-130）+0.8*6.67=7.47
s5=0.1（120-130-6.67）+0.9（-30）=-28.67

以此类推，可得到y9预估值=l8+1b8+s9-42=149.63

虽然手动算麻烦一点，但以上这两种方式，确实可以通过计算看到数据和趋势变化如何产生。

适用于中长期

接下来要聊的两种方法，就不足以通过手动计算了。4. ARIMA(p,d,q)。时间序列预测很古典和著名的方法。

模型是由三部分组成：

1）自回归部分AR

p为参数，核心解决的是预测未来的数据，应该选历史多少个时间点的数据更好，最远的时间是t-p，因此p为参数。

2）移动平均部分MA

q为参数，要解决的是y实际值和y预测值之间的差，选择历史上多少个时间点更好，最远时间为t-q，因此q为参数。

3）差分部分，d为参数，要解决的是 yt-yt-1这样做几阶差分更好，为的是把非平稳的数据转换为平稳数据。先通过ADF检验对d进行差分检验（与统计临界值对比），在通过ACF(自相关函数)和PACF(偏自相关函数)分别对p和q进行检验，通过AIC和BIC对模型复杂性评估后可得到更为合理的p、q值。

Prophet。时间序列进化到Prophet，操作更友好了。

模型是由三个小模型组成：ϵt 为误差项g(t)：增长和分段线性模型（线性或者逻辑回归函数）s(t)：周期性和季节性模型（正弦和余弦组合函数）h(t)：节假日或特殊事件模型（线性函数）该模型很好理解，且命中了趋势预测里经常要思考的几个问题：如果趋势有上升和下降几段趋势怎么办？周期性的数据并非完全自然周期怎么办？遇上突发事件出现某个点异常怎么办？过往的时间序列模型很难进行拟合和描述，不过Prophet解决了这个问题。这里对具体公式不详细展开，感兴趣可在参考资料里了解，这里主要介绍模型参数的作用，对实操会更有帮助。

growth（增长函数类型）：linear（默认）：线性增长，适用于无明确上限的趋势（如销售额），logistic：逻辑回归增长，适用于有增长上限的场景（如用户数）；
changepoint_prior_scale（变点灵敏度）：0.001~0.5（默认 0.05），若预测结果过于平滑（欠拟合）增大该值，若预测结果波动剧烈（过拟合），减小该值；
n_changepoints（变点数量）：25（均匀分布在时间序列前80%区间），越大将趋势变化切分越多；
seasonality_prior_scale（季节性强度）：0.01~10（默认10），值越大季节性波动越大；add_seasonality（傅里叶阶数）：name=’yearly’, period=365.25, fourier_order=12，fourier_order越大阶数越高拟合越复杂，name对应的是yearly，weekly，daily或者命名一个，period写对应周期；
holidays_prior_scale（节假日效应强度）：0.01~10（默认 10），值越大节假日波动越强。节假日窗口，比如双11大促 = pd.DataFrame({‘holiday’: ‘promo’,’ds’: pd.to_datetime(‘2022-11-11’, ‘2023-11-11’, ‘2024-11-11′),’lower_window’: -30, #双11前30天’upper_window’: 2 #双11后2天})

后边也有新的升级 Neural Prophet，如果感兴趣也可以再查找了解。

如何评估模型效果

预测时数据会切分成两部分，训练集和测试集，评估模型效果简单来讲就是拿训练集得到模型，后再去预测测试集对应的数值，把测试集的真实结果同预测结果比对，差异越小说明预测越准确，但也要兼顾鲁棒性，注意不要过拟合。

几个线性模型评价模型准确度的指标和计算公式如下，比较简单就不做过多解释了。MAE 平均绝对误差

RMSE 均方根误差

MAPE 平均绝对百分比误差（使用时不能有0，且去量纲可比较不同数据集）

参考资料

知乎文章《时间序列原理篇之Facebook Prophet算法》

知乎文章《时间序列模型(四)：ARIMA模型》

作者：小王子和小企鹅，公众号：小王子和小企鹅

@小王子和小企鹅原创发布于人人都是产品经理。未经作者许可，禁止转载。

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。