Deepseek帮我生成了分析预测报告
随着人工智能技术的飞速发展,AI工具在数据分析和预测领域的应用越来越广泛。本文作者通过实际操作,展示了如何利用DeepSeek这一AI工具,仅用31天的假订单量数据,成功预测未来7天的订单量。
Deepseek+数据分析师,这个组合有点王炸。
数据分析师、商业分析师常处理的经营情况分析、产品迭代分析、市场调研、规模预测等等这些工作,在deep seek的帮助下,一个人就是一个团队,大大提高了效率。以下是一个数据分析场景:未来趋势预测。
……
抱着好奇心态,看看到底deep seek能解放我双手多少,我给了它31天的假订单量数据,让它帮我预测未来7天的订单量。经过几轮对话达到了基本要求,内容如下:
看公式很容易理解,间隔为n的时间窗口内的平均值,该值可作为T+1的预估值,适用场景通常为趋势稳定的数据,如果数据有周期性,会出现预测峰谷值同实际错位的情况。
y^为预测值,y为实际值,α为平滑系数,范围(0,1),α越大近期更敏,感适合波动较大的数据,反之越平滑适合稳定趋势。T+1的预测值,为t天实际值和预测值的加权所得。
包含水平平滑、趋势平滑、季节性平滑。
水平平滑
趋势平滑
季节性平滑
几个参数:
有点抽象,举个例子说明,假如如下对应每个季度的商品销售量,现在想要预测2025Q1(t=9)的销量
假设参数设定:α=0.3(水平) β=0.2(趋势) γ=0.1(季节性),季节周期:m=4
初始化预测参数:
预测2024Q1(t=5):y5预估=l4+b4+s5-4=130+6.67-30=106.67,实际y5=120更新预测参数,即t=5对应的预估值,
以此类推,可得到y9预估值=l8+1b8+s9-42=149.63
虽然手动算麻烦一点,但以上这两种方式,确实可以通过计算看到数据和趋势变化如何产生。
接下来要聊的两种方法,就不足以通过手动计算了。4. ARIMA(p,d,q)。时间序列预测很古典和著名的方法。
模型是由三部分组成:
1)自回归部分AR
p为参数,核心解决的是预测未来的数据,应该选历史多少个时间点的数据更好,最远的时间是t-p,因此p为参数。
2)移动平均部分MA
q为参数,要解决的是y实际值和y预测值之间的差,选择历史上多少个时间点更好,最远时间为t-q,因此q为参数。
3)差分部分,d为参数,要解决的是 yt-yt-1这样做几阶差分更好,为的是把非平稳的数据转换为平稳数据。先通过ADF检验对d进行差分检验(与统计临界值对比),在通过ACF(自相关函数)和PACF(偏自相关函数)分别对p和q进行检验,通过AIC和BIC对模型复杂性评估后可得到更为合理的p、q值。
模型是由三个小模型组成:ϵt 为误差项g(t):增长和分段线性模型(线性或者逻辑回归函数)s(t):周期性和季节性模型(正弦和余弦组合函数)h(t):节假日或特殊事件模型(线性函数)该模型很好理解,且命中了趋势预测里经常要思考的几个问题:如果趋势有上升和下降几段趋势怎么办?周期性的数据并非完全自然周期怎么办?遇上突发事件出现某个点异常怎么办?过往的时间序列模型很难进行拟合和描述,不过Prophet解决了这个问题。这里对具体公式不详细展开,感兴趣可在参考资料里了解,这里主要介绍模型参数的作用,对实操会更有帮助。
后边也有新的升级 Neural Prophet,如果感兴趣也可以再查找了解。
预测时数据会切分成两部分,训练集和测试集,评估模型效果简单来讲就是拿训练集得到模型,后再去预测测试集对应的数值,把测试集的真实结果同预测结果比对,差异越小说明预测越准确,但也要兼顾鲁棒性,注意不要过拟合。
几个线性模型评价模型准确度的指标和计算公式如下,比较简单就不做过多解释了。MAE 平均绝对误差
RMSE 均方根误差
MAPE 平均绝对百分比误差(使用时不能有0,且去量纲可比较不同数据集)
参考资料
知乎文章 《时间序列原理篇之Facebook Prophet算法》
知乎文章《时间序列模型(四):ARIMA模型》
作者:小王子和小企鹅,公众号:小王子和小企鹅
@小王子和小企鹅 原创发布于人人都是产品经理。未经作者许可,禁止转载。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。