回归模型可解决的决策问题-DeepSeek分析第二篇
在数据分析和决策支持领域,回归模型是解决复杂业务问题的强大工具。本文通过深入探讨回归模型在预测和解释变量关系中的应用,展示了如何利用多元线性回归和逻辑回归模型解决实际业务中的决策问题
在上一篇deepseek生成时间预测模型分析之后,继续探索deepseek结合分析的可能性,让它用于解决业务中常见的决策问题。
预测问题:已知一部分变量,想要预测另一变量。
解释:在众多变量中,想要知道这些变量对目标变量的影响程度是多大。
以上两个问题,使用多元线性模型和逻辑回归模型可简单解决。
简单看一下两个模型的数学表达式:
其中X为变量,β为参数,以示意图来理解的话(非数学表达式对应图形)
简单解释上图:多元线性回归,就是找到一条线,使得每组x对应的预测值y都与真实y距离和最短(垂直距离);逻辑回归,是找到一条线,可以将两个不同的类别,准确分到这条线的两边,与实际类别相比预测对的个数越多越好。
逻辑回归其实是一种特殊的多元线性回归,它进行了一次指数转化,把线性回归结果值映射到(0,1]上并保持单调,表达的含义为是y的概率,如以会流失的用户为目标群体,所计算的概率就为用户流失率。
举个例子做个实操,假如在二手车交易平台,新上架一辆二手车,现在需要填写参考价格,希望它既能很快卖掉,又可以尽量多赚到钱。
先梳理一下报价的参考信息,车辆的参数很多如发动机相关的排量、智能系统是否有中控屏、车辆辅助配置是否有雷达等,这些同新车参数一样,也有一些二手车特有比如行驶里程、上牌年份等。重点挑一下对购买具有决策价值的字段,假如筛了如下这些:
对于二手车预计价格可以用多元线性回归模型处理,对于未来3年是否保值这类是否问题,可以使用逻辑回归预测未来3年可保值(p>0.5)的概率。模型选择之后,可能还需要解决一些疑问:
1. 自变量的处理
2. 参数估计
3. 模型评估指标
4. 模型结果
【二手车价格预测模型】
价格预测模型公式 Y1 = 22.636+0.069×行驶里程(万km)-1.8737×上牌距今年间隔+0.3383×新车指导价(万元)-3.6993×中控屏-4.3435×排量+2.3033×BBA品牌-3.3105×SUV车型+3.5228×MPV车型
假如新上架一辆二手车,对应的变量如下,求Y1
预测:可通过变量进行二手车售卖价格为9.89万元
模型解释:
【二手车是否保值模型】
是否保值预测公式Y2= ln(p/(1-p)) = -3.4375 + (-0.0293)*行驶里程(万km) + (0.4238)*上牌距今年间隔 + (0.0200)*新车指导价(万元) + (1.5857)*中控屏 + (-0.4167)*排量 + (-0.3276)*BBA品牌+ (0.5123)*SUV车型+ (1.6684)*MPV车型
假如新上架一辆二手车,对应的变量如下,求Y2
预测:未来保值的概率为0.52
模型解释
以上,利用回归模型进行预测和变量解释。方法比较简单,不管是预测还是变量解释性还有一些调优的空间,在后边的文章中会再详细介绍。
但是,可定量衡量自变量对因变量的影响,对一些因素的重要程度进行判断,已经可以帮助我们在纷繁的因素中,找到方向和重点。
作者:小王子和小企鹅,公众号:小王子和小企鹅
本文由@小王子和小企鹅 原创发布于人人都是产品经理。未经作者许可,禁止转载。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。