从产品视角说说DeepSeek

人人都是产品经理

  ·  

2025-02-25 07:11:33

  ·  

2次阅读

近年来,DeepSeek凭借其卓越的技术实力和创新应用,迅速走红于市场。本文从应用场景、数据服务和研发成本三个角度,深入探讨DeepSeek的独特之处,供大家参考。

近期,DeepSeek真可谓火出天际,相关的文章和报道犹如雨后春笋。集中讨论的方向主要包括:中美博弈、开源胜利、技术解析,投资价值……

然而,作为一个产品人,只想从以下三个方面说说我对DeepSeek的理解。

一、应用场景:DeepSeek 解锁高时效、高精度的复杂分析决策场景

DeepSeek 的进展有望解锁更多对“响应时效和精度要求极高”的复杂分析决策场景,例如投资决策、科研辅助、家庭教育、兵棋推演、具身智能、案件分析等。

小参数模型的优势不仅在于算力成本低,更在于其能够显著提升响应速度,并支持边缘计算。

通过强化学习(RL)和模型蒸馏技术,DeepSeek 使得较小参数的模型也能够展现出长思维链和自我验证的能力。

DeepSeek 为行业开启了一个巨大的想象空间:

许多原本需要深度分析推理的“慢思考”场景,未来可能以“快思考”的速度完成。这并不是说 DeepSeek 已经实现了这一目标,而是它正在推动这一趋势的发展。

回顾 2017 年,AlphaGo 已经能够在围棋这种有限规则的封闭场景中快速落子,而大语言模型(LLM)则能够应对更加多变、开放的无限场景。

正如《有限与无限的游戏》一书所描述的,这两种场景共同构成了人类社会的全部行为模式。

以往,只有人类的认知能力能够在无限游戏中实现瞬时响应,而未来 AI 也可能具备这种能力。

以马斯克为例,他的每一句即兴表达几乎都遵循第一性原理,深度思考率接近 100%,这是一般普通人难以企及的。

类似地,福尔摩斯在第一次见到华生时,仅凭一眼就推断出他是刚从阿富汗回来的军医。这种瞬间复杂推理的能力,即便给华生一年时间也难以完成。

通过大量强化训练,将原本需要“慢思考”的复杂逻辑推理问题,转变为接近“快思考”的速度。这种能力的人在专业领域内几乎无敌。

如果你读过《思考,快与慢》,可能会更容易理解这一点。书中提到,人类有两种思考系统:

系统 1 ——快速、直觉的“快思考”;

系统 2—— 是缓慢、逻辑的“慢思考”。

通过长期训练,某些系统 2 的行为可以逐渐自动化,接近系统 1 的运作方式。DeepSeek 带来的最本质改变,正是让复杂决策能够实现瞬时响应。

二、数据服务:高质量专业数据成为稀缺资源

在复杂场景和垂直领域中,高质量的专业数据比以往更加稀缺。

在 GPT-4 发布时,我曾提出一个观点:通用训练数据已接近耗尽。

后来,Ilya 等业界大佬也表达了类似看法,印证了这一猜测。监督微调(SFT)本身存在局限性,如果要进一步突破模型上限,强化学习是为数不多的可行路径。

DeepSeek 的实践表明,仅通过强化学习就能很好地完成模型的后训练(post-train),从而减少对标注数据规模的依赖。

然而,这并不意味着不再需要标注数据。如果希望大模型能够解决更复杂的推理场景,就必须对数据结构和标注质量提出更高要求——即提升评测标准。

具体来说,标注评测标准的提升主要体现在两个方面:专业化和拟人化。

那专业化需要达到什么程度?

我认为,未来各行业的业务专家和领导者需要亲自参与数据贡献,将他们的认知复刻到大模型中。通用场景数据和中低端数据外包服务将不再重要,因为开发者可以通过导师模型合成数据来训练小参数模型。真正稀缺的是经过精心设计、筛选、标注、核验和优化的高质量专家数据。

拟人化需要达到什么程度?

每一轮对话都应像真人交流,而非机械地“念稿”。“像真人”这一标准可以无限高,例如像 AGI(通用人工智能)那样,或者像马斯克、王阳明那样的顶尖人类。

那什么样的数据才能训练出如此拟人的模型?

仅仅依赖微信、抖音等平台上的内容数据是远远不够的。如果这些数据足够有效,互联网大厂的大模型性能早已遥遥领先,但事实并非如此。目前,DeepSeek 在模型性能上表现出色,而 AI 领域的其他新兴力量也并未被大厂拉开质的差距。

当前主流的训练数据混合模式是“人工数据 + 合成数据”,但合成数据的质量远不如人类专家。因此,专家们需要亲自下场,参与数据构建。

我认为,2025 年将是 AI 数据领域的分水岭,劳动密集型的数据服务将逐渐被淘汰,取而代之的是专家密集型的高质量数据服务。

这也是为什么 Scale AI 的创始人会因 DeepSeek 的崛起而感到焦虑,甚至呼吁限制中国 AI 发展——本质上是因为他们的商业模式受到了冲击。

三、研发成本:头部 AI 公司将控制算力成本与团队规模,并提升人才密度

1)算力成本:DeepSeek 展示了低成本、高 ROI(投资回报率)的模型研发路径,让更多玩家看到了应用场景落地的可能性。

这将吸引更多应用端玩家入场,并促使资金投入更加坚决。同时,DeepSeek 的崛起也加剧了中美 AI 军备竞赛,使得英伟达芯片断供问题更加严峻。国产替代芯片的需求因此变得更加迫切,市场对低成本高端芯片的渴望也将推动国内芯片产业的发展,这对国运而言是一大利好。

2)人力成本:DeepSeek 的成功揭示了 AI 大厂组织精简的拐点已经到来。

不仅是硅谷,国内大厂同样难以避免这一趋势。与此同时,低成本、高效率的大模型研发机会将刺激更多新老软件公司加速布局 AI,从而导致 AI 人才呈现结构化流动的趋势。

优秀的 AI 公司永远缺乏顶尖人才。无论是在算法、工程还是产品领域,100 个普通工程师的价值可能远不如 1 个顶尖人才。

这就像房地产和股市中的现象:自 2021 年以来,房价暴跌,但一线城市的豪宅明显比刚需房更具抗跌性,因为豪宅有其独立的价值逻辑。

同样,在股市中,投资者偏爱龙头股,表面上是人性使然,但更深层的逻辑在于:龙头股涨得最早、涨得最多,也跌得最晚。

本文由人人都是产品经理作者【并步跳步交叉步】,微信公众号:【一起侃产品】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。