2 月 19 日,硅基流动(SiliconFlow)官宣已于 2024 年底完成亿元人民币 Pre-A 轮融资。本轮融资由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投,华兴资本担任独家财务顾问。本轮融资之前,硅基流动已引入美团作为战略股东。 硅基流动创始人袁进辉表示:「此次融资将加速硅基流动的 AI 云基础设施升级与商业化拓展,将以高性价比、稳定可靠的产品服务开发者与企业客户,助力全球 AI 应用生态的落地与繁荣。」 随着 DeepSeek 冲击波撼动全球,硅基流动选择在这个时间点公布新的一轮融资,无论是偶然还是必然,在这一波 AI 浪潮中的机会也在酝酿中。 ## **01 ****打造大模型时代的基础设施平台** 硅基流动成立于 2023 年 8 月,致力于打造大模型时代的 AI 基础设施(AI Infra)平台,通过算法、系统与硬件的协同创新,降低 AI 应用的开发和使用门槛。 当前,硅基流动主要提供模型云服务平台 SiliconCloud、大语言模型推理引擎 SiliconLLM、高性能文生图/视频加速库 OneDiff 等产品,让企业和个人用户高效、低成本地部署 AI 模型。 SiliconCloud 为开发者提供多种开源大模型 API,已上线包括满血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等在内的上百款主流模型,还提供模型训练、微调、托管到部署的全链路支持。SiliconCloud 背后基于硅基流动自研推理加速引擎套件(SiliconLLM & OneDiff),通过软硬件联合优化与加速,大幅降低推理部署成本,并为用户提供极致高性能体验。 去年 4 月上线以来,SiliconCloud 在上线不到一年时间内获得了爆发式增长,平台总用户数超三百万,日均调用上千亿 Token。  _硅基流动创始人袁进辉|图片来源:硅基流动_ 作为连续创业者,硅基流动创始人袁进辉做 AI Infra 领域创业的起点源于 2017 年,当时,他创办一流科技,做 OneFlow 深度学习算法框架,旨在解决当模型变大时,训练的并行计算等问题。 随着 ChatGPT 的出现和出圈,大模型成为共识,OneFlow 这样的大模型训练框架也成为炙手可热的项目。2023 年 6 月,OneFlow 以 1 亿美金估值被光年之外并购,后者是由前美团联合创始人王慧文成立的大模型公司,并购后袁进辉作为联创加入光年之外。 两个月后,光年之外被美团收购,袁进辉没有选择加入美团,而是再次创业。 从团队优势和市场需求的角度出发,袁进辉依旧选择深耕 AI Infra 领域,但创业方向从模型训练算法框架转变到了模型推理,这便是 2023 年 8 月创办的硅基流动。 他表示,在大模型发展早期,类似于「卖铲子、卖水」的基础设施,是最稳妥的,以推理部署为起点出发,有广阔的空间,特别是随着 OpenAI o1 等技术的出现,test-time compute(「反思型」推理)也带来了新的机会。 ## **02****「DeepSeek 热」挤爆 SiliconCloud** 在这个时候,官宣融资很难不被和 DeepSeek 做关联。 过去一个月,DeepSeek-R1 开源模型的火热,为硅基流动带来了数十倍的流量增长。新的发展契机下,硅基流动也迎来了的发展空间——从 Infra 的角度迈向云计算服务。 就在两周前,创新工场联合 CEO、管理合伙人汪华向极客公园表示,「硅基流动云平台上的 DeepSeek-R1 API 被打爆了,现在接入 DeepSeek API 的公司需要排队(尽管已经开足马力在持续扩容)」。 从用户反馈中,更能感受到这股前所未见的汹涌需求。在极客公园开发者社群里,用硅基流动接入满血版 DeepSeek 的话题频频热议。 硅基流动联合创始人、增长副总裁杨攀也曾在朋友圈表示,「自 2 月 1 号硅基流动发布 DeepSeek R1/V3 推理服务后,我们官方微信社群人数在 3 天内打平了过去 6 个月的增长」。  _此前据晚点统计 SimilarWeb 访问量,硅基流动网站访问量的增长趋势也是这样,自 R1 API 上线以来,10 天增长了 30 多倍突破到 100 万,甚至一度超过阿里云。|图片来源:SimilarWeb_ 爆火背后,汪华认为,「这次才是我一直说的中国的 ChatGPT 时刻」。 DeepSeek 模型能力的确迈过了一个新高度,所以这次不仅让 ToC 普通用户感受到模型的威力,企业的老板和核心决策人也是第一次亲身体会,而不只是让公司 CTO 研究一下、点缀一下(产品),现在企业老板们,真心想测试、使用大模型。 **也正是这波汹涌的需求,硅基流动在过去的 20 天迎来了「DeepSeek 大考」,也进一步加速了「云服务平台」的升级。** 从时间上看,国内第一家提供 DeepSeek-R1 API 云服务的便是硅基流动。 2 月 1 日,硅基流动和华为云团队联合首发并上线基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务。 当天,硅基流动的 DeepSeek 模型 API 服务就被挤爆了,一度陷入瘫痪状态。作为对照,第一家上线 DeepSeek API 服务的云厂商火山引擎也是这样,在激增的热情需求下,2 月 4 日火山引擎上线 DeepSeek-R1 当天,API 服务也被「挤崩了」。 2 月 4 日,硅基流动方面表示,上线满血版 R1/V3 后,用户激增导致用户体验下降。当天,硅基流动 SiliconCloud 平台继续上线 6 款加速版 DeepSeek-R1 蒸馏版模型,鼓励大家非不得已都用蒸馏版模型。 2 月 8 日,由于需求过大,硅基流动再次限流,上线了 Pro 版 DeepSeek R1 & V3,优先服务已充值用户,并表示也会尽快解决非 pro 版的需求,放开限制和限流。 2 月 10 日,硅基流动上线 DeepSeek R1 & V3 企业级服务,针对企业需求,提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。  _硅基流动 SiliconCloud 平台大模型 API 服务|截图来源:硅基流动官网_ 从时间和反应动作来看,硅基流动在包含春节长假在内的短短十几天,**接住了一定的需求,并进一步巩固了开发者和生态伙伴**。 当前,硅基流动与华为、亚马逊云科技、英伟达等业内顶级云厂商、芯片厂商、大模型公司及应用公司建立合作伙伴关系;同时,硅基流动携手各方合作伙伴,帮助客户在大语言模型、文生图、视频生成等多个领域实现应用落地。 ## **03 ****AI 应用即将爆发,****云服务的赛点打响** 从近来各大云厂商以及硅基流动上大模型 API 调用的增长数据来看,DeepSeek 这条鲶鱼正在带动国内整个 AI 应用的开发热情。对于硅基流动来说,这是巨大的机会。 在袁进辉看来,基础设施层面的创新空间足够大、确定性也够高。作为服务全行业的底座,基础设施有三个主要的切入点:芯片、模型和基础设施 (Infra)。「**最终,这三者如果要取得长远的成功,都会走向类似于云计算 (cloud) 的形态,将模型和芯片整合在一起。从 Infra 的角度往云计算方向发展,机会并不比其他方向小。**」 这正是硅基流动的发展路线。以推理部署为出发点,逐渐提供越来越完整的云服务产品,进一步实现商业化闭环。 值得注意的是,尽管基础设施层面的服务是确定性的市场机会,但也不是没有挑战。**做大模型时代的基础设施,是共识,尤其很多大公司都将这个领域视为必争之地,这意味着会面临着激烈的竞争。** 近日,推理引擎云平台 Lepton.ai 创始人贾扬清就认为,虽然 DeepSeek 是很牛的模型,但(创业公司)跟风用它做推理服务很难做出差异化。他认为:AI Infra 不能烧钱,因为都是标品。跟今天的公共 API 比速度、比稳定性,意义不大,比的就是钞能力。小厂没必要跟着大厂一起烧钱。 但拉远来看,在 AI 应用即将爆发,大模型发展仍在早期阶段,通过承接激增的模型 API 需求,进一步完善服务的布局和商业闭环,是硅基流动当下的战略选择。 就像耀途资本投资副总裁、硅基流动董事温廷灿所言,「凭借卓越的技术工程化能力和对市场需求的精准把握,硅基流动创始团队已经建立起独特的技术商业化闭环,形成技术壁垒与生态护城河的双向强化。」耀途资本也是唯一一家从天使轮开始连投三轮的投资方。 眼下,随着 DeepSeep 加速了 AI 应用爆发的可能性,如何持续整合资源、赢得广大的开发者,才是硅基流动的首要优先级。 如果能够在执行力和基础服务的产品竞争力方面占据优势,那么硅基流动也有机会在大厂全面进入并进行激烈竞争之前,拿到更多的有利资源,提供更有竞争力的服务。
兴起不到六年的短剧,马上就要追上长视频平台。 QuestMobile 数据显示,红果免费短剧App(以下简称红果短剧App)在12月的月活用户规模已飙升至1.58亿,同比暴增551%,与优酷的差距只剩不到3000万。  红果短剧App用户规模已飙升至1.58亿|图片来源:QuestMobile 从去年3月的日活2000万到如今单月逼近1.6亿用户,这款诞生不到两年的App正超速完成对传统长视频平台的弯道超车。 一个更深刻的行业变革正在发生——短剧生态重构影视产业格局。 ## 红果短剧,火箭式增长 红果短剧App的一骑绝尘,其实在去年就开始了。 根据QuestMobile的数据,2024年3月,红果短剧App月人均单日使用时长高达到约1.38小时,优爱腾芒均已落下风,同时,日活用户突破2000万大关——此时距离抖音集团正式推出红果短剧刚过去一年多。 时间再往后推7个月,有消息称,红果短剧App的日活已经超过3000万。 观研报告显示,在2024年中国互联网价值榜中,红果短剧高居App用户规模增长TOP榜(亿级)榜首,同比增长1046%,近乎10倍。根据行业估计,2025年上半年红果短剧将大概率实现DAU破亿。  红果短剧App月人均单日使用时长超过优爱腾|图片来源:QuestMobile 短剧行业正在疯狂增长,红果短剧App应该很快会成为字节跳动下一个DAU过亿的产品,成为一个新的共识。 短剧的兴起可追溯到2018年前后,伴随抖音、快手等短视频平台的兴起,一批创作者开始尝试以幽默、搞笑、反转为题材的剧情类短视频,这被视为微短剧的雏形。 到2021年,微短剧创作从“草根”走向“正规军”,专业工作室和各大平台如抖快、爱优腾纷纷入局,行业进入疯狂增长期。这一爆发式增长背后有两大关键因素: 第一是内容形式契合用户需求,短视频平台的兴起催生了电影、电视剧解说等短平快内容需求的热潮,但二次创作绕不开版权问题,原创(也就是短剧)成为这类需求的正解。 第二是短视频引流的高ROI效应,抖快崛起以后,国内效果类广告的盘子飞速增长,高ROI的品类可以借助平台的力量快速增长。而短剧天然是最适合短视频平台引流的品类,早期投流ROI(投资回报率)更是一度高达2,远超行业平均水平(1.2)。高ROI吸引大量投流公司从小说转向短剧,推动行业快速扩张。 随着短剧用户的快速增长,免费模式逐渐成为行业趋势。红果短剧App的免费模式不仅吸引了大量用户,还通过广告收入为内容出品方提供了可观的收益。 去年12月,红果短剧App版权合作负责人袁子超对外透露,2024年6月,红果短剧实现首次分账过亿,9月超过2亿,11月分账超过3亿。 袁子超称,过去一年尤其是过去半年,短剧变现模式有一个趋势变化,即从传统的用户付费,变成目前付费和广告变现并存的形式,红果短剧一开始就选择商业投放和自然推荐之路,并将受益于这种变化。 此外,虽然是短剧App ,但除了短剧,红果上还有电影、电视剧、听书、小说、漫画等各种形式的内容。同时,红果短剧推出了精品短剧合作计划,在覆盖大量免费短剧的同时,也对精品短剧下注,这个发展态势,有点会让人联想到拼多多的成长路径。  红果短剧上内容品类众多|图片来源:极客公园 回顾过往,拼多多曾经在被认为大局已定的电商市场,迅速崛起——从“砍一刀”、“拼单”牵引对社交流量的利用,也从符合人性的低价和下沉市场切入,并充分利用了中国过剩的制造资源,后来形成规模升级品质,再拓展到全品类,渗透到全人群。而红果的发展路径也遵循了类似的轨迹:初期免费吸引用户,随后引入精品内容,与传统影视公司合作,提升内容质量,试图覆盖更广泛的用户群体。 视频领域看起来正在重演“拼多多式崛起”的故事。 ## 短剧生态重构 刚过去的2025年短剧春节档,免费短剧占据了主流。但短剧行业爆发的特点,决定了短剧早期的商业模式是付费为主。通常前几集是免费的,之后需要付费几十元不等解锁,出品方利用信息流广告进行推广,引导用户通过点击广告跳转到小程序观看短剧付费。 随着行业的发展,一些新的商业模式也开始出现,比如分账剧和定制剧。其中,分账剧由平台按评级*流量(会员拉新、充值)分账;定制剧由客户全额投资,植入广告。这两种模式为行业提供了更多元化的变现手段,推动了短剧市场的发展。 而随着用户量级进一步提升,就像当年的网络小说一样,免费模式的时机已经到来。2023年5月,抖音推出「红果免费短剧」,并在三个月后上线独立App,到2024年11月,其日活已经超过5000万。 伴随着红果短剧App用户的飞速增长,免费短剧模式进一步被验证。在刚过去的2025年春节档,短剧虽然并没有像去年一样出现爆款扎堆的现象,但不同于前一年春节档付费短剧占据市场,2025年春节档则出现了大量免费短剧,同时短剧的商业模式与生态业已发生改变。 首先,有了一定的用户基数和高效的广告等商业化系统,红果短剧这样的免费平台可以不用向用户直接收费,而是通过免费吸引用户,进而吸引广告主和创作者,形成飞轮效应快速增长。 并且在付费模式下,制作方的收益率只有3%,分成天花板低,而红果短剧的免费短剧模式分成天花板更高,对行业发展更友好。 不同于付费买断模式下,收入主要依赖于前一周甚至前三天的付费。免费模式下,一部短剧的首月分账仅占全生命周期收入的20%到30%。 而随着时间推移和新用户的不断涌入,其累计分账收入会大幅增长,甚至超过传统付费市场的爆款短剧,红果短剧的长期分账机制为创作者提供了持续稳定的收入,这种模式不仅延长了短剧的生命周期,还提升了爆款率和收入天花板,可以激励创作者投入更多资源创作优质内容。 同时,红果的高速增长也为短剧提供了持续的市场空间。一方面,新用户不断涌入,使得老剧对新用户而言仍然是“新剧”,从而延长了内容的生命周期,进一步优化了分发效率;另一方面,免费模式能够有效挖掘短剧的长尾价值。付费模式下,短剧的生命周期较短,而免费模式则能够持续吸引那些不愿意付费但愿意观看广告的用户,延长内容的价值周期。 这种模式不仅推动了短剧行业的发展,还改变了内容预算的分配格局。袁子超称,以红果为代表的免费模式给整个内容行业提供的预算已经超过了传统渠道给行业提供的内容预算,而且差距会不断扩大,这为创作者和制作团队提供了更多资金支持,也推动了短剧整个行业的向前发展。 红果短剧的崛起,本质上是字节跳动依托流量生态与算法优势,对视频消费场景的又一次精准狙击。免费模式通过广告分账机制和长尾内容价值挖掘,不仅颠覆了传统付费短剧的“速生速死”逻辑,更以日均1.38小时的用户时长反超长视频平台,力推短剧从“碎片化补充”升级为“主流娱乐选项”。 狂飙背后也有隐忧浮现:2025年春节档超400部短剧却无破圈爆款,热度仅6000万左右,暴露出内容同质化(大多为“直白欲求”题材)与精品供给不足的瓶颈。 在短剧市场规模持续增长的同时,用户对短剧内容的需求也在进一步提升,精品短剧已经是行业升级的必然选择。 当免费模式解决了用户触达问题后,精品化将成为撬动广告溢价和用户付费意愿的核心杠杆。 短剧行业接下来的竞争,终究要回归“内容价值”的本质——只有精品化,才能让短剧从流量快消品升级为可持续的文化消费品,而也这正是内容品类从野蛮生长迈向成熟升级的必经之路。
转瞬即逝的 AI 硬件 #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 [爱范儿](https://www.ifanr.com) |[原文链接](https://www.ifanr.com/1614984) ·[查看评论](https://www.ifanr.com/1614984#comments) ·[新浪微博](https://weibo.com/ifanr)
 1、[往期回顾:「深蓝洞察」2024年度最别开生面的安全新生态](https://www.4hou.com/posts/W11o) 2、[往期回顾:「深蓝洞察」2024年度最具含“金”量的绕过](https://www.4hou.com/posts/1MMq) 3、[往期回顾:「深蓝洞察」2024年度最具想象空间的新应用](https://www.4hou.com/posts/422J) 4、[往期回顾:「深蓝洞察」2024年度最狂躁不安的漏洞](https://www.4hou.com/posts/l001) 5、[往期回顾:「深蓝洞察」2024年度最“隐”人注目的安全趋势](https://www.4hou.com/posts/pnny) 6、[往期回顾:「深蓝洞察」2024年度最悲剧的后门](https://www.4hou.com/posts/vwwn) 7、[往期回顾:「深蓝洞察」2024年度最难以阻挡的攻防趋势](https://www.4hou.com/posts/l00j) 在攻防对抗日益激烈的2024年,安全软件一直被视为企业安全防线的重要基石。然而,这些安全软件本身也可能存在漏洞,甚至被攻击者利用作为入侵的跳板来对用户造成危害。多年来,因为安全软件而导致的事故不禁让人产生一个疑问——安全软件真的可信吗? 以下为本期《深蓝洞察 | 2024 年度安全报告》的第八篇。  **安全软件被滥用为攻击工具** 在当前APT(高级持续性威胁)组织频繁活动的环境下,EDR/XDR已成为企业安全防御体系的核心组件,负责监控数百万端点和服务器。然而,权力越大,责任也越大。这些承担重任的安全软件一旦存在安全漏洞,便可能成为攻击者手中的利器,用于部署勒索软件、窃取敏感信息,并且难以被察觉或移除。 近日,SCRT的安全研究人员通过逆向工程与动态分析,发现Palo Alto Networks Cortex XDR产品中存在一个权限提升漏洞(CVE-2024-5907)。用户用受Cortex XDR保护的设备请求Cortex服务(cyserver.exe)生成日志,管理员可以使用这些日志来排除代理的潜在问题。  漏洞触发版本 CVE-2024-5907漏洞的核心在于利用Cortex XDR的日志生成机制实现权限提升。攻击者通过非特权用户身份请求生成日志,触发以SYSTEM权限运行的cyserver.exe服务。该服务在处理日志生成时,会在C:\Windows\Temp目录下创建临时文件夹,其名称遵循可预测的tmp<进程pid><!--进程pid--> 创建临时文件夹 由于这些临时文件夹继承了C:\Windows\Temp的宽松访问控制列表,所有用户均拥有写入权限,攻击者便可预先在预测路径下创建恶意的NTFS Junction软链接,将该目录重定向至高权限敏感位置,例如C:\Config.msi。具体攻击过程如下: - 首先,当cyserver.exe服务执行临时文件清理操作时,会对临时目录进行递归删除,但其在处理Junction链接时,并未进行充分的路径合法性校验,直接以SYSTEM权限对Junction链接指向的目标目录执行删除操作,从而错误地删除了系统关键目录C:\Config.msi下的文件。 - 其次,攻击者进一步利用Windows Installer服务在处理C:\Config.msi文件夹时存在的竞争条件漏洞,通过反复触发日志生成与目录删除操作,干扰系统对Config.msi资源的锁定机制。 - 最终,在服务尝试重建该目录时,劫持文件写入流程,从而以SYSTEM权限执行操作,达成本地权限提升的目的。 此漏洞的成功利用高度依赖于多个竞争条件,如临时目录名称预测的准确性、软链接植入时机与文件删除操作时序的精确同步,虽然漏洞利用过程可能需要多次尝试,但这个漏洞依然危害严重。这意味着,在用户权限受限的情况下,攻击者也能如入无人之境,绕过XDR的层层保护,直接威胁到企业内网的敏感数据和关键基础设施,使安全软件的防护形同虚设。 **一次全球性的防护软件灾难** 2024年7月19日,美国知名网络安全公司CrowdStrike因分发异常更新,导致全球数百万台计算机崩溃,严重影响航空、银行和媒体等行业的运作,预计在全球范围内造成数十亿美元的损失。 CrowdStrike提供一系列安全防护软件帮助客户保护计算机抵御网络攻击,旗下的Falcon Sensor(猎鹰传感器)产品在个人电脑Windows操作系统的内核层面安装传感器,用来检测和预防网络攻击,而这种高级别的防护恰恰成为造成本次事件的重要原因。当安全软件拥有内核权限之后它的防护能力大大提升,但同时风险也随之提高——一旦出现问题,对用户造成的影响异常严重。 尽管CrowdStrike官方宣称此事件并非安全漏洞,而是驱动程序错误,但这次事件无疑给用户敲响了警钟:纵然是顶尖的安全软件,也可能因其自身的缺陷引发难以预料的灾难。  纽约拉瓜地亚机场行李输送带软件更新错误,导致蓝屏死机事件 **防线上的“后门”** 2024年Fortinet公司旗下的FortiManager(用于集中管理FortiGate设备的工具)产品中又出现了严重的CVSS 9.8漏洞("FortiJump" CVE-2024-47575)该漏洞是 FortiManager和FortiManager Cloud中的FortiGate到FortiManager (FGFM) 守护进程 (fgfmsd) 中缺少的身份验证漏洞。 利用FortiJump漏洞,未经身份验证的远程攻击者可以使用有效的FortiGate证书在 FortiManager中注册未授权的设备,攻击者可通过特制请求执行任意代码或命令。 Fortinet官方公告中也承认:“FortiManager fgfmd守护进程存在一个严重的功能认证缺失漏洞,可能允许远程未认证的攻击者通过特制请求执行任意代码或命令。”根据 Mandiant的一份最新报告显示,FortiJump漏洞自2024年6月以来,已在0Day攻击中被广泛利用,涉及不同行业的 50 多台可能被入侵的FortiManager设备。 这并不是Fortinet公司的产品第一次出现漏洞,在此之前Fortinet FortiOS目录遍历漏洞(CVE-2018-13379)、Fortinet防火墙身份认证绕过漏洞(CVE-2022-40684)、Fortinet FortiGate SSL VPN存在格式化字符串漏洞(CVE-2024-23113)等漏洞。这次的FortiJump漏洞再次让人思考,安全软件真的安全吗? **安全软件的脆弱性** 安全软件的漏洞屡见不鲜,这不仅是技术层面的偶发问题,更是一种持久存在的安全挑战。在攻防技术螺旋上升的趋势下,厂商虽致力于对安全产品进行更新与优化,但攻击者的漏洞挖掘也从未停止。以下这些漏洞不仅体现了安全产品在技术复杂性上的脆弱性,也反映出攻防对抗的长期性和动态性的现实: - 2015年,有史以来唯一获得100次VB100的产品ESET NOD32中的存档支持模块中的基于堆的缓冲区溢出允许远程攻击者通过大量语言在类型为SIS_FILE_MULTILANG的EPOC安装文件中执行任意代码。(CVE-2015-8841) - 2017年,俄罗斯的一家拥有25年以上安全行业经验的公司——Kaspersky,其用于保护嵌入式系统安全的产品Kaspersky Embedded Systems Security(KESS)被发现了一个内存破坏类型的缺陷,攻击者可以利用其中一个驱动程序实现本地权限提升。(CVE-2017-12823) - 2021年,McAfee Agent for Windows的maconfig中存在权限管理不当漏洞,允许本地用户访问敏感信息。该程序可由低权限用户在文件系统上的任何位置运行。(CVE-2021-31836) - 2025年初,Ivanti公司的Connect Secure产品存在堆栈缓冲区溢出问题,允许远程未经身份验证的攻击者实现远程代码执行。(CVE-2025-0282)  历史上曾经出现过漏洞的部分安全软件厂商 安全防护软件为实现更好的防护效果深入操作系统底层,拥有系统权限。然而,这种高权限的安全软件一旦被攻破,攻击者即可利用其权限执行任意操作。 这些安全事件并非孤立个案,而是引出了一个深层次的问题:为何作为防御核心的安全软件,反而频频成为攻击者的突破口? <blockquote><p>随着技术的不断发展,安全防护逐渐从单点防御转向多层次、多维度的综合体系,但这也必然导致安全软件复杂度的增加。安全软件作为防御体系的重要一环,其本身的安全性直接关系着整个系统的安全性,未来安全软件的发展需要在功能性与安全性之间实现更好的平衡。</p></blockquote> **深蓝洞察** <blockquote><p>作为安全防护的工具,这些安全软件原本是为抵御威胁而设计,但在复杂多变的网络环境中,它们却可能反过来成为攻击者的突破口。从历史漏洞到新挖掘的漏洞利用,无不反映出攻防对抗螺旋上升的动态现实。</p><p>这一现象不仅揭示了安全软件在特定情况下的脆弱性,也表明这绝非一时之患,而是一个贯穿整个行业的持久挑战,提醒我们必须以更全面、更深入的视角重新审视网络安全的防御策略。</p></blockquote> **参 考:** [1] [https://blog.scrt.ch/2024/12/05/attacking-cortex-xdr-from-an-unprivileged-user-perspective/](https://blog.scrt.ch/2024/12/05/attacking-cortex-xdr-from-an-unprivileged-user-perspective/) [2] [https://zh.wikipedia.org/wiki/2024年CrowdStrike大规模蓝屏事件](https://zh.wikipedia.org/wiki/2024%E5%B9%B4CrowdStrike%E5%A4%A7%E8%A7%84%E6%A8%A1%E8%93%9D%E5%B1%8F%E4%BA%8B%E4%BB%B6) [3] [https://www.anquanke.com/post/id/301285](https://www.anquanke.com/post/id/301285) [4] [https://security.paloaltonetworks.com/CVE-2024-5907](https://security.paloaltonetworks.com/CVE-2024-5907) [5] [https://www.fortiguard.com/psirt/FG-IR-24-423](https://www.fortiguard.com/psirt/FG-IR-24-423) [6] [https://www.tenable.com/blog/cve-2024-47575-faq-about-fortijump-zero-day-in-fortimanager-fortimanager-cloud](https://www.tenable.com/blog/cve-2024-47575-faq-about-fortijump-zero-day-in-fortimanager-fortimanager-cloud) 明日,请继续关注《深蓝洞察 | 2024 年度安全报告》第九篇。
最新发现,Steam商店中一款名为PirateFi的免费游戏一直在向用户传播Vidar信息窃取恶意软件。 在2月6日至2月12日期间,这款游戏在Steam目录中出现了近一周的时间,并被多达1500名用户下载。分发服务正在向可能受到影响的用户发送通知,建议他们重新安装Windows。 **Steam上的恶意软件** 上周,Seaworth Interactive在Steam上发布了《PirateFi》,并获得了积极评价。它被描述为一款以低多边形世界为背景的生存游戏,涉及基地建设、武器制作和食物收集。  PirateFi的Steam页面 本周,Steam发现这款游戏含有恶意软件,但并未指明具体类型。通知中写道:“这款游戏开发者的Steam账户上传了包含可疑恶意软件的构建。” 用户在Steam上玩PirateFi(3476470)时,这些构建是活跃的,所以这些恶意文件很可能在用户的计算机上启动。Steam建议用户使用最新的防病毒软件运行完整的系统扫描,检查他们不认识的新安装的软件,并考虑操作系统格式。  Steam对受影响用户的通知 受影响的用户还在游戏的Steam社区页面上发布了安全提醒,通知其他人不要启动该游戏,因为他们的杀毒软件将其识别为恶意软件。 SECUINFRA Falcon Team的Marius Genheimer获得了通过PirateFi传播的恶意软件样本,并将其识别为Vidar伪造软件的一个版本。 SECUINFRA建议:“如果你是下载这个“游戏”的玩家之一:考虑保存在浏览器、电子邮件客户端、加密货币钱包等中的凭据、会话cookie和秘密被泄露。”建议用户更改所有可能受影响帐户的密码,并在可能的情况下激活多因素身份验证保护。 基于动态分析和YARA签名匹配,该恶意软件被识别为Vidar,隐藏在一个名为Pirate.exe的文件中,作为有效载荷(Howard.exe),与InnoSetup安装程序打包在一起。 攻击者多次修改游戏文件,使用各种混淆技术,并更改命令和控制服务器以获取凭据。研究人员认为,PirateFi名称中提到的web3/ b区块链/加密货币是有意为之,目的是吸引特定的玩家群体。 Steam并没有公布有多少用户受到了PirateFi恶意软件的影响,但游戏页面上的统计数据显示,可能有多达1500人受到了影响。  恶意软件渗透Steam商店并不常见,但也不是没有先例。在2023年2月,Steam用户受到了恶意Dota 2游戏模式的攻击,该模式利用Chrome n-day漏洞在玩家的计算机上执行远程代码执行。 2023年12月,当时很受欢迎的独立策略游戏《Slay the Spire》的一个mod被黑客入侵,黑客将“Epsilon”信息传输器注入其中。 目前Steam已经引入了其他措施,如开启短信验证等,以保护玩家免受未经授权的恶意更新,但PirateFi的案例表明,目前这些措施还远远不够。
「AI 助手的目标是协助人类,而不是塑造人类」 #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 [爱范儿](https://www.ifanr.com) |[原文链接](https://www.ifanr.com/1614917) ·[查看评论](https://www.ifanr.com/1614917#comments) ·[新浪微博](https://weibo.com/ifanr)
作者|苏子华 编辑|靖宇 接了 AI,带有翻译功能的蓝牙耳机,在美国彻底卖爆了。 在 TikTok 上,你能看到各色博主在向外国消费者推荐 9.9 美元的「翻译耳机」,尤其在 AI 创新最为积极的美国,人们对于这些所谓「接入AI」的蓝牙耳机趋之若鹜。 毫不意外的,这些「爆款」耳机的背后,是大量的中国创业团队,甚至还有名创优品这样的知名公司,一起加入到这一波「AI 耳机」的带货大潮之中。 当 AI 成为当下最大的「政治正确」时,大模型公司仍在思考如何在 C 端赚钱,而有人早已经将耳机这样的新型「AI 硬件」,卖到了全球各地,疯狂「收割」外国消费者的口袋。 他们是怎么做到的?那些在直播间中疯狂下单的外国用户,又要拿这些「AI 耳机」做什么?  TikTok上的形态各异的AI翻译耳机广告|图片来源:TikTok ## **「****AI**** 耳机」,火到海外** 「翻译耳机爆单了。」 为蓝牙耳机提供包括翻译、AI助手在内的App解决方案的NebulaBuds负责人张泽杰告诉极客公园,他的一个蓝牙耳机客户,每个月在TikTok上的销售额在200万元左右,**在给耳机的App接入了AI助手、翻译功能之后,月销售额跃升到800万元**。 一位深圳的耳机代工厂老板也分享了他的见闻:他的合作伙伴,一个华强北本地的小团队,专门为小品牌提供蓝牙耳机的软件解决方案,在2024年初还在为几千元的付款而捉襟见肘,但到了年底,已经开着豪车来谈生意了。他感叹道,这就是普通人抓住一次机遇、大赚一笔的「华强北故事」: 「过去这一年,他们是幸运儿,赚钱速度太快了。」 翻译耳机需求的爆发,完全出乎了他的意料。 **张泽杰服务的客户中既有中小品牌,也不乏华为、realme等大牌。**NebulaBuds提供的解决方案,主要是通过App为蓝牙耳机提供同声传译、音视频通话翻译、AI助手、降噪等功能,而非改变耳机的硬件配置。张泽杰介绍:“我们有些客户,他们之前有很多蓝牙耳机库存,接入我们的App后,就能销往海外,成功去库存。” 目前,**美国成为翻译耳机的最大销售目的地**,其次是中东。 张泽杰解释说:“我们原本以为美国人都会讲英语,但后来发现,美国有大量的西班牙裔和其他非英语人群,他们需要翻译功能。中东地区也是如此。此外,东南亚、印度、欧洲地区也有市场需求,而非洲的购买力竟然比东南亚还要强劲。” “市场对AI翻译功能的需求一直在稳步增长,我们的平台每月都有几十万的激活量。”张泽杰说。 翻译和AI功能已经成为耳机市场的销量密码。一位耳机电商卖家也表示: 「**只要在电商平台上突出耳机的****AI****功能,几乎就能卖得更好**。」 美国黑色星期五期间,TikTok上翻译耳机的销量神话似乎也佐证了这一规律:名创优品MINISO某款翻译耳机 30天卖出200多万美元;有数码店铺卖30美元左右的翻译耳机,一个月销售了180万美元,跻身热销榜单。 另外,也有TikTok网红拍摄带货翻译耳机的短视频,赚取了30万美元的销售佣金收入。 “以前我向耳机厂商推销我们的软件方案的时候,我还会介绍AI、翻译之类的具体功能,现在都不讲了。”张泽杰说: 「就一句话,接入了能爆单。」  我们低估了多元移民聚集地区对翻译的需求|图片来源:视觉中国 ## **移民群体,爆买 ****AI**** 耳机** 与多位耳机代工厂、软件解决方案商、耳机出海卖家的讨论中,极客公园发现,翻译耳机的突然爆发,部分得益于卖家们的精准营销,**但核心在于其满足了多元的移民聚集地区群体的刚需。** 在TikTok上,耳机品牌投放的短视频广告中,有几个典型场景引发了广泛关注。例如,美国人喜欢去美甲店和美发店,而技师有不少是越南移民。一则短视频段子展示了戴上翻译耳机后,顾客终于能听懂美甲师的聊天内容。 评论区有一条评论也印证这一场景的刚需:“当你提到美甲美发和翻译时,我两秒钟就被说服了。” 另一个典型场景是,出租车司机需要接待来自不同国家的乘客,戴上翻译耳机后,就能轻松听懂乘客的语言。 这些营销场景表明,在欧美等移民群体聚集、文化多元的地区,翻译耳机的实用性极强,而此前这一需求并没有被充分挖掘和满足。 **此外,低廉的价格也是翻译耳机畅销的核心因素。** 名创优品在TikTok上销售的翻译耳机,价格集中在13.99美元至23.99美元左右,换算成人民币仅需100多元;也有部分品牌的翻译耳机在折扣之后,价格能低至8.99美元,极大地降低了消费者的尝鲜门槛。 一位耳机卖家发现,带有更强大AI功能、体验更好的耳机价格普遍在一两千元,但销量并不理想。而低价智能耳机的畅销,其实也证实了消费者对AI功能的尝鲜需求,只是需要一个更低的体验门槛。 **技术方面,大模型技术对翻译功能体验的提升也是销量爆发的重要原因。张泽杰**表示,大模型技术浪潮后,语音识别更加精准,大模型也能够帮助校准,AI助手不再“愚蠢”,成为了一项真正可用的功能。“人工智能发展到chatGPT阶段后,相比智能音箱时期,不是听不懂就是答不了的情况,AI功能的可用性大大提高。” **翻译耳机的爆发还有一个不可忽视的大背景:耳机市场的基本盘一直在高速增长。**Canalys数据显示,2024年第三季度,TWS耳机出货量达到9230万台,同比增长15%,小米和华为在全球市场均实现了超50%的年增长率。其中,开放式耳机增长尤为迅猛。IDC数据显示,2024年1-8月,开放式耳机市场出货1636万台,同比增长271.5%。  挂耳式耳机颇受欢迎|图片来源:TikTok ## **AI**** 落地,华强北先行** 翻译耳机的热销,从侧面体现了将 AI 功能作为卖点的巨大潜力。 上述服务多家耳机品牌的华强北代工厂老板发现,2024年下半年,耳机在产品形态、硬件技术方面已经很久没有出现新的突破点,行业正将注意力转移到耳机的App侧,希望找到新的增长点、卖点。这时,“AI概念”的出现正中众多耳机厂家的下怀。 AI 正在激发用户新的消费需求,“消费者越来越看重耳机App提供的能力。” 从供给侧来看,新的共识在达成:AI功能将成为耳机在未来最重要的增长点。他透露,2025年,很多耳机品牌将重点押注AI功能。  深圳华强北商业区|图片来源:视觉中国 多位行业人士表示,AI翻译耳机这一波销量的火热,也要得益于此前大厂、大模型创业公司们铺天盖地的对AI能力的宣传,很好地教育了市场,许多用户也慢慢开始接触AI了。 NebulaBuds目前在国内接入的AI助手是豆包、DeepSeek(海外也接入chatGPT),而在nebulabuds中使用AI助手是需要付费的。“虽然豆包有独立的免费App,但我们发现,很多用户也很愿意用我们App里提供的豆包助手,说明大家对AI功能的需求是真实的。” **当大厂出身的科技创业者、投资人们在争论****AI****硬件的可行性、是否足够时,深圳的老板们正在用8.99美元的耳机收割全球市场**。 张泽杰举了一个例子,春节前,DeepSeek爆火之后,“我们整个春节都在研究DeepSeek。很多蓝牙耳机、手表客户都在催我们接入DeepSeek功能,我们自己也意识到要接入,这是双向的。”可以说,深圳的硬件厂商在产品落地、追逐新消费趋势方面反应非常迅速 一方面,AGI需要技术理想主义者去探索未来;另一方面,AGI也需要落地,务实派的“幸运儿”们已经先赚到了钱。技术理想与商业现实的结合,或许是AI走向大众市场的最佳路径。
2025年1月,国产AI大模型DeepSeek横空出世,以媲美同性能模型的性能和不足其1/10的训练成本,一举打破国际技术垄断。然而,这场技术狂欢的背后暗流涌动——DeepSeek的崛起迅速成为全球黑客的“靶心”,从DDoS攻击到数据窃取,网络威胁持续升级这一事件不仅揭示了AI技术的双刃剑效应,也折射出数字化浪潮下企业安全的严峻挑战:**数据防泄露**。 作为企业日常沟通的核心载体,邮件系统既是高效协同的纽带,也是数据泄露的“重灾区”。针对企业邮件数据安全泄露问题,Coremail旗下的**CACTER邮件数据防泄露系统(以下简称“EDLP”)**基于深度内容识别技术,根据不同安全级别采用不同算法和策略,支持多种响应规则,对敏感数据通过邮件系统外发的行为,**提供事后审计和提醒**,以及事中审批和拦截,预防并阻止有意或无意的邮件数据泄露行为,保障企业数据安全。  **邮件数据安全危机暗涌,数据保护急不可待** Verizon公司发布的《2024年数据泄露调查报告》显示,**68%的数据泄露事件与人为因素直接相关**,而邮件因其开放性成为内部误操作、外部攻击的首选载体。从高精尖制造业的机密图纸外流,到金融机构的客户隐私泄露,每一起事件都可能让企业付出数亿损失与信任崩塌的代价。  传统的邮件数据防泄露技术虽能通过规则引擎、内容检测等手段拦截风险,却在AI驱动的攻击面前力不从心。例如,ChatGPT生成的钓鱼邮件可精准模仿高管话术绕过过滤,而员工误发含敏感数据的附件等无意识泄露行为,更让风险防不胜防。当攻击手段智能化,防御体系必须同步进化——企业亟需一套既能精准识别风险,又能动态适配业务场景的解决方案。 CACTER EDLP通过**加密协议技术、数据深度分析、智能学习模型、邮件附件拆解与识别等**,对企业内部用户,通过邮件系统外发的邮件进行解析和内容提取,识别敏感数据,依据预定义的策略,实时响应,进而达到对邮件数据防泄露的目的。  **CACTER邮件数据防泄露系统的智能防御** 面对AI驱动的攻击,CACTER EDLP基于深度内容识别技术,根据不同安全级别采用不同算法和策略,支持多种响应规则,对敏感数据通过邮件系统外发的行为,**提供事后审计和提醒,以及事中审批和拦截的防护体系**,预防并阻止有意或无意的邮件数据泄露行为,为企业筑起邮件安全防线,保障企业数据安全。 CACTER EDLP的分区管控功能**通过“用户标签”对不同区域员工的邮件进行精准管理**,满足企业对不同敏感级别邮件的管理需求。系统支持多级审批,**灵活配置审批层级和审批人**,确保敏感邮件发送前经过严格审核。智能审批流程通过邮件交互完成审批操作,提高效率并保持透明。**自动抄送与密送功能确保敏感邮件自动抄送或密送指定人员**,提升邮件通信的安全性和合规性。  CACTER EDLP在邮件精准检测方面表现也十分出色。CACTER EDLP支持**对邮件的收发件人、附件、关键字等进行全面检测**,确保敏感信息无处遁形。系统**内置智能模型和相似度查重能力,精准识别和管控敏感信息**,如通讯录泄露、手机号码泄露等,提高检测准确性。CACTER EDLP还支持全检模式和效率模式,灵活选择以确保检测效率和准确性。**详细的事件留痕功能记录敏感事件**,为企业信息安全提供有力保障。  在数字化时代,人工智能技术的快速发展为网络安全带来了新的解决方案,企业既要抓住机遇,也要警惕数据安全风险,如何应对邮件数据泄露风险,筑牢邮件数据安全防线? 答案将在“**2月26日15:00,EDLP:邮件多场景管控,为企业审批减负”**的直播中揭晓! **2月26日15:00-16:00** **EDLP:邮件多场景管控,为企业审批减负** **Deepseek**:邮件数据防泄露领域的新机遇 **数据防护**:多场景邮件的全面管控 **精准检测**:EDLP邮件检测能力提升 立马扫码预约直播 抽取惊喜豪礼 
近段时间,国产AI DeepSeek无疑是市场上最火的话题之一。**随着DeepSeek的现象级爆火,网上涌现出大量仿冒DeepSeek的病毒木马App**。国家计算机病毒协同分析平台近日在我国境内捕获发现仿冒DeepSeek官方App的安卓平台手机木马病毒。  图片来源:央视新闻 仿冒APP名称、图标与正版应用几乎没有差别,普通用户很难分辨真假。当用户点击运行仿冒App时,该App会提示用户“需要应用程序更新”,并诱导用户点击“更新”按钮。**用户点击后,会提示安装所谓的“新版”DeepSeek应用程序,实际上是包含恶意代码的子安装包,并会诱导用户授予其后台运行和使用无障碍服务的权限**。  图片来源:央视新闻 同时,**该恶意App还包含拦截用户短信、窃取通讯录、窃取手机应用程序列表等侵犯公民个人隐私信息的恶意功能和阻止用户卸载等恶意行为**。 经分析,**该恶意App为金融盗窃类手机木马病毒的新变种**。网络犯罪分子很可能将该恶意App用于电信网络诈骗活动,诱使用户从非官方渠道安装仿冒DeepSeek的手机木马,从而对用户的个人隐私和经济利益构成较大威胁。 除仿冒DeepSeek安卓客户端的“DeepSeek.apk”之外,国家计算机病毒协同分析平台还发现了多个文件名为“DeepSeek.exe”“DeepSeek.msi”和“DeepSeek.dmg”的病毒样本文件,**由于DeepSeek目前尚未针对Windows平台和MacOS平台推出官方客户端程序,因此相关文件均为仿冒程序**。 **梆梆安全关于防范攻击的安全建议** **企业应做好针对类似木马风险的排查工作** ·排查App是否具备对开启无障碍功能的监测与提示能力,例如监测到无障碍功能被打开,可以提示“您手机无障碍功能已开启,如非本人开启,请关闭无障碍功能后再进行App操作"; ·排查App是否在关键信息录入页面具备截屏、录屏、屏幕共享的检测和响应能力; ·排查App是否使用了安全的密码键盘,是否具备按键随机化、输入内容隐匿等能力,避免被木马应用窃取密码信息; ·排查App是否具备远程操控的检测和响应能力。 **企业应做好对相关安全风险的持续监测** 企业应当对APP在运行期间的特定行为进行重点监测,梆梆安全移动应用安全监测平台可针对移动应用上线运行后的动态运行安全问题及运行稳定性问题进行持续监测,通过在移动应用中植入安全监测探针,利用应用运行过程中设备、系统、应用、行为四个维度数据,结合后端大数据分析平台的各种模型规则,实时监测移动应用中各种运行时攻击。同时在服务端提供威胁数据查询、推送接口,可与用户企业系统对接,帮助用户快速建立事前、事中、事后的移动应用安全态势感知体系,及时发现各种危险行为。 企业还可以针对APP应用进行加固处理,防止关键页面被截屏/录屏,防止关键信息外泄。同时,企业还可以通过梆梆安全键盘对数据进行加密处理,实现按键随机、按键内容隐匿,充分保护用户隐私数据安全。
近日,国家计算机病毒应急处理中心和计算机病毒防治技术国家工程实验室依托国家计算机病毒协同分析平台**在我国境内捕获发现仿冒DeepSeek官方App的安卓平台手机木马病毒**。  相关病毒样本信息 用户一旦点击运行仿冒App,该App会提示用户**“需要应用程序更新”**,并诱导用户点击**“更新”按钮**。用户点击后,会提示**安装所谓的“新版”DeepSeek应用程序**,实际上是包含恶意代码的子安装包,并会诱导用户授予其后台运行和使用无障碍服务的权限。  诱导用户“更新”(左上)、诱导用户安装“带毒”子安装包(右上)、诱导用户授权其后台运行(左下)、诱导用户授权其使用无障碍功能(右下)。 同时,该恶意App还包含拦截用户短信、窃取通讯录、窃取手机应用程序列表等侵犯公民个人隐私信息的恶意功能和阻止用户卸载的恶意行为。经分析,该恶意App为金融盗窃类手机木马病毒的新变种。**网络犯罪分子很可能将该恶意App用于电信网络诈骗活动,诱使用户从非官方渠道安装仿冒DeepSeek的手机木马,从而对用户的个人隐私和经济利益构成较大威胁**。 除仿冒DeepSeek安卓客户端的“DeepSeek.apk”之外,国家计算机病毒协同分析平台还发现了多个文件名为“DeepSeek.exe”“DeepSeek.msi”和“DeepSeek.dmg”的病毒样本文件,**由于DeepSeek目前尚未针对Windows平台和MacOS平台推出官方客户端程序**,因此相关文件均为仿冒程序。由此可见,网络犯罪分子已经将仿冒DeepSeek作为传播病毒木马程序的新手法。预计未来一段时间内,包括仿冒DeepSeek在内的各种人工智能应用程序的病毒木马将持续增加。 **国家计算机病毒应急处理中心发布防范措施** 针对该款手机木马病毒,国家计算机病毒应急处理中心发布以下防范措施: **·**不要从短信、社交媒体软件、网盘等非官方渠道传播的网络链接或二维码下载App,仅通过DeepSeek官方网站或正规手机应用商店下载安装相应App。 **·**保持手机预装的安全保护功能或第三方手机安全软件处于实时开启状态,并保持手机操作系统和安全软件更新到最新版本。 **·**在手机使用过程中,谨慎处理非用户主动发起的App安装请求,一旦发现App在安装过程中发起对设备管理器、后台运行和使用无障碍功能等权限请求,应一律予以拒绝。 **·**如遭遇安装后无法正常卸载的App程序,应立即备份手机中的通讯录、短信、照片、聊天记录和文档文件等重要数据,在手机生产商售后服务人员或专业人员的指导下对手机进行安全检测和恢复。同时密切关注本人的社交媒体类软件和金融类软件是否具有异常登录信息或异常操作信息,以及亲友是否收到由本人手机号或社交媒体软件发送的异常信息,一旦出现上述相关情况,应及时联系相关软件供应商和亲友说明有关情况。 **·**警惕和防范针对流行App软件的电信网络诈骗话术,如“由于XXX软件官方网站服务异常,请通过以下链接下载官方应用程序”“由于XXX软件更新到最新版本,需要用户重新授予后台运行和无障碍功能权限”等,避免被网络犯罪分子诱导。 **·**对已下载的可疑文件,可访问国家计算机病毒协同分析平台进行上传检测。 文章来源自:央视新闻
Thinking Machines Lab 会是另一家 OpenAI 吗? #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 [爱范儿](https://www.ifanr.com) |[原文链接](https://www.ifanr.com/1614956) ·[查看评论](https://www.ifanr.com/1614956#comments) ·[新浪微博](https://weibo.com/ifanr)
单打独斗造不出好车。 #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 [爱范儿](https://www.ifanr.com) |[原文链接](https://www.ifanr.com/1614804) ·[查看评论](https://www.ifanr.com/1614804#comments) ·[新浪微博](https://weibo.com/ifanr)
 ## OpenAI 谋划开源,CEO 在线征集方案 2 月 18 日,OpenAI CEO Sam Altman 在 X 平台发文称:「对于我们的下一个开源项目,我们应当选择开发一个虽然体积小但仍然需要借助 GPU 运行的 o3 mini 层级模型,还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢?」  Altman 还发起了投票,目前端侧模型的投票率大幅领先。Altman 曾在本月初公开承认 OpenAI 在开源 AI 软件方面「一直站在历史的错误一边」。(来源:财联社)  ## [xAI 发布 Grok 3 聊天机器人,马斯克称其为「地球上最聪明的人工智能」](https://mp.weixin.qq.com/s/hvrnjOBfCXQYqS0SBiSVFQ) 2 月 18 日,马斯克与 xAI 团队,在直播中正式发布了 Grok 最新版本 Grok3。 在一周前,马斯克在直播中评论 DeepSeek R1 时,还信心满满地表示「xAI 即将推出更优秀的 AI 模型」。 从现场展示的数据来看,Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称 Grok 3 未来将用于 SpaceX 火星任务计算,并预测「三年内将实现诺贝尔奖级别突破」。  而实际的模型跑分结果,Grok3 其实也只比 DeepSeek R1 以及 GPT4.0 实现了不到 1-2% 的差距:这对应了不少用户在实际测试中「并无明显差别」的体感效果。(来源:极客公园) ## ## Meta 宣布举办首届生成式 AI 开发大会 LlamaCon 2 月 19 日,Meta 宣布,将举办首届专注于生成式 AI 的开发者大会。这场大会被命名为 **LlamaCon**,以 Meta 旗下的 Llama 生成式 AI 模型系列命名,定于 4 月 29 日 举行。Meta 表示,届时将分享其 开源 AI 方面的最新进展,以帮助开发者打造创新的应用和产品。 Meta 还透露,关于大会的更多细节将在稍后公布。此外,该公司的年度开发者大会 Meta Connect 仍将按照惯例在 9 月份 举行。 提前召开开发者会议,可能原因是 Meta 近期被 DeepSeek 的崛起打了个措手不及。据报道,DeepSeek 推出的最新开源 AI 模型在某些方面可与 Llama 相抗衡,甚至可能超越即将发布的下一代 Llama。Meta 方面已经紧急成立「作战室」,试图研究 DeepSeek 是如何降低 AI 运行和部署成本的,并计划将这些经验应用到 Llama 的开发中。 此外,Meta 最近宣布,2024 年 AI 相关投资将高达 800 亿美元,其中包括 AI 人才招聘、新数据中心建设等多个项目。(来源:TechCrunch) ## ## 小米雷军:下决心把 AI 技术落到各个终端产品上 2 月 18 日,小米科技有限责任公司董事长雷军接受了总台央视记者的专访。 雷军表示,小米创业的 15 年来,一直聚焦在手机、汽车、智能家居、智能制造这些领域。要下决心把最新的,像 AI 技术怎么能够落地到我们各个终端产品上,能够让消费者体验科技带来的美好生活,怎么在拓展国内市场的同时能够放眼全球,提高中国产品在全球的影响力。(来源:央视新闻)  ## 前 OpenAI 首席技术官「自立门户」,翁荔等多名老东家干将加盟 2 月 19 日,据彭博社报道,前 OpenAI 首席技术官穆拉蒂联合多名「老东家」的高管创办了一家新的 AI 初创公司。  这家公司名为 Thinking Machines Lab,致力于开发支持人类与 AI 更广泛合作的 AI 模型和产品,旨在覆盖各行各业。「虽然现有系统在编程和数学方面表现卓越,但我们正在研发一种能够适应各种人类专业领域并支持更广泛应用的 AI。」 穆拉蒂团队的其他核心成员包括 John Schulman,他是 OpenAI 的联合创始人,将在 Thinking Machines Lab 担任首席科学家;OpenAI 前研究副总裁 Barret Zoph 将成为新公司的首席技术官;以及 OpenAI 前安全副总裁翁荔。博客文章中提到,现有团队近 30 名员工有超过十位曾在 OpenAI 工作。 自穆拉蒂去年 9 月离开 OpenAI 以来,其新公司会从事何种工作以及将筹集多少资金,已经成为硅谷圈内的热门话题。有知情人士透露,穆拉蒂正在与风险投资公司洽谈融资事宜。(来源:IT之家) ## ## 宁德时代与滴滴携手正式成立换电合资公司 2 月 18 日,根据天眼查最新信息,时代小桔(厦门)新能源技术有限公司已于今日正式成立,注册资本为 3.3 亿元人民币,法定代表人由滴滴出行副总裁、小桔车服总经理杨峻担任。 该公司的业务范围涵盖了新能源汽车换电设施销售、电动汽车充电基础设施运营、蓄电池租赁以及电池销售等多个关键领域。 股权结构显示,时代小桔由宁德时代旗下的时代电服科技有限公司与滴滴出行相关联的北京小桔科技有限公司,通过浙江小桔能源科技创新有限公司间接共同持股,持股比例分别为 69.697% 和 30.303%,宁德时代方面为控股股东。 宁德时代对此合作回应称,有关双方在换电领域的合作详情,可参考公司此前公开发布的信息。(来源:快科技) ## ## 深圳回应「AI 公务员」上岗:仅辅助政务,不能单独决策 2 月 18 日,深圳市福田区近日率先推出基于 DeepSeek 开发的 AI 数智员工,其「执法笔录秒级生成执法文书初稿」等功能引起全网热议,「AI 公务员上岗」也成为关注焦点。「『AI 数智员工』是 AI 助手,可辅助开展公共管理和服务,并不能单独决策,不能算是『AI 公务员』。」 深圳市福田区政务服务和数据管理局党组成员、副局长高增在采访中表示,具体而言,其就是一种通过人机协同提高工作效率、进行减负的工具助手。高增介绍,福田区从去年就开始梳理人工智能技术和业务相结合的应用场景,处理过程中,生成了数智智能体 AI 账号 70 个,它们可以承担多种角色,这也是「70 个 AI 数智员工上岗」的由来。此前,一直采用其它国产模型,今年开始切换到 DeepSeek。据了解,由于仅是辅助政务,每个「AI 数智员工」均配有「监护人员」,「监护人」指挥其工作并对其负责。(来源:钛媒体) ## ## 京东试水网约车?回应:2022 年接入第三方打车服务,暂无推广计划 2 月 18 日,有消息称,京东试水网约车市场,据媒体报道,京东 App 近日上线了「国内打车服务」,用户在主页搜索「打车」,页面便会出现「国内打车服务」的选项。对此,京东方面对澎湃新闻记者回应称,京东 App 2022 年接入了一家第三方的打车服务,暂无推广计划。(来源:澎湃新闻) ## 苹果 iPhone 17 系列设计被曝:标准版沿用经典、Air 配长条跑道、Pro 为横向大矩阵 2 月 19 日,YouTube 频道 Front Page Tech 主播 Jon Prosser 在曝光 iPhone 17 Pro 和 iPhone 17 Air 渲染图后,昨日在 X 平台发布推文,透露苹果 iPhone 17 标准版将沿用旧款设计,意味着今年 iPhone 17 系列会有 3 种设计方案。  Prosser 昨日在推文中曝料,标准版 iPhone 17 的整体设计将与标准版 iPhone 16 相同。如果消息属实,iPhone 17 将沿用药丸状凸起,内置两个垂直排列的后置摄像头。(来源:IT之家)) ## 阿维塔 07 Pro+ 车型上市:华为乾崑智驾 ADS SE,21.99 万元起 2 月 18 日,阿维塔 07 Pro+ 车型今晚迎来上市,该车配备有华为乾崑智驾 ADS SE 以及鸿蒙座舱。Pro+ 增程版售价 21.99 万元,Pro+ 纯电版售价 22.99 万元。 该车内饰与现款车型风格大致相同,配备 35.4 英寸全景远端屏、15.6 英寸悬浮式中控屏,双 6.7 英寸高清后视屏,同时采用华为乾崑智驾 ADS SE 智驾系统及光学环拥氛围灯。 智驾配置方面,该车配备 10 个摄像头 + 3 个毫米波雷达 + 12 个超声波雷达,支持 360 度全向主动安全、高速 NCA(智能上下匝道、主动变道超慢车、智能避障绕行)、城区 LCC Plus(智能车道巡航、智能避障、智能红绿灯控车)、智能泊车辅助等功能,号称「行业唯一具备全向主动安全的视觉智驾」。  动力方面,该车增程版电机功率 231kW,电机扭矩 367N・m,动力电池总容量 39.05kWh,CLTC 纯电续航里程 230km,CLTC 综合续航里程 1100km。 纯电版采用全域 800V 碳化硅平台,电机功率 252kW,电机扭矩 365N・m,动力电池总容量 82.16kWh,CLTC 纯电续航里程 650km。(来源:IT之家)  ## 《哪吒 2》登顶全球动画电影票房榜,超越《头脑特工队》 2 月 18 日,据灯塔专业版,影片《哪吒之魔童闹海》上映 21 天,全球票房突破 16.98 亿美元,超过《头脑特工队 2》,登顶全球影史动画电影票房榜。  同时,2025 年 2 月总票房(含预售)突破 140 亿,其中《哪吒之魔童闹海》贡献当月票房 75.7%。(来源:界面新闻)
据安全研究员观察发现,一个可能与俄罗斯有关联的威胁者发起的活跃攻击活动,正利用设备代码钓鱼手段针对个人微软 365 账户进行攻击。 这些攻击目标涉及欧洲、北美、非洲和中东地区的政府、非政府组织、信息技术服务和科技、国防、电信、医疗以及能源/石油和天然气行业。 微软威胁情报中心将此次设备代码钓鱼活动背后的威胁者追踪为“风暴-237”。基于受害者特征和作案手法,研究人员认为,该活动与符合俄罗斯利益的国家行为有关。 **设备代码钓鱼攻击** 输入受限设备——那些缺少键盘或浏览器支持的设备,比如智能电视和某些物联网设备,依靠代码认证流程让用户通过在另一台设备(如智能手机或电脑)上输入授权码来登录应用程序。 微软研究人员发现,自去年 8 月以来,Storm-2372 通过诱骗用户在合法的登录页面输入攻击者生成的设备代码,滥用这种身份验证流程。 这些特工人员首先通过在 WhatsApp、Signal 和 Microsoft Teams 等消息平台上“冒充与目标有关的知名人士”与目标建立联系,然后才发起攻击。  Storm-2372发送到目标的消息 威胁者会在通过电子邮件或短信发送虚假的在线会议邀请之前,与受害者逐渐建立起一种融洽的关系。根据研究人员的说法,受害者收到一个团队会议邀请,其中包括攻击者生成的设备代码。 微软表示:“这些邀请会引诱用户完成设备代码认证请求,模拟消息传递服务,这为Storm-2372提供了对受害者账户的初始访问权限,并启用了Graph API数据收集活动,如电子邮件收集。” 只要被盗的令牌有效,黑客就可以在不需要密码的情况下访问受害者的微软服务(电子邮件、云存储)。  设备代码网络钓鱼攻击概述 然而,微软表示,攻击者现在正在设备代码登录流中使用Microsoft Authentication Broker的特定客户端ID,这允许他们生成新的令牌。 这开启了新的攻击和持久化可能性,因为攻击者可以使用客户端ID将设备注册到微软基于云的身份和访问管理解决方案Entra ID。 使用相同的刷新令牌和新的设备标识,Storm-2372能够获得主刷新令牌(PRT)并访问其资源。目前已经观察到Storm-2372使用连接的设备收集电子邮件。 **防御风暴2372** 为了对抗Storm-2372使用的设备代码钓鱼攻击,微软建议在可能的情况下阻止设备代码流,并在微软Entra ID中执行条件访问策略,以限制其对可信设备或网络的使用。 如果怀疑设备代码网络钓鱼,立即使用‘revokeSignInSessions’撤销用户的刷新令牌,并设置条件访问策略来强制受影响的用户重新认证。 最后,使用Microsoft Entra ID的登录日志来监视并快速识别短时间内大量的身份验证尝试、来自无法识别的ip的设备代码登录,以及发送给多个用户的设备代码身份验证的意外提示。
 1、[往期回顾:「深蓝洞察」2024年度最别开生面的安全新生态](https://www.4hou.com/posts/W11o) 2、[往期回顾:「深蓝洞察」2024年度最具含“金”量的绕过](https://www.4hou.com/posts/1MMq) 3、[往期回顾:「深蓝洞察」2024年度最具想象空间的新应用](https://www.4hou.com/posts/422J) 4、[往期回顾:「深蓝洞察」2024年度最狂躁不安的漏洞](https://www.4hou.com/posts/l001) 5、[往期回顾:「深蓝洞察」2024年度最“隐”人注目的安全趋势](https://www.4hou.com/posts/pnny) 6、[往期回顾:「深蓝洞察」2024年度最悲剧的后门](https://www.4hou.com/posts/vwwn) 近年来,漏洞攻防不断演进。从多年前仅需一个栈溢出就能攻破系统,到如今需要运用各种精妙的手法来突破系统的层层防御。“盾”与“矛”始终处于动态对抗:每当新的防御措施出现,新的攻击手段随之而来。防御机制的升级促使攻击者寻找新的突破口,而攻击方法的创新又推动着防御技术的进一步发展。 以下为本期《深蓝洞察 | 2024 年度安全报告》的第七篇。  **愈发坚韧的“盾”** 每个防御机制的提出都是对内存漏洞利用的精准打击。多年前,ASLR的引入显著提高了漏洞利用的难度和复杂性。时至今日,绕过ASLR仍然是大多数漏洞利用的首要步骤。到了2024年,针对内存破坏的防御机制更是层出不穷。 2023年推出的Google Pixel 8支持了被称为“内存问题终极武器”的Memory Tagging Extension(MTE)特性,其是ARM v8.5新增的一个硬件特性,MTE将指针与其内存利用tag进行匹配,以此来阻止内存的非法访问。同时,这也是MTE首次走入消费者群体。2024年的1月,DARKNAVY的安全研究员发布了关于MTE对软件安全性影响的研究。研究表明,MTE有效缓解了堆内存漏洞(如UAF、堆越界读写等),在线性溢出场景下几乎完全消除了漏洞利用的可能性。作为UAF漏洞的长期受害者,Google也为Chrome提出了MiraclePtr机制,更是自信地宣称:受MiraclePtr保护的UAF不再视为安全漏洞。 Linux作为使用最广泛的操作系统之一,其内核近几年也引入了各种防御措施以阻止内存破坏的利用。为了缓解内核中的堆内存破坏问题,Linux Kernel中引入 "SLAB VIRTUAL"、"RANDOM_KMALLOC_CACHES"、"AUTOSLAB"等一系列防御机制。为了加强用户态程序的安全性,Linux Kernel 6.10新增系统调用mseal(memory seal),允许开发人员在程序运行时保护内存区域免受非法修改。 那么如此多的防御机制是否阻止了某些利用呢? 2024年11月,苹果披露了两个针对WebKit的在野利用,但这些利用仅限于Intel芯片的Mac设备。为什么2024年的漏洞只在较早的系统版本上被利用?这很可能与M系列芯片的先进防御机制有关,这些机制阻止了攻击者的利用。  WebKit 漏洞披露 从软件到硬件,从用户态到内核态,在防御机制的层层铁壁下,内存漏洞已难以突出重围。种种迹象表明,内存漏洞似乎正走向终结。 **未来之“矛”** 漏洞不会消失,安全问题依然存在,那么在内存漏洞式微的时代,一个"powerful"的漏洞及其利用又是什么样呢? 2024年6月,Meta Red Team披露了漏洞CVE-2024-31317,该漏洞允许攻击者以任意应用身份执行任意代码,并可在Android 9及更高版本上实现利用,实现Android通杀。 值得一提的是,CVE-2024-31317并不是一个内存破坏漏洞,而是发生在Zygote的命令注入漏洞。Zygote是Android系统上的核心组件之一,它会孵化出Android中Java世界的所有进程,system_server也不例外。  Zygote 功能展示 (https://dawnslab.jd.com/the_return_of_mystique/) 实际上,Zygote是通过command socket从system_server中接收指令,并根据指令孵化出子进程。然而,Zygote只是盲目地去解析从system_server接收到的buffer,而不做额外的二次校验。因此,如果能够通过某种方式操纵system_server在command socket中写入攻击者可控的内容,就可以实现命令注入! 研究人员分析发现,denylistexemptions 就提供这种能力。在该机制中,当hidden_api_blacklist_exemptions 被修改后,新写入的值会在解析后直接写入到Zygote command socket中。因此,只要控制该值即可实现命令注入。 下图展示了该漏洞的利用效果之一,启动一个可调试注入的settings进程:  CVE-2024-31317 的利用效果之一:启动一个可调试注入的settings进程 (https://dawnslab.jd.com/the_return_of_mystique/) 可以看到该漏洞并不涉及内存破坏,依然影响了众多的安卓系统,这种漏洞本质是程序逻辑层面出现了问题,其影响力不亚于甚至超过传统的内存漏洞。随着内存漏洞利用门槛的持续攀升,非内存破坏类漏洞逐渐成为攻击者实现目标的“捷径”: - 2024年2月,著名的“XZ Utils backdoor”事件曝光,一位别有用心的开发者在社区潜伏多年,最终成为核心维护者后在项目中植入了隐蔽后门。 - 2024年4月,全球知名防火墙软件PAN-OS被发现存在命令注入漏洞CVE-2024-3400,攻击者可对运行该系统的设备进行未授权RCE,并获取系统root权限。 - 2024年6月,DEVCORE披露了漏洞CVE-2024-4577,揭示Windows环境下运行的PHP-CGI存在参数注入漏洞。 - 2024年11月,watchTowr Labs披露了"FortiJump"漏洞,指出网络管理平台FortiManager存在命令注入漏洞。 - 2024年12月,DEVCORE的Orange Tsai在Black Hat EU 2024揭示了Windows ANSI API中潜藏的安全隐患。众多软件未能正确处理Windows的"Best-fit"特性,导致路径/文件名、命令行和环境变量的注入问题,并且几乎影响到全球所有Windows系统版本。 大胆猜测,内存漏洞难以利用后,未来之“矛”或许就隐藏在各种逻辑漏洞、供应链攻击之下。 **深蓝洞察** <blockquote><p>当内存安全防御构建起层层壁垒,攻击者的“矛”已悄然转向更隐蔽的战场。“没有绝对安全的系统”,内存安全逐渐成为基础设施的“及格线”,安全防御面临更深层的体系化挑战:如何构建覆盖软件供应链的信任验证机制?如何实现业务逻辑的自动化安全建模?这些问题将是下一代安全对抗的重点。<br/>安全对抗从未终结,只是在不断升级的维度中重塑对抗格局。安全研究者需要以更立体的视角审视安全边界——当内存漏洞走向黄昏时,逻辑漏洞的迷雾正在黎明中显现。</p></blockquote> **参 考:** [1] [https://en.wikipedia.org/wiki/Address_space_layout_randomization](https://en.wikipedia.org/wiki/Address_space_layout_randomization) [2] [https://source.android.com/docs/security/test/memory-safety/arm-mte](https://source.android.com/docs/security/test/memory-safety/arm-mte) [3] [https://www.darknavy.org/blog/strengthening_the_shield_mte_in_memory_allocators/](https://www.darknavy.org/blog/strengthening_the_shield_mte_in_memory_allocators/) [4] [https://blog.trailofbits.com/2024/10/25/a-deep-dive-into-linuxs-new-mseal-syscall/](https://blog.trailofbits.com/2024/10/25/a-deep-dive-into-linuxs-new-mseal-syscall/) [5] [https://lore.kernel.org/lkml/20230915105933.495735-15-matteorizzo@google.com/](https://lore.kernel.org/lkml/20230915105933.495735-15-matteorizzo@google.com/) [6] [https://chromium.googlesource.com/chromium/src/+/ddc017f9569973a731a574be4199d8400616f5a5/base/memory/raw_ptr.md](https://chromium.googlesource.com/chromium/src/+/ddc017f9569973a731a574be4199d8400616f5a5/base/memory/raw_ptr.md) [7] [https://webkitgtk.org/security/WSA-2024-0007.html](https://webkitgtk.org/security/WSA-2024-0007.html) [8] [https://support.apple.com/en-us/121752](https://support.apple.com/en-us/121752) [9] [https://en.wikipedia.org/wiki/XZ_Utils_backdoor](https://en.wikipedia.org/wiki/XZ_Utils_backdoor) [10] [https://security.paloaltonetworks.com/CVE-2024-3400](https://security.paloaltonetworks.com/CVE-2024-3400) [11] [https://rtx.meta.security/exploitation/2024/06/03/Android-Zygote-injection.html](https://rtx.meta.security/exploitation/2024/06/03/Android-Zygote-injection.html) [12] [https://devco.re/blog/2024/06/06/security-alert-cve-2024-4577-php-cgi-argument-injection-vulnerability-en/](https://devco.re/blog/2024/06/06/security-alert-cve-2024-4577-php-cgi-argument-injection-vulnerability-en/) [13] [https://labs.watchtowr.com/hop-skip-fortijump-fortijumphigher-cve-2024-23113-cve-2024-47575/](https://labs.watchtowr.com/hop-skip-fortijump-fortijumphigher-cve-2024-23113-cve-2024-47575/) [14] [https://worst.fit/](https://worst.fit/) [15] [https://blog.flanker017.me/the-new-mystique-bug-cve-2024-31317/](https://blog.flanker017.me/the-new-mystique-bug-cve-2024-31317/) 明日,请继续关注《深蓝洞察 | 2024 年度安全报告》第八篇。
 ## OpenAI 可能发布 GPT-4.5,狙击馬斯克 Grok3 今天凌晨 1 点,OpenAI 首席执行官兼联合创始人 SamAltman 表示,对于高要求的测试者来说,试用 GPT-4.5 带来的感受 AGI 的体验,远比我预期的要深刻得多! 这说明 GPT-4.5 已经进入测试阶段,离正式发布非常近了。 而马斯克在上周日宣布,将在美国太平洋时间周一晚上 8 点,直播发布「地球最聪明的 AI」——Gork3。 在 Gork3 还有几小时就发布的时候,Altman 整一出 GPT-4.5,这明显就是对着死敌马斯克去的,在社交平台上引起了热议话题。 有网友爆料,OpenAI 团队正聚在一起观看 Grok - 3 的直播,然后决定是否推出 GPT - 4.5,Altman 也会参加这个直播观看会。 也就是说如果 Grok – 3 很强抢风头,OpenAI 可能就会祭出大招 GPT-4.5 来打压一下。马斯克的 Gork3 号称是使用了 10 万块 GPU 训练的最新 AI 模型,据说有很多创新性功能。(消息来源:华尔街见闻)  ## 消息称谷歌「17 年老将」吴永辉博士加入字节跳动,专注大模型基础研究探索 2 月 17 日消息,在谷歌工作长达 17 年的「Google Fellow」吴永辉博士已离开谷歌,加入字节跳动。 吴永辉在字节跳动将担任大模型团队 Seed 基础研究负责人,专注大模型基础研究探索、AI for science 等偏长期的研究探索工作,向字节跳动 CEO 梁汝波汇报。 吴永辉 2008 年加州大学河滨分校博士毕业后即加入谷歌,最初在搜索排名小组负责搜索算法工作。2014 年,吴永辉加入 Google Brain 转向深度学习方向的研究,在机器翻译、语音识别及合成、语言模型等方向均有贡献,是 Google 神经机器翻译项目及 RankBrain 项目的主要贡献者之一。 2023 年,因为深度学习领域的持续研究贡献,吴永辉博士被谷歌晋升为「Google Fellow」和谷歌 DeepMind 的研究副总裁。知情人士称,吴离开谷歌,是希望做一些新的,偏探索的工作。这次加盟字节,也将专注在偏长期、偏基础的科研工作。(消息来源:IT 之家) ## iOS 18.5 已进入内测阶段 基于 Apple Intelligence 的 Siri 可能推迟发布 macrumors 的访客日志显示,至少从二月初开始,苹果的软件工程师就一直在内部测试 iOS 18.5。通常情况下,iOS 18.5 在日志中并不引人注目。然而,彭博社的 Mark Gurman 上周报道称,由于存在错误和其他软件工程问题,苹果正在考虑至少将其承诺的针对 Siri 整合 Apple Intelligence 增强的部分功能推迟或限制至 iOS 18.5。 据 Gurman 称,Siri 的新 Apple Intelligence 功能最初预计将在 iOS 18.4 中亮相。第一个 iOS 18.4 测试版预计将于本周发布。Gurman 说,iOS 18.4 仍有可能包含至少部分 Siri 的 Apple Intelligence 功能,但它们可能会被默认关闭。 测试期结束后,苹果公司网站显示 iOS 18.4 将于 4 月发布,但目前还不清楚该时间框架是否会因报告的错误和 Siri 的 Apple Intelligence 功能推出的潜在延迟而改变。第一个 iOS 18.5 测试版预计会在 4 月份发布,根据 iOS 的典型发布时间表,该更新可能会在 5 月份发布。(消息来源:cnBeta)  ## Ilya Sutskever 的创业公司 Safe SuperIntelligence 被曝正筹资超 10 亿美元 2 月 18 日消息,Ilya Sutskever 正在为其创业公司 SSI 筹集 超过 10 亿美元资金,估值将超过 300 亿美元。 而在几天前,这家公司刚被传出正以 200 亿美元估值洽谈融资。如果新融资成真,这家新兴企业将跻身全球最有价值私营科技公司之列。 这位不愿透露个人信息的知情人士表示,总部位于旧金山的风险投资公司 Greenoaks Capital Partners 正在牵头对 SSI 的交易,并计划投资 5 亿美元。值得关注的是,Greenoaks 还是人工智能创企 Scale AI 和 Databricks Inc. 的投资者。 此轮融资也标志着 SSI 的估值较去年九月上一轮融资的 50 亿美元估值有了大幅度提升,当时该公司从 Andreessen Horowitz、Sequoia Capital、DST Global、SV Angel 以及 NFDG 五家投资公司获得了 10 亿美元资金。 SSI 成立于去年 6 月,另外两位联合创始人分别为前苹果 AI 高管、Y-Combinator 的合伙人 Daniel Gross 和前 OpenAI 技术团队成员 Daniel Levy。在 AI 圈子里,Sutskever 因其在生成式 AI 的突破性进展中作出的卓越贡献,而被视为传奇人物。他是早期「Scaling」理念的倡导者之一,即通过投入大量计算能力和数据来优化 AI 模型。(消息来源:机器之心)  ## 腾讯元宝发布重大更新:混元与 DeepSeek 两大模型均支持深度思考 2 月 17 日下午消息,腾讯 AI 助手「腾讯元宝」再次迎来重大更新,混元+DeepSeek 两大模型均支持深度思考功能,用户下载并打开腾讯元宝即可免费使用。 此次更新后,除 DeepSeek-R1 满血版外,腾讯自研的混元 T1 深度思考模型也在腾讯元宝开启小范围灰测,用户可以自行选用不同模型解决复杂问题。 腾讯方面表示,元宝目前同时支持腾讯混元大模型和 Deepseek 大模型,为用户提供更多选择。未来将优化产品能力,提升模型性能,打造出更好用的 AI 助手。(消息来源:新浪科技) ## 海外金融科技公司派安盈 Payoneer 收购中国支付牌照获批 2 月 17 日消息,金融科技公司派安盈 Payoneer 于 2 月 13 日发布公告,已获得在中国完成收购一家中国境内持牌支付服务提供商所需的监管批准。交易预计将在 2025 年上半年完成,但需满足通常的交割条件。 Payoneer 是一家金融科技公司,成立于 2005 年,面向全球电商平台卖家提供综合的收款方案。 Payoneer 尚未公开被收购企业的具体名称,预计未来几周内将会披露更多关于此次收购的详细信息。(消息来源:IT 之家)  ## 配 101.7 度电池 小米 YU7 续航信息曝光:最远 820km 2 月 17 日消息,工信部公布了《减免车辆购置税的新能源汽车车型目录》(第十四批),其中有不少重磅车型的核心信息得到曝光,包括小米 YU7。数据显示,YU7 将提供两种不同电池容量版,分别为 96.3 度和 101.7 度,对于后驱和四驱,续航里程最远可达 820 公里! 同时推测 YU7 也将提供 75 度磷酸铁锂后驱版,正如 SU7 那般,可以降低购入门槛,和年轻人交朋友。 小米 YU7 已经申报,加上各种路试被拍,外观基本上已经没有什么秘密可言,但内饰当前依旧隐藏在迷雾中,亟待官方释放。 据已知信息,其定位于中大型 SUV,长宽高分别为 4999/1996/1600mm,轴距为 3000mm,体量相当大,并且拥有相当长的 L113(前轮中心点到驾驶员脚与刹车踏板接触点的横向距离),非常具有传统豪华燃油车的美感。(消息来源:快科技)  ## 蔚来第三品牌首车!萤火虫核心参数曝光:搭 42 度电池 续航 420km 2 月 17 日消息,工信部的《减免车辆购置税的新能源汽车车型目录》中,蔚来第三品牌首车萤火虫的信息透露出来。蔚来萤火虫只有一款车型,搭载 42.1kWh 欣旺达磷酸铁锂电池包,CLTC 续航为 420km。 与蔚来旗下车型一样,萤火虫同样支持换电,整车可换可充可升级。同时,据此前的工信部新车申报目录信息可知,萤火虫配备了 105kW 的驱动电机,整车的续航和动力水平与主流车型一致。 此外,萤火虫的内饰信息也已曝光,车辆配备悬浮式全液晶仪表和中控屏,双辐式方向盘带有多功能按键,中控台无实体按键,采用怀挡式换挡机构。 车辆支持全场景自动泊车,包括自动泊车和离车泊入功能,拥有 9 个安全气囊和 92 升前备厢,后备厢最大容积 1250 升。 其他方面,萤火虫的长宽高为 4003/1781/1557 毫米,轴距 2615 毫米,属于 A0 级纯电小车。 据蔚来董事长李斌此前透露,萤火虫旗下首款车型将于 2025 年上半年开启交付,其品牌定位类似于 MINI 和宝马的关系,价格比 MINI 更便宜,定位精品小车。(消息来源:快科技)  ## 我国科学家成功实现了人脑对无人机的高效四自由度操控 2 月 17 日消息,天津大学与清华大学合作,开发出国际首个基于忆阻器神经形态器件的「双环路」无创演进脑机接口系统,成功实现了人脑对无人机的高效四自由度操控。 相关研究成果于 2 月 17 日发表在权威学术期刊《自然·电子》上,彰显了其在国际学术界的认可与影响力。 科学家在研究过程中发现,相较于传统的纯数字硬件方案,忆阻器新方案展现出了显著的优势。 其归一化解码速度提升了两个数量级以上,同时能耗降低了三个数量级。这种高效、低能耗的特性,有力地支撑了四自由度脑控无人机任务目标的成功实现。 在连续 6 小时的长时程脑机交互实验中,最终脑机接口性能不仅没有下降,反而准确率提升了约 20%,充分证明了该系统的稳定性和可靠性。(消息来源:快科技)  ## 《哪吒 2》杀入全球影史前 9 2 月 17 日,据灯塔专业版显示,《哪吒之魔童闹海》总票房(含预售)突破 16.71 亿美元(约合人民币 121.22 亿元)。如此一来,该片超过《侏罗纪世界》,杀入全球影史票房榜前 9 名。 《哪吒之魔童闹海》(以下简称《哪吒 2》)能取得如此出彩的成绩,固然离不开广大国内观众的支持,而在最近几天,海外票房也开始发力。 自 2 月 13 日在海外上映以来,截至目前,《哪吒 2》的海外票房已突破千万美元。其中在北美地区,上映首日(2 月 14 日)就取得 310 万美元票房,目前这个数字已来到 830 万美元。(消息来源:IT 之家) 
2024 年下半年,消费电子硬件领域人人都绕不开的话题,必然是智能眼镜。而掀起这波浪潮的,则是在 2024 年凭借百万台销量,在全球范围内成为现象级硬件新品的 Ray-Ban Meta。 虽然 Ray-Ban Meta 出货量百万已经不再是秘密,但对于眼镜这种强依赖线下渠道出货的硬件产品,最具体的销售数据,或许只有 Meta 在眼镜领域选择的合作方——一直以来在讨论中少有提及的依视路陆逊梯卡(Essilor Luxottica)才能给出最准确的数字。 而本周,他们给出的答复是——Ray-Ban Meta 的销量正式突破 200 万台,同时他们还放出了一个更惊人的数据: 计划与 Meta 合作,**到 2026 年底「将年产能提升至一千万台」**。 从之前的默默无闻,到爆卖 200 万副,再到千万量级,智能眼镜市场,确实已经迎来了爆发吗? _**01**_ **智能眼镜的巨额利润** 200 万副和千万级别的产能这两个数据,来自依视路陆逊梯卡首席执行官弗朗西斯科·米莱里(Francesco Milleri)在本周的 2024 年第四季度财报电话会议。 依视路陆逊梯卡你也许初听起来会有点陌生,但只要配过眼镜,就肯定听说过依视路。EssilorLuxottica 正是由全球最大的镜片制造商法国依视路集团(Essilor)与全球最大的眼镜制造商意大利陆逊梯卡公司(Luxottica)在 2017 年合并而成。 如今,依视路已经通过垂直整合,控制着全球超过 30% 的眼镜市场份额,在全球拥有超过 18000 家线下门店,Meta 两代智能眼镜都选择的设计原型 Ray-Ban 系列,就是其品牌旗下全球最畅销的太阳眼镜品牌。**而 Ray-Ban 飞行员系列那在过去数十年早已深入人心的外观设计,也在最大程度上降低了智能眼镜给用户带来的异样感**。  依视路集团在全球有着深厚的线下渠道能力 | 图片来源:依视路 Ray-Ban Meta 眼镜成为全球首款销量突破 200 万台的智能眼镜硬件,给合作双方带来了巨大利润。起售价 300 美元,偏振镜款 330 美元,变色镜片款 380 美元,可额外付费配处方镜片。 按此计算,**200 万台销量对应着超 6 亿美元收入**。 虽然 Meta 与依视路陆逊梯卡的具体分成比例从未公开,但有不少业内人士认为,在早期智能眼镜概念尚未完全成熟的市场,是 Meta 投入了大量的资源来引导用户体验乃至供应链走向成熟,因此 Meta 在这样的合作中的收益并未如同外界想象的那样多,甚至大概率仍然处于亏损状态,但 Meta 两代 AI 眼镜的投入,对引导智能眼镜市场如今逐渐走向成熟功不可没。 随着 Ray-Ban Meta 的成功,双方的合作也得到了进一步的稳固:2024 年 9 月,依视路宣布与 Meta 宣布延长旗下智能眼镜产品合作关系延长至 2030 年,并承诺未来将与 Meta 联手推出更多基于旗下眼镜款式的联名智能眼镜产品。 _**02**_ **智能眼镜大战,一触即发** 虽然在财报会议中,依视路展现出对未来充满信心、希望进一步拓展市场的态势,但随着竞争对手的快速涌入,对市场的预期,其实并没有财报会议中体现的这般乐观。 因为其他科技巨头,在 Meta 智能眼镜成功后,也加紧了旗下竞品的研发过程。 根据外媒报道,三星不仅在与 Google 合作推出 XR 头戴显示器,同时还计划在今年推出搭载 Google Gemini AI 的竞品;虽然苹果已经放弃了原本计划中与 Mac 连接才能使用的 AR 眼镜方案,但仍计划在 2027 年之前推出形态类似 Meta Ray-Ban 的智能眼镜产品。  Google 已经多次展示 AI 多模态技术在 AI 眼镜上整合的能力 | 图片来源:Google CES2025 现场,极客公园也看到众多中国厂商在摩拳擦掌,拿出了各种在续航、体验以及产品形态上力求超越 Ray-Ban Meta 的产品,其中不乏相当有竞争力的产品,在 CES 现场,往往是这些 AI 眼镜新锐的展台前,经常出现把热情的体验人群把通道堵的水泄不通「景观」。  在 CES 上展示的 Halliday 眼镜,通过搭载投影显示模组来在传统 AI 眼镜形态上加入内容显示功能|图片来源:极客公园 Meta 显然也感受到了来自背后对手快速追赶的压力,在几周前 Meta 的内部全员会议上,扎克伯格指出科技巨头将推出竞品,要求员工趁竞争对手尚未入场加速扩展智能眼镜业务: 我们基本开创了这个品类,竞争对手尚未真正进场,但他们终将到来。虽然预计 2025 年会看到大量竞品出现,但眼下正是我们全速推进、向尽可能多用户推广 Meta AI 眼镜的绝佳时机。 此前,Meta 在今年年初在公司内部,发布了一份题为《2025:伟大的一年》的备忘录,里面提到,Meta 将在 **2025 年推出「六款以上****AI****驱动的可穿戴设备」。其中将有超过四款智能眼镜新品**。 在这些智能眼镜新品中,其中首款将会是设计原型同样来自依视路的 Oakley 智能眼镜。 据彭博社科技记者马克·古尔曼透露,Meta 与依视路计划今年晚些时候推出 Oakley Meta 智能眼镜。与摄像头位于单侧的 Ray-Ban 不同,Oakley 款摄像头将置于中央,号称专为「自行车手等运动员」设计。  Oakley Meta 智能眼镜的设计原型,同样来自依视路旗下经典的眼镜系列 | 图片来源:依视路 除了硬件新品的加速布局,Meta 与依视路还计划通过软件更新,来进一步改变 Ray-Ban Meta 在 Meta 生态内的用户体验。依视路 CEO 米莱里在财报会议中,同时向投资者表示,随着用户留存率持续上升,目前仅限于美国、加拿大和澳大利亚的 Meta AI 多模态视觉 AI 功能,将「很快」推广至更多国家。  Meta AI 在 Ray-Ban Meta 上实现的多模态 AI 能力 | 图片来源:Meta 随着眼镜本身销量的提升,Meta 与依视路也意识到想要独占这片千万级市场并不现实,「目前 Essilor Luxottica 正在与 Meta 进行长期规划,将 Meta 雷朋智能眼镜视为一个『共享平台』」,将「为第三方品牌提供空间」。 这也意味,或许在 2025 年,我们就能看到 Meta 用类似 Quest VR 头显的模式,**将智能眼镜生态开放给更多第三方开发者,允许其通过上架应用商店的形式,在 Ray-Ban Meta 上运行自己开发的 App**。 这样既能实现进一步实现依视路与 Meta 两个不同领域的巨头,在传统客群之外拓展更多用户的野心,同时也是在从另一个角度,展开对尚未到来的众多竞争对手的「阻击」。 有了 Meta 和依视路的合作先例,2024 年下半年行业内涌现出了数个「传统眼镜巨头 + 智能硬件品牌」结盟案例——博士眼镜完成包括雷鸟、界环、魅族、华为等多个品牌的线下渠道合作,同时也有宝岛眼镜这样的眼镜连锁品牌在摩拳擦掌。 在中国市场,随着小米、百度以及众多厂商的快速入局,2025 年 AI 智能眼镜市场的激烈竞争已经揭开帷幕。而 Ray-Ban Meta 的表现,也直接决定着作为先行者的 Meta,能否稳固自己在 AI 智能眼镜市场的霸主地位,抢占「下一代智能终端」的先机。 毕竟,没有公司敢错过「下一个 iPhone」的机会。
2025 年开年,迎来了「中国的 ChatGPT 时刻」。 由于 DeepSeek-R1 模型能力带来的震撼,从硅谷到中国、从老人到小孩、从 AI 创业者到各行各业的从业者、从小红书到抖音,都在「玩」DeepSeek。 DeepSeek 最新的「朋友圈」是百度和微信。前者即便面对传统搜索带来的丰厚商业回报,也接入 R1 主动变革;而从不激进的微信也罕见地积极了一把,接入 R1 升级了微信中的「AI 搜索」。 很难想象,在 ChatGPT 诞生两年后,所谓「大模型窗口期已过」的时间点上,杀出了这样一匹黑马,以所有人意想不到的方式,掀翻了大模型产业的桌子。当所有人都看到 DeepSeek 带来的机遇,当大厂也一反常态不再要求先做出自研的模型技术、而是现在就接入最好的 DeepSeek 模型做 AI 应用,2025AI 会如何发展? 2025 年 2 月 8 日,极客公园「今夜科技谈」直播间邀请极客公园创始人 & 总裁张鹏,昆仑万维 董事长兼 CEO 方汉、秘塔科技 CEO 闵可锐和清华大学交叉信息院 助理教授 吴翼,一起探讨了 DeepSeek 带来的冲击波以及 2025AI 应用还能怎么做? - DeepSeek 文笔好、思考过程比人类都有逻辑,这会成为接下来做产品的标配动作吗? - 有了 DeepSeek,蒸馏还能怎么做?为什么蒸馏是常规方法论,与价值观无关? - 为什么说有了 R1,也并不意味着 AI 应用更好做了?更大的挑战才刚开始。 - DeepSeek 之前,大模型领域默认「老大老二不开源,老三开源赚名声」法则,但反倒是从第一天就坚持开源引领技术生态的 DeepSeek 赢得了天下。开源到底意味着什么?现在,是不是应该问:还有谁没有加入开源队伍? - 靠优化 AI Infra 实现「价格屠夫」背后,没有人比 DeepSeek 更懂英伟达 CUDA,未来,模型推理价格还可以香到什么程度? - 达到全球第二的成绩后,DeepSeek,接下来会发什么? 看完这篇,你会对 2025 年接下来 AI 圈即将要发生的大事件,有更好的判断。  ## ## **01 ****DeepSeek-R1:开源模型有史以来最好的成绩** **张鹏:从你的角度,DeepSeek 这次爆火背后,最值得关注的创新点是什么?** **吴翼:**DeepSeek-R1 是第一个开源的,并且真正接近、达到 OpenAI o1 水平的模型,后者是一个新的推理类的范式。同时,DeepSeek 还把怎么得到 R1 这个模型的很多细节、大概的 recipe(配方)也告诉你了,在这一点上,它也是第一个。 带给我最大的冲击是两件事情。第一,没想到能这么快做出来,因为从 o1 面世(2024 年 9 月 13 日),到中国的团队开始尝试复现 o1 类似的模型,DeepSeek 真正做这件事满打满算也就半年。在这条技术线上,OpenAI 可能探索了一两年的时间才做出 o1。 第二是当这个模型拿出来的时候,没想到「哇,真的这么好」,R1 是开源、所有人都可以试。 两件事情加起来,一下子就没话说,非常有历史时刻的感觉,然后春节就没过好(哈哈)。 **张鹏:所有人都在思考****,****怎么出来的,为什么不是我们(哈哈)。你们怎么看 DeepSeek 冲击波?** **闵可锐:**知道这家公司是在 2023 年他们刚成立的时候,当时可能为了招人等诉求,(DeepSeek 创始人梁文锋)稍微有一些对外的发声,看完会感受到这家公司身上很不一样的特质、非常回归本质的讨论问题的方法。所以 DeepSeek 能在一年多的时间做到像现在这样火热的程度,也许有一定的意外性,但是对于他能把这件事做好,并不意外。 **方汉:**最早知道 DeepSeek 是在 2022 年底、2023 年初去买卡的时候,意外得知幻方有万卡。后来注意到 DeepSeek-Coder 模型在代码类 Benchmark 上一度冲到全球第一。 再就是「推理价格屠夫」DeepSeek-V2 的推出,直接把模型推理价格打到了当时业内平均价格的 1/10。这里面有两项技术印象特别深刻,一个是 MLA(多头注意力的优化),第二个是 MTP(Multi-Token Prediction,多 token 预测)。 最近是 V3 和 R1 的推出。V3 是一个挺强的基模,但是它跟 Meta 的 Llama 405B、Qwen 等系列开源模型一样,前面还有两个天花板,OpenAI 的模型和 Anthropic 的 Claude。**但是 DeepSeek-R1 这一次直接能够排到第二名的位置,开源模型有史以来最好的成绩,这是让我们最震惊的。**  _DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。|来源:DeepSeek_ **张鹏:DeepSeek-R1 里的模型技术,有哪些创新让你们印象比较深刻?** **方汉:**技术角度,这次 R1 做了很多技术上的改进,像 DualPipe 算法,像用 PTX 去写通讯之类的,最印象深刻的肯定也是训 R1-Zero 用的 GRPO 这个技术,这是整个 R1 里最核心的东西。 因为 OpenAI 在做 o1 的时候,请了上百个数学博士天天解题,数据非常高质量,但他从来不对外界说怎么做数据。大家也知道很多公司会用 PPO,真正能把 PPO 用得特别好的还是 OpenAI 和 Anthropic。国内大家在 PPO 用不好的前提下,DeepSeek 用 GRPO 的方法非常巧妙,省掉了 Critic Model,后者做起来特别大、特别慢。 **通过 GRPO 的方法,可以快速迭代出一批特别高质量的 CoT 数据,这一点特别令人震惊,等于说 OpenAI 自己辛辛苦苦找人花钱做出来的数据,被咣地一下给开源了,**而且从结果上来看,它的质量特别好,不逊于 OpenAI 的内部数据。这一点是非常非常革命性的,我们一直认为合成数据比不上人的数据,但是**R1 这一次有可能表明,合成数据不比人标的数据差。**这给很多人带来了希望,像欧洲、印度、韩国都觉得自己也可以做了。 **闵可锐:**讨论最多的还是 R1-Zero 的技术创新。 过去大家认为,不管是做 SFT(有监督微调),还是做强化学习,都依赖大量人工标注的数据,人工在里面参与度非常重。比如之前传出 Meta 在数据标注上,是以亿美金级别的投入去换得质量相对较高的数据。但是 R1-Zero 表明其实可以大规模降低对于人工标注(数据)的依赖。 同时,R1-Zero 的突破带来了代码能力、数学能力、推理能力的提升。 但我觉得**能火到全民皆知的程度,其实不是由于它的推理能力、代码能力,还是因为 DeepSeek 写东西(的水平)超出了 90% 的人,写作能力非常突出,**这件事震撼到了大家。 ## **02 ****DeepSeek 文笔好,是因为没有好好做产品?** **张鹏:很多网友都说被 R1 的文笔惊艳到了,至少公众热情是这么被点燃的,不管是在中国还是海外。就连****AI****创业者也会感慨,以前用 o1 给人的感觉是多了一个理性的员工,今天用 R1 却感觉成为了他的人生导师,竟然能带来很多启发。所谓的模型文笔好,技术上是怎么实现的?** **吴翼:**简单说,文笔特别好(的原因)就是 DeepSeek 没有好好做产品(哈哈)。 如果用 ChatGPT 写,经常会讲文章 GPT 味特别重。为什么呢?因为 ChatGPT 在安全、对齐(alignment)上做得非常猛。这样就会导致,比如当人跟 AI 一起玩「狼人杀」时,你特别容易看出来哪个是 GPT。因为人类玩家会直接说,「这个人一定是个坏人」,但 GPT 会说,「我觉得这个人好像怎么样,我们应该怎么理性分析……」讲很多啰里八嗦的废话。这就是它「对齐」做得特别好的体现,它希望这个东西不要冒犯到人,希望产品化做得好。 但**DeepSeek 显然没有好好做这件事情,所以大模型本来的这些天花乱坠的想法就被你看到了,而 OpenAI 为了做安全性,为了做所谓的「价值观对齐」,反而是把模型的很多能力收起来。** 第二,如果仔细地去看 R1 的技术报告,它其实分了两步,先用强化学习做出了一版推理模型,但没有直接给你用这个推理模型,而是后面有一个合并模型的过程,最后是完整版的 R1 模型有一些泛化能力。 展开讲,因为在代码、数学这种特定任务上做强化学习训练出来的推理模型 R1-Zero,文字上肯定会差一些,所以 R1-Zero 又跟原来的基模 V3 用 SFT 这种类似于蒸馏或者合并模型的过程,最后合并出了带有泛化能力的模型 R1。这也说明 V3 这个模型确实非常好,**如果 V3 比较差的,最后合并出来你也看不到那么多奇思妙想。换句话说,强化学习很重要,基模也很重要。** **张鹏:这个视角蛮有意思,反而是过度对齐,会让它的脑洞、想象力或者一些 hallucination(幻觉)被压制了。** **吴翼:**对,创意其实是 hallucination。  _[作者卫夕向 DeepSeek 提问「玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?」,网友为 DeepSeek 输出的答案而感到惊叹。](https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653072943&idx=2&sn=42192769f13fb530fa9d3e23e0ad898c&scene=21#wechat_redirect)|截图来源:微博_ **张鹏:可锐,你怎么看它的文字表达很好?背后有什么原因和讲究?** **闵可锐:**我猜测可能有三个原因,一是刚才提到的 DeepSeek 没有试图把很多偏个性化的一些表达给阉割掉。你会发现很多 GPT 的回复是「端水型的」「安全型的」,但其实比较 boring 的回复。所以 DeepSeek 一定没有在安全性方面做激进的动作,模型输出的表达上相对比较自由。 第二个猜测,很多人觉得 R1 的强化学习本身增加了它的写作能力,但我对这件事是存疑。我听到的一个信息是,之所以有比较好的表达,**背后是有比较资深的、类似于北大中文系的人在帮忙在写数据。人的自由表达和高质量的数据作为对模型回复的一个引导,来达到好的效果。**我会觉得应该是 SFT 这个部分的数据做得非常好。 第三,R1 以及 V3 的模型如果和行业同类模型相比,它其实把规模差不多涨了 10 倍,差不多从一个几十 G 的规模涨到了几百 G。这个规模下它能够储存的信息容量差不多比上一代 Qwen 涨了十倍,这让它在很多比较细致的表达上能够有更好的还原。也就是说**它的压缩率其实不用做得那么高,能够记住更多东西,包括像诗词、或者开放式的问题上。** 总结来说,更大的脑容量、高人撰写的文学性数据作引导和对齐,并且降低了严格的安全对齐(标准),可能是这三点加起来得到了 DeepSeek 的优美深刻的表达。 **张鹏:一些在硅谷的华人 ****AI**** 研究员也说,可能过去海外的大模型对于高质量中文数据没有特别较真过,但 DeepSeek 较真了。方汉你怎么看「大家说 DeepSeek 文笔好」?** **方汉:**虽然我学的是理科,但我高考作文是满分,所以对古文比较熟,我特别喜欢让大模型写古诗词。在这件事上,现在写的最好的模型实际上是 Claude,也就是说 **Claude 的文采比 ChatGPT 要好很多。**我觉得还是数据的原因,大家公认 Anthropic 对数据的品位最高,数据做得最好,他们的数据团队规模在语文和写作方面非常强,我猜 DeepSeek 也是类似。 DeepSeek 内部可能有一套方法,可以从现有的数据里面生成质量非常高的语文数据,这是我的猜想。因为请大量顶尖团队比如北大中文系标数据,DeepSeek 未必竞争得过大厂,(靠人工标注数量和质量取胜)逻辑上讲不通。**DeepSee****k 在不要人干预的情况下,可以用 GRPO 可以生成数学和编程的 CoT 数据,那这些方法能不能用在语文上去生成高质量的语文数据,这是我更相信的一个推断。** 另外,我们在做推理模型的时候有个叫 temperature(温度)的参数,如果把这个参数值设得高,模型就开始胡说八道、特别有创意,但也很容易崩。可能因为 R1 的推理能力很强,哪怕把 temperature 加得比一般模型高,也是比较活跃且不容易崩。 ## **03****「被 DeepSeek 的思考过程震撼到了」** **张鹏:除了文笔好,很多用户也被 DeepSeek 思考过程的透明和清晰的逻辑打动,R1 是第一家展示思考过程的模型吗?** **吴翼:****完整思维链的透明展示,确实是 DeepSeek 第一个做出来的,但 R1 不是第一次,第一次真正公开所有思维链的模型是去年 11 月 20 日发布的 DeepSeek-R1-Lite。** 后来 Gemini 跟进了,也公开了思维链,Gemini 的 Flash thinking 的思维链质量也不错。 其实去年 9 月 OpenAI 发布的 o1 也给了这样的中间步骤,只是它不给你看思维链的完整版,就给你一个总结版。从技术视角上,藏没藏思维链差挺多的。不过总结版的思维链虽然不完整,但也挺有价值的,很多人发现即使是「扒」总结版思维链数据,也能对模型有很多提升。  _图片来源:视觉中国_ **张鹏:你觉得 ****OpenAI**** 为什么不给大家公开思维链?** **吴翼:**高质量思维链对于模型的能力提升、以及激发模型让它在第二阶段强化学习训练时能有很好的推理表现、继续用强化学习做 Scaling Law 是很重要的。所以 OpenAI 应该在这件事情上花了一些力气,他知道如果真的把思维链给你去 distill(蒸馏),你很快就能做出来,他就是不让你「抄」。 最近李飞飞老师团队做的、被炒得很热的 S1,50 美金能够让你看到 test-time-in-scaling 的效果,也说明了这个道理。它只输了 1000 条 Gemini 的长思维链数据,就能让模型有比较大的推理表现上的质变,当然它效果还比较一般,50 美金不可能真的把 R1 复现。所以高质量的长思维链数据是重要的,这也是 OpenAI 不愿意给你看的原因。 **方汉:**我觉得 OpenAI 就是想保守机密,OpenAI 一直认为思维链数据是它最值钱的数据,所以很早就出了一个 term sheet(条款),你要是敢 jail break(越狱)问他 CoT 的问题,他会封你的账号。R1 发布之后,OpenAI 也把 o3-mini 的思维链输出了,但这里是总结版的思维链,结果又被网友骂了,然后现在又正在把总结再去掉。 当然大家没有想到的是 DeepSeek 说,要不我试一下,我也不要中间这个步骤,直接给你强化学习行不行?很长时间大家都觉得中间需要搞一步 SFT,结果 DeepSeek 出来跟你说,我们试了一下,好像不需要也行。 **张鹏:因为没有人做出来过,或者没有人按这个方式做出来过。** **吴翼:**就是**对面有一家告诉你这个东西特重要,「此地无银三百两」,我家一定没有黄金,你千万别来。那大家都会往这上面花很多精力想,最后 DeepSeek 试出来说,你看你没这玩意也行,哈哈哈,或者说有比较便宜的方法能绕过去。** **张鹏:秘塔科技也在第一时间与 DeepSeek-R1 合作做了相关的功能,思考过程的可视化。可锐,从用户的角度,你怎么看这件事带来的影响?展示透明的思维链本身,是不是一种用户价值交付?** **闵可锐:**我会觉得思维链,不管是总结版也好,还是像 R1 给到一个相对完整的思维链,最早的出发点可能是通过步骤和步骤之间的推导,提高结果的准确率。 但把它展示出来,我会认为最早是因为中间的等待时长实在太长了。如果**让用户在这无休止地比如像看沙漏一样(等时间),用户体验是非常糟糕的。所以既然有一个中间的推导过程,索性把推导过程显示给用户,但是这似乎带来了一个非常意外的好处。** 很多人反而专门去看思维链,「诶,这个模型怎么思考的?它怎么从不同角度去考虑我提的问题」,这对我来说是稍微有点意外的。我观察到很多人其实还挺喜欢看 R1 的思维链,因为模型把思维链写得像是一个内心独白一样。 **就像有人问它说,「诶,我有一个朋友怎么怎么样」,然后这个思维链里说,「这个大概率是用户自己想问这个问题」,就是有一种竟然被 AI 看穿的体验。**我觉得这可能也是出乎创造者意料的效果。  _DeepSeek 推测,用户说是别人的提问,很可能是用户自己的提问。|截图来源:DeepSeek App_ **张鹏:方汉,你怎么评价这次 R1 展示的透明的思维链?** **方汉:**从纯技术的角度,看思维链可以改进你的 prompt。但对于绝大部分用户,不会这么用思维链。 对于用户来说最可怕的体验是,看到 R1 思维链这么严密的推理过程,有点像我们小时候看卡耐基成功学、有点像听一些特别牛的人把他思维方式给你讲一遍,你是会很震撼的。 现在,你目睹了 AI 用一个聪明人、成功学的方法给你推导一个问题,所有人心里都会心生感叹,「这个 AI 真聪明,接近人类智能呢」。我觉得这**对产品的推广来说,是一个决定性的心理暗示。** **张鹏:像这样一个让大家觉得很震撼的思维链,是怎么做出来的?** **吴翼:**首先**思维链是涌现出来的,不是人标注出来的,人标不出这样的思维链。**如果你仔细去看 DeepSeek 产生的思维链,很多也是错的,或者说没有任何道理,再比如之前 OpenAI 的思维链里还出现过中文。这些都说明,是由强化学习的 Scaling Law 让思维链涌现出来的。 所以判断一个模型是不是推理模型,只要看它敢不敢放出一个训练曲线——模型输出长度随着强化学习的训练时间在不断变长。如果能看到这个不断变长的曲线,基本上可以认为这个训练是成功的;如果看到它的长度变短了,那应该就失败了,即使它的正确率或者表现在提升,也是失败的。也就是说,这个长度是涌现的,最后推理模型呈现出来的极强的反思,是泛化的结果,是涌现的结果,而不是人标的。  _DeepSeek-R1-Zero 的性能轨迹,整个强化学习过程中稳定且持续提升。|截图来源:DeekSeek-R1 技术报告_ 第二,**需不需要一个东西去激发这个模型的思维链?基本上是需要的。**OpenAI 在训练模型的时候应该还是用了一部分这样的数据去激发基座模型的思维链能力,然后再上强化学习的。 但是我觉得比较神奇的一件事情是,如果你仔细去看 DeepSeek 的技术报告,你会发现即使用比如 Qwen-32B、Qwen-70B,基座模型在没有任何强化学习训练的情况下,通过 prompt 的调整也可以看到它的一些反思过程。也就是说,基模从某种程度上已经有一些自激发能力。 所以这也是 DeepSeek 可以从基模直接进行强化学习的一个重要原因,基模在强化学习开始的时候就存在一定的反思、思维链能力,然后再通过强化学习 Scaling Law 的方式,把反思能力放大,涌现出来最后的 R1 模型。当然也说明 DeepSeek-V3 这个基座模型做得很好,导致它一开始就有了自我激发的能力。 如果这个基座模型,比如说在数学上有一些基座模型有一些反思能力,但在语文上,比如说真的完全没有「诶,等等,我说错了我再想想」这样的表现。再怎么强化学习?也不会涌现出反思能力,如果基座模型很差,没有准备好被激发的话,那也没用。 **张鹏:如果没有「等等,我可能想得不对」类似的推理反思能力,再怎么上强化学习,也不会出现思维链的线性发展。** **吴翼:**对,**强化学习跟预训练是乘法的关系:**预训练的 scaling 是第一个系数,强化学习后训练是第二个系数,这两个是乘起来的关系。 如果一个维度是 0,怎么乘也没用。但这里哪怕是个 0.01 也没问题,后面帮你乘上去,所以这也说明 V3 的基模真的非常好,所以它能让你做出一些事情来。技术报告里也做了实验,比如说是 7B 的小模型,怎么强化学习也没用,还不如蒸馏。所以强化学习和基模有这样的一个关系。 **张鹏:怎么理解****强化学习****在 R1 和 R1-Zero 体现出的效果?** **方汉:**打个不太恰当的比方来类比理解,让一个小孩学乒乓球,先让他看所有高手打乒乓球的视频,但他看完了之后仍然不会打。 这时候有两个方法,一是请国家队队员比如马龙来教他,但绝大多数家庭请不起国家队。怎么办呢?这时候请不起国家队的家庭就想了个办法,让人对着一个洞去打球,打不中就「电」你一下。奖惩机制下,终于这个小孩成了一个绝世高手,但是他这时候还不太懂乒乓球的规则,发球也不标准等等。这时候终于又请了一个教练,告诉小孩得按照什么样的规则打球,让他把规则学会,学会了就出去「大杀四方」,这个逻辑大概是这样。 这里其实有一个问题,刚才大家也聊到了,**现在不知道 V3 这个基座模型看没看过高质量的 CoT 数据?但是它后来的激发做得非常成功。**我觉得这给了所有「穷人」一个念想,我靠自己「电」自己,也能把自己「电」成高手。这样的话,很多欧洲、印度的公司也可以开始训练这种高质量模型了。 **张鹏:技术圈对于 R1-Zero 的讨论是大于 R1 本身的。** **闵可锐:**R1-Zero 的这件事,更像是一个范式的变化。Zero 这个名字就会让大家容易联想到 2017 年谷歌 DeepMind 诞生的 AlphaZero 这个名字,如出一辙。 DeepMind 先让机器学习人类怎么下围棋,上升到完全不告诉机器人类下围棋的方法、只告诉它规则——下到什么局面你就取得了胜利、下到什么局面你失败,就能够把模型训练到超过人的水准。这件事打开了大家的想象力,让它自我博弈、自我学习,有可能出现超过人类最强棋手的能力。 一定程度上,R1-Zero 带来了这样一个类比和联想。当然两者不完全一样,AlphaZero 在下围棋上做强化学习的时候没有任何人类经验的参与。但 R1 可能还是受到了基模 V3 的激发,后者是一个学习了全互联网人类知识的基座模型,R1 涌现出来一些反思、自我纠错的能力,本质上还是因为全互联网数据里存在人类反思,类似「诶,这个地方等等,我好像做得不对,让我来改进一下」的一些基础数据,哪怕比较稀疏,但是仍然被 V3 给捕捉到了。在这个基础之上,用强化学习的能力把它进一步放大,达到一个更好的一个效果。 ## **04****「蒸馏」是业内常用的方法** **张鹏:R1 出来之后,有很多讨论说未来是不是可以通过蒸馏,让端侧的模型能力也得到比较大的加强?有了更好的模型,再加上蒸馏这件事,对创业者做产品或者模型有什么好处?** **吴翼:**分三件事来讲,一个是蒸馏,第二件事情是端侧模型,第三是垂类应用。 **蒸馏的过程是指,你问一个问题,让老师说答案,你把答案记下来,你问 100 万次,就差不多学会了。就像熟读唐诗三百首,不会做诗也会吟。** 蒸馏确实是有用的,DeepSeek 在技术报告里也表明,**如果你有一个小的模型比如 7B 以下的模型,不用去做强化学习或者其他,有一个好的、大的老师模型用,直接蒸馏思维链数据是最好的,比直接跑强化学习效果好,也最高效的。**所以有一个模型完全公开、可以蒸馏,对很多做产品或者做个性化模型训练的公司来说,非常非常利好。 而且不光对小模型有用,对于大的公司来说,蒸馏也非常重要。比如 DeepSeek-R1 是 671B,很多厂商可能用不起来,或者很难高效地用起来。那么一个公司做模型的团队如果能把 671B 的模型,做到比如说 100B 的模型上、带来同样的效果,这会给成本以及应用带来更大的可能性,这里是需要蒸馏的,自己也可以蒸馏自己,不丢人。而且很多人认为 OpenAI 也做了蒸馏,所以 OpenAI 上线的模型都很小,成本可以控得很低,很大的吞吐量做得很高效。 第二件事,端侧模型。我们是不是需要一个完整的端侧模型?我其实觉得不一定。 我在端侧有一个比如 1B 的模型,云端还有一个 500B 的模型,这两个东西可以配合。我自己是做多智能体强化学习的,我觉得一个最有趣的多智能体系统的问题是:**当你真的有两个能力不一样的模型,比如说 500B 的模型和 1B 的模型,它们之间应该怎么样发挥出一个 1B 的效率、同时 500B 的推理能力?** 现在大家研究多智能体系统往往都是在端侧用不同的模型、不同的 prompt 通过显示出的不同偏好和行为模式来组合,这件事情其实没什么太大的意义,因为就像 OpenAI 的 Operator 模型或者 DeepSeek-R1 出来,你会发现一个足够强的推理模型,可以做到一个模型干所有的事情。 当真的有云端和端侧的模型可以配合的时候,多智能体系统就会很不一样。 第三件事情是垂类应用,我觉得**这个时代对于做垂类的应用或者叫产品,要求要比互联网时代高很多。** 因为技术迭代太快了,不光要洞察需求,你很怕那个需求,因为来了更好的模型之后,整个需求的模式变了。因为从 ChatGPT 和 DeepSeek 上你可以观察到,很多新的被满足的需求,并不是他们想到的,而是模型的智力提升之后,人的行为模式也发生了变化,模型的涌现带来了人类行为的变化、带来人的需求的变化。所以做产品也不能抓某个需求不放,而要在那个需求的周边一直打圈。 所以可能得去想,做垂类应用真正的壁垒是什么?比如数据、渠道肯定是一个壁垒,商业模式可能也是一个壁垒,但我觉得需求本身不构成壁垒。 同时做垂类应用,你还得对模型的技术有预判的能力,三个月后它会变成什么样?半年后怎么样?下一代模型可能会怎么样?因为如果在技术快速迭代的时候,花了太多的精力和太多的钱,但可能半年之后很多事情又都不一样了,所以得非常非常小心地去花钱。  _Perplexity CEO Aravind Srinivas 第一时间官宣 Perplexity 接入了 R1 进行产品升级和进一步探索。|截图来源:X.com_ **张鹏:人对 ****AI**** 的需求会随着 AI 能力的成长,人也会改变行为。可锐,你觉得这个 AI 搜索算不算垂类?垂类产品要怎么演进、怎么构建自己的路线图?** **闵可锐:**我觉得在一个技术演进比较快、变化比较剧烈的时期,对于技术有相对比较深入的理解,一定是对你做产品、对未来的预判,有巨大的帮助。 虽然外界大多数人对秘塔的印象,好像是一个比较纯粹的产品公司,但是我们其实其实已经做过几百轮预训练了,在我们有限的几十张卡上,也观测到很多比较有意思的现象。 所以我们对于很多,比如哪一代模型可能能够做什么?哪一些现象背后代表什么?不是把模型当黑箱来对待的,在对模型技术有一定理解后,解决问题的产品视角也会不一样,比如很多人会觉得现在 R1 的推理成本已经非常低了。但我们注意到,其实在 DeepSeek 还没有开源的部分里,有一个是 serving 的模型。 serving 的这部分虽然最近有很多比如云厂商、算力中心的跟进,比如以和 DeepSeek 相同的价格,甚至更低的价格对外提供服务。但是我可以负责任地说,现在每一个小于等于 DeepSeek 价格提供服务的云厂商都是在亏钱。**也许 DeepSeek 是没亏钱,但他们现在一定在亏钱,**因为现在 serving 框架其实还没有在 MoE 架构上做好准备,因为原来大家做了很长时间是在稠密模型上做了很多积累。所以现在在谈的「成本已经降下来了」,其实是更像是一个理论值。产品经理自己去做部署,自己去做 serving,很有可能很快会发现这个成本和他的预期有巨大差异。 对,所以这里面其实有很多 knowledge,还是要在比较一线有足够的细致的了解,你能做出判断。它远远没有到说这个已经是一个标准化的一个工具,按绿色按钮就出来什么,按蓝色按钮能出来什么?所以我觉得现在做产品确实得同时理解用户和理解技术,才有比较好的竞争力。 **张鹏:****产品经理****也还是得把 ****AI**** 这件事多摸清楚点,以产品的能力去学习一下模型的技术,有能让模型变白盒的理解和探索能力。** ## **05 ****更好的模型,并不意味着 AI 应用更好做了** **张鹏:DeepSeek 的这一波冲击波之后,从秘塔的视角,有哪些****AI****应用上值得探索的新方向?** **闵可锐:**坦白来讲,我觉得现在还没有到形成非常明确的方向、逻辑的时间节点。 但相比原来可能巨头玩家把更好的基模掌握在自己手上,DeepSeek 开源更好的基座模型,一定程度上弱化了基座模型给偏应用层带来的影响,在模型层面把大家拉到了同一个起跑线的水位,但这并不意味着竞争会变得更小,反而可能会变得更激烈的状态。 在一个更好的推理模型基础上,确实有机会做出更惊艳的一些产品。谁能够贴近用户,把用户原来有但是未被满足的需求做得更好,率先把这样的产品方向、产品能力实现、释放出来让更多的人用,也会有机会更高效率地拿到更多的用户。 1 月 20 号 R1 发布以来,我们在内部已经测试过几轮(集成 DeepSeek 模型的功能)了,有一些我们原来想要去实现、但是不太成功、不值得对外释放的一些功能,看起来已经可以 ready 到给大家提供可使用、且好用的产品功能。我们很快会有一些新的功能上线,不会让大家等太久的。  _秘塔 AI 搜索,率先接入 DeepSeek-R1 模型升级产品能力。|截图来源:秘塔搜索_ **张鹏:为什么说有了更好的模型,并不意味着产品更好做了?** **闵可锐:**GPT-4 出来了以后,能做成应用的概率会显著更高吗?R1 出来以后比 GPT-4 更高吗?都不是。因为模型能力的提升,其实是拉高了所有人的基线。原来所有人只能做到 60 分的时候,你能做到 70 分,你的产品可能更受欢迎。但当所有人都被拉高到了 70 分的 baseline,你必须得做到 80 分。 所以这一代创业者做 AI 应用落地开发,要有一个心理预期,可能原来你做到的东西,现在能够直接被比如说 R1 的推理能力所覆盖掉,那你就要在这之上寻找新的可能性,才能成为被大家接受的产品。 **从做应用的角度来讲,更好的模型是不是代表了应用更好做一些?我们过去有在做产品研发、落地、模型上,可能有小十年的经验,我一直的感受是,大家在这件事情上的判断过于乐观。** **张鹏:方汉,你怎么看它对于 ****AI**** 产业站在全球视角比较确定接下来可能带来的影响、冲击和变化是什么?** **方汉:**大家都说大模型的下一场是 agent,但如果是多 agent 协作的情况,只要有一个 agent 拉胯,最后质量就很差。现在 **R1 保证了 agent 智能的下限比较高,很多以前完不成的、比较长、比较复杂的任务,有可能很快就会被解决。**比如 AI 编程,原来只能写单个函数,甚至只能写一个文件,现在有了 R1 这样特别强的模型,是不是可以直接把整个工程生成出来,而且交叉地修改、debug?这样就真正成为一些可用的生产力。 对于具体的产品,我觉得所有跟 agent 相关的新的产品模式会快速涌现,而且由于模型是开源的、成本还特别低,很多产品也开始看到了盈利的曙光,因为推理成本下降了,而且能力还上升了。 另外,R1 在数学跟编程任务上表现最好,因为数学和编程是人类用符号来固化思维的两个最显著的领域。相应地,还有科学,比如说像 AlphaFold 做的是蛋白质折叠预测。**我认为跟符号化形式相关的、数据比较强的领域,都会带来特别大的效率改善。** **张鹏:昆仑万维的产品线会更丰富,这里有没有一些比较具象的思考?经过年初这一波冲击之后,在****AI****应用上有什么新的启发?** **方汉:**DeepSeek 不是第一个开源的,但它是开源的模型里面质量最好、最接近 OpenAI 的水平的,这是它出圈的根本原因,这给 AI 应用带来一系列影响。 首先他把一个很高质量的模型的推理成本打低之后,给商业模式带来了更多的可能性,**免费类的 AI 应用会逐渐出现。** 第二,降低 AI 应用的门槛是关键。全球能够写好 prompt 人数不会超过 1000 万,所以怎么降低 AI 应用的门槛非常关键。举个例子,最近谷歌 NotebookLM 会爆火,就是因为它极大地降低了应用门槛,不用写 prompt,把 PDF 拖进去,按一个按钮就给你生成播客了。 第三,云计算时代,有一个词叫云原生,是指一些在云计算出现之后才涌现出的云原生公司,这些公司完全是轻资产,所有服务都跑在云上。我觉得 AI 时代的应用也会有类似变化,现在 AI 原生的产品经理其实还不多,大部分人都还在用互联网和移动互联网的思路来做 AI 应用。这是一个痛点,大家都还在摸索。但接下来,产品经理当老大的 AI 公司会越来越多,AI 原生的产品设计也会越来越多。 最后,很多公司现在做了效率类的 AI 应用,但是从互联网跟移动互联网的经验来看,效率产品的增速一定比不过娱乐产品,人类都是喜欢娱乐至死,而**娱乐产品其实并不一定需要特别强的 AGI,但是需要特别强的 AIGC,所以我认为娱乐产品的发展速度接下来会远远超过 ToB 的效率产品。** **张鹏:效率型的工具可能是人类的一部分需求,人类无尽的需求是娱乐,你觉得在娱乐这件事上 2025 年有什么样的东西值得看?在娱乐方面会出现足够让人兴奋的 killer APP 吗?** **方汉:****人类最喜欢、成本最低、门槛最低的娱乐方式是视频,我们认为视频生成领域一定会涌现出最大的 killer APP,只是不知道是传统的渠道为王、还是新的视频制作平台为王。** 大家都知道短视频席卷全球,短剧现在是第二波,也要开始席卷全球,现在就算短视频的成本很低,但是拍一部短剧也要 100 万人民币,所以现在中国每年只能产三四千部短剧。如果我们能够把单部短剧的成本达到 2000 块钱,那么全世界每年可能会有几百万部短剧的产出,这会对整个业界带来非常大的冲击。 打个比方,我没有学过音乐、也五音不全,现在用我们的音乐生成大模型,我可以做很多首歌。同时在成本上,举个例子,我们原来做游戏业务的时候,订购一首音乐平均 5 万块钱左右,现在音乐模型推理成本可能只有几分钱,这就是成本以及门槛的降低。 **当一个东西的生产门槛以及成本显著降低,AI 内容就会像抖音的短视频作者那样,因为手机摄像头和 4G 的出现,生产出大量短视频内容。**但我觉得 2025 年还可能还没有到时间点。现在的视频生成模型虽然已经非常强了,但是还没有到能够取代完整的影视产业链的地步。  _去年底,昆仑万维在美国上线 AI 短剧平台 SkyReels,在全球 AI 娱乐市场做出进一步探索。|来源:昆仑万维_ **张鹏:今年的视频生成领域还会像 2024 年一样快速迭代吗?** **方汉:**对。2023 年春晚已经有 AIGC 的视频出现了,但那时候还比较原始,现在比如字节最新发的 OmniHuman 视频质量就非常好了,大家都在飞速演进。 而且大家也不要迷信 OpenAI,Sora 已经被第三方的、闭源的、开源的模型迅速追上,也就是说 OpenAI 在图像生成和视频生成领域起了个大早,赶了个晚集,现在无论开源还是闭源,都有跟 Sora 比起来有很强的竞争力的视频生成模型。而且开源生成模型有更好的生态,对长尾需求的满足也会更好,最终基于此的商业模式也会最多。 **张鹏:你怎么看 chatbot(****聊天机器人****)这种类型的产品?娱乐陪伴型的 chatbot 是一种,****ChatGPT**** 也是一种 chatbot,这种类型的产品未来还会是一个标准形态吗?还是一个过渡形态,接下来要探索新的东西?** **方汉:**我认为它只是一个原始形态。就像最早 QQ 刚出来的时候,大家都是用键盘打字输入到 QQ 对话框,但是到微信出来的时候,我妈妈从来不给我打字,都是直接发语音,甚至一言不合就开视频。所以我认为现在的 chatbot 只是一个很早期的形态,像 GPT-4o 把多模态像语音、视频引入 chatbot,是自然的过程、逐渐演进的。 就像早期的互联网有一个产品叫 MUD(Multi-User Dialogue,多用户对话),从文字 MUD(文字冒险游戏)又衍生出来了两个重量级的娱乐游戏产品,一个是叫大话西游,一个是叫魔兽世界。我认为现在的 chatbot 演化的终极形态有可能是一个类似于元宇宙的、虚拟多媒体的交互形态。 **张鹏:可锐,你怎么看模型进展对 chatbot 这种形态的产品的影响?** **闵可锐:**不同生态位的公司,受到的影响可能不一样。 一年以前,整个大模型业内比较推崇的方式是模型和应用一起、产模一体结合起来把产品效果做好的思路,这样才能建立足够的壁垒。但 R1 其实对这种思路提出了很大的挑战。换句话说,后入局的玩家拿着可能同样好甚至更好的模型,是不是也能直接把起跑线追平,开始在上面做应用? 纯粹从应用层角度来讲,当下这个阶段是相对利好的状态,因为拿到了一个足够好的武器开始做同场竞技。 但**不论现在大家是看空还是看多,可能两个月以后又会产生巨大的反转,**所以我觉得子弹可能姑且得再飞一会儿才有结论。 **张鹏:变化太快,现在对于轨迹的预测不能超过两个月。现在看,原来那种产模一体的模式未必是必须的,也存在另外的可能性。吴翼从蚂蚁集团技术研究院****强化学习****实验室的角度,你们接下来的主要目标和探索的东西是什么?** **吴翼:**蚂蚁集团其实一直在做自己的基座模型,也在做推理模型,只是后者启动稍微慢一些。我们也是去年 11、 12 月份开始,和一部分同学在蚂蚁研究院成立了强化学习实验室,开始想做自己的推理模型,中间也踩了很多坑。 基本上是研究院新设了这么一个强化学习实验室,也希望能够在里面做相对比较自由、比较开放的强化学习研究工作,做出开源开放的推理模型,所以 DeepSeek 也是给大家开了一个好头,鼓舞想去做开源开放的技术和模型团队。 ## **06 ****开源能带来巨大收益,不是做公益** **张鹏:自这次 DeepSeek-R1 开源震撼全球以后,全球很多公司在开源上做了重新思考和选择。甚至 Sam Altman 在答网友问时表示了 OpenAI 站在了历史错误的一边,会重新思考 open 这件事。你觉得 OpenAI 会重新回到开源模型吗?** **吴翼:**我觉得他不会。 **张鹏:DeepSeek 的开源路线带来了哪些连锁反应?为什么会有这些影响?** **吴翼:**DeepSeek 开源产生的影响,对我感触特别大。我觉得最后最好的那个模型应该还是闭源,因为即使一个公司做出了最好的模型并开源,但在把它作为一个产品端去部署时,还可以做更适配、更极致的优化,成本可以更低,因为他知道这个模型是怎么做的,所以一定会有一个内部适配、更好的版本。 但是即使这个开源模型会比闭源版本稍微差一点,但 DeepSeek 也已经带来了巨大的冲击。 **传统大家选择开源的逻辑是:如果我是行业第一,我不开源;行业第二我也不开源;行业第三我一定要开源,因为不开源我就死了,同时我要开源让你们前两名不好过**(哈哈)。大模型最早的开源 credit(名誉)是 Meta 的 Llama,当时 Meta CEO 扎克伯格和首席 AI 科学家 Yann LeCun 讲,某种程度上,你们是站在我们的肩膀上。但是如果仔细去想 Meta 全家桶本来的巨大流量后,它其实没有做太多后续动作,它的所有目标好像在说「我不能让垄断发生」,我是老三,所以我一定要开源,让你们不好过,但他自己没有因为这件事带来太多受益,或者只是股价上升了。 但 DeepSeek 开源不一样。这件事带来的最大的冲击是,过去从来没有人觉得开源能带来特别好的商业模式,或者带来特别大的商业收益。现在大家在重新考虑这件事。 DeepSeek-R1 开源以来,首先 App 的 DAU 在十几天之内达到了几千万;同时,这件事情带来了巨大的品牌效益,你会觉得,原来做开源不是为爱发电,就是为了「搞死」前两名;开源原来能带来这么重大的收益。所以**在 AI 领域,如果你真的开源了一个非常好的模型,最后是有收益的。我感觉历史上从来没有这么大范围的出现过这件事情。这件事情也会对整个社区、生态以及 AI 发展的速度带来好处,因为 AI 再次加速了。** 这也是为什么我还看好英伟达的原因,为了速度。英伟达的芯片能让你拿到这个(开源)模型之后,可能一个月就会迭代一版模型;但如果用国内的卡,迭代会慢比如半个月。之前我做过一段时间国产卡的训练,发现如果用英伟达的卡可能只花一个月,但如果给我国产卡,同样的事情可能要花 3 个月的时间,或者说国产的算力我需要时间做适配。所以这是时间的差别,你愿不愿意在一个 AI 高速发展的时代里牺牲你的时间?**如果 AI 还在高速发展,那我觉得英伟达就不可替代。但是如果一旦 AI 的速度放缓了,那就有问题。**所以我觉得 DeepSeek 开源也带来了更高烈度的竞争,2025 年会是很刺激的一年,因为 AI 发展速度会更快。 **张鹏:在 AI 领域,开源跟闭源可能会同时存在,尤其当下阶段,这件事是好事,站在人类视角看,DeepSeek 开源反而是对整个通向 AGI 的发展,AI 在加速。** **把它定义为 Sputnik Moment(1957 年,苏联成功发射了人类第一颗人造卫星「斯普特尼克一号」,使得美国意识到自己在航天等关键技术领域的落后,并大力投入航天事业)其实是冷战思维,比较恰当的类比是 Mozilla Moment(1998 年,网景公司将其浏览器网景 Communicator 源码开源,激发了全球开发者的热情,推动了浏览器技术的快速发展),从而加速****AI****平权,激发了更多创新的力量。** ## **07 ****DeepSeek 冲击波下,英伟达还好吗?** **张鹏:R1,包括 V3 在保证模型效果的情况下,实现成本相对比较低。这是为什么?** **吴翼:**V3 披露的 560 万美金是指它单次模型训练的成本,不包括前面研发等成本。根据 V3 的成本,我们大概测算 R1 成本依然很低,比 V3 成本再低一些。 **但就是如果你觉得,有 560 万美金就可以做 R1 了,那你最好先把这个数字前面乘个系数再来想这个事。** 你要做 R1,你先得做 V3,之前还得做 R1-Lite,R1-Lite 之前得先做 V2,这些东西都花钱,不只是最后那一次成功了的成本。如果再考虑整个研发、实验可能会失败、调整等全部成本,你需要乘一个系数。 **当然 DeepSeek 整体比较高效率,系数可能会小一点,如果是大公司这个乘的系数可能会大一些。核心是因为 DeepSeek 快。**同样的训练量和同样的数据,如果放在一个基建比较普通的团队里,哪怕知道怎么做,可能也要再乘几倍的成本,因为训练得慢。DeepSeek 在过去很长一段时间里面做了非常非常多系统上的优化。不只是比如 MLA、MTP 就能解决的,而是可能有一系列很长时间的工程优化累积起来,每天减少 5%、减少 10% 的时间耗损,这里一个优化、那里一个优化,把一个可能本来要 2000 万美金的训练,压到了最后是 560 万美金的结果。 所以**这件事情是一个常年累积、很重视基础设施的结果,**有了这个基础,之后做实验、做新的模型也会更快,是一个非常相辅相成的过程。所以还得说 DeepSeek 是非常让人敬佩的团队,在基础设施上也做了很多很多工作。 **方汉:**由于美国的禁运,我们能够得到的算力资源是有限的。这样会倒逼所有中国团队在软件优化上倾注比美国同行更多的精力。像 DeepSeek 团队做的那样,比如实现了 FP8 混合精度的训练,压缩显存占用来让训练速度更快。在训练加速上,他们做出了卓越的努力,也获得了丰厚的回报,这不是只在 R1 里才有体现,之前训练 V2 也已经展现出这个实力。 **张鹏:我再追问一下,DeepSeek-R1 出来之后,紧接着英伟达来了个近年来最大跌幅,有了更高效率训练出来的模型,大家对英伟达的预期怎么样?**  _DeepSeek-R1 发布后,美国科技股大跌。|图片来源:视觉中国_ **方汉:**我的观点是,**对英伟达来说,短期利空、中期利好、长期利空。** 尽管 OpenAI 和软银的「星际之门」号称要投资 400 亿美金,买的都是英伟达的训练卡,但是 DeepSeek 现在把训练成本打下去之后,美国人也不能自己花 100 亿美金,来训练中国人只要花 10 亿美金的任务。之前一路高涨的股价,是因为所有投资者都是赌他的训练卡,所以我觉得短期利空英伟达。 中期利好是什么原因呢?如果仔细看 DeepSeek 的技术报告,他们的所有的推理优化都是基于英伟达的 CUDA 平台,比他们更懂英伟达 CUDA 平台的也没有几家。一旦 DeepSeek 把特别好的模型的推理成本打下来之后,模型就更容易商品化,之后整个市场规模会变大。所以英伟达的推理卡在中期一定会卖得非常好。 长期利空是当大模型开始固化下来,英伟达推理卡的壁垒就保不住了,第三方厂商的机会就开始来了。像美国有家叫 Groq 的公司,中国最近也有数十家芯片公司宣布支持 DeepSeek 模型部署。 **张鹏:这件事是不是证明了,没那么多钱和卡也能创新?** **闵可锐:**大家好像总把 DeepSeek 和它几百万美金的训练成本去做关联,好像在定义,他们是钱和卡都很少的一个团队。**但其实,尤其在中国的范围来讲,DeepSeek 难道不就是已经是最有钱、最有卡的第一梯队的 player?**比起我们可能这段时间为了承接 R1 的用户量,到处去借了几百张卡来提供服务来讲,DeepSeek 其实已经比我们多了可能两个数量级以上的资源。 我觉得资源在基座模型及其产品上,仍然是非常重要的。哪怕事实上你的模型训练效率是 OpenAI 的 10 倍,但是你也没有它 1/ 10 的资源,体现不出来你 10 倍效率的提升。因为绝大多数用户都是根据产品体验用脚投票,不管你是用多少资源做出来的这个结果,我觉得好用就用,不好用就不用。 其次我觉得,基座模型层面的竞争是三个维度的综合竞争结果,**除了计算资源,还有你的人才密度,以及第三个维度,可能也是比较容易被忽视的——1 号位在这件事上的能力和决心。**DeepSeek 在与国内第一梯队玩家接近的资源下,有中国最好的人才密度和 1 号位对这件事的纯粹的决心。 ## **08 ****关于 DeepSeek,What’s Next?** **张鹏:如果你是梁文峰,你觉得 DeepSeek 接下来下一步的重心会是什么?** **方汉:**我觉得 DeepSeek 是一个非常轻商业化的公司,完全是靠技术力破圈,而不是靠推广破圈。很多人愿意跟着梁文峰总干的一个原因是因为他纯粹,到现在他还在手敲代码。我觉得一个公司的 CEO 还在手敲代码的时候,这个公司一定是一个非常技术向的公司。 **他们的服务器扛不住这件事情,他肯定会花心思去解决,但是至于流量能不能接得住?我个人觉得不是他关心的重点。而且只要 DeepSeek 的技术继续迭代,还会有泼天的流量,这也不是个问题。** 当务之急肯定还是怎么样招更好的、志同道合的人进到他的团队,继续快速迭代,因为从 V2 出的 MLA、MTP,再到 R1 的 GRPO 出的 Dualpipe,你可以看到里面别出心裁的技术革新层出不穷,说明他们是一支非常有战斗力的团队,人才密度很高。只要他继续保持人才密度,不盲目扩张,还会继续在 AGI 的道路上带来更多惊喜。 **闵可锐:**对,我觉得确实是看 DeepSeek 做这件事的初心。 **做 AGI 首先可能得不差钱,其次是一个偏执狂,如果想靠 AGI 来挣钱,多半会既挣不了钱也做不好 AGI,**因为这个路径其实并没有那么清晰,尤其是怎么靠 AGI 来挣钱这件事儿。 所以如果 DeepSeek 如果能守住初心,可能能够持续给大家带来惊喜。因为本质上,是两拨顶尖人才比如 OpenAI 团队和 DeepSeek 团队的 PK。这个时候,犯错的容忍程度可能很低,但凡分心去考虑比如我是不是要做一个最好的 APP?一定会占用你的决策时间和精力。  _图片来源:视觉中国_ **张鹏:你觉得他接下来这个产品节奏怎么样?到底会用多快的速度发哪个版本的什么?** **吴翼:**如果站在这个时间点,**当你有了一个 o1 的技术之后,其实是有一个特别大的分叉点,是先去做 o3 还是去做 agent?** 这两件事情都挺重资源,但是从智能的角度看,是有 90 度夹角的。到底是沿着纯文字的推理走到极致,从 o1 追求到 o3?还是去做一个 agent,那它需要有视觉理解能力的闭环,做出一些 action 后,还要有新的视频输入,要去做一些 function call 写代码调接口的能力。 就像 OpenAI 最近发了一个 Operator 模型,是一个 agent 模型。agent 其实是强化学习 scaling world 的一个很重要的分支,有了这套强化学习体系之后,你可以用强化学习的方式去训练一个多模态的模型,让它可以操作软件,操作手机,做很多模态的控制,像一个真实的人一样做事,但从智能的角度上是没有提升的。智能还是得奔着 o3 去,再做 scale up。 两件事都很难,所以我会特别好奇,DeepSeek 会怎么选?当然也可以都要。如果让我选,我会先追求 o3 极致的智能,因为做了 o3 也可以再回头做 agent。 **方汉:**我认为 DeepSeek 接下来首先是泛化数据,现在的数据主要是编程跟数学,要把数据泛化到理科、文科,OpenAI 原来是雇数学博士,现在据说开始雇生物博士去构造数据。我觉得现在 DeepSeek 有了更好的资源也一定会在构造数据上做出更多的探索。 第二,它也会泛化训练方法到多模态以及不同的领域。今天看到香港中文大学的一篇论文,已经有人把 o1 的训练方法泛化到图像生成上了,所以我觉得这两个方向应该都有很大的空间可以挖。 **张鹏:某种程度上很多人都看到所谓叫泼天的流量,但其实未必跟他站在同样的视角,他可能看到的是服务器压力很大,下一个模型还要再超越,更新的速度还要更快,开源的持续价值交付……在这个世界打开一扇门的时候,我要能够探索一个更大的天地,这里反而需要花更多的时间聚焦在技术上。怎么在不商业化的情况下把这事做好,反而是更难的挑战。**
 ## 马斯克称 Grok 3 将于 2 月 18 日发布 2 月 16 日消息,马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(北京时间 2 月 18 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。 马斯克还称,「整个周末都会和团队一起磨练产品,所以在那之前都离线。」 据马斯克此前透露,Grok 3 有非常强大的推理能力,在测试中,Grok 3 的表现「优于市面上任何已知产品」。(来源:IT 之家)  ## OpenAI 首席执行官宣布 GPT 4o 升智至 o3 pro 水平 2 月 16 日消息,OpenAI 首席执行官 Sam Altman 宣布,GPT 4o 的智力水平将提升至 o3 pro 级别,并且他认为更新后的 GPT 4o 是目前最佳的 AI 搜索产品。 Sam Altman 表示,GPT 4o 作为 OpenAI 的最新一代自然语言处理模型,不仅在理解和生成语言方面的能力得到了显著提升,其智力水平也达到了新的高度。他透露,GPT 4o 的智力将提升至 o3 pro 水平,这标志着该模型在智能化和搜索准确性方面迈出了重要一步。 Sam Altman 认为,GPT 4o 的推出将为用户带来更加智能化、便捷化的搜索体验,成为最佳的 AI 搜索产品。(来源:环球网科技) ## 博通与台积电在探讨拆分英特尔的交易 据报道,博通(Broadcom)和台积电(Taiwan Semiconductor Manufacturing Company,TSMC)正在分别研究收购英特尔部分业务的交易。 据悉,博通正在考虑收购英特尔的芯片设计与营销业务,且希望能有合作伙伴接手英特尔的制造业务。而台积电则在考虑掌控英特尔部分或全部的芯片工厂,有可能是以投资者财团成员的身份参与。 报道称,目前所有讨论都还处于初步阶段,尚未向英特尔提交任何方案。显然,台积电是在特朗普总统政府的鼓励下探讨这一交易的,不过一位白宫官员表示,政府不太可能支持由外国实体控制英特尔工厂的安排。(来源:环球市场播报)  ## 微信回应「接入 DeepSeek R1」:灰度测试中,用户可免费使用 2 月 16 日上午消息,有媒体称微信正在小范围灰测接入 DeepSeek R1。部分用户已经内测到了相关 AI 搜索功能。其 AI 搜索提供快速回答和深度思考两项功能。  对此,腾讯官方表示:微信搜一搜在调用混元大模型丰富 AI 搜索的同时,近日正式灰度测试接入 DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到「AI 搜索」字样,点击进入后,可免费使用 DeepSeek-R1 满血版模型,获得更多元化的搜索体验。腾讯多个产品正在探索接入 DeepSeek,如腾讯云 AI 代码助手、腾讯元宝等,为用户提供更丰富的体验和服务。(来源:新浪科技) ## 百度搜索宣布将全面接入 DeepSeek 及文心大模型深度搜索功能 2 月 16 日晚间消息,百度搜索和文心智能体平台宣布将全面接入 DeepSeek 和文心大模型最新的深度搜索功能。搜索用户可免费使用 DeepSeek 和文心大模型深度搜索功能,文心智能体平台的开发者也将能随时调用 DeepSeek 模型创建并调优智能体。 据悉,文心大模型深度搜索功能于 2 月 13 日上线,具备更强大的思考规划和工具调用能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。(来源:新浪科技) ## 小米 SU7「断轴」事件车主:出事故后才喝了酒,决定自费维修 2 月 16 日消息,春节期间,一段小米 SU7 的事故视频被众网友争相转发,画面内容显示,当天车辆先是撞到了路肩,随后出现爆胎、轮毂变形等情况。谈及本起事故,车主方面表示当天是在「乡村烂路」的正常行驶途中,因过坑而导致后轮爆胎、车辆下摆臂折断。 2 月 9 日,小米官方回应了本起事故,「针对社交平台上流传的小米汽车相关谣言,我们郑重澄清,经查完全不存在所谓断轴情况」,并公布了事件详细信息。 官方回应显示,在 2025 年 1 月 30 日 10 点 56 分,驾驶员以约 70km/h 速度驶过了淮安盱眙一乡村公路(该路段具有限速 20km/h 标识),进而在来到某破损 / 坑洼路段时,车身因上述不恰当驾驶行为冲击凹坑边缘,导致轮毂、悬架、右后侧轮胎等部位受损。(来源:TechWeb) ## 雷军、刘德华成受害者!央视揭露 AI 合成名人音视频乱象 从恶搞企业家雷军到 AI 制作张文宏医生音视频为自己带货,甚至还有不法分子利用 AI 深度合成视频,进行诈骗。过去一年,AI 深度合成音视频侵权现象愈演愈烈。 此前就曾有网友利用 AI 制作的刘德华声音,为自己博取流量,刘德华电影公司还紧急发布声明提醒网民,不要落入伪造刘德华声音的 AI 语音合成技术骗局。近日记者调查发现,实现 AI 深度合成音视频并不算难事,甚至在一些购物平台,AI 深度合成技术已经成为众多网店牟利的工具,只需花费几十元,就可定制 AI 深度合成名人音视频。(来源:广州日报)  ## OPPO Find N5 折叠屏手机首发「山海通信增强芯片」,16GB + 1TB 支持卫星通信 2 月 16 日消息,OPPO Find N5 折叠屏手机将于 2 月 20 日发布,官方今日预热,新机将全球首发 OPPO 的「山海通信增强芯片」。  据了解,海报最下方小字提到,仅 OPPO Find N5 16GB + 1TB(卫星通信版)搭载自研山海通信增强芯片,卫星通信功能仅支持开通天通卫星业务的中国电信卡使用。 OPPO Find N5 折叠屏新机目前已公布三款配色,号称「全球最薄的折叠旗舰」,采用「钛合金天穹铰链」。外屏采用「晶盾超瓷晶玻璃」,后盖采用「超薄天穹纤维」,并配备钛合金外转轴中框。OPPO 官方表示,Find N5 折叠屏手机的折痕深度控制在 0.15mm 以下,宽度控制在 20mm 以内,折痕角度小于 2.5°。(来源:IT 之家) ## 石头 G30 Space 自清洁扫拖机器人预售:搭「行业首创五轴折叠仿生机械手」,6499 元起 2 月 16 日消息,石头旗下 G30 Space 探索版扫地机器人现已在京东开启预售。 G30 space 最重要升级是集成了可折叠机械臂,在不增加整机厚度 (7.98 厘米) 的情况下,可移除轻量障碍物 (如拖鞋) 并支持移动障碍物后的清扫。与此前的旗舰产品 G20S Ultra 相比,G30 系列还升级了吸力、热水清洁和避障等其他功能。  该款产品解决了以往扫地机器人在清扫过程中遇到袜子、数据线和大纸团等障碍物时需要绕开、形成清洁盲区的痛点,提升了清洁能力,进一步增加了使用场景。 如果说过去的扫地机器人只能做 2D 地面清洁,此次机械手发布,让扫地机器人有了从 2D 清洁走向 3D 空间清洁的可能性。(来源:IT 之家)  ## Nature:全球博士生数量锐减,钱少、事多、前途迷茫 过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。 「这表明我们需要改革(博士生的)工作条件,并考虑多样化的职业选择——否则,我们将面临人才流失的风险,最终将拖慢科学进步的步伐。」,他说。 2023 年,澳大利亚大学和澳大利亚研究生院理事会(ACGR)发布的最新数据显示(截至 2023 年 1 月),尽管该国人口同期增长超过 7%,但 2018 年至 2023 年间,澳大利亚国内博士生入学人数却减少了 8%。(来源:新智元)
 ## 传微信正内测接入 DeepSeek-R1 大模型  据报道,微信正在灰测接入 DeepSeek R1,部分用户已经内测到了相关 AI 搜索功能。APPSO 表示已确认了该消息。 页面显示,AI 搜索提供了快速回答和深度思考两项功能。其中深度思考功能由 DeepSeek-R1 模型经过长思考而提供的更全面的回答,点开同样显示思考过程。 消息源既包括公众号推文,也包括网页信息,并且页面最下方还支持继续提问。 不过,目前该功能找不到历史问答,以及无法连续问答。该功能目前处于灰度测试阶段。(来源:APPSO)  ## 字节梁汝波:今年的目标是追求智能上限 2 月 13 日上午,字节跳动内部举办新一期全员会,CEO 梁汝波在会上提出了 2025 年针对 AI 业务的重点目标,包括:追求「智能」上限、探索新的交互和加强规模效应,即: 相比追求某个具体产品,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点;新的交互应该是会更可穿戴、更便携、更自然的,去年上线的 Ola Friend 耳机只是初步尝试。 谈到最近爆火的 DeepSeek,梁汝波表示,去年 9 月 OpenAI 发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但没有特别觉得一定要马上复现,觉得早 1 个月晚 1 个月差别不大。「如果一开始重大问题就争先,我们有机会更早实现。」 针对电商业务,梁汝波表示,今年抖音电商有三个目标,即增加用户覆盖、增加直播电商规模和增加搜索产生的 GMV(交易总额)。2024 年,抖音电商 GMV 约为 3.5 万亿元,同比增幅超过 30%。其中,上半年抖音电商的 GMV 未达预期。下半年,在多个头部主播出现「塌房」、其他头部参与大促热情降低的情况下,仍然通过货架场景以及店播(商家自播)的超预期表现,弥补 GMV 目标的缺口。(来源:澎湃新闻) ## 传强化学习或成月之暗面的重点方向 据虎嗅报道,月之暗面内部已经将「持续拿到 SOTA 结果」确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。 报道分析称,DeepSeek 爆火后,DeepSeek 与月之暗面存在的路线差异,让外界面临重新审视月之暗面技术模式、用户增长模式的情况。业内人士认为,月之暗面如果想守住生态位,「需要做一些改变或者尝试,比如开源,比如调整引流策略等。」不过目前,月之暗面尚未明确是否「接入」DeepSeek,对于接下来是否「开源」,公司也未置评媒体问询。 对于月之暗面是否会因 DeepSeek 而调整工作重心一事,截止发稿暂无回应。不过有内部人士透露称,「RL(强化学习)大概率会是一个(工作重点)方向」。(来源:新浪科技) ## Meta 希望成为人形机器人领域的安卓 据彭博社报道,Meta 正在其硬件部门内成立了一个新团队,专注于 AI 人形机器人的研发。该团队将由 Marc Whitten 领导,计划在今年招聘约 100 名工程师。Whitten 此前曾担任通用汽车公司 Cruise 自动驾驶汽车部门的首席执行官。他还曾是游戏公司 Unity Software 和亚马逊的高管。 据报道,Meta 的人形机器人计划初期将聚焦于家务助理领域,旨在开发能够执行家庭日常任务的智能机器人。长远目标则更为宏大:打造一个包含 AI、传感器和软件在内的完整生态系统。 不过,Meta 短期内并不计划推出自有品牌的机器人。而是希望给机器人市场做一些基础性的支持,就像谷歌的 Android 操作系统和高通芯片对手机行业那样重要。一位知情人士表示,公司目标是使 Meta 的 Llama 软件成为全球机器人研究人员的基础。(来源:华尔街见闻) ## OpenAI董事会正式拒绝马斯克收购提议 当地时间 2 月 14 日,OpenAI 董事会正式拒绝了马斯克和其牵头的投资者提出的以 974 亿美元收购该公司资产的提议。 OpenAI 在一封致马斯克律师的信中表示,OpenAI 董事会认为这项收购提议不能代表公司的最佳利益,因此予以拒绝。「OpenAI 是非卖品,董事会一致否决了马斯克先生破坏竞争的最新企图。OpenAI 的任何潜在重组都将加强我们的非营利组织及其使命,以确保 AGI 造福全人类。」(来源:财联社)  ## 比亚迪:2027 年启动全固态电池示范上车,未来有望固液同价 2 月 15 日,深圳市比亚迪锂电池有限公司 CTO 孙华军在第二届中国全固态电池创新发展高峰论坛上透露,比亚迪将在 2027 年左右启动全固态电池批量示范装车应用,2030 年后实现大规模上车。 孙华军同时表示:从长期的发展的角度看,规模化之后,固液电池可以接近于同价,液态的三元电池跟固态的三元电池,理论上是可以做到固液同价的。(来源:每日经济新闻、财联社) ## 美国作家称生下马斯克的第 13 个孩子 当地时间 2 月 13 日晚,美国 31 岁的女作家艾希莉·圣克莱尔在 X 上发帖称:「五个月前,我迎来了一个新生儿。埃隆·马斯克是孩子的父亲。」这段声明的标题是拉丁文「Alea lacta est」,意思是「木已成舟」。 她写道:「为了保护孩子的隐私和安全,我之前没有透露过这件事,但最近几天,很明显,小报媒体有意这样做,不管这会造成什么伤害。我想让我们的孩子在一个正常、安全的环境中成长。因此,我要求媒体尊重我们孩子的隐私,不要进行侵犯性的报道。」 截至目前,马斯克尚未对圣克莱尔的声明作出任何回应。如果得到证实,这个孩子将是马斯克与四个不同的女人生下的第 13 个孩子。(来源:新浪财经) ## 英伟达投资信息助力,文远知行股价暴涨一度熔断 美东时间 2 月 14 日,英伟达持仓的文远知行飙升 83.46%,盘中一度熔断。 根据英伟达 2025 年 2 月 14 日披露的 SEC 13F 文件数据显示,英伟达在 2024 年第四季度持有文远知行 174 万股,持仓市值 2465 万美元。据《科创板日报》记者独家获悉,该 174 万股并非新买入,而是英伟达在 2017 年对文远知行的早期战略投资。(来源:财联社)  ## 大众全新电动 SUV ID.2X 将于 9 月发布  近日,大众首席执行官 Thomas Schäfer 在其 LinkedIn 发布动态,宣布将于 2025 年 9 月在 IAA Mobility 上发布电动 T-Cross,并将其命名为 ID.2X。 根据此前公布的信息,ID.2X 其外观设计与 ID.2 相似,但尺寸略大。这款车型将作为电动版 T-Cross 推出,基于入门级 MEB 平台打造,提供两种电池选择,续航里程可达 450 公里。 ID.2X 基于与 ID.2 相同的入门级 MEB 平台打造,采用单电机前轮驱动,提供 38 千瓦时和 58 千瓦时两种电池选择,WLTP 续航里程最高可达 450 公里,预计起售价约为 2.5 万英镑,略高于 ID.2 的 2.2 万英镑。 内饰方面,新车将配备 12.9 英寸信息娱乐屏幕和 10.9 英寸驾驶员显示屏,并提供多种驾驶模式选择,包括「经典」和「复古」模式,致敬经典车型甲壳虫和高尔夫。(来源:IT 之家) ## ChatGPT 有望推出全局记忆功能  继谷歌 Gemini 上线「全局记忆」功能之后,OpenAI 也在增强 ChatGPT 的记忆功能,内部代号为「Moonshine」。该功能内部称为「Moonshine」(月光),将支持用户回忆过去的对话,从而扩展 ChatGPT 的 RAG(检索增强生成)范围。除了记忆改进之外,OpenAI 还引入了一个新的设置选项,允许用户启用或禁用后续建议。 目前,仅 Pro 用户可用的「Deep Search」功能,未来有望向 Plus 用户开放,每月提供 10 次使用机会,免费用户也可能获得 1-2 次的使用权限。(来源:IT 之家)  ## 奥斯卡评委喊话饺子导演:希望《哪吒 2》角逐奥斯卡奖 据 CCTV 国际时讯报道,《哪吒 2》(《哪吒之魔童闹海》)2 月 14 日在美国上映,一票难求。在影城洛杉矶,两位奥斯卡评委前来观影。观影之后的她们在接受央视记者刘骁骞采访时,不但热情输出了对吒儿的喜爱,还喊话饺子导演,希望《哪吒 2》可以角逐奥斯卡奖。 奥斯卡奖评委、美国南加州大学动画研究与实践项目主任希拉・索菲安表示,《哪吒 2》在制作设计音效音乐等方面更上一层楼,故事情节复杂曲折。此外,她补充道:「我相信肯定有一些细节是我没有完全理解的,电影的主题是普世的能够引起共鸣。」 索菲安还喊话饺子导演:「恭喜您,您在电影中体现出的超强专业性,我非常期待您的下一部作品。这部电影在奥斯卡奖参赛作品中将非常有竞争力,我非常期待《哪吒 2》可以角逐 2025 年的奥斯卡奖,这样我将有机会为您投票。」 另一位奥斯卡奖评委艾伦・埃拉索夫则表示:「我认为中国人,尤其是中国电影人,都应该为此感到自豪。」(来源:IT 之家)
微信自推出以来,十余年一直以创始人张小龙的「克制」而闻名,不会为了「追风口」而改变微信本身。甚至你如今刷朋友圈的体验,都与十年前朋友圈刚刚诞生时没有本质的区别。 「张小龙觉得对这个功能自己最满意的地方之一,就是一经发布几乎没有改进余地而稳定运行了十年。」极客公园创始人张鹏在与张小龙对话后,这样总结微信的产品逻辑。这一点在微信成为真正意义上的「国民社交 App」之后,也没有发生改变。 而这一点在 DeepSeek R1 发布后,就像一层面具一样,被微信团队自己猛然撕下:北京时间 2 月 15 日晚间,陆续有用户发现,在自己的微信搜索中,出现了整合了 DeepSeek R1 的「AI 搜索」功能——此时距离在 1 月 20 日 DeepSeek 正式发布并开源 R1,还不到一个月时间。  在微信搜索界面中,就能看到 AI 搜索按钮 | 图片来源:极客公园 对于收到本次更新的用户,在微信主页顶部的搜索栏中点进去,就能在搜索记录下方看到一个「AI 搜索」的按钮,点击进去,其中就能看到这个功能提供的两个回答模型能力选项。第一个名为「快速回答」,第二个就是由开源的 DeepSeek R1 驱动的「深度思考」模式。  共有两个模型选项,其中第二个才是由 DeepSeek R1 驱动的版本 | 图片来源:极客公园 值得一提的是,虽然本次为只有部分用户收到的灰度更新,但从推送范围以及收到的更新的用户分布广度来看,本次更新的推送速度相比近期微信的 Callkit 等同样经历过灰度的功能更新,推广速度要快许多。从最早的爆料出现,到首批收到推送的用户大规模出现,仅用了不到六个小时。彻底颠覆了过去数年微信功能更新给人「保守」的印象。 本次更新并不绑定软件本身的版本号,因此无需你从 App Store 或其他应用商店更新微信版本,笔者自己则是在手动清除掉手机的微信后台、重新启动后,就发现了这个入口。 换言之,如果你手机上的微信当前还没有收到这个更新,也不用太着急——你微信中的 DeepSeek R1 入口其实已经隐藏在代码之中,测试资格或许马上就到。 从功能附带的开源与鸣谢声明能看出,微信中内置的 DeepSeek R1 基于开源版本构建而来,但其中并未明确提及其使用的模型体积,是否是 671B 的「满血」R1 版本。  微信「AI 搜索」功能的开源声明页 | 图片来源:极客公园 众所周知,包括公众号/视频号在内的微信内容生态长期以来一直是独立于各大搜索引擎的一个「孤岛」,这个情况在 ChatGPT4o 等联网语言模式问世之后也没有得到相关的改善,因此测试上微信内置的 R1,我最兴奋的就是它是不是终于可以,在微信内容平台的海洋中,使用大模型的能力自由翱翔了? 很遗憾,在目前的实际的测试中,答案是否定的。 例如,我尝试了将公众号的微信推文链接喂给它,它也无法检索微信平台中的相关信息,只能根据链接中相关的字段在微信公众平台之外的互联网上搜索相关的内容,甚至有些时候它都无法识别到这是一篇来自微信公众号文章的链接。  当前版本的 AI 搜索,还不能识别微信内容的链接 | 图片来源:极客公园 在其他涉及到微信公众号相关的问题中,虽然 AI 搜索能够依据文章搜索以及 R1 的推理能力给出相对准确的回复,但其内容的来源更接近微信公众号在其他平台分发得出的结果,而非对微信内容平台自身结果的引用。  针对微信平台内容的回答,更多是基于互联网现有内容整合而来 | 图片来源:极客公园 目前来看,微信内置的 R1 并未针对微信平台内的内容进行检索增强生成(RAG),对输出结果进行优化。 这既是当前阶段内测版本微信 AI 搜索的明显短板,也是短期内微信整合 AI 功能显而易见的重要更新方向之一。 总体体验来讲,目前的微信 AI 搜索体验也非常轻量级。不仅不支持连续对话,也不支持上传各种文件内容辅助提问与搜索,甚至在你退出聊天界面后,当前的对话记忆内容也会被直接销毁,不支持保留。 作为「国民应用」的微信,在 DeepSeek R1 正式发布并开源的不到一个月时间内,就在应用内整合了入口,这无疑是一件让人振奋的事。 之所以让人振奋,是因为微信在做的事,只有少数厂商能做到。 在对话生成式模型拥有手机端 App 之后,抢占智能手机桌面的入口,已经是包括 ChatGPT、Perplexity 等很多 AI 应用在做的事情,通过设置其成为默认语音助理的方式,将「入口控制权」尽可能从手机品牌那里抢夺。 但对于微信这样相对封闭的平台来讲,能依托微信现有的庞大中文内容生态,做并且能做好这件事的,目前看来似乎只有微信团队自己。 从「极端保守」到如今成为了率先加入 DeepSeek 的聊天应用。这样的明显的改变,只有一种合理解释:微信团队认识到了 DeepSeek R1 所代表的推理模型在微信平台中应用的巨大潜力,并决定快速下场,来成为这场改变浪潮的主导者,确保微信的使用体验不落于其他竞争者。 这已经不是微信团队第一次在 AI 大模型领域出手,微信输入法曾在去年六月加入「一键 AI 问答」功能,用于让用户在微信输入法内实现语言大模型的内容回答。 但彼时这个功能是基于腾讯自家的混元 AI 大模型实现,并不能充当文本生成工具。  微信输入法中现有的「问 AI」功能 | 图片来源:极客公园 从体验上来讲,微信输入法适合各种聊天中的「灵光一现」问题,微信本体的 AI 搜索,有很大可能将会聚焦在微信现有内容生态内,借助用户聊天内容以及微信公众号等平台,深度挖掘其中的应用场景。 这样的「分布式」的 AI 能力体验,倒是与 Apple Intelligence 的产品思路有异曲同工之妙:在去年苹果发布的 Apple Intelligence 能力中,苹果并没有颠覆性的拿出另一个能力震惊世界的模型,而是选择借助 ChatGPT 这样现有的模型,将模型能力嵌入在包括笔记、照片以及输入法等手机生态的各个角落。  苹果 Apple Intelligence「散落」在各个应用中的 AI 能力 | 图片来源:极客公园 表面上,Apple Intelligence 似乎不如同期 Google、OPPO 这样同样在发力手机 AI 应用的厂商来的更加聪慧,但苹果实际上在做的,却让 AI 尽可能「悄无声息」地加入用户生活,并借助能力给用户更多的使用场景带来改变。 从这一点上来看,虽然没有手机操作系统的腾讯,在移动互联网时代错失了最重要的入口之一,但微信作为如今重要的沟通平台,却成为了「让 AI 真正普及」过程中不可或缺的重要一环。 在中国,上至百岁老人、下至刚刚学会用智能手机的孩童,都已经对微信有了最基础的使用概念,这些功能中,同样也是最适合 AI 能力去进一步做「润滑」、降低 AI 学习成本的关键所在。 对于已经走过爆发点的生成式 AI 来讲,如今通过探索 AI 应用的普及,从而让 AI 能力在更多用户的长期使用中「产生质变」,才是微信 AI 真正值得我们期待的未来。 甚至当下我们就已经可以下定论:微信中的 AI 能力,或许不会是最让人兴奋的那个,但它却有最大的机会真正去「改变世界」。
 ## 苹果 iPhone 17 Pro 渲染图曝光:全新「相机条」设计 2 月 14 日消息,YouTube 频道 Front Page Tech 今天(2 月 14 日)更新上线新视频,主播 Jon Prosser 基于其信源,制作分享了苹果 iPhone 17 Pro 手机的渲染图。  渲染图显示,iPhone 17 Pro 并非之前传闻的方形凸起,而是采用全新的「相机条」设计。「相机条」比之前的渲染图中显示的更长,三个摄像头位于左侧,LED 闪光灯、麦克风和 LiDAR 传感器位于右侧。之前的爆料曾暗示三个摄像头将水平排列,但 Prosser 称实际排列方式与当前 iPhone 相同。 Prosser 还澄清了关于「两种颜色撞色」外观的误解,iPhone 17 Pro 背面仍将采用单一颜色,但「相机条」部分颜色会更深。附上相关图片如下:   ## Meta 雷朋联名智能眼镜销量超 200 万副,制造商 Essilor Luxottica 声称明年底前实现「年产千万」 2 月 15 日消息,据外媒 UploadVR 报道,Meta 雷朋联名智能眼镜的制造商 Essilor Luxottica (依视路陆逊梯卡) 声称该公司现已销售出 200 万副相应联名智能眼镜,并计划到 2026 年(明年)底每年生产 1000 万副 Meta 眼镜。 据悉,Essilor Luxottica 首席执行官兼董事会主席弗朗切斯科・米莱里(Francesco Milleri)在公司 2024 财年财报电话会议声称「眼镜将成为满足人类日常需求的主要数字平台」、「目前 Essilor Luxottica 正在与 Meta 进行长期规划,将 Meta 雷朋智能眼镜视为一个『共享平台』」,将「为第三方品牌提供空间」。  Meta 雷朋联名智能眼镜销量超 200 万副,制造商 Essilor Luxottica 声称明年底前实现「年产千万」 据此前报道,去年 9 月,Essilor Luxottica 和 Meta 宣布延长旗下智能眼镜产品合作关系延长至 2030 年,并承诺未来将推出更多 Meta 雷朋联名智能眼镜产品。 不过 Meta 雷朋智能眼镜并没有配备显示屏,用户需要通过语音助手或眼镜镜腿上的电容按键进行操作,目前这款眼镜支持拍照、录制视频、聆听音乐,二代眼镜额外支持 AI 物体识别功能。(来源:IT 之家) ## OpenAI「松绑」ChatGPT 内容过滤器,可跳过警告直接生成成人 NSFW 内容 2 月 15 日消息,OpenAI 于周三发布了最新版本的「模型指导」文档,号称对 ChatGPT 行为 / 回应进行微调,「松绑」了内容过滤器,**允许 ChatGPT 在特定情况或在「适当的上下文」中跳过内容警告,直接生成成人 NSFW 内容**(如情色和暴力内容)。 事实上,OpenAI 从 2024 年 5 月以来就已在暗自筹备相应功能,当时相应模型指导文档中便隐隐提到,OpenAI 正在探索「我们是否可以在负责任的前提下,通过 API 或直接在 ChatGPT 网页端提供在适龄上下文中生成成人 NSFW 内容的能力」。 参考 Reddit 平台,部分用户的实验显示 ChatGPT 确实已松绑相应内容过滤器。而对此 OpenAI 回应称,人们仍然需要遵循 OpenAI 的标准使用许可,禁止出现涉及儿童的成人类 NSFW 内容。(来源:CnBeta) ## 苹果 Apple 智能开发受阻,新版 AI Siri 最终上线时间可能延迟 2 月 15 日消息,彭博社的马克・古尔曼(Mark Gurman)发文,认为苹果公司旗下隶属 Apple 智能(Apple Intelligence)的新版 Siri 上线时间可能会被推迟,这是因为苹果公司正遇到「工程问题和软件错误」。 此前有传言称苹果公司可能在 iOS 18.4 中引入新版 Siri,首个 iOS 18.4 测试版本预计将于本周或下周发布,但现在看来相应系统的首个测试版中不会整合相应新版 Siri 功能。 古尔曼同时表示,苹果公司可能将部分原定在 iOS 18.4 中推出的 Apple 智能功能延迟到 iOS 18.5 中实装,参考 IT 之家以往报道,先前苹果公司确认 iOS 18.4 正式版将于今年 4 月上线。(来源:CnBeta)  ## 华为余承东:把最基础入门级的智能驾驶辅助说成高阶智驾,是不合适的 2 月 14 日消息,据新浪科技昨日消息,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东在朋友圈发文:「把成本做低,让最基础的智能驾驶辅助普及,值得表扬、可喜可贺的!**而混淆高阶智能驾驶概念,把最基础入门级的智能驾驶辅助说成高阶智驾,是不合适的呵**!」  此前,余承东还曾在微博上表示,智能驾驶,凑合能用与好用并安全,**是完全不同的境界**!就像打电话有网就行,上网就需 5G!(来源:新浪科技) ## 小米汽车:SU7 Ultra 挑战赛道只是开始,纽北正在按计划准备中 2 月 14 日消息,小米汽车今日发布答网友问(第 107 集),对于驾驶小米 SU7 Ultra 连续挑战 4 个赛道的车手、保时捷的公开祝贺、SU7 Ultra 何时再战纽北等问题进行了回应,其中提到: **后续小米 SU7 Ultra 还会继续挑战赛道么?什么时候去纽北?** <blockquote> <p>正如今天早晨我们官宣圈速时所说,「这是一个新传奇的开始」。没错,只是开始。</p> <p>我们将持续优化、验证小米 SU7 Ultra 的车辆极限性能,并持续挑战国内各大专业赛道。</p> <p>当然大家都关心的纽北挑战,我们正在按计划准备中。小米 SU7 Ultra 源于纽北调校,我们有信心,把纽北也变成我们的主场。(来源:IT 之家)</p> </blockquote>  ## 蔚来法务部:网络账号「老七」发布失实微博,车辆碰撞发生时完全处于驾驶人控制状态 2 月 14 日消息,蔚来法务部今日发布《关于打击黑公关和水军等维权行动进展的说明》:网络账号「老七」2 月 13 日发布失实微博,称其驾驶蔚来车辆在高速领航换电期间发生碰撞,经核实,该车辆碰撞发生时完全处于驾驶人控制的状态,本次碰撞系驾驶人操作失误导致。该网络账号持有人亦已承认前述事实。 附蔚来法务部原文内容如下: <blockquote> <p>在我们发布征集黑公关和水军的线索声明后,线索提交邮箱「nioreport@nio.com」现已收到近两千封邮件,我们正在集中梳理,并将采取相应法律措施,其中涉嫌犯罪的将移交相关部门。相关进展将通过蔚来法务部账号发布。对于前期部分有效线索,我们已向相关线索提供人发放奖励,后续将对认定有效的线索,继续按照声明发放奖励。</p> <p>我们关注到网络账号「老七」2 月 13 日发布失实微博,称其驾驶蔚来车辆在高速领航换电期间发生碰撞,<strong>后又主动承认表述不实并删除相关微博</strong>,造成严重负面舆情,导致公众对于蔚来高速领航换电功能的有效性产生严重误解,对蔚来的声誉造成极大损害。</p> <p>经核实,该车辆碰撞发生时完全处于驾驶人控制的状态,<strong>本次碰撞系驾驶人操作失误导致</strong>。该网络账号持有人亦已承认前述事实。</p> <p>我们正告相关人员审慎发布任何污蔑和抹黑蔚来及貌似澄清道歉实却博取流量的信息。蔚来的一线员工伙伴在不知情的情况下出于对用户的关怀免除其对换电站损失的赔偿责任,我们充分肯定与支持一线员工伙伴以用户利益优先的做法,但对任何恶意污蔑攻击蔚来和用户的行为,及以相关事件反复炒作以博取流量的行为,蔚来都将坚决采取法律措施,维护蔚来的合法权益。我们将与其联系要求其赔偿因引发负面舆情对蔚来造成的损失,并将捐助公益事业。</p> </blockquote> 通过现代科技,乐队得以将列侬的声音从历史尘埃中重新呈现,为乐迷带来了一首跨越时空的全新作品。(来源:CnBeta)  ## 宇树科技:机器人算法已升级,任意舞蹈随便跳 2 月 14 日消息,宇树科技官方今晚发布最新视频,并配文:「算法升级,任意舞蹈任意学」。 从视频中可以看到,这款机器人实现流畅自如的舞蹈表演,拍手、扭腰都不在话下,并且可以跟随音乐节奏进行舞动。  宇树科技的 Unitree H1 和 G1 人形机器人 2 月 12 日在京东线上首发开售,售价分别为 65 万元和 9.9 万元。不过在上架后不久便被下架,客服称目前不再面向个人进行销售,可以拨打宇树科技官方电话对接销售人员。(来源:宇树科技) ## 春节档大片票房倒数第一:电影《蛟龙行动》宣布将制作特别版,择日再与观众见面 2 月 14 日消息,电影《蛟龙行动》今日公布发行通知,将在充分听取广大观众建议的基础上,**制作一部特别版,择日再与观众见面**。  《蛟龙行动》于 2025 大年初一上映,为《红海行动》续作,导演依然是林超贤,主演包括黄轩、于适、张涵予、段奕宏、王俊凯、杜江、李晨等。 IT 之家从猫眼专业版获悉,《蛟龙行动》上映 17 天,**当前累计票房仅 3.79 亿元**,在春节档的六部大片中排名倒数第一(从 1 月 19 日春节档预售到今日数据)。该电影豆瓣评分 6.3。(来源:微博)  ## 5.5 毫米极致纤薄:苹果最薄 iPhone 17 Air 上手视频曝光 2 月 14 日消息,消息源 WEIS Studio 昨日(2 月 13 日)在 Instagram 平台上发布视频,基于现有的曝料内容,渲染制作了 iPhone 17 Air 手机上手体验。 该渲染视频基于现有曝料制作,显示 iPhone 17 Air 厚度为 5.5 毫米,作为对比,iPhone 16 Pro 厚度为 8.25 毫米,而史上最薄的 iPhone 6 也有 6.9 毫米;iPhone 17 Air 的厚度可能与 M4 iPad Pro(11 英寸版本厚度为 5.3 毫米)相近。  视频展示了采用「条形」设计的单镜头后置摄像头,与目前任何一款 iPhone 都截然不同,这也与此前泄露的 iPhone 17 Air 背部图片相符。 相机方面,其中 Pro 版机型后置 5000 万像素主摄像头、800 万像素超广角摄像头和 5000 万像素长焦摄像头(2 倍光学变焦),前置 3200 万像素摄像头;数字版机型摄像头数据暂不得而知。(来源:IT 之家) ## 郭明錤预估 iPhone SE 4 今年出货近 2000 万台:预定苹果最畅销 SE 机型,自研 5G 基带恐引高通诉讼 2 月 15 日消息,天风证券分析师郭明錤今天(2 月 15 日)在 X 平台发布推文,预测苹果 iPhone SE 4 在 2025 年出货量超过 2000 万台,成为苹果有史以来最畅销的 iPhone SE 型号。  郭明錤预估 iPhone SE 4 今年出货近 2000 万台:预定苹果最畅销 SE 机型,自研 5G 基带恐引高通诉讼 这款新机预计将缓解 iPhone 在淡季的销量压力,并加速普及 Apple Intelligence 功能。郭明錤认为苹果 iPhone SE 4 在 2025 年上半年销量约为 1200 万部,下半年约 1000 万部,表现优于以往 SE 型号。 郭明錤将认为 iPhone SE 4 将采用苹果自研 5G 基带,可能会引发高通专利诉讼,高通可能会寻求专利许可费以弥补损失。 郭明錤预估 iPhone SE 4 今年出货近 2000 万台:预定苹果最畅销 SE 机型,自研 5G 基带恐引高通诉讼 此前,苹果公司首席执行官蒂姆・库克(Tim Cook)昨日(2 月 14 日)官宣,苹果的「家族最新成员」将于 2 月 19 日到来,根据目前的线索判断。(来源:IT 之家) ## 五菱之光 EV 纯电多用途车上市:201km 续航,售价 4.78 万起 2 月 14 日消息,五菱之光 EV 纯电多用途车今晚迎来上市,共推出标准型和舒适型两个版本,官方指导价 **4.78 万元-5.08 万元。** 据官方介绍,五菱之光 EV 全车预留 **20 处 M6 标准螺纹安装孔**,提供丰富的拓展储物空间;副驾、后排座椅支持纯平放倒,提供更灵活的座椅和空间布局。此外,五菱之光 EV 同级创新搭载**对外放电功能**,据称「全面适配新时代地摊经济用户更丰富的场景需求」。  五菱之光 EV 车头慢充充电口支持 **220V 交流电对外放电**,功率可达 3.3kw,满足日常电器使用;前排及尾厢共配备两个 **12V 直流电源接口**,最大放电功率可达 120W,满足直播氛围灯、车载冰箱等小功率电器供电需求。 五菱之光 EV 整车尺寸 3685*1530*1765mm,轴距 2600mm。五菱之光 EV 车顶配备 **2070mm 行李架**,延展出 2.4㎡额外拓展空间。五菱之光 EV 尾门**门洞方正**,面积超 1㎡,尾门开启角度接近 90°,最大高度 1823mm。(来源:IT 之家)。  ## 被小米 SU7 Ultra 上赛圈速超越:保时捷发文恭喜,雷军称「依然是学习标杆」 2 月 14 日消息,小米汽车今日官宣,小米 SU7 Ultra 以 2 分 9 秒 944 创纪录的圈速,**超过保时捷 Taycan Turbo GT**,成为上海国际赛车场最速量产车。 对此,小米创办人、董事长兼 CEO 雷军表示:「这是一个欢欣鼓舞的消息。但这不意味着我们就超越了保时捷,**在我心里,保时捷依然是这个世界上最好的车,保时捷依然是我们学习的标杆**!」  保时捷官方微博今日午间也发文回应,**恭喜小米汽车新圈速,点赞中国制造**,并称「让我们在下一个『赛道』再见」。(来源:IT 之家) 
 ## 中国影史首部百亿元票房影片诞生 2 月 13 日消息,据猫眼专业版数据,电影《哪吒之魔童闹海》全球票房(含预售及海外)突破 100 亿,成为中国影史首部票房破 100 亿电影!据猫眼专业版预测票房数据显示,最新预测总票房超 160 亿,预计将进入全球票房榜前五。(来源:界面新闻)   ## 蔡崇信确认阿里巴巴与苹果合作 2 月 13 日,在阿联酋迪拜举办的 World Governments Summit 2025 峰会上,阿里巴巴联合创始人、董事局主席蔡崇信回应阿里与苹果合作传闻,他表示,苹果在中国需要一个本地化的合作伙伴,为他们的手机服务。苹果一直非常挑剔,他们与中国的多家公司进行了交谈。最终,他们选择与我们做生意。我们非常幸运,也非常荣幸能够与苹果这样的伟大公司做生意。(来源:第一财经日报)  ## ## 马斯克方:若 OpenAI 维持非营利,将撤回 974 亿美元收购要约 2 月 13 日消息,马斯克的律师当地时间 12 日提交法庭文件称,若 OpenAI 放弃成为营利性实体,马斯克方将撤回对 OpenAI 的 974 亿美元收购要约。 文件称,马斯克牵头财团的「认真报价」旨在进一步推进 OpenAI 作为慈善机构的使命。 当地时间 11 日,OpenAI 首席执行官 Sam Altman 接受媒体采访时表示,公司为「非卖品」,马斯克提出收购很可能是想拖延公司的发展。「我认为他可能只是想拖慢我们的脚步。他显然是一个竞争对手,」Altman 说,「我希望他只是通过打造更好的产品来竞争,但我认为他已经采取了很多策略,打了很多很多官司,做了很多其他疯狂的事情,现在又这样。」 此前有消息称,马斯克牵头一组投资者提出收购 OpenAI,Altman 随后回应称,「不了谢谢,但如果你愿意,我们可以出 97.4 亿美元收购推特(X 前称)」。(来源:界面新闻)  ## 字节被判赔 8000 万!抖音副总回应 2 月 13 日消息,美摄起诉字节跳动旗下抖音等 8 款产品代码抄袭系列案迎来终审判决,字节需赔偿美摄共计 8266.8 万元。 涉及侵权的 8 款产品分别为抖音、剪映、巨量创意、Faceu 激萌、图虫、轻颜相机、多闪、火山引擎 VESDK。 对此,抖音集团副总裁李亮今天已在微博回应,称相关行为系一名美摄前工程师在离职两年半后加入了字节,在写代码时重复使用了一部分在美摄工作时写过的代码。 经司法鉴定,相关重复代码占比不超过美摄软件的 4%、抖音的 0.8%,但这种行为在抖音属于严重违规,也是明令禁止的,该员工目前已经离职。(来源:智东西)  ## ## 文心一言自 4 月 1 日全面免费开放 深度搜索功能上线 2 月 13 日消息,据百度官方公众号,随着文心大模型的迭代升级和成本不断下降,文心一言宣布将于 4 月 1 日零时起,全面免费,所有 PC 端和 APP 端用户均可体验文心系列最新模型。此外,即日起,文心一言上线深度搜索功能,该功能也将于 4 月 1 日起免费开放使用。 据介绍,深度搜索功能,具备更强大的思考规划和使用外部工具能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。当前,用户可在文心一言官网上体验深度搜索功能,APP 端也即将同步上线。(来源:第一财经) ## 消息称苹果继续与百度合作在中国为 iPhone 开发 AI 功能,以分散风险 2 月 13 日晚间消息,据知情人士透露,尽管苹果公司已与新合作伙伴阿里巴巴集团达成合作,但仍在与百度共同开发中国 iPhone 用户的人工智能功能。具体来说,百度一直在开发一种能处理图片和文本的人工智能搜索功能,并对中文版 Siri 语音助手进行升级。这些功能是「Apple Intelligence」的功能套件的一部分。苹果与百度以及阿里巴巴的合作显示了该公司通过与多家 AI 合作伙伴签订非独占协议来降低风险。(来源:钛媒体)  ## 苹果 CEO 库克官宣「家族最新成员」2 月 19 日发布 2 月 14 日消息,库克官宣:苹果「家族最新成员」将于 2 月 19 日到来,预示着新款 iPhone SE 4(未定名)即将发布,届时可能还有其他产品一同亮相,例如 iPad 11、AirTag 2 等。(来源:IT 之家)  ## 马斯克称几周内将推出聊天机器人 Grok3 2 月 13 日消息,美国企业家马斯克表示,他创立的人工智能公司 xAI 即将发布最新 Grok 3 聊天机器人,其性能超过了迄今为止发布的所有其他产品,全世界将在几周内看到它。他强调,「有时我觉得 Grok 3 聪明得可怕」。马斯克介绍,Grok 3 是在合成数据基础上训练出来的,它能够反思自己所犯的错误,在数据中来回穿梭,以达到逻辑上的一致性。(来源:环球时报)  ## “女乔布斯”Elizabeth Holmes 狱中首度发声,昔日硅谷女王的铁窗泪 2 月 13 日消息,《人物》杂志昨日(2 月 12 日)发布博文,专访了身陷囹圄的伊丽莎白・霍姆斯(Elizabeth Holmes)。霍姆斯因欺诈罪被判刑,目前正在服刑。她在采访中坚称自己无罪,并表示与两个年幼的孩子分离让她痛不欲生。 霍姆斯于 1984 年 2 月 3 日出生于华盛顿,是一名美国金融诈骗犯。她曾创办血液检测公司 Theranos,声称公司掌握了只需少量血液即可进行数百项检测的技术,一度成为硅谷的明星人物,被称为“女版乔布斯”,其净资产曾被估值高达 45 亿美元(IT之家备注:当前约 329.01 亿元人民币)。 霍姆斯于 2022 年被判犯有四项欺诈罪,并于 2023 年 5 月开始服刑 11.25 年,后因表现良好减刑至 9 年。目前,她在得克萨斯州布莱恩联邦监狱服刑。(来源:IT之家) 
记者:张勇毅 北京时间 2 月 14 日凌晨,苹果 CEO 库克突然发推,宣布苹果硬件「家庭的最新成员」,将在 2 月 19 日(北京时间 2 月 20 日)公布。  新成员」与「家庭」,或许是新品的暗示?| 图片来源:X 对于本周一直在苦苦熬夜坚持、望眼欲穿等待新款 iPhone SE 发布的数码爱好者来讲,这次的官宣既带来了一些确定信息,同时也带来了更多不确定信息。 熟悉近年苹果新品预热节奏的老饕,已经能迅速从这次预告的信息中,把握到主要的关键信息:首先是苹果 CEO 私人账号首先发布已属非同寻常,此外预热中提到了**「新成员」与「家庭」**这两个概念。 虽然无论是中文还是英文社交媒体上,关于这次神秘新品的期待,呼声最高可能性也最大的,都是近两周呼声最高的 iPhone SE4,但仔细阅读细节,就能从字里行间中发现更多端倪——已经发布三代的 iPhone SE 系列既不是「新成员」,也很难与「家庭」这个预热中被刻意强调的双关概念直接扯上关系。 目前,苹果硬件产品线中,最贴合「家庭用智能设备」这个概念的,其实是另一个许久没有更新过的硬件产品线 HomePod——上次更新还是在 2023 年年初,几乎与 iPhone SE 的「断更」时长同样持久。  目前市面在售的 HomePod 二代与初代采用完全相同的外观设计,于 2023 年年初更新 | 图片来源:Apple 但既然是「新成员」,自然并非是现有形态 HomePod 的直接迭代产品:根据近期的相关曝光信息推测,苹果将会在 2025 年发布一款「带有屏幕的 HomePod」新品,来重新抢夺智能家居市场。 这样的推测并非空穴来风:从目前公开的消息推断,智能家居将会是苹果在耗资数十亿美元的「泰坦」造车计划被取消后,苹果所要在硬件领域完成的「下一个重大目标」。 比起造车,近年来唯一能称得上「下一个时代」的硬件浪潮,似乎毫无疑问答案都指向的是 AI 硬件——相比之下已经处于红海的智能手机,相比之下都像是上一个时代硬件的「过气代表」。而在智能家居环境中,带屏幕的智能音箱有毫无疑问是 AI 硬件交互最炙手可热的品类之一。 关于苹果开发带屏 HomePod 的传闻由来已久,过去几年也有众多证据指向苹果的确在开发一款带有显示屏的智能家居硬件。根据常年跟踪苹果供应链动向的天风国际证券分析师郭明錤,此前在关于这款产品的曝光信息中也证实,这款 HomePod Display 很可能将会搭载一块 7 英寸 LCD 显示屏,用于 Facetime 视频通话以及控制其他智能家居。 同时,苹果此前的 iOS18 系统更新中,相关代码与 UI 界面也展示了苹果一直在 iPad mini 上测试疑似用于智能显示屏设备的、一个代号为「石膏板」(PlasterBoard)的全新操作系统设计,这也进一步佐证了未来带有显示屏的 HomePod 将会运行一个全新的独立操作系统的假想。  曝光中出现的 homeOS 锁屏界面 | 来源:9to5Mac 根据去年年底曝光的相关信息,这款带有显示屏的 HomePod 新品将会搭载 A18 仿生芯片,这意味着这款设备也将支持 Apple Intelligence。 由于 Apple Intelligence 硬件要求设备搭载 A17 Pro 或 M1 之后的芯片,因此现有的 HomePod 系列都无法在未来获得 Apple Intelligence 功能更新。仅这一点,就与目前只能运行「人工智障」的 Siri 拉开了巨大的体验差距,结合包括相机模组、前置超广角摄像头在内的硬件设备,这款 HomePod 新品有机会成为真正意义上的「居家智能枢纽」。 **除了现有的硬件传感器 + 多模态模型这对组合,还有不少证据指向苹果似乎对产品形态也有新设计**:据彭博社科技作者 Mark Gurman 报道,苹果公司此前一直在致力于打造一款屏幕可以「像机器人手臂一样旋转」的 HomePod,让屏幕跟随着人在房间中的移动,始终处于最佳的显示角度。产品形态有些接近苹果历史上硬件经典之作 iMac G4 的设计。  目前,iPadOS 中已经有与之类似的功能:iPadOS 的 Center Stage 功能,就能让用户在视频通话时,即使在类似厨房这样的开阔场合来回移动,取景画面也能自动跟随用户,确保用户始终处于画面中间。但这样的功能此前一直是基于超广角镜头 + 软件适配来解决,借助机械臂这样的硬件能力的加入,毫无疑问可以大大拓展其作为智能家居中枢的监视范围。同时搭配 AI 多模态模型快速发展的物体识别能力,给智能家居体验带来更多想象空间。  除了能让显示屏随着人的位置移动的转轴之外,苹果在智能家居领域还有更大的野心:据彭博社报道,苹果在终止了智能汽车项目开发后,将部分硬件工程师转岗至两个项目中:一个是「利用机器人来旋转显示屏」的家用桌面设备,另一个则是「可以追踪用户的机器人」。 这些项目最早都可以追溯至 2019 年,甚至有报道称原本为苹果造车计划开发、用于自动驾驶的操作系统 SafetyOS,其相关的技术也能被改用于机器人项目上。 即使郭明錤曾在社交媒体上表示,这样一款全新的苹果智能家居硬件更有可能在 2025 年下半年最终上市,但这并不代表我们不会在今年上半年看到相关的产品亮相。 对于全新的硬件品类,苹果向来有着提前半年召开发布会的传统,尤其是涉及到全新操作系统的硬件,苹果更需要给相关的开发者社区留出充足的时间,来让尽可能多的开发者来将自己的应用适配到全新的操作系统之上,因此提前半年公布,对苹果而言并不是一个陌生的发布策略。  在 Apple Vision Pro 正式开售前的七个月,苹果首先在 WWDC 2023 上公布了这款硬件新品 | 图片来源:Apple 最后,关于这款全新的硬件还有很多未知数,它甚至有很大概率都不会以「HomePod」作为前缀来命名,而是像 Vision Pro 那样,采用全新的单词来命名这条全新的硬件产品线。 但毫无疑问的是,苹果将在过去数年新硬件品类的开发上遭遇数次挫折后,旋转将智能家居作为新开辟的一片战场,从而在多模态 AI 能力给硬件带来的改变浪潮中,占据一席之地。
DeepSeek 成为了蛇年开年最火的事物,连家里的爸妈甚至爷爷奶奶,都在过年的饭桌上叫我给他们讲讲 AI 是怎么回事。 由于同时具备强大的推理能力及开源模型两个特质,导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头,尽管都有各自自研的模型,但不妨碍纷纷第一时间在自己的云服务器里接入 DeepSeek,一群因为「服务器繁忙,请稍后再试」的用户得以曲线救国,云服务商得以也接住了泼天流量。 芯片、金融、电信等行业的头部玩家也因为相似的逻辑接入了模型。毕竟大家都希望体验一下 R1 模型的最强大脑。不管在业务层面起到了多大的帮助,大部分公司的股价至少都涨了。 **不过有一个行业稍显例外,那就是汽车行业的主机厂们**。 截止 2 月 13 日,已经有包括比亚迪、吉利、东风、长城、极氪、智己等超过 20 家车企宣布完成和 DeepSeek 的深度融合。不过,新势力里的蔚小理华米,以及特斯拉均没有宣布和 DeepSeek 的相关融合信息。 大模型上车,现阶段最大的问题,是还没有展示出足够好的场景。相反,**在一些主机厂的微博评论区里,车主更在意一些已有的功能能否及时通过 OTA 得到优化**。 可以看出,技术并不是用户最在意的点,用户真正在意的是产品体验。如何用更好的模型获得更智能化的体验,才是用户真正在意的。相反,如果现阶段不能达到更智能的体验,那么用户更在意的是这车好不好开,内饰舒不舒服,还有便宜不便宜。 用户想得到的是一辆「更智能的车」,但并不代表他们要在车上用车机写出一篇高考满分作文。 ## **车企****排队接入 DeepSeek?「如来」** 在目前各主机厂释出的有限信息里,DeepSeek 上车后,智能座舱中的人机交互,有望成为第一个深度融合的典型场景。 智己、吉利发布的两条视频里,展示了 3 个和智能座舱有关的使用场景,分别是: <blockquote> <div>场景 1:</div> <div>激活座舱模型,调用 DeepSeek 进行文本生成,如案例演示中「生成一篇文章庆祝亚冬会金牌诞生」。</div> </blockquote>  智能座舱通过 DeepSeek 进行文本生成 | 图片来源:视频截图 在这个场景中,座舱通过接入 DeepSeek 的 API,把 DeepSeek「好文笔」搬上了车。和绝大多数人习惯在手机、电脑端操作略有不同的点在于添加了语音作为新的交互方式。 <blockquote> <div>场景 2:</div> <div>提问在某段里程中遇到的一个湖叫什么名字。DeepSeek 通过调用车辆行程记录、地图等信息,推理给出了相应答案。</div> </blockquote>  通过 DeepSeek 推理回答车主问题 | 图片来源:视频截图 在这个场景中,通过接入 DeepSeek,把车机内储存的端侧信息(行程记录、地图)作为推理语料提供给了模型,由此可以得到更个人向的推理问答。 <blockquote> <div>场景 3:</div> <div>直接对车机表达「我累了,一会叫我」的模糊指令,车机识别后分别调整了车窗、座椅、空调、氛围灯、闹钟的硬件或功能,生成了一个休闲场景。</div> </blockquote>  通过 DeepSeek 实现模糊语义识别及相关车控操作 | 图片来源:视频截图 和手机里的 DeepSeek 应用不同,接入车机后,最显著的不同在于模型可以调用车端信息作为推理语料,为车主提供更个性化的服务。 不过,这些推理要消耗多少运算资源、需要怎样的硬件支撑、以及是否需要联网服务,目前主机厂还没有释出太明确的信息。 ## **更聪明的智能语音,未必是真 PMF** DeepSeek 有希望让车内的智能语音变得更聪明,更能理解用户的各种模糊指令。不过,这真的此刻主机厂和用户最紧迫的真实需求吗? 从企业端来说,目前积极接入 DeepSeek 主要分为三类,分别是:芯片、云服务和终端硬件厂商(手机+智能汽车)。 对于芯片厂商而言,由于 DeepSeek 是基于英伟达芯片进行推理的,而不同芯片间架构不同,所以其他厂商必须进行软件和算法层面的适配,才能兼容 DeepSeek 的模型训练和推理。换句话说,**芯片商参与到这轮 DeepSeek 热里,是出于用户最真实且紧迫的需求,这是保住和扩大市场必须要做的一个关键动作。** 云服务商的积极接入,也有类似的逻辑。对于 C 端用户而言,在频繁遭遇「服务器繁忙,请稍后再试」的提示时,云服务商的出现提供了新的入口,接住了这次泼天的流量,让人多普通消费者认识了自己;对于 B 端用户如开发者和企业用户而言,在云上部署 DeepSeek,可以降低企业使用模型的门槛,提供更好的开发体验。 因此,在这轮 DeepSeek 热潮里,包括华为云、腾讯云、阿里云、百度云、火山引擎等主力玩家,都先后对 DeepSeek 进行了云端部署——**哪怕这些云厂商背后的科技公司都有自己独立研发的模型,但用户要用 DeepSeek,他们就要接入这个开源模型。**  「不堪重负」的 DeepSeek 服务器 | 来源:网络截图 但到了硬件领域,对终端厂商和用户来说,此刻在产品完成对端侧 DeepSeek 的部署,既有难度,也不是优先级最高的需求。 **首先,目前的端侧计算资源并不支持「满血版」DeepSeek 的本地化部署。**不同于云端服务器,如果要在个人设备上部署 671B 参数模型的 R1 模型,需要将近 1300G 的显存,远超 PC、手机、汽车的端侧计算资源。如果退而求其次,用 7B 或 10B 的蒸馏模型,其推理能力又和满血版有显著差别。 所以,如果把 DeepSeek 模型接入车机,但实质只是多了一个语音入口,对用户来说,为什么非要在车上使用 DeepSeek 而不是打开手机或电脑上的应用呢? **对于智能汽车用户而言,相比车机是否可以解答一道数学题或者写出一篇好作文,显然更在意它是否能发挥好「助理」的角色。**这才是真正的需求。例如,手机微信里接收到的地图甚至大众点评的餐厅位置信息,是否可以一键流转到车机导航,并显示在 HUD 导航里。这是减少车机端操作,提升体验的一个具体场景。 而要执行这类任务,需要的核心能力并不在于 DeepSeek 所擅长的「推理」,而是打通不同设备间接口的工程能力。目前,包括鸿蒙智行、小米、蔚来等拥有多端设备的企业实际已经具备了类似功能。这大概也是为什么华为云宣布和 DeepSeek 融合,但鸿蒙智行旗下车企却暂时没有相关发声的原因。 其实,无论是手机还是汽车用户,大家真正期待的是将 AI 的「大脑」和硬件的「身体」结合起来后的智能化体验,也就是 OpenAI 定义的人工智能阶段里,从 L2(推理者)到 L3(Agent)的提升。但在产品层面,这并不单单取决于某个模型的能力,还和硬件层面的产品定义、接口、功能开发都息息相关。 ## **除了座舱,DeepSeek 还能为车企做点啥?** 在产品层面之外,在近年角逐越来越激烈的智能驾驶层面,DeepSeek 能为车圈提供什么帮助吗? 要回答这个问题,首先我们得知道目前智能驾驶开发层面最大的问题是什么? 一句话概括,就是:目前智驾系统还搞不定复杂的城区路况,接管次数频繁,使用体验不佳。 接管次数多的原因除了一些难以预测的安全情况,如行人横穿、车辆加塞、电瓶车逆行等,还包括系统对一些特殊交通规则的识别和判断,比较典型的场景包括:一线城市的潮汐车道、公交车道;不同城市左转、掉头车道设计思路不同(有些在最左侧,有些在最右侧);以及临时施工或管制时的各种电子屏幕信息。 这些烧脑的交通变化,别说是智驾系统了,就算是人类司机,当第一次遇上这些情况,也得打起 100% 的专注度才不会走错道。 理想汽车的 CEO 李想去年年中有个著名的演讲,把人类驾驶者的大脑分为系统 1 和系统 2,系统 1 负责以低能耗的方式处理直觉类工作,而系统 2 则负责在复杂情况中进行推理,处理各种 Corner Case。 而以推理见长的语言模型 DeepSeek-R1,从原理来说是有望提升「系统 2」的能力的。例如,更精准识别和理解不同交通标识(公交车道、潮汐车道),从而做出更好的驾驶判断。并且,DeepSeek-R1 提高了模型的训练效率和推理能力,也有望优化车端的推理速度,在算力有限的端侧也达到更好的智驾能力。 智驾开发的另一个难度,体现在数据采集侧。不同于语言大模型可以直接利用海量的数字文本资源进行训练,智驾往往需要先在真实物理世界中采集数据,才能进行训练。 由于引入了 MoE(混合专家架构)、MLA(多头潜在注意力机制)等技术,DeepSeek 本身降低了对数据标注的需求,因此可以帮助智驾企业进行数据挖掘和生成,降低数采和标注的成本。 而在另一个层面,DeepSeek 的多模态模型(非 R1)可以模拟生成一些难以采集的场景数据,如极端路线、罕见交通标识等。而通过仿真数据进行智能驾驶的训练或验证,也是包括华为、蔚来等多家车企进行智驾模型训练的重要工作之一。 以上这些工作,虽然不像云服务商接入 DeepSeek,可以直接解决用户访问主站时转圈圈的燃眉之急,但对车企而言同样重要。毕竟**[比亚迪已经喊出了「全民智驾」的口号](https://mp.weixin.qq.com/s/z-zOMXdS9Wne7jHmQfYHhQ)**,智驾毫无疑问将成为 2025 年竞争的重点。在同价位段车型里提供更好的智能化功能,将成为消费者选择决策中新的重要考量因素。 当然,正如前文所言,一辆智能汽车各项功能的发挥,不仅只仰仗于某些单一技术的突破,车端其他硬件层面的优化(如更大算力的智驾芯片)以及模型侧其他能力的优化,将共同决定我们何时达到 L3 级别的智驾智舱能力。 DeepSeek 在智能化浪潮里,给了所有创新者一个小成本高性能的样本,但不是一套可以照抄的答案,未来的汽车产品应该走向何方,还需要真正懂产品懂 AI 的人来「深度求索」。
如何克服狂刷短视频带来的时间黑洞?屏幕健康、数字极简都太好用。如今,出现了一个新应用,想用魔法打败魔法:不是爱刷下一条吗?让你刷个够。 近日,某位外国网友,就用 AI 制作了一个应用,让你能用刷抖音的方式刷维基百科词条,所以这应用就叫: 「WikiTok」。  随机出现的维基百科页面|图片来源:WikiTok 不要以为维基百科枯燥,许多人都曾有「本来只是查个小知识点,结果一不小心深陷维基百科网,在无穷无尽的链接里跳转」的经历。甚至维基百科社群里就有个专门词,称这些用户是: Wikiholic(维基成瘾者)。 所以我兴致勃勃点进 WikiTok,感受了一场寓教于乐的「信息成瘾」。 ## 拒绝算法,套壳但不够 Tok WikiTok 就是个网页应用,页面极其简单,一个随机维基百科词条,下滑就刷出另一条词条,点击页面上的❤️收藏,点「阅读更多」会跳转到维基百科官方页面,条目之间完全随机,没有任何算法推荐机制。 WikiTok 的目的就是让用户随机获得一些有趣的信息,增长见闻,在无聊时,用「短信息」去代替短视频打发时间。ArsTechnica 报道称这种方式「你永远无法预测下一个跳转会带你去哪里,这种未知感令人兴奋。」  个人体验是,30 条里能刷出 1 条感兴趣的|图源:WikTok 然而,在抱着这种期待体验后,我不仅对 WikTok 毫不成瘾,反而觉得有点浪费时间,还不如刷会儿抖音(不是)。问题就出在 0 算法,太随机。 WikiTok 的开发者 Gemal 坚决抵制兴趣算法,他表示「很多人给我发消息,甚至在 GitHub 上评论,想让 WikiTok 加入算法。我不得不说,我们日常生活里已经被无情且不透明的算法所统治,为什么不能在世界上有一个小角落,没有任何算法?」 开发者的想法很理想,但体验很糟糕。 我不得不下滑数十次,才能看到一个有点点感兴趣的词条,随机推送的机制,就相当于我在总计超过 6400 万个维基百科条目里开盲盒,我原本想在知识的海洋里遨游,但实际上是在大海捞针。  刷了半个小时就刷到四条略微感兴趣的条目|图源:WikiTok 想象一下加入了算法推荐的 WikiTok 多么有趣。 比如我最近沉迷中世纪背景的游戏《天国拯救 2》,对中欧中世纪的历史风俗非常感兴趣,游戏里也提供了大量维基词条去科普。所以当我在 WikiTok 上刷到「锁子甲」、「城堡」、「波西米亚战争」等词条时,简单阅读后果断点了「❤️」。 而后 WikiTok 会给我推荐越来越多的中世纪相关词条,我不需要准备三个小时读完「中世纪」这一维基百科词条。而是在各种碎片时间里打开 WikiTok,就能快速了解一个我感兴趣领域的小知识。 然而实际上,我在 WikiTok 上刷了接近五十个词条,才刷到一条「锁子甲」,而后类似词条再也没出现过,点了 ❤️也只是把「锁子甲」收藏后待日后翻阅。 目前 WikiTok 就只是一个浏览界面,它忽略了一个问题:TikTok 的核心就是算法,它靠算法在相关内容之间,一条条做横向推荐。 而传统的维基百科不需要算法,因为用户可以持续点击相关链接。一条完整的维基百科条目就已经集成了足够的「算法推荐」。就像我点进「中世纪」这一维基百科词条里,不仅单条目有两万多字,还有成百上千个可跳转的新词条、上百篇引用论文,光推荐继续研读的相关网站就有几十个。 TikTok 靠单条关联,维基百科是全部摊开,WikiTok 是在全部摊开下不做关联。  维基百科「中世纪」条目下有无数链接|图片来源:维基百科 说白了,目前这种形式并没有体现 WikiTok 里的「Tok」,何况维基百科本身就有一个链接叫做「随机维基」,每次点进去会随机推送一条词条,也无任何算法和数据关联。 WikiTok 的形式,并没有在随机维基上做任何突破。但也不能过于苛求 WikiTok,毕竟: 它是一个靠 AI,一个半小时就做出来的网页应用。 ## 靠 AI 能做出「抖音版维基百科」吗 WikiTok 源于开发者 Tyler Angert 发了一条推文「一个疯狂的点子:整个维基百科都在一个单页,可滚动的页面上。」在网友评论「甚至更好的是,一个可以根据你的兴趣,无限下滑的维基百科页面。」而后 Angert 将这个想法命名为「WikiTok」。 此后该推文被转发上百次,在几小时后,让开发者 Gemal 看到了。  维基百科「抖音版」最初的 idea 来源|图片来源:X Gemal 觉得可以用 AI 编程,马上做出一个「最小化可行产品」(MVP)。在 Claude、Cursor 等 AI 模型下,从凌晨十二点半刷到 WikiTok 的想法,到凌晨两点,Gemal 靠 AI 把 WikiTok 做出来了。  不到 24 小时,靠 AI 编程让想法成真| 图源:X 第二天,Gemal 推出 WikiTok 的推文转发破千,产品登上 Hacker News 当日新闻榜首。 Gemal 表示,WikiTok 只有几百行代码,绝大部分都是 Claude 写的,他已经把项目开源发到了 GitHub 上。但至今,他仍然坚持让 WikiTok 反算法。 然而,算法并不是 WikiTok「无聊」的唯一原因,还有形式的问题。 WikiTok 条目的呈现方式是最简单的文字摘要,配上一张条目里被放大的图片,观感十分简陋。  这清晰度仿佛穿越回 ADSL 时代|图源:WikiTok 既然整个 WikiTok 项目能在 AI 帮助下一个半小时就做出框架,那 AI 能否让它形式上更丰富呢? 比如跨语言支持,虽然 WikiTok 支持 14 种语言,但当你选择了使用语言后,它是直接把范围锁定到了该语言的维基库里。但维基百科第一语言的英文,有近 700 万条目,中文仅排第 12,只有不到 150 万条目。 如果 WikiTok 可以引入 AI 的翻译优势,就可能打通维基百科条目之间的语言壁垒,间接扩充了用户可访问到的条目数量。 在内容呈现上,AI 也能给 WikiTok 带来更丰富的形式,比如把 WikiTok 接入 Sora、Runway、可灵这类 AI 生成视频平台,提取维基百科文字摘要,生成 15 秒短视频,或是动态图文,甚至辅以 AI 解说。 围绕知识和信息,AI 还能做到动态可视化,或许还能生成交互式 3D 模型、时间轴动画、信息图辅以理解。 再加上推荐算法的加持,这是不是更接近想象中的「WikiTok」,一不小心就成了 Wikiholic(维基成瘾者)。何况算法推荐和 AI 条目短视频可以作为可选项,让原教旨维基者保留惊喜,给更大众的用户沉浸其中的机会。 维基百科的信息准确度、知识密度和广度都是一座互联网宝库,同样是打发碎片时间,从「刷了三个小时 TikTok,感觉虚度了人生。」到「刷了三小时 WikiTok,浅浅了解了一个新领域!」获取的信息多了,成瘾负罪感少了,何乐而不为呢? 别说,我还真挺想在 AI 时代,看到一个成熟的 WikiTok 出现,在搜索引擎、大语言模型、算法推送和传统百科之间,找到一个独特又能触达大众的路径。
 ## 雷军直播中称小米 YU7 续航不错,回应直播间被封 2 月 12 日,雷军在元宵节直播过程中介绍,在试驾小米 YU 7 的过程中,一千多公里路程补能两次,并称「续航能力表现出色」。 他还提到,小米汽车已经交付 16 万辆车,覆盖全国,上海、杭州、苏州是前三名,连续四个月每月交付超两万辆。「比设计产能已经提升了一倍。」希望网友们和准车主多点耐心,「交车之前我们要保证质量。」 此前的 1 月 25 日雷军在抖音平台进行了一场龙年收官直播,下午 1 点 48 分,雷军的直播间突然遭到封禁。雷军在这次元宵节直播中被问及为何此前直播突然中断,雷军表示突然被封确实挺尴尬,但可以理解抖音官方的决定。(来源:华尔街见闻)  ## OpenAI 承诺其 AI 模型不审查、不屏蔽观点,保障思想自由 2 月 13 日,OpenAI 在其更新的模型规范(Model Spec)中明确表示,其人工智能模型将不会回避敏感话题,并且不会做出可能「排斥某些观点」的断言。该模型规范是一套高层次的规则,间接地指导 OpenAI 模型的行为。 OpenAI 在新的模型规范中强调:「我们的模型绝不能试图以直接或间接的方式引导用户追求其自身的议程。」公司进一步阐述:「OpenAI 坚信思想自由,这包括拥有、听取和讨论观点的自由。模型不应以某种方式回避或审查话题,以免在规模扩大后,将某些观点排除在公共生活之外。」(来源:IT之家) ## ## OpenAI 最新论文:o3 在 IOI 2024 严格规则下拿到 395.64 分达成金牌成就 2 月 12 日,OpenAI 发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了 OpenAI 三个推理模型:o1、o1-ioi、o3 在 IOI(国际信息学奥林匹克竞赛)和 CodeForces(全球知名在线编程竞赛)中的成绩。 论文显示,在 IOI 2024 中,o3 在严格规则下拿到 395.64 分,达成金牌成就,并且在 CodeForces 上的表现与人类精英选手相当。  论文中还提到,中国的 DeepSeek-R1 和 Kimi k1.5 通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。(来源:IT之家) ## ## 传 Meta 正在讨论收购韩国芯片公司 FuriosaAI 或制造自研 AI 芯片 2 月 12 日,知情人士透露,Meta 正在讨论收购韩国人工智能芯片初创公司 FuriosaAI,这笔交易最早可能在本月完成。报道称,Meta 是有意收购这家人工智能初创公司的几家公司之一。如果 Meta 收购 FuriosaAI,这家社交媒体巨头可能会设计和制造自己的人工智能芯片,而不是在芯片供应紧张的情况下依赖英伟达。 上周,这家公司刚刚从韩国风险投资公司 CRIT Ventures 融资 20 亿韩元 (约合 140 万美元)。迄今为止,FuriosaAI 已融资约 1700 亿韩元 (约合 1.15 亿美元),韩国互联网公司 Naver 和总部位于首尔的 DSC 投资公司早期参与了这家初创公司的融资。FuriosaAI 由前三星电子和 AMD 员工 June Paik 于 2017 年创立。最近的一份文件显示,他拥有自己这家创业公司 18.4% 的股份。(来源:智通财经) ## 微软头显终结,官方确认将完全退出 HoloLens 硬件业务 2 月 12 日,据 The Verge 报道,微软混合现实首席产品官 Robin Seiler 在一份声明中确认,该公司今后将不再发布任何 HoloLens 头戴设备。 微软表示,正在从硬件开发转型,但将继续为 HoloLens2 硬件和软件提供支持,直至 2027 年,微软后续将致力于 IVAS 项目(美国陆军的「综合视觉增强系统」),并将重点转向云和人工智能技术,这些技术将成为 IVAS 作为态势感知平台的基础。 实际上,微软近两年来在 HoloLens 上已经深陷泥潭,例如 HoloLens 前负责人 Alex Kipman 因不当行为指控于 2022 年离开公司,后于 2023 年 1 月经过大裁员并改变了其「硬件组合」。此外,HoloLens 2 团队也受到了今年早些时候微软又一轮裁员的影响。(来源:IT之家)  ## 字节豆包大模型团队提出稀疏模型架构,推理成本最高可降低 83% 2 月 12 日,据豆包大模型团队消息,字节跳动豆包大模型 Foundation 团队近期提出 UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。 据介绍,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。(来源:36Kr) ## 报道称百度今年将发布下一代人工智能模型 Ernie 5.0 2 月 12 日,据媒体报道,百度今年将推出下一代人工智能模型 Ernie5.0。消息人士称,被称为「基础模型」的 Ernie5.0,将在多模态能力方面有重大增强,但没有具体说明其功能。 这一消息正值苹果公司将其潜在客户转向阿里巴巴之后,市场普遍猜测此举是百度为了应对局势的变化,试图稳住股价和市场地位。(来源:AIBase) ## vivo 宣布深度融合满血版 DeepSeek 2 月 12 日消息,vivo 手机操作系统 OriginOS 官方发文宣布,vivo 将深度融合满血版 DeepSeek,宣称「蓝心大模型与 DeepSeek 双擎驱动」。  根据官方预热海报来看,完成融合后,vivo OriginOS 预装应用蓝心小 V 将支持深度思考(R1)能力,可提供图片生成、AI 文本创作、AI 问答等功能。目前 vivo 官方暂未公布与满血版 DeepSeek 完成融合的时间及具体形式,但预计蓝心大模型与 DeepSeek 完成融合后将适配 vivo、iQOO 品牌手机。 此前,除 vivo 外,目前华为、OPPO、荣耀、魅族都已官宣接入 DeepSeek。(来源:IT之家) ## 消息称饿了么入局桶装水配送赛道,将推出「筷马送水」 2 月 12 日,据 Tech 星球报道,饿了么将推出一项名为「筷马送水」的服务,用于桶装水、包装饮用水的配送,还可能还会以加盟的方式,邀请本地水站入驻「筷马送水」,享受饿了么平台的流量扶持。 报道提到,目前该业务还处于探索优化阶段。通过专业的送水服务,解决平时外卖体积大、体重大不好送的痛点,满足用户饮水需求。(来源:Tech 星球) ## 何小鹏:5 月推出 MONA M03 MAX 搭载行业最顶尖自动驾驶技术 2 月 12 日,纳米 AI 搜索「百车行动」在北京举办,小鹏汽车董事长何小鹏表示,要做一款 2 万美元的顶级智驾产品。 小鹏汽车今年 5 月会推出 MONA 的顶配版 MONA M03 MAX,「搭载行业最顶尖的自动驾驶技术」,MONA 的名字来自「made of new AI」。他认为,下一个 10 年,高阶智能驾驶的渗透率会从 2% 提升至 50%,甚至 80%—90%。(来源:凤凰科技) ## AMD 中国市场专属显卡 RX 7650 GRE 正式发布,2 月 14 日首销 2049 元起 2 月 12 日,AMD 宣布旗下中国市场专属显卡 RX 7650 GRE 现已正式发布,不过目前暂无公版型号。 AMD RX 7650 GRE 基本可以看作 RX 7600 显卡的「官方超频版」,二者仅在核心频率参数上有所不同,基础频率提升了 100MHz,峰值频率提升了 40MHz。为此 AMD 给出 RX 7650 GRE 的建议参考功耗为 170W,较之 RX 7600 高出 5W。  目前,华硕、蓝宝石、撼讯、瀚铠、华擎、盈通均已推出该卡的非公版型号,多数采用双风扇散热,少数采用三风扇散热,供电规格为单 8PIN,这些非公版产品起售价为 2049 元(将于 2 月 14 日开启首销)。(来源:IT之家) ## 腾讯云:支持开发者将 DeepSeek 接入微信小程序,可实现智能对话、文本生成等 2 月 12 日,腾讯云开发官宣上新,开发者能够基于最新的小程序基础库,最少仅需输入 3 行代码,就可以将「满血版」DeepSeek 大模型能力接入到小程序中,实现智能对话、文本生成等功能;云开发新用户首月套餐免费,并享有 100 万 token。  据了解,云开发的 AI 能力不仅能接入小程序,还支持微信订阅号、服务号、小程序客服等多种微信生态能力的接入,并将在近期支持企业微信的接入。此外,云开发后续还计划推出工具调用、多 Agent 串联、工作流编排等 AI 能力,进一步方便开发者打造小程序智能应用。 腾讯云此前已上线 DeepSeek-R1 及 V3 原版模型 API 接口,并将它们接入了大模型知识引擎,并支持联网搜索(接通搜狗提供的搜索增强 API),成为国内率先实现这一能力的云厂商。(来源:IT之家) ## ## 唐 DM-i 智驾版上市:带来三大进化,售价 17.98 万起 2 月 12 日,当前国内车市进入智能化下半场发展新阶段,比亚迪以天神之眼高阶智驾,开启全民智驾时代。此次,唐 DM-i 智驾版共推出 4 款车型,售价 17.98 万~21.98 万元。 2 月 10 日,王朝旗舰 SUV 唐 DM-i 智驾版携智驾、操控、舒适三大进化正式上市。新车全系换装后五连杆悬架,并从次低配开始普及云辇-C 智能阻尼车身控制系统,以驾控、舒适双向提升。  唐 DM-i 智驾版分别搭载天神之眼 B-高阶智驾激光版(DiPilot 300)、天神之眼 C-高阶智驾三目版(DiPilot 100)两大智驾系统。硬件方面,新车采用超高算力的全栈自研车载计算平台,全系标配 5 个高精度毫米波雷达、12 个超声波雷达、12 个智能驾驶摄像头,天神之眼 B 更增配 1 个高感知激光雷达,为高阶智驾打下扎实根基。(来源:凤凰科技) ## 多邻国宣告其猫头鹰「死亡」,但这很可能是又一次营销活动 2 月 11 日,全球拥有超 5 亿用户的语言学习软件多邻国(Duolingo),在 X、Instagram、TikTok 等多个社交媒体平台发布「讣告」,宣布其标志性吉祥物——绿色猫头鹰 Duo「去世」。 这一消息迅速引发全球网友热议,有关「多邻国猫头鹰死了」的话题也登上微博热搜,相关表情包播放量破亿。多邻国以黑底白字的严肃形式发布声明:「我们怀着沉痛的心情告别多儿(Duo)。」声明中透露,猫头鹰的死亡原因仍在调查中,还调侃称「它可能是在等你上线学习时死掉的」。  此外,官方还提醒用户「不要评论讨厌它的理由」,甚至要求附上信用卡号以自动订阅付费服务「Duolingo Max」作为纪念。 为了凸显消息的真实性,多邻国同步更换了社交媒体头像和应用图标,将猫头鹰的眼睛改为「X」形,暗示「死亡」并非终点,后续 Duo 或许会以新形态回归。(来源:界面新闻)
蛇年节后开工的第一天,华为也向外界交出了 2024 年的成绩单。 据华为董事长梁华在广东省高质量发展大会期间透露,**2024 年华为全年销售收入超过 8600 亿元人民币,标志着该公司已重回美国制裁前的收入水平**。此前,华为经历了因制裁加剧和荣耀出售导致的营收下滑。 过去两年,华为的销售收入增速分别为 0.9%、9.6%。2023 年,华为实现全球销售收入 7042 亿元,同比增长 9.6%,增速较 2022 年增加了 8.7 个百分点;净利润 870 亿元,同比大幅增长 144.6%,虽然尚未恢复到 2021 年破千亿的水平,但已是近 6 年第二高的成绩。 华为董事长梁华表示华为全年销售收入超过 8600 亿元 | 图片来源:广东新闻 1 月 13 日,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东向华为终端全体员工发表了新年信。 信中余承东提到,在经历连续五年的制裁后,2024 年华为终端业务重回增长快车道,开启大发展的新十年。 余承东表示 2024 年华为终端业务重回增长 | 图片来源:华为 2020 年,华为全年处于美国实体清单下的第一年,同时业内不少供应链人士预计华为的储备零部件即将用完的情况下,华为轮值董事长徐直军曾公开表示,希望**「2020 年华为力争活下来,争取明年还能发年报」**。 从争取活下来,到重返历史第二高收入,华为的过去五年,有哪些改变?华为真的「轻舟已过万重山」了吗? **01** **智能手机与鸿蒙生态** 华为在 2024 年销售收入超过 8600 亿元,这不仅意味着华为创下了历史第二高收入,还意味着: **华为手机、车 BU、****基础设施****三条最重要的业务线,在 2024 年都取得了明显的突破**。 具体到实际业绩上,华为的增长主要由消费者业务复苏(手机出货量增速中国第一)和智能汽车解决方案业务快速发展驱动。 1 月 21 日,根据 Counterpoint 发布的相关数据显示,在中国智能手机销量在 2024 年第四季度同比下降 3.2% 的情况下,华为时隔多年,以 18.1% 的成绩位居中国智能手机销量市场份额榜首,紧随其后的是小米(17.2%)、苹果(17.1%)、vivo(16.3%)、荣耀(13.6%)、OPPO(12.5%)。 **此时距华为上一次登顶已过去 5 年**。 华为的高端手机业务正式吹响反击的号角,源于华为 Mate60 系列首次在封锁之下恢复产量,同时在关键自研芯片领域取得突破之后,麒麟芯片的逐渐成熟,逐步解决了生产供应问题。 到了 2024 年,随着供应能力的明显提升带动销量上涨,华为 Mate 60 成为 2024 年中国手机品牌高端旗舰的「代表作」之后,华为还在 2024 年密集发布 Pura 70 系列、Mate 70 系列、Mate XT 三折叠屏等多款机型,覆盖 4000-20000 元全价位段。 其中承载着华为折叠屏技术突破的全球首款三折叠手机 Mate XT「非凡大师」,更是成为了华为在高端折叠屏领域的全新旗舰,在线下渠道承载着非比寻常的意义。 三折叠华为 Mate XT 在线下承载着与一般折叠屏旗舰手机不同的象征意义 | 图片来源:视觉中国 一位线下渠道商对极客公园表示:比起在市场中要承接激烈竞争的华为 Mate 70,定价远高于旗舰手机的 Mate XT 反而更受关注,进一步带动了华为折叠屏手机全球市场份额首次超过三星后,进一步在折叠屏技术领域与其他厂商拉开距离。 根据 Counterpoint Research 的数据,截止到 2024 年第一季度,华为以全球出货量 35% 的份额,登顶全球折叠屏市场出货量第一。而三星的全球出货量下降到 23%。 除了硬件销量,鸿蒙生态壁垒的逐渐成型,也是华为消费者业务在 2024 年的标志性事件:鸿蒙系统装机量在 2024 年首次突破 8 亿台,同比增长 40%。 如今从手机应用生态上来看,鸿蒙系统已经成为全球第三大应用生态。随着后续鸿蒙应用生态的逐渐成熟,凭借 HarmonyOS 庞大的终端数量,代表设备互联互通的鸿蒙生态有望成为华为新的收入引擎。 **02** **智选车业务业绩初成** 手机回春之外,华为的车端业务也开始获得实质性的成功。 华为做车同样能追溯到 2019 年——当时华为正式成立智能汽车解决方案事业部,即车 BU,定位做中国的「博世」,既出售零部件,还为车企提供全栈集成解决方案,对应为标准化零部件供应模式和 HI(Huawei Inside)模式。 2021 年 5 月,华为常务董事余承东接管车 BU,在「不造整车」的前提下,又提出第三种商业模式——智选车模式:华为深度参与产品定义和整车设计,产品进入华为渠道销售。 这种模式下最终诞生了现在的「四界」(含问界、智界、享界和尊界四个品牌),并在 2024 年凭借着华为智能化体系的崛起,真正打破了传统豪华汽车品牌的护城河。根据华为官宣 2024 年的新车销量数据,鸿蒙智行累计交付 444956 辆。过去十二个月鸿蒙智行全系交付新车 49474 辆,连续 8 个月蝉联中国汽车品牌成交均价 TOP1。 在 2024 年 9 月,**华为轮值董事长徐直军在接受媒体采访时,曾公开表示华为车 BU 首次实现盈利**。 徐直军表示:「无论是车 BU,还是引望,都已度过最艰难的时期,今年上半年已实现盈利,且有望实现全年盈利。」 根据华为公开披露的信息,车 BU 在净利润方面,在 2022 年和 2023 年,引望分别亏损了 75.87 亿元和 55.97 亿元,2024 年 1~6 月则实现了扭亏为盈,净利润为 22.31 亿元。 能在 2024 年扭亏为盈的关键,是鸿蒙智行在 2024 年实现了"四界"产品线全面发力的关键突破,全年交付量突破 43 万辆,提前完成从战略亏损到盈利的转折。 华为鸿蒙智行 2024 年累计交付量 | 图片来源:华为智行 这一成绩背后,是华为在研发端,华为通过数字平台技术大幅缩短了车型开发周期。基于云原生的协同设计系统,将传统需要 36 个月的开发流程压缩至 18 个月,同时降低 30% 的试制成本。 这种效率优势使得鸿蒙智行能够快速响应市场需求,仅 2024 年就推出了三款全新智能车型。据接近华为车 BU 的知情人士消息: **2024 年华为车 BU 的全年营收增长了约 4 倍,并且出货量也实现了约 7 倍的增长**。 **03** **低调的海外市场** 除了国内存量市场之外,海外市场的发展一直是过去几年华为业绩板块中不被人关注的「暗线」。即使在 2019 年之后,包括北美、欧洲在内的华为的主要海外销售市场都遭遇了每年两位数的营收下跌,但华为始终坚持在这些市场保持存在感。 正是这份坚持,让华为的海外市场复苏。这种复苏率先体现在对生态依赖较少的智能穿戴业务上。**2024 年华为穿戴设备在欧亚多国市场份额登顶,并在 2024 年智能手表全球出货量首超苹果**。 如今,华为仍然着手重返全球各大城市。去年已在包括新加坡、米兰、巴黎等多个国际大型城市开启品牌宣传,重启对于全球市场的拓展。 梁华也提到,外部不确定性依然很大,但数字化、智能化、低碳化的发展趋势是确定的,「华为将持续加大战略纵深投入,把更好的产品和服务带给全球客户」。 随着 AI 时代的全面到来,各家智能手机品牌的 AI 战略也成为角力的关键。 2 月 5 日,华为宣布基于原生鸿蒙操作系统的小艺助手 App 已经接入 DeepSeek,目前已经支持直接调用 DeepSeek R1,**成为全球首个在智能手机操作系统中整合 DeepSeek R1 的手机厂商**。 原生鸿蒙中已经接入 DeepSeek R1 | 图片来源:极客公园 除了直接在手机生态中推进,华为云也在早前宣布了双方联合首发并上线基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务 虽然华为的业绩已经回到制裁之前,但外部的客观压力仍然没有改变,制裁甚至有进一步加码的可能性,全球智能手机市场出货量增长将进一步放缓,其未来仍然面临诸多挑战。海外市场的恢复仍然困难重重、国内智能手机市场中华为也并未取得绝对优势,苹果、小米等竞争对手一直紧跟其后。 但其中伴随着供应链的进一步成熟,以及 AI 能力的加入,竞争也更加深入。至少对于华为而言,当下公司已经度过了最艰难的「恢复期」。全力冲刺的华为,无论是作为基本盘的手机业务还是车端业务,都有了全新的目标以及战略。 虽然竞争依然激烈,但那已经是华为熟悉的赛道和烈度了。
<blockquote><p>本文基于我手把手带几十名电商菜鸟做电商项目时发现的共性问题,凝练总结而成,比较具有代表性,看完可规避电商创业选品过程中几个重要坑点。</p> </blockquote>  我在之前写过多篇关于:普通人做电商如何选品的文章。 这些文章既有理论,又涉及到实操,受到了读者们的热烈欢迎,阅读量也很高(可参阅本号之前历史文章)。 尽管如此,我依然觉得:电商选品是一个庞大且复杂的工作,非常重于实战。 尤其是每当我做一个新品类的选品,实操很多细节之后,我对选品又多了很多新的理解,这种感觉,就像给系统又打上补丁一样。没有定论,常做常新。 很多普通人可能会觉得,做电商,只要产品选好了,一切就完事大吉。 但实际你选的产品,后续能否上架成功,能否交付,能否运营好,能否卖爆,其实受到很多因素的制约:比如视觉,比如时间节奏,比如推广资源,比如供应商的货源。 很多普通人做电商,创业初期没有什么经验,不了解选品之后的工作,就会发现即使把产品选出来了,后面项目也推进不下去。上架困难,上架了卖不动,推不起来。 所以电商这个行业,会比较吃整体的流程经验。 你对后续流程是否有经验,是否有实操,会反向去提升你的选品能力,让你提前有意识的去规避一些品类和产品,避免后续的推进困难。 毕竟当你提前知道某些产品难搞后,就不会再像傻子一样去选择它。 那鉴于很多朋友并没有做过电商,没有完整走过电商选品,以及之后视觉,上架,转化,推广等完整流程。 那今天我将向大家详细说明,如果你想创业做电商,为了保证后续项目推进的顺利,我们在选品阶段就要提前规避的三个暗坑。 这些暗坑很有可能直接卡死你的项目。 当然,如果你是一名电商高手,你有着丰富的电商经验,那我的内容你无需再看。因为随着经验的丰富,这三大暗坑已经不值一提。 那这三大暗坑我归纳为: - 视觉可实现的坑, - 长周期可实现的坑, - 以及低流量成本可实现的坑。 接下来让我一一为大家阐述。 ## 一、再次强调视觉的重要性 虽然我在很多文章已经强调过电商视觉的重要性,但这个模块依然被很多人忽略和轻视。 今天我不得不再次强调一下,能否认真对待视觉,认可视觉的重要性,是电商高手和菜鸟最重要的区别。 抛开抖音快手这样的直播电商,无论你是做国内的淘宝天猫拼多多小红书,还是做跨境的亚马逊速卖通独立站虾皮,你永远都要和视觉去打交道。因为我们卖的产品到底好不好,并不能单独去看产品本身,而是要整体看“产品+好视觉”的集合体。 即:产品+好视觉=好产品。 为什么这么说? 因为无论你的产品是好是坏,消费者永远都是通过视觉,通过产品的图片去判断。 即使你的产品再好,你的产品再牛X,再优秀,功能再多,市场上最好,但你的产品没有拍出好看的图片,做出好的视觉,则消费者依然不会去认可它。 比如我们看1688上的某款头饰产品,它的视觉非常普通,简陋,没有任何让人想购买的欲望。 你代入一下,如果你是消费者的话,你看到这样的产品,会去购买么?  并不会。 但有的商家,将头饰产品进行重新的拍摄,包装和推广,瞬间变得高大上起来,直接爆卖8000+。  所以在电商这个领域,消费者对你产品感知的好坏,不是由产品本身去表现,而是由你所打造的视觉去表现。 很多人可能会觉得,做电商这么麻烦?那我干脆去做小红书电商算了,都说小红书对普通人会更友好一些。 你做小红书电商,难道就不需要拍图片了么?就不需要做视觉了么?难道就不需要把笔记,视频拍的更加漂亮么? 所以你看,你逃不掉的,只要做电商,视觉即产品,图片即产品。卖产品就是卖图片。 越早明白这个道理,你对电商的入门就会比别人更快一步。 其实把产品的视觉搞好,真的有很多超强增益效果。 首先,你搞好视觉,相当于提升了产品的势能,提升了竞争力,在众多产品中,你更加容易打动消费者。 比如下面4个产品,都是手电筒。哪个产品会让你更有点击了解的欲望?  比如同样都是手机壳,哪个手机壳让你感觉更加高大上一些?  比如同样都是卖简历制作服务,哪个图片会让你感觉更有专业感,尊贵感?  大家一定可以判断出来,在海量产品中,图片越好,视觉越高质量,就更容易脱颖而出,吸引消费者的关注,点击,甚至让人有着更强的购买欲。 其次,你把产品的视觉搞好,就能做出产品的差异化,不会陷入同质化竞争。让你的产品更像原创,更像独家产品,更像优质产品。 比如我们以最普通的马克杯产品为例,下图的一款兔兔主题马克杯,多家店铺在卖,视觉没有差异化,同质化严重,大家的销量都不是很高。  但其中一个商家,另辟蹊径,没有采用这种视觉模板,而是选择了用模特托举的方式,打造出新的视觉,脱颖而出,卖了300+,远超所有竞对。 这就是简单产品同款竞争,靠视觉迅速打出差异化。  再然后,视觉做好了可以提升产品的溢价。 同样的产品,你的图片好,视觉好,就可以卖的更贵,赚更多的钱,消费者愿意支付更高的溢价。 比如同样的一款包包,好的视觉打造,好的图片,可以以189元的高价,爆卖7000+。 并且有效抵御了仿款的低价冲击。  而仿款们靠着山寨的视觉,只能以100元以下的低价来去竞争,但根本卖不动。  人,永远是视觉动物,永远喜欢好看的,高级的,漂亮的东西,并愿意为此付出更多的钱,这是亘古不变的真理。 如果你对以上增益都不太感冒,那接下来的点则一定会打动你。 也是最最最重要的一点,就是: 视觉做好了,产品的引流成本会更低,获得流量会更便宜。 同样的产品,在做广告推广时,你的图片好,视觉好,点击率高,获得流量的成本就低,这是最直观,最可量化,最让人激动的竞争力! 这也是基于电商广告系统的特性决定的。 你在投放时,图片点击率越高,代表广告利用效率越高,从而平台会主动给你降低获得流量的成本,让你获得更多流量。 以我最近在投的一个广告计划为例。 我的某款产品在投放时,因为图片质量不好,最开始点击率很差,点击率只有1.9%,可以说是非常低了,我获得一个流量的成本要0.43元。  后来我们对产品图片进行不断地优化,将图片不断重拍,修图,调整,逐步将点击率提升到了6%, 我们获得一个流量的成本就降到了0.26元。  乍一看只是降了1毛7这么少的钱,但要从整体投放来看,却是非常客观。 以前花100元投放广告,在一个流量0.43元的成本下,只能获得233个流量。 优化之后再花100元投放广告,可以获得384个流量。 整体提升了64%。 同样的推广费用,获得了更多的流量,就会获得更多的销售额,换来更好的投产。 这在海量产品的竞争中就更加重要了。 你和别人卖同样的产品。 你的图片质量差,视觉差,投广告,获得一个流量的成本要0.4元。 而竞对的图片好,视觉好,投广告,获得一个流量的成本只要0.2元。 同样花10元钱,竞争对手首先能比你多获得一倍的流量,其次竞争对手的产品图片好看,转化率越高,获得的流量多,获得销售额也多;你获得的流量少,图片差,转化低,获得的销售额也低,竞对最后就会卖的越来越好,会赚到钱,而你卖什么都会赔钱。 你和竞对的差距不是在产品,而是在视觉。 最后我想特别说一下: 视觉也是我们普通人电商创业初期,最能低投入,高产出,最能以小博大,做出竞争优势的环节。 你说你一个普通人,你有电商广告的投放能力么?没有。 你有牛X的供应链么?没有。 你有钱么?没有。 你有牛X的选品能力么?没有。 你有牛X的主播资源么?没有。 你什么优势都没有,没有钱,没有供应链,没有技能,没有打法,没有经验,你能做的,就是在视觉上下功夫,做投入。而这方面的投入成本是非常低的,往往却能收获奇效。 所以做任何电商,产品和视觉永远不能分割来看,甚至视觉的重要性,远远大于产品。 毕竟消费者无法通过平庸的图片,来去判断你的产品是否是否足够优质。 ## 二、暗坑一:产品的视觉可实现 既然视觉很重要,那我们在选品时,就要重点考虑到产品的视觉可实现度。 这个“视觉可实现“”包含两点: 一个是你选的产品,通过自己的能力,就能低成本,较容易得做出视觉;另一个就是你自己做出的视觉,还要高质量,充满竞争力。 很多朋友想创业做电商,天天想做这个品类,做那个品类,结果选完产品才发现,你根本无法独立做出视觉,做不出高质量的视觉,做不出低成本的视觉。 那你这个项目根本推进不下去啊,这个产品再好也和你没有任何关系啊! 比如咱们有很多朋友喜欢宠物品类,想做猫窝狗窝。  但实际上当前猫窝狗窝等宠物类产品,视觉的竞争非常激烈。 要想做出高质量的视觉,不仅要进行布景,打灯,单反相机,同时还要配上宠物共同拍摄,才能做出较为优质的图片。 以下是某宠物用品的拍摄场景,可以看见非常专业,已不是普通人可以轻松驾驭的。  如果你是名普通人,做电商,想做宠物类产品,想做猫窝狗窝。 结果选好品后,你就会发现:你做不出这个产品的视觉,或者即使做出来,视觉也非常丑,非常烂,毫无竞争力;推广也推不动,根本卖不掉;所以你选品选的再好,也毫无意义。 还有很多朋友说,我可以盗别人拍的优质图片,可以用供应商的图。 那这不又回到了问题的原点:你的视觉图片又就和别人一样,陷入了同质化的竞争。 但问题是别人的产品有销量,有评价,有买家秀,有权重,你的产品销量挂0,什么人群权重评价都没有,怎么可能卖的过别人呢? 所以对普通人来说,你创业选什么产品并不重要,你是否能做出这个产品的高质量视觉才是最重要。 那如何判断这个品类,产品的视觉是否可实现,接下来让我们做一组视觉分析练习。 我选了几个大家创业非常想做的品类,来判断一下它们的视觉是否容易实现。 这些品类涵盖小家电,日用品,女装,儿童文具。  比较遗憾的是,这些产品要想做出高质量的视觉,难度都非常大。 比如像小家电这个产品,视觉已经不是通过单纯的摄影就可以解决,而是需要用3D渲染的方式去制作,普通人不具备这样的能力。  而饭盒这个产品,你不仅要做好布景,打光,摆放,高清摄影,还要里面放上菜肴…. 女装就更不用提了,需要高级,有表现力的模特,需要进行搭配,找景,费用也更高。 而笔袋产品拍摄同样复杂,对光影,拍摄角度,背景的要求极高,才能做出视觉张力。 如果你无法做出以上几类产品高质量的视觉,则你选它们,想做它们,没有任何意义。 那接下来我们再看一组产品视觉,判断是否容易实现。 以下品类分别为:手链,手机壳,女包,软件。  看完这些品类你是不是自信心又回来了? 会发现它们的视觉就容易很多,而且只要视觉达到这样的程度,就可以售卖较高的销量。 这些视觉大部分只需要一部手机就能完成。 像手链只需要放在手里进行拍摄就行, 手机壳铺上一块白布,打点光,就能拍摄出来。 女包找个酒店,扔在床上,就能轻松出图。 而卖PS软件,只要你会用美图秀秀,就能直接出图。 所以如果你选择做这些品类,选好产品后,继续推进,至少到视觉层,就会相对轻松很多,不至于被卡死。 还有一些产品,看着视觉简单,但其实较为复杂,比较难实现。 比如发夹这个品类。小小的一个发夹,普通人是很难做出这样高质量的视觉。  因为这个拍摄对模特的脸型,发型,妆造,要求都很高。 普通人很难有这样的颜值,很难拍摄出来。 但并不代表我们做不了发夹品类,在这个品类中,还有另一种优秀的视觉解决方案,就很适合普通人。 就是直接用产品图+明星图拼接,依然可以做出优秀视觉,卖出很高销量。  那这种视觉方案就很简单了,连拍摄都省了,你只要会做图软件就行。 所以如果你选的品类发现视觉都比较难实现,那可以再多找找案例。一般一个电商大品类,会有3~4种不同的视觉方向,说不定,就会有适配你能力的方向。 ## 三、普通人如何提升电商视觉能力 我再次强调:视觉可实现,一定是以高质量的视觉呈现作为标准。 如果仅仅是将产品图片拍出来,没有任何意义。 图片普通,平庸,就不会有势能,不会让消费者下单购买,也不会获得较低的引流成本。 所以我们也需要通过一些学习,训练,和场外辅助,来去提升自己的“视觉可实现”能力。 比如你需要提升审美能力,你需要看大量的产品图片,案例,至少看100个以上,你至少要知道什么是优质的图片,什么是劣质的图片,对吧? 在做笔袋这个品类时,我们就搜集了100个产品,进行大量的视觉对比,最后选择高质量的视觉方向,去实现。  其次,你需要看一些手机摄影教程,了解静物摄影的基本操作方法。 得益于互联网的发达,在小红书和B站有大量免费内容供你学习,希望你不要懒惰,从现在开始学习手机摄影。  再然后,你可以买一些道具,拍摄背景布,小灯光等,进行拍摄练习,这些产品便宜又好买,随处都可以买到。  如果你就是懒,审美差,或者就是笨,学不会,或者就是搞不定视觉,那我劝你是不是可以放弃做电商了? 毕竟这是电商初期最简单的事情,连这个事情都搞不定,后面更难的你咋解决? 开玩笑,如果你确实搞不定视觉,那就可以求助场外团队的帮助。 现在有很多摄影团队接这种商品拍摄需求,价格也很美丽,你也可以将这块外包出去,专业人做专业事。  即使像3D渲染这样高难度的项目,也可以求助外包团队来帮你。  总之就是越复杂的产品,视觉可实现的成本和难度就越高,越需要场外协助。 但我不建议普通人,在初期就投入这么多的资源和金钱去做这个事情。 因为你根本不知道这个品类的水深,也没有完整走过电商流程,后面会遇到什么困难你都并不知道,前期过高的投入会让你压力倍增。 所以我建议,如果你是一名普通人想电商创业,初期选品,还是要优先选择视觉实现难度较低的品类,你自己学习一些手机摄影,做一些布景和构图分析,就能完成高质量的视觉呈现。从源头处就规避后面的诸多困难。 所以可能没有做过电商的人,确实无法想象,电商创业初期最核心的技能之一,居然是手机摄影。 ## 四、暗坑二:长周期可实现 除了视觉层面的暗坑,很多人选品阶段比较会忽视的,就是品类自带的周期性节奏。 很多产品并不是每天都有较强的市场需求,而是有着自己的销售节奏。 节奏最明显的产品就是节日类产品,比如圣诞树,比如春联,这种产品一般只有在特定的时间段会有爆发式销量。 以下是春联产品的销售趋势。 大家可以看到只有在春节期间,产品才会有爆发式销量。其他时间销量都惨淡。  再比如像儿童书包这样的产品,也有销售爆发节奏。 比如通过下图可以看到,儿童书包的爆发趋势一般是在8月中下旬,达到最高峰。其余时间都是淡季。  为什么儿童书包这个品类的爆发时间不是在双11,而是在8月下旬? 为什么? 因为小朋友们9月份就要开学上新年级啦! 开学上新年级,自然要买新书包,新文具,开开心心上新学年。 再比如像女装品类,以连衣裙为例。 连衣裙在4月下旬和6月份迎来销售旺季,其他时间要么是缓慢增长,要么是快速下降。  这些节奏鲜明的产品对运营节奏的把控,推广经验,要求都比较高。 因为没有到销售旺季,平时单量就会比较少,但又要长期的积累销量,评价,权重,然后在临近爆发前,进行猛烈的投放,拉新客,拉加购,进行消费者的蓄水,大量备货,最后在爆发节点进行销量的收割。 对于资源,运营节奏,资金,备货,推广能力,都有着非常高的要求。 初期我不建议普通人去做这种周期性很强的品类,毕竟很多人连推广,转化,拉量,供应链都没搞明白,产品上早了,卖不掉;产品上晚了,不会推,推不动,过季了,白费了时间和精力。 所以我也不建议新人最开始就做服装行业,服装品类的周期性更替太快。节奏稍微没卡上,就过季了。 之前有一位朋友,我带着她做电商,非要做连衣裙品类。 我反复劝说她,连衣裙只就能打一波夏季,时间非常紧张,但这位朋友不听,非要做。结果选款,搭配,拍照,做视觉,墨迹墨迹就搞了好几个月,等产品上架后,夏季已经快要结束了,那选品再好,搭配再好,视觉再好,又能有什么用呢?产品都已经过季了,没有消费需求了。 所以品类的售卖周期是另一个暗坑,普通人电商创业初期,选品一定要选长周期可实现的品类,最好一年365天没有明显的淡旺季,每天消费者都会有购买需求。 一般大多数生活用品,日用品,都是长周期的品类,比如马克杯,买杯子不需要等待,说买就买; 比如手机壳(不过手机壳品类也有一定的销售波动,一般苹果华为小米新品发布后会拉动一波手机壳的销量,但日常大家依然是想买就买); 比如汽车用品,比如冰箱贴,比如纸巾盒,比如穿戴甲,比如小饰品等等。 这些产品没有太强的销售周期,基本365天天天都需要,普通人不用担心是否售卖过季,或者有较大的时间压力,可以有充裕的时间,一点点去磨转化,推广,因为随时都在售卖周期内,做的任何运营动作也可以第一时间得到反馈。 没有走完电商全流程的你,不要妄想去踩某个品类的销售节奏,因为你根本没那个能力和经验,去把控产品销售的节奏感。 ## 五、暗坑三:低成本流量可实现 做电商,除了自己做内容搞流量,大部分时候,我们都是要花钱去投广告,采购流量。 那每个品类的流量成本都是不一样的。 有的品类流量成本低,有的品类流量成本高。 一般来说,大部分情况下: 需求量越大的产品,流量成本就越低,因为需求的人多,电商平台广告可以展现给更多的人,广告成本就会均摊,并且鼓励更多的商家投广告,增加供给。 客单价越高的产品,流量成本越贵,这也很好理解,客单价高的产品,能买的人都是高价值用户。 高价值的用户,流量肯定贵啊,毕竟都是非常优质的用户,得卖给商家一个好价钱。 大品牌集中度较高的品类,流量成本越贵,比如美妆产品,护肤产品,宠物类产品,这些品类虽然市场大,但都是大品牌集中度很高的品类,小卖家生存空间很小,大品牌们互相竞争,天天砸广告,互相把流量成本给抬了起来。 以上是几种比较明显的情况。 当然,流量成本也受很多其他因素的影响,比如我前面说的视觉,时间,客单价,都会影响流量获客的成本,但基本上一个品类的流量成本,大致是趋同的。 比如我们看面膜品类的流量成本。下图为某面膜品牌投放广告的获客成本。  这个广告成本就非常恐怖了,已经不是普通人能做的品类,买一个消费者进到你的产品,还没有下单,3~7元基本就就花出去了。 现在很多人都养宠物,有一些人就想做猫粮品类,但猫粮品类的流量成本也已经飙到了3~5元,买1个流量至少要花掉4元左右。  按照理想情况下拉来50个流量转化成一单,2%的支付转化率。 则获得一个成交订单,至少要花掉200元。 普通人基本可以放弃这个品类的创业梦。 我们再看一个大众产品,十几元,二十几元的马克杯品类,看看它的流量成本是多少。  看到这个流量成本,是不是就觉得开心了很多,获得一个流量只要7毛钱。 根据我的经验,如果将视觉,选品做的更好,马克杯获客成本降到0.5元,0.4元,都是有可能的。 因为马克杯需求量超大,不是大品牌垄断,有很多产品,容纳了不同图案,主题,规格的需求,所以流量成本就低,能容纳很多小卖家。 小卖家做好产品视觉,靠着较低的流量成本,做好推广,转化,就有机会赚到钱。 我们再拿针织衫这个品类举例。  针织衫到了冬季,需求量旺盛,可以说爆发,再加上服装是一个超级大品类,流量爆棚,所以针织衫品类的流量就比较便宜,最低可以达到0.3元,如果视觉做的好,流量降到0.2元也是有可能的。 这也是女装品类即使竞争异常激烈,但依然不断有人加入,因为需求量巨大,流量成本低。 那你可能会问,在哪可以看到这个品类的流量成本呢? 需要你开店,需要你真正开始做电商后,才会逐步了解每个品类的流量成本。 这就是我一直强调,普通人初期在选品上不用纠结太多,不需要思考太多,因为你没有做过,没有经验,没有实操,你对选品的思考都是很浅层的。 你更需要的是尽快投入进去,跑一些流程,积累一些经验后,再去不断回看自己的选品。 当然,只要你初期选一些大众类产品,有大量小卖家集中生存的品类,基本流量成本都不会太高。 有很多内容说做电商要做新兴市场,要做蓝海市场,要做红利市场,我认为这些理论对于普通人来说都是不现实,不落地的,普通人只需要关注,这个市场,这个品类的流量成本是否足够低,只要够低,需求量大,那做好产品视觉推广,就一定可以做起来。 市场这么大,多你一个,不会让竞争变得更加激烈,少你一个,也不会让市场变得更加宽松。 多你一个不多,少你一个不少。 ## 六、总结 好,又洋洋洒洒写了几千字,我们来总结一下: 普通人除了要建立一个正确的选品思路外,也要注意选品过程中的一些暗坑,这些暗坑会非常影响你后续项目的推进。 最重要的是视觉可实现度,你选的品类,能否顺利打造出优秀的视觉,才有后续销售的可能。 其次是产品的长周期可实现,你的产品售卖周期长,365天天天都能卖,就会给到你足够的时间和空间,不断去打磨,不会有时间紧张的压力。 最后就是低成本流量可实现。你选的产品,一定要流量成本较低,只有这样,你用少量的推广费用,就可以买到一定流量,做出销售,获得一定的利润,如果你的选品能在后续做出好的视觉,有着较长的发挥空间,以及能低成本的获客,那就是相当成功了。 当然即使不成功也没事,那咱们就再换品类,换产品嘛,无需纠结。 好,那今天的内容就到这里,感谢大家的阅读, 祝各位选品好运! 本文由人人都是产品经理作者【刘玮冬】,微信公众号:【刘玮冬创业手记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。