所有文章

美国FDA出台更严格新冠疫苗加强针审批标准 健康人群需提供更强证据

美国食品药品监督管理局(FDA)周二发布新版新冠疫苗加强针监管指南,对健康人群设定了更严格的审批标准。根据发表在《新英格兰医学杂志》的指导文件,FDA将依据患者重症风险实施分级证据标准。该文件由FDA局长马蒂·马卡里(Marty Makary)与疫苗监管负责人维奈·普拉萨德(Vinay Prasad)共同撰写,后者是以批评制药业著称的学者。 [![](https://static.cnbetacdn.com/thumb/article/2021/0524/969b52798c08cc9.jpg)](https://static.cnbetacdn.com/thumb/article/2021/0524/969b52798c08cc9.jpg) 这一政策调整正值卫生与公众服务部部长小罗伯特·F·肯尼迪(Robert F. Kennedy Jr.)——著名的疫苗怀疑论者——全面改革国家卫生机构之际。 对于65岁及以上老年人,以及6个月以上存在特定基础疾病的患者,FDA表示可接受免疫原性数据(证明疫苗能激发足够抗体反应)作为获益大于风险的判定依据。但对6个月至64岁无风险因素的健康人群,该机构要求必须提供随机对照试验的临床终点证据,包括降低感染率或住院率等实际疗效数据方可获批。 高风险人群疫苗获批时,FDA将要求药企承诺开展健康成人随机对照试验作为上市后研究。此前FDA主要依赖免疫原性数据审批针对新流行毒株的年度加强针,这种模式与流感疫苗审批机制类似。 “新政策体现了监管灵活性与科学严谨性的平衡,”FDA在文件中表示,“既确保高风险人群及时获得疫苗,又要求提供健康人群的黄金标准数据。”马卡里与普拉萨德将于美东时间周二下午1点通过线上会议阐释新框架。 [查看评论](https://m.cnbeta.com.tw/comment/1501146.htm)

2025-05-20 16:35:40 · 0次阅读
 
 
新的CAD图像泄露揭示三星Galaxy Z Fold 7和Flip 7的完整尺寸和设计细节

三星似乎正为 Galaxy Z Fold 7 和 Z Flip 7 的发布做准备。随着发布日期临近,各种传闻似乎也愈演愈烈。最有趣的猜测是,Z Fold 7 最终可能会成为史上最薄的可折叠手机。虽然外界对这一传言持怀疑态度,但[SamMobile](https://www.sammobile.com/news/samsung-galaxy-z-fold-7-flip-7-thinness-dimensions/)最新泄露的 CAD 文件似乎为即将推出的机型带来了更多细节。 根据最近出现的渲染图,我们可以看到三星大幅减少其手机的厚度,尤其是折叠时的厚度,Z Fold 7 展开时的厚度介于 9 毫米和 4.54 毫米之间,这是迄今为止最光滑的外形,尤其是考虑到 Oppo Find N5 保持的当前记录,该记录比 Z Fold 7 厚 0.1 毫米。这可能会改变公司的游戏规则,并可能有助于其在来自中国对手的激烈竞争中重新获得地位。 ![](https://static.cnbetacdn.com/article/2025/0521/50d535ee3562901.jpg) 然而,纤薄外形的重点似乎更多地放在了Fold机型上,因为Galaxy Z Flip 7的厚度并没有太大变化。图片显示,Flip机型展开时厚度为6.94毫米,折叠时厚度与前代产品相同。如果将摄像头凸起也考虑进去,手机厚度将降至9.17毫米。 ![](https://static.cnbetacdn.com/article/2025/0521/3b9f9a9296afa47.jpg) Galaxy Z Fold 7 的官方尺寸为 158.43 x 143.14 x 4.54 毫米,Z Flip 7 的官方尺寸为 166.61 x 75.23 x 6.94 毫米。三星今年似乎将重点放在 Z Fold 7 的外形上,并不断优化其设计,Z Flip 7 的改进也只是循序渐进。虽然尺寸信息确实有助于更清晰地了解预期,但随着发布日期的临近,更多细节将会浮出水面。 [查看评论](https://m.cnbeta.com.tw/comment/1501144.htm)

2025-05-20 16:35:28 · 0次阅读
 
 
Red Hat与AMD合作为AI工作负载提供开源GPU/加速卡支持

除了 AMD 与红帽合作开发面向[Gen AI 的全新 llm-d 开源项目](https://www.phoronix.com/news/Red-Hat-llm-d-AI-LLM-Project)外,AMD 和红帽今日还宣布,双方将进一步合作,为 AI 工作负载提供开源 GPU/加速器支持。AMDInstinct 加速器现已在红帽 OpenShift AI 上全面启用。 AMD Instinct MI300X GPU 也可与红帽企业 Linux AI 配合使用,同时双方还致力于与上游 vLLM 社区进一步合作,以进一步增强开源 AI 推理能力。 Red Hat 和 AMD 将在以下领域开展合作: <blockquote>AMD <strong>GPU 性能提升</strong>:通过上游 AMD 内核库并优化 Triton 内核和 FP8 等各种组件,Red Hat 和 AMD 正在提升密集模型和量化模型的推理性能,从而能够在 AMD Instinct MI300X 加速器上更快、更高效地执行 vLLM。<p><strong>增强的多 GPU 支持</strong>:改进集体通信和优化多 GPU 工作负载为更具可扩展性和节能性的 AI 部署打开了大门,这对于需要跨多个 GPU 进行分布式计算的工作负载尤其有益,可减少瓶颈并提高整体吞吐量。</p><p><strong>扩展 vLLM 生态系统参与</strong>:Red Hat、AMD 以及 IBM 等其他行业领导者之间的交叉合作有助于加速上游开发,推动 vLLM 项目和 AMD GPU 优化的持续改进,进一步使依赖 AMD 硬件进行 AI 推理和训练的 vLLM 用户受益。</p></blockquote> ![image.webp](https://static.cnbetacdn.com/article/2025/0521/2d0eaaa06d567f1.webp) AMD Instinct 也将获得 Red Hat AI 推理服务器的支持。 如果您对 AMD 和 Red Hat 的最新合作感兴趣,请关注[今天的新闻稿](https://www.redhat.com/en/about/press-releases/red-hat-and-amd-strengthen-strategic-collaboration-expand-customer-choice-ai-and-virtualization-across-hybrid-cloud),了解更多详情。 [查看评论](https://m.cnbeta.com.tw/comment/1501142.htm)

2025-05-20 16:35:13 · 0次阅读
 
 
高危权限提升漏洞影响Atlassian Jira数据中心产品

高危漏洞!Jira数据中心遭权限提升攻击,企业需紧急升级!

2025-05-20 16:25:33 · 0次阅读
 
 
蚂蚁武威:下一代「推理」模型范式大猜想

R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。一方面,R1 证明了大模型深度思考的可行性;与此同时,尽管 R1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站在更高视角思考,提出前瞻引领的技术思想。蚂蚁技术研究院自然语言处理负责人武威对推理的思考就是其中一个典型。 武威的本科与博士均毕业于北京大学数学科学学院。2011 年获微软学者后,他于 2012 年加入微软亚洲研究院,历任主管研究员、微软小冰首席科学家。加入蚂蚁前,他还曾任美团 NLP 中心负责人。 针对模型的推理,武威从数学出发,提出了许多与目前业内主流不同的声音。 事实上,早在 OpenAI 发布 o1 之前的 2023 年下半年,武威与团队就已开始研究大模型的推理问题。武威指出,R1 的实现结果是令人兴奋的,但同时他评价,长思维链推理未必最优,“因为这样的模型维度太高、能量太高,以致表现不太稳定。” 实际上,物理与化学中的大量现象均表明,能量最小的结构才最稳定。因此,武威猜想,未来的推理模型可能是更低维、更稳定的人工智能系统。如果说长思维链是系统 2,一些研究则显示,在人的日常思考中,占主导的往往是消耗更低的系统 1。 此外,当前的主流推理模型都出现推理结果正确、但推理过程出错的现象。在长思维链的实现中,纠错的成本也随之增加。同样以数学为例,武威指出:当推理模型发展到最后,思考过程或许比结果更重要;相比解决一个问题,模型在思考中发现新知识(如经典数学问题的新证法)是更有价值的——由此可见,深度思考还有很大的潜力。 如何设计一个能够将系统 1 与系统 2、或快思考与慢思考高效结合的推理模型,成为大模型的下一个重要方向。而武威认为,从数学的角度出发,用一个优雅的数学模型去刻画人工智能的思维方式或许是终极解法;亦或者,自洽是所有推理系统的最终归宿。 以下是 AI 科技评论与武威的对话: **1、什么是「推理」?** **AI 科技评论:现在圈内对于「推理」有各种各样的定义,还有的观点将 Reasoning 与 Inference 相混淆。** 武威:对。根据我自己看的文献,「推理」的定义最早能够追溯到 2011 年。那一年,机器学习大佬 Leon Bottou 写了一篇文章,叫「From Machine Learning to Machine Reasoning」。当时业内对「Reasoning」还没有一个清晰的定义,Leon Bottou 就在这篇文章说,他认为「Reasoning」(推理)是「代数地操作已有的知识去解决新的问题」。 ![](https://static.leiphone.com/uploads/new/images/20250521/682ca844d9623.png?imageView2/2/w/740) 论文链接:https://arxiv.org/pdf/1102.1808 那什么叫「Reasoning System」(推理系统)呢?Leon Bottou 认为,推理系统应该包含两点:一是包含一个函数的代数空间,二是任何一个问题都能对应到这个代数空间中的一个函数组合。——我当时看到这个观点,就觉得跟 Marvin Minsky 在上世纪 80 年代的一本书《Society of Mind》(心智社会)中对「智能」的观点是非常吻合的。 什么是真正的智能?Minsky 认为,人的意识应该是由非常多的小的过程(smaller processes)组成的,他管这些叫「Agent」(智能体)。这些Agent能够解决非常简单的问题,而且几乎不消耗能量。当遇到复杂问题时,这些Agent一部分会被激活,并且会以一种方式组合在一起——这时候真正的智能就诞生了。 今天再看,Minsky 在上世纪 80 年代提出的观点可能有点过于经验性,但同时我又觉得非常有道理,因为它非常符合人的直觉。而 Bottou 的文章是用形式化的语言进行了解释。Bottou 所提到的这个函数的代数空间,你可以认为是这些智能体的一个集合;而这个函数的代数组合,则是 Minsky 所说的智能体之间的连接或组合。雷峰网 接着,Leon Bottou 又在文章里提出了一个有趣的猜想。他说,现在有各种各样的推理系统,包括概率推理、逻辑推理、因果推理等等,那么最终的推理系统会是什么样的呢? 他认为有两种可能:一种可能是出现一个绝对强的(推理)模型,把这些小的(推理)模型都干掉,而且这个超强模型是能够扩展、能够计算的,计算成本也是大家能负担得起的;另一种可能是,不同的推理模型互不干涉、各干各的,因果推理做因果推理,概率推理做概率推理,逻辑推理做逻辑推理等等。 今天来看,其实 Bottou 的第一种预言被验证了,这个超强的模型就是「大模型」。但即使大模型出现了,「推理」这件事也仍然是模糊的,而如果让我给一个定义,那么我觉得,推理是指:用逻辑组合知识解决新问题的过程。 **AI 科技评论:R1 有「推理」的雏形吗?** 武威:有,因为假设你让它去解决数学题,第一它有知识,它会说这个问题应该用 XX 定理去解;然后它会说,解决这个问题应该怎么做、中间的步骤是什么。这其实就是将数学知识以一种逻辑整合在一起解决问题。雷峰网 如果将模型应用到其它方向上,不再是解决数学问题,而是变成旅游规划,那么模型就要对旅游目的地的人文、地理、美食等知识有所了解,最后将这些知识以合理的逻辑组合在一起,生成一个旅游方案。 如果没有足够的知识,或者正确的逻辑,那就会出错:比如我跟大模型说要去西北旅游三天,模型输出结果告诉我,第一天上午在乌鲁木齐、一个小时后就跑到西安,那就不是正确的「推理」了。所以我说,推理是要用逻辑将知识合理地组织在一起,「知识」与「逻辑」缺一不可。 **AI 科技评论:是不是 R1 出来后,您才看到「推理」范式有所诠释?** 武威:我觉得 R1 提供了一种「推理」的可扩展的实现方式,这很了不起。但我同时觉得,长思维链的「推理」并不一定时最优的,原因在于能量太高、维度太高。 物理与化学都是追求「最小能量」,因为能量最小的时候、结构最稳定。在化学中,势能最低时、结构最稳定;在热力学中,自由能最低的时候、系统才稳定。 但在长思维链的推理中,本质上是每一个 token 的预测对应词库上的一个分布,当你有 1 万个 token 时、其实就是 1 万维,1 万乘以这个词库维度的向量是非常大的、非常高维的,与之相随的就是系统不稳定。现在的推理模型实际上在训练过程中也很不稳定。 所以我觉得,未来在推理模型上应该有一个更低维、更稳定的系统出现。现在的长思维链推理都太高维、能量也太高,只要用自回归的方式做长推理都会面临这个问题。 **AI 科技评论:那现在除了自回归,还有其它的技术路线去实现模型的推理吗?** 武威:现在大家也在探索。把你的问题绕开一点,首先现在大家又回到了已有的「范式」:当「好」出现之后必然会走向「快」和「省」,所以现在研究推理的人在做「高效推理」。但我觉得,「高效推理」也并不是一个本质的、系统性的解法。雷峰网 我认为真正系统性的解答,应该是想办法用一个模型把「推理」的能量降下来。不管是在强化学习里加长度的约束,或者进行混合长度微调,我都觉得不算太优雅,不是最终解决方案,因为你最终的范式还是在一个大空间里面去搜索。 o1 是一种相对新的「推理」范式,但步子迈得没有那么大,本质上还是自回归生成、token by token。只是做得足够长了,发现在更长的文本中好像模型能够去反思、模型效果会变好,但其实还是预测下一个 token。这就牵引出另外一个问题:预测下一个 token 会是推理的有效解吗? 我觉得它可以作为一个解法,但不一定是那个最好的解法。用数学的话说就是,梯度确实是在下降,但还没有下降到局部极小。 **2、「推理」为什么重要?** **AI 科技评论:您在人工智能领域做了这么多年的研究,您的研究世界观是怎样的?** 武威:简单来说就是 8个字: “多快好省, 双商齐备”(智商与情商)。 “多快好省”原是零售里的说法。在零售中,“多”指“品类多”,能在网上买到各种各样的商品;但在研究中,我们希望的“多”,至少包括两块: 一是模型的任务范围要广,解决尽量多的任务。这很重要,比如现在的大模型推理,大家将其聚焦在数学与代码上,就不够多,世界上其实很多问题都需要深度思考才能解决; 二是模型处理的信息要足够多。ChatGPT 刚出来时,上下文长度大约是 4k,到今天 GPT-4.1 发布时,上下文已经达到 100 万,看起来模型能处理的信息已经很多了,但实际上还不够多,因为未来我们或许希望人工智能系统能够处理 Lifelong Memory(终生记忆),能“记住”它在这个世界上经历的所有事情与信息。 第二个“快”,在零售中“快”体现为“送得快”,而在人工智能中的“快”,我觉得是“响应要快”。这在今天也是一个共识,现在各家都希望自己的大模型能响应地越来越快。“好”与“省”就是模型效果要好、同时要便宜,这也是大家所追求的。 事实上,人工智能的整个发展历史就是在不断地重复这样一个“多快好省”的故事。2018 年 BERT 出圈是凭借效果“好”、任务“多”,接着圈内大家基于 BERT 往两个方向发展:一是追求更大的模型(如 GPT-3),从结果上看是效果更好,任务更多(生成也能做),二是追求模型的轻量化(即“快”与“省”)。 先是“多”与“好”,接着走向“快”与“省”。当“多快好省”这四个字都达到了一个边际效益很低的水平时,整个人工智能领域在干什么呢?在准备下一轮的突破。 2022 年,大家觉得 BERT 的“多快好省”已经达到一个瓶颈时,ChatGPT 出来了,也是先“多”(什么都能做)与“好”(解决一些原本做得不太好的任务,比如长文本生成)。到今天,大模型的追求又变成了要越来越快、越来越省。比如 GPT-4 刚出来时,响应是一个字一个字地蹦,后来变得越来越丝滑、流畅。 所以我觉得,无论是需求侧(用户)、还是供给侧(研发人员),大家对人工智能的“多快好省”追求都是永恒的。 “多快好省”是基础, “智商”与“情商”是上层能力。模型能力不强的时候,大家很少讨论智商、情商,但现在谈得越来越多,解读也有很多。 在我看来,我想追求的“智商”是:用逻辑组合知识,去解决实际问题。这当中有两个非常重要的概念,一是知识,二是逻辑,而且要有机地组合在一起。智商的一个外延体现就是 Reasoning(推理)。 情商这块,我们希望人工智能系统可以理解人的情绪、人的心理状态等,在与人交互的过程中能够共情。这很重要,因为现在的大模型都是大应用、都要跟人交互。我们希望沿着这 8 个字的大方向去做一些对行业和社区有价值的研究。 **AI 科技评论:沿着这个大方向,你们目前有哪些有趣的研究?** 武威:比如“多”,我们一个聚焦的点是长上下文,不仅包括文本、还有多模态。实际上,多模态比文本更需要长上下文,一条几分钟的视频就可能产生超过百万的视觉 token。我们刚开源了一个叫 ViLAMP 的 7B 长视频理解模型,单卡就能处理 3 小时视频,而且效果在目前的开源模型中也基本是 SOTA 的。 再比如“好”,我们很看重“推理”(Reasoning),因为推理让人工智能有希望把一些复杂问题解决好。“推理”是一个很模糊的概念。如果你去看不同的领域,会发现心理学、哲学、数学与计算机等不同领域对“推理”的定义是不一样的。而在我看来,“推理”是用逻辑组合知识的过程。在这个大框框下,我们先后做了知识推理智能体 AMOR,基于代码规划的推理范式 CodePlan,以及基于深度思考的问题合成方法 PromptCoT 等。 再比如“情商”,连数据都不太完善,因此今年我们也开源了一个包含 130 万条个性化对齐数据的数据集 AlignX,至少希望社区能先玩起来。总的来说,这块的研究还没有收敛,但我觉得“情商“”最终还是要走到模型对人类世界的理解,而这个理解也可以认为是某种程度上的 “推理”,只不过可能是对人类偏好或人类情绪的推理。今天大家把“推理”限定在了数学与代码上,最后大模型都变成了做题家与程序员,我觉得范围限制太死了,实际上大模型还可以是好的产品经理、销售、朋友,有非常大的潜力。所以我说,推理这件事很重要。 **AI 科技评论:您入行 15 年,经历了许多重要的技术浪潮。您认为,为什么在现在这个时间点,推理显得更重要?** 武威:我记得在 MSRA 的时候,大约是 2014 年,大家还讨论过为什么 NLP 叫“自然语言处理”。因为当时大家觉得,机器都还不能理解人类语言,更别提生成了。 那时深度学习开始兴起,NLP 也开始拥抱深度学习。2015 年,我参加 ACL,当时是 Christopher Manning 做了开幕式演讲。他当时形容,NLP 就像躲在战壕里的兔子,深度学习就像一把机关枪或大炮,正在瞄着这些兔子、准备把它们一扫而平(笑)。 后来发现,在深度学习的帮助下,机器对语言的理解能力好像还行,后来又发现竟然还能生成、创造。这是一件了不起的事。深度学习不仅在语言理解上展示了非常强大的潜力,更重要的是它让生成也变成了可能。 到 2018 年 BERT 出来,“预训练+微调”又是另一个技术浪潮,直接改变了整个 NLP 的运作范式,使 NLP 走向了大一统。2020 年 meena出来后,短文本生成已经做得很好了。ChatGPT 出来后,长本文生成被突破,这在之前的很长时间里是不可想象的。现在没有人单独研究长文本生成,因为被大模型研究囊括了。 所以总的来说,当我们在讲自然语言处理时,我们在问自然语言是否能理解;BERT 突破了理解后,我们又问自然语言是否能生成。从处理、理解到生成,是计算机逐渐掌握人类语言的过程。 经历了一波又一波大的发展之后,我就非常想看推理,因为我觉得现在生成也被突破后,下一步就是推理。推理涉及到要将知识进行组合,复杂度更高,也能解决更复杂的任务。 **AI 科技评论:您是从什么时候开始思考推理这个问题的?** 武威:2016年我们在讨论小冰未来的技术时就觉得推理很重要,因为小冰做不了推理,所以很多任务解决不了。 说实话,讨论推理在当时是非常超前的,因为那时候的 Chatbot 不仅做不了推理,也普遍受限于知识不强、无法进行深度交流。没有知识,生成也会受影响。 当时我们通过生成的方式创造回复,只是将海量数据里的语言组合在了一起,符合人类的语言表达习惯、但没有知识,效果甚至比不过检索模型。今天的大模型也会有幻觉,也会在知识上犯错,但出现的情况已经不多。 我在小冰的时候,能想到研究推理,但没有机会去做,这多少受限于当时的技术,无法以一种规模化的方式去推理。当时我们甚至也想不清楚什么叫“推理”。 现在我觉得相对清楚了。所以我们团队真正开始研究推理是在我加入蚂蚁之后。这也是源于我几年前未尽的夙愿吧。 **3、「推理」的解法猜想** **AI 科技评论:2024 年以来,您的一些研究也围绕推理提出了不同的声音。您认为 o1、R1 之后的下一步推理应该怎么发展?** 武威:我刚才提到,大家都在做高效推理。但如果从快思考、慢思考的角度来看的话,这个话题其实也很有意思。 《思考,快与慢》这本书是从心理学的角度来解释一些问题,也比较经验、没有一些形式化的验证。但我们今天来看,OpenAI 的大模型有两个版本号,一个是数字系列(如 GPT-3、GPT-4),另一个是 o 系列(如 o1、o3),两个系列分别代表快思考与慢思考,就体现了从系统 1 到 系统 2 的演进。 ![](https://static.leiphone.com/uploads/new/images/20250521/682ca8cada21c.png?imageView2/2/w/740) 大家对系统 1 与系统 2 的认知基本已经达到共识,系统 1 的特点就是快、自发、没有消耗,系统 2 是要把注意力分配给需要花费很大努力的行为与心理活动上。这是作者丹尼尔·卡尼曼认为的快与慢的区别。不过这本书里,我觉得更有趣的是,作者写了他认为快思考与慢思考如何协调的问题。 第一个观点是,书中提到,其实人在每日思考的过程中大部分时间都是系统 1 的快思考占主导。 快思考会产生非常多且复杂的 idea pattern(观点模式),并将这些传递给系统 2。而大部分情况下,系统 2 不经思考就接受了、而不是每个 idea 都检查一遍。所以日常的思考大多是系统 1 的结果,系统 2 是懒惰的、只有在个别情况下才会去检查与思考。同时,系统 1 因为想得快,会有很多错误,而且还会为这个错误提供一些更深层次的洞见。 那为什么会有错误?就像今天大模型为什么会有幻觉?我觉得可以作为对大模型幻觉的一个解释。说白了还是能量最低,因为系统 1 要追求“认知的简便”(Cognitive Ease)——当我把这些信息跟我的认知整合在一起时,通顺、自洽就可以了,至于有没有错,系统 1 是不在乎的。 这是系统 1 喜欢干的事情,这么干确实消耗低。然后这些错误又因为系统 2 比较懒、不怎么查,所以导致这些结果被固化了下来。最后这类错误积累越来越多。这种错误的根源在于认知上的懒惰或简便,很难避免,但很有意思的点是,作者说:那你又避免不了错误,人怎么办好呢?他说,最好的办法是尽可能地发现什么情况下容易出错,然后对这些高风险情况尽量多思考。 最终,作者也没有就如何发现高风险情况提出解法。他认为,许多情况下,人最后就是变成了活在一个自洽的世界里,哪怕有错误、但只要自洽就好。 回到大模型。如果援引丹尼尔·卡尼曼的说法,大模型应该能将长推理与短推理结合在一起,合在一起可能是一个模型,也可能是两个模型,关键在于两个模型、或两个系统怎么调度。目前行业里也还没有特别优雅的方式,比较优雅的方式应该是自动分配两种模式。 **AI 科技评论:您提到了核心问题,就是系统 1 与系统 2 怎么结合起来?单一的 Transformer 架构可以实现吗?这块似乎也还没有共识。** 武威:我认为是还没有一个很好的模型、或者没有一个很好的 Equation(公式)来解决这个问题,所以大家都还在做一些尝试。比如把长思维链和短思维链的数据混合在一起做 SFT,这可能是一种解决方案。或者在强化学习上做长度的 Reward(奖励)。 但是,它们都还没有一个模型去刻画快思考与慢思考,或者说系统 1 与系统 2 之间的协作。 我觉得归根结底还是要有一个模型、最好是一个数学模型去刻画人工智能的思维方式。我的猜想是,这个模型很可能是在低维空间上的一个模型,通过将能量最低进行优化来实现。 **AI 科技评论:那接下来,您计划从哪些角度进一步研究模型的推理问题?** 武威:除了自回归以外,我们也看先规划、再推理这样的层次化结构。 比如,要做一个用户调研的方案,这个任务交给你之后,你是马上就拿起笔来开写吗?不是的,正常情况下是脑海中先有一份草稿,有一个抽象的规划,然后再去实现每个步骤。——你可以认为,这个抽象的规划就是整个推理过程中的一个低维表示,在这个低维下我再说我怎么把它展开变成一个高维的执行。这也是一种推理范式。 其实 Yann LeCun 每次采访都在说,规划与推理很重要。但同时,他又说,他觉得现在的推理模型好像不太对、因为太简单了。至于什么样的推理模型是对的,LeCun 也没说。 **AI 科技评论:刚刚提到系统 1 与系统 2。业内也有一种讨论,即我们在设计模型时是否一定要模仿人脑?** 武威:说实话,我觉得机器不一定要像人一样思考。这个问题其实也困扰了我很久,就是我们到底应不应该按照人脑的方式去设计人工智能的模型。举个例子,计算机能很快计算出 π 的值,但人脑就不行。 比如《思考,快与慢》这本书中,有大段对人的思维方式的描述,但这些描述就一定是对的吗?大家确实可以通过一些事实去印证书中的说法,但还是这个问题:你不能说第 1 个 case 是对的,第 2 个、第 3 个、第 4 个……到第 100 个也都是对的,第 101 个 case 就一定正确。 这在数学上是不成立的,数学不允许这种情况出现。如果有例外,数学就一定要有一个条件去约束、将这个例外抹掉。换句话说,不完全归纳法是不对的。 所以我想来想去,最后我的观点是,不管人工智能系统到底应不应该像人,我只要想办法去接近这个目标就好了。这个目标就是我刚才说的 8个字:多快好省,双商齐备。 **AI 科技评论:现在的推理还有一个问题,就是有研究发现,o1、R1 与 Gemini 等模型在做推理时,更重视结果的正确率,中间的推理过程可能是错的。** 武威:关于这个现象,我有两个观点。第一个观点是:我认为长思维链是以一种相对笨拙的方式实现了深度思考。当然,它非常有意义,因为它起码给出了一个实现,即使这个实现是高能耗的。我们不能天天空谈深度思考、却没有任何实现。 第二个观点是,当模型的能力发展到最后,思考的过程可能比结果更重要。因为我们回到数学来看,其实很多数学问题已经有结果了,只是有些结果被证实了、有些没被证实。 比如费马定理,最早叫费马猜想,它的结果早就有了,就是当整数 n&gt;2 时,方程 x 的 n 次方加 y 的 n 次方等于 z 的 n 次方没有正整数解。黎曼猜想也是,早就有结果了,重要的是:你怎么得到从这个假设到这个结论的整个求解过程。从数学的角度看,推理过程是非常重要的。 所以 Andrew Wiles 的巨大贡献,一方面是他证明了费马猜想,将费马猜想变成费马定理;更重要的是,在这个证明过程中,数学的许多新兴方向诞生,比如椭圆曲线、代数几何等等,这对数学界是巨大的贡献。 在我看来,推理是利用逻辑对知识进行有机组合。如果我们在不同的问题上都能给出各种各样的知识组合,那么会不会有一些知识组合是人类未曾触碰到的、对人类文明进步有非常大启发的呢?如果有,那么产生这些组合的价值远比你解决一个问题还要大,因为你会创造出新的知识来。 从这个角度看,其实深度思考的巨大价值与潜力还没有被挖掘出来。推理的结果很重要,但我更重视当中的思考过程。现在 R1 已经给我们提供了一个高维的实现,我们应该在 R1 的基础上去做更大胆的迭代。 **AI 科技评论:R1 出来后,有改变您对推理的看法吗?您对推理的研究有更兴奋吗?** 武威:我觉得还是很令人振奋的,因为R1 让我们看到了深度思考的一种规模化实现,不过R1本质上仍然是自回归,我觉得这里面空间还是很大的。 我觉得应该有一个通用的模型,但我也不知道这个模型长什么样子。所以 2023 年我们刚开始研究推理的时候,是先研究 Agent。 为什么是先研究 Agent 呢?就是因为我不知道通用的怎么做,没办法,只能先做一个特殊的 Knowledge Agent(知识智能体),看能不能扩展。我们把一个任务拆成一个个模块,然后再把这些模块用人工设计的逻辑串在一起。 就好像我们在解一道数学题的时候,你不会解,怎么办呢?就先找一些具体的 case,加一些条件。比如一个泛函问题,你先把它变成二维空间,二维空间能证明、再看三维空间能不能证明;当二维、三维都证明之后,再看中间有没有共性、能不能拓展到高维。 R1 令人惊艳的地方是直接就到高维了。我觉得更令人兴奋的地方在于通过深度思考来创造新的知识,那这一点 R1 还达不到,因为还没有办法保证思考过程是对的。我们也还没有办法保证我们的推理过程一定是对的,但我觉得这是一个很重要的问题。 后来我们又探索了 CodePlan,希望用代码实现先规划、后推理。只是我们当时做完后,受限于一些资源问题,没有办法验证它的效果是最好的。今年年初 DeepSeek 团队有一个工作,也是先用代码做规划,不同的是他们后来又将代码变成了自然语言。我猜测可能是因为纯代码的效果不太好。 最近我们又研发了 PromptCoT,尝试将深度思考用到问题合成上,也看到了非常惊艳的效果。一个 7B 小模型就可以和 32B 模型比肩。最重要的是,这个工作让我们看到了深度思考 for 其它任务的可能性。 其实大家都在想,到底下一代推理模型应该是什么样的,同时又希望追求智能极限。这两个目标都很难,特别是对企业来说。在企业里,你不太可能说,你有一个非常大的目标、要投入多少资金,还不能确定这个目标能不能达到,这是一个现实问题。理性来说,我们需要更多的 case 去支撑继续探索的信念。

2025-05-20 16:10:00 · 0次阅读
 
 
苹果公布WWDC 2025日程安排

苹果今天[公布了](https://www.apple.com/newsroom/2025/05/apples-worldwide-developers-conference-kicks-off-june-9/)其年度开发者大会 WWDC 2025 的日程安排,大会将于 6 月 9 日至 6 月 13 日举行。日程安排确认,苹果的主题演讲将于 6 月 9 日上午 10 点太平洋时间开始,预计苹果将发布 iOS 19、macOS 16、watchOS 12 和其他软件更新。 ![](https://static.cnbetacdn.com/article/2025/0520/27522b959632d8a.jpg) 主题演讲结束后,将于太平洋时间 6 月 9 日下午 1 点举行“平台进展演讲”。将深入介绍其软件平台上面向开发者的新功能和工具。 WWDC 2025 将主要以线上形式举行,数百个会议视频将在 Apple Developer 网站和 Apple Developer App 上发布,供所有人免费观看。此外,大会还将安排线下活动,中签的开发者和学生将受邀于 6 月 9 日参加在 Apple Park 举办的特别活动,共同观看主题演讲视频,与 Apple 的部分团队成员见面,并进行社交互动等。 [查看评论](https://m.cnbeta.com.tw/comment/1501140.htm)

2025-05-20 15:35:11 · 0次阅读
 
 
卡塔尔首相否认向特朗普赠送大型客机是贿赂行为

卡塔尔首相谢赫・穆罕默德・本・阿卜杜拉赫曼・阿勒萨尼周二否认了多哈向特朗普提供一架价值约 4 亿美元的波音 747 客机是试图讨好美国政府的指控。“我认为这是两国之间的交流。卡塔尔与美国之间的关系本质上是非常制度化的关系,” 他表示,“飞机一事是国防部与国防部之间的交易,完全透明且合法,这是我们几十年来一直开展的合作的一部分。” ![2025 年 5 月 14 日,美国总统唐纳德・特朗普与卡塔尔埃米尔塔米姆・本・哈马德・阿勒萨尼在卡塔尔多哈会晤。](https://n.sinaimg.cn/finance/crawl/59/w550h309/20250520/0332-e1a4217c2d0691ad308a023c732e9f1c.jpg) 2025 年 5 月 14 日,美国总统唐纳德・特朗普与卡塔尔埃米尔塔米姆・本・哈马德・阿勒萨尼在卡塔尔多哈会晤。 **争议焦点** 特朗普上周对中东进行了旋风式访问,先后抵达沙特阿拉伯、卡塔尔和阿拉伯联合酋长国。多哈提出赠送飞机后,特朗普在国内遭到反对党政客的抨击。 卡塔尔当时还同意订购多达 210 架美国制造、配备通用电气航空发动机的波音 787 梦想客机和 777X 飞机。白宫称这是波音公司(美国主要国防承包商)“有史以来最大的” 宽体机和 787 订单。 阿勒萨尼周二强调,此举是 “盟友之间的正常互动”,并驳斥了卡塔尔可能试图 “用这种方式影响本届政府” 的指控。 “这是一种双向关系,对卡塔尔和美国都互惠互利。我们没有任何暗箱操作,” 他指出,“许多国家都曾向美国赠送过许多礼物。我不是说这能和自由女神像相比,但……” 特朗普上周在 “真相社交”(Truth Social)平台发帖称,这架可能赠送的飞机将 “暂时” 取代已有 40 年历史、通常为总统服务的 “空军一号” 飞机。据报道,他还表示这架飞机日后将归入未来的总统图书馆基金会。波音公司目前正在生产新的 “空军一号” 飞机,但由于该公司面临供应商和零部件方面的障碍,包括这架飞机在内的交付均已推迟。 **美国国内批评声浪** 民主党人严厉批评卡塔尔的赠机提议,提出了更广泛的伦理和安全担忧。根据美国宪法《外国薪酬条款》,“任何在合众国担任有报酬或信任职位者,未经国会同意,不得接受任何国王、王子或外国的任何礼物、薪酬、职位或头衔”。 多名民主党人已在众议院提交决议,要求特朗普根据《外国薪酬条款》向国会提交有关这架大型客机捐赠的所有计划。 众议院司法委员会 ranking member(首席反对党成员)杰米・拉斯金议员表示:“宪法赋予国会的职责是确保总统不会将国家最高职位当作快速致富的工具,从外国总统、独裁者和埃米尔那里收受奢华礼物。现在是国会履行职责的时候了。” 康涅狄格州民主党联邦参议员克里斯・墨菲周日在 NBC《与媒体见面》节目中称:“这就是腐败的定义。” **特朗普的辩解** 特朗普为卡塔尔的 “非常友好的姿态” 辩护,称这是在波音公司制造更多飞机期间为国防部提供的贡献,而非个人礼物。 “他们要送我们一架免费的飞机。我可以说‘不,不,不,不要送我们,我想付你 10 亿或 4 亿美元之类的’,或者我可以说‘非常感谢’,” 他上周表示,并在另一场合补充道,“我可以做一个愚蠢的人,说不,我们不想要一架免费的非常昂贵的飞机,但是…… 我认为这是一个伟大的姿态。” [查看评论](https://m.cnbeta.com.tw/comment/1501134.htm)

2025-05-20 15:05:41 · 0次阅读
 
 
马斯克承诺未来五年继续领导特斯拉

特斯拉首席执行官埃隆・马斯克周二承诺,将在未来五年继续领导这家电动汽车制造商。“是的,这一点毫无疑问,” 马斯克在阿布扎比举行的彭博卡塔尔经济论坛接受采访时表示。此前,部分投资者曾对马斯克是否专注于特斯拉提出质疑。 ![2025 年 5 月 20 日周二,特斯拉首席执行官埃隆・马斯克通过视频连线在卡塔尔多哈举行的卡塔尔经济论坛(QEF)上发言。](https://n.sinaimg.cn/finance/crawl/59/w550h309/20250520/fe8d-df0ef636b6dd43ee8bfc89e08d68e5e7.jpg)2025 年 5 月 20 日周二,特斯拉首席执行官埃隆・马斯克通过视频连线在卡塔尔多哈举行的卡塔尔经济论坛(QEF)上发言。 近几个月来,马斯克一直担任唐纳德・特朗普总统的关键顾问,领导所谓的 “政府效率部”,这也是这位科技亿万富翁近期的主要工作重心。特斯拉股价今年初波动较大,年初至今累计下跌超 12%。 周二,特斯拉股价上涨约 1%。 马斯克的表态 马斯克表示,他希望保留特斯拉首席执行官的职位,以保持对公司的控制权。 他说,希望拥有 “足够的投票控制权”,以免被激进投资者罢免。 “这不是金钱的问题,” 马斯克称,“而是对公司未来合理控制权的问题。” [查看评论](https://m.cnbeta.com.tw/comment/1501132.htm)

2025-05-20 15:05:25 · 0次阅读
 
 
马斯克称未来将大幅削减竞选捐款

特斯拉和SpaceX首席执行官、美国政府效率部(DOGE)负责人埃隆·马斯克周二表示,未来计划大幅减少政治捐款,这标志着这位特朗普总统最大竞选金主的态度转变。 ![](https://n.sinaimg.cn/tech/transform/59/w550h309/20250520/2ca4-bf8805549ce2b26aa86aedcaf75047c7.webp) 马斯克曾斥资逾2.5亿美元助特朗普赢得第二任期。 但在卡塔尔经济论坛被问及是否会在未来选举中保持同等捐款规模时,马斯克予以否认。 “我认为在政治献金方面,未来会大幅缩减,”他表示。追问原因时,他简单回应:“我觉得做得够多了。” 这位全球首富同时为态度转变留有余地。他称:“如果未来发现有必要进行政治捐款,我仍会出手。但目前看不到理由。”此番表态或令谋求2026年连任的共和党人倍感失望。 除支持特朗普的捐款外,马斯克在2024年大选最后阶段还投入1900余万美元,助共和党以微弱优势赢得国会多数席位。 [查看评论](https://m.cnbeta.com.tw/comment/1501130.htm)

2025-05-20 15:05:11 · 0次阅读
 
 
出差罗马吃大餐,步行朝圣梵蒂冈 | 《纪元117 : 罗马和平》媒体试玩会游记

![](https://image.gcores.com/ec7494905b721a2a943911c4c8101cd7-1600-900.jpg?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 本期时间轴制作: 9S 萝卜与即视团队于4月26日出发前往意大利罗马,参加由育碧举办的《纪元117 : 罗马和平》媒体试玩会。作为萝卜人生中第一次出国旅行,他讲述了旅途中的衣食住行种种见闻和思考,也为大家带来了关于《纪元117 : 罗马和平》的试玩体验汇报。

2025-05-20 15:00:00 · 0次阅读
 
 
亚马逊 Zoox 将在亚特兰大开始测试自动驾驶汽车

亚马逊的自动驾驶汽车部门 Zoox 即将开始在佐治亚州亚特兰大绘制地图并收集数据,这让他们成为测试其自动驾驶汽车并最终在该市提供公共交通服务的先行者。 ![](https://static.cnbetacdn.com/article/2025/0520/b26ea188dd5008d.jpg) 亚特兰大将成为Zoox 在美国测试其自动驾驶汽车的[第七座城市](https://zoox.com/journal/atlanta-expansion-2025/)。就在该公司宣布测试计划的第二天,Waymo 及其合作伙伴 Uber宣布,将在亚特兰大向早期用户提供其自动驾驶出租车服务,并于今年夏天进行更大规模的公开发布。 Zoox 正在有序地推出其承诺的自动驾驶出租车服务。该公司表示,在亚特兰大,以及其他城市,它将首先使用经过改装的丰田 Highlander 来记录每条道路的几何形状和交通信号灯的位置等信息。之后,Zoox 才会开始测试其自动驾驶汽车技术。 该公司已在加州福斯特城和旧金山等城市以及内华达州拉斯维加斯测试其专用的无安全操作员自动驾驶出租车。Zoox 计划在今年年底前在旧金山和拉斯维加斯提供公共出行服务。 作为这一进程的一部分,该公司一直在解决其自动驾驶汽车技术中的问题。Zoox在 3 月和5 月发布了与软件更新相关的召回通知,旨在解决其自动驾驶测试车队在测试期间遇到的问题。 [查看评论](https://m.cnbeta.com.tw/comment/1501128.htm)

2025-05-20 14:35:48 · 0次阅读
 
 
德克萨斯州正在推动一项法案 禁止18岁以下人士加入社交媒体平台

德克萨斯州希望效仿佛罗里达州,禁止未成年人注册社交媒体账户,但他们走得更远:佛罗里达州禁止 14 岁以下的人注册社交媒体账户,而德克萨斯州的提议将最低注册年龄提高到 18 岁。 ![](https://static.cnbetacdn.com/article/2025/0520/d7d63a593b2e608.webp) 11月提出的众议院第186号法案目前正在德克萨斯州推进成为法律。该法案已在德克萨斯州众议院获得两党支持,并且似乎获得了参议院议员的大量支持,为州长格雷格·阿博特签署成为法律铺平了道路。 该法案将禁止18岁以下的个人注册社交媒体账户。此外,下载应用程序需要获得父母同意,并在网站上贴上关于社交媒体危害的警告标签。任何允许用户创建和分享内容的网站都将被视为社交媒体平台,因此YouTube似乎也属于这一类别。该法案不适用于电子邮件、新闻或赌博网站。 该法案的起草人、众议员贾里德·帕特森表示,该法案的出台将有助于解决“我们的孩子在德克萨斯州可以合法接触到的最有害的产品”。 该法案要求在社交媒体网站上张贴警告标签,这与时任美国卫生局局长的维韦克·穆尔蒂博士去年的呼吁相呼应,后者要求社交媒体平台贴上与香烟和酒精类似的健康警告标签。 虽然美国有 10 个州对未成年人使用社交媒体制定了不同的年龄限制和验证法律,但佛罗里达州目前是唯一一个完全禁止未成年人注册社交媒体的州,尽管年龄限制为 14 岁。2024 年,澳大利亚将禁止 16 岁以下人士使用社交媒体平台,即使获得父母许可也是如此。 虽然该法案目前的针对对象是 18 岁以下的人群,但帕特森表示参议院可能会改变年龄限制。 年龄验证和限制法律经常因违反《第一修正案》权利而受到抵制。其中一些法律已被法院禁止实施,包括阿肯色州、俄亥俄州和加利福尼亚州。 人们还担心这些法案对隐私的影响,因为它们没有提供关于平台如何删除为验证目的收集的信息的指导。 [查看评论](https://m.cnbeta.com.tw/comment/1501124.htm)

2025-05-20 14:35:37 · 0次阅读
 
 
FAA 已批准亚马逊 Prime Air 无人机运送包含锂离子电池的设备

[亚马逊宣布,](https://www.aboutamazon.com/news/transportation/amazon-drone-deliver-package)美国联邦航空管理局 (FAA) 已批准亚马逊 Prime Air 无人机运送新类别的设备,包括 iPhone、AirPods 等配备锂离子电池的产品。该公司表示,如果您位于亚利桑那州或德克萨斯州符合条件的配送区域,这些产品类别可以在 60 分钟内送货上门。 亚马逊写道,它最近简化了无人机送货流程。新流程包括亚马逊会给出一个送货时间窗口,左右两侧各有五分钟,顾客无需再走到外面在地上放置二维码。 ![](https://static.cnbetacdn.com/article/2025/0520/336948fa1f73416.jpg) 买家可以从房屋的俯视图中选择无人机送货区域 首次订购无人机投递服务时,买家需要从住处的航拍照片上预先设定的投递区域中选择。此后,亚马逊将使用同一投递地点(前提是该地点空旷),直到更改投递地点为止。无人机将从约13英尺(约4米)的高空投递包裹,因此在投递期间,最好将宠物或儿童留在室内。目前,无人机投递仅在德克萨斯州大学城和亚利桑那州凤凰城都会区的西谷地区提供,并且仅在天气良好的情况下才提供。 此次配送由亚马逊新款 MK30 无人机完成,这是该公司十多年来一直致力于推进的无人机配送项目的重要组成部分。MK30 无人机最多只能运送 5 磅(约 2.5 公斤)的包裹,但比之前使用的无人机飞行距离更远,甚至可以应对小雨。去年,亚马逊成功获得美国联邦航空管理局 (FAA) 的批准,允许其无人机在操作员视线范围之外飞行,从而大大扩展了其实际配送范围。 [查看评论](https://m.cnbeta.com.tw/comment/1501122.htm)

2025-05-20 14:35:24 · 0次阅读
 
 
沃尔玛发布支持杜比视界的Google TV电视盒子Onn 4K Plus

沃尔玛发布了其 4K Google TV电视盒子的新版本,它可以更好地替代Google现已停产的 Chromecast 系列。新款Onn 4K Plus 流媒体设备售价 29.88 美元,比沃尔玛售价 19.88 美元的入门级 Onn 4K仅贵 10 美元,但它包含了价格更高、售价 49.88 美元的 Onn 4K Pro 智能音箱的一项功能,支持杜比视界 HDR 内容。 ![](https://static.cnbetacdn.com/article/2025/0520/af03a8693d20586.jpg) 新款 Onn 4K Plus 还配备了比一年前推出的 Onn 4K Pro 稍快的处理器 - 主频为 2.5GHz 的 Amlogic S905X5M 四核处理器 - 但只有 2GB RAM 和 16GB 存储空间,而 Pro 型号则是 3GB 和 32GB 组合。 Onn 4K Plus 也不像沃尔玛的 Pro 型号那样兼作智能音箱,并且牺牲了其内置语音遥控器的功能,例如背光和遥控器丢失时的查找功能。但与售价 20 美元的入门级 Onn 4K 盒子不同,Plus 的遥控器包含一个可自定义的按钮,可以通过编程启动您喜爱的流媒体应用,以及一个专用的“免费电视”按钮,可以快速访问Google广告支持的 FAST 频道。 选择沃尔玛新款 Onn 4K Plus 最诱人的理由是它通过 USB-C 端口连接电源。Pro 型号则使用常规的DC连接线连接电源适配器,而入门级 4K 型号则使用更为老旧的 Micro USB 端口。 [查看评论](https://m.cnbeta.com.tw/comment/1501120.htm)

2025-05-20 14:35:12 · 0次阅读
 
 
娃哈哈代工背后,宗馥莉的品牌与控制权博弈战

最近,关于娃哈哈饮用水代工的新闻在网上持续发酵,几次冲上热搜。这件事情的起因是有网友发现,自己买到的娃哈哈饮用水其实是由今麦郎等多家企业代工生产的。有人算了一笔账,在某网购平台上,娃哈哈纯净水每瓶596毫升,一箱24瓶的价格为38.9元,统一麦郎纯净水每瓶550毫升,一箱24瓶的价格是27.9元。 ![](https://static.cnbetacdn.com/article/2025/0520/8c3f3184b94f25b.png) 对此,不少人质疑,娃哈哈的品牌溢价是不是太高了?还有网友说,都是同一个厂出来的,干嘛不直接买今麦郎? ![](https://static.cnbetacdn.com/article/2025/0520/e0f0b52cd442cb3.png) 面对质疑,娃哈哈官方回应因2024年瓶装水市场需求激增导致产能紧张,委托今麦郎代工生产纯净水,合作周期内今麦郎共完成12亿瓶产品交付,但因为质量问题,双方合作于2025年4月终止了。而在5月16日,今麦郎集团董事长范现国在接受新华网专访时表示,今麦郎在与娃哈哈合作代工业务中,始终坚守品质底线,每瓶蓝标水净利润仅为2分钱。 2024年2月娃哈哈创始人宗庆后去世后,女儿宗馥莉接班后,娃哈哈一直处于舆论的风口浪尖。有媒体曝出近半年,娃哈哈一边处于产能不足状态,另一边却在调整各地的工厂。 娃哈哈的代工风波背后,到底还有哪些隐情?代工事件又折射了快消品行业普遍面临的产能调配问题呢? **宗馥莉掌权下的娃哈哈:** **停产、代工与股权迷局何解?** 娃哈哈的声明中表示,未来将始终坚持自有生产模式。 ![](https://static.cnbetacdn.com/article/2025/0520/1106276be579a09.png) 众所周知,娃哈哈的爆火源于去年3月,有业内人士指出,当时娃哈哈的产能已经不能匹配整个发展。整体去看,从轻资产的角度去做代加工,符合了饮料行业未来轻资产的发展趋势。然而,持续的代工也需要一个稳定的代工体系和合作伙伴,目前看起来也不像。 在出现今麦郎代工风波之前,据《华商报》报道,娃哈哈的陕西公司的乳品车间从2025年2月16日停产。还有报道显示5月,娃哈哈关闭了十余家分厂的生产线,停产的名单中有天津武清工厂、河北高碑店工厂。 一边在委托代工,一边又在调整生产线,娃哈哈的各种操作又让人遐想连篇。 有部分自媒体报道最近连续关闭工厂的陕西娃哈哈,其第一股东并非宗馥莉,宗馥莉全资持股的浙江启力投资有限公司仅持股40%。 ![](https://static.cnbetacdn.com/article/2025/0520/90a239a127430fa.png) 宗馥莉 结合这次的代工风波和去年宗馥莉的“主动辞职”,不少媒体猜测,现在的娃哈哈还处于母公司股权纠纷的阵痛期,企业还处于宗庆后家族式班底和传统股权模式向传统企业发展的过渡期。无论是关闭工厂还是找代工,或许都是新掌门宗馥莉和股东们相互博弈的一部分。 可以预见的是,这场代工风波只是宗馥莉改革风暴的冰山一角。自去年7月正式掌权以来,宗馥莉便开启了大刀阔斧的变革。 将人力、财务、供应、运输等13个部门的核心成员调整。接着,向大锅饭文化开刀,废除宗庆后不开除45岁以上员工的传统,将薪酬体系改为绩效四档制。把一部分经销商的签约主体,换到了宏胜系旗下。这位小宗总正在逐步用自己的节奏打造一个新的娃哈哈。 ![](https://static.cnbetacdn.com/article/2025/0520/bad9e8f6a230477.png) 今年2月,387件娃哈哈商标也从集团转到了宗馥莉的控股公司。紧接着,宗馥莉又在5月悄悄注册了娃小宗商标,产品线不仅涵盖饮料,连啤酒和保健品都准备好了。 公开数据显示,2024年娃哈哈集团的营业收入约为700亿元。过去的一年时间里,在宗馥莉的带领下,娃哈哈再次攀上了700亿元的高峰,实现了业绩的大幅回升。受益于各种因素,娃哈哈的销量仍保持了一个不错的数字,然而,作为新掌门的宗馥莉,如何继续控制这家头部饮料的主动权,让品牌继续发展则是一个需要继续考虑的议题了。 **饮料行业代工背后的商业秘密** 无论娃哈哈的发展如何,代工却是一个在当下的饮料行业广泛存在的模式。根据2024年年报,公司将其约15%的纯净水产能外包给了今麦郎‌,其实很多知名品牌都采用过自主生产加代工混合模式。 ![](https://static.cnbetacdn.com/article/2025/0520/7a5526147779be2.png) 娃哈哈饮料生产车间 数据显示,中国饮料行业代工比例已从2015年的8%激增至2024年的27%。2023年中国瓶装水整体代工比例则高达63.7%。 代工总是给人贴牌、质量差等刻板印象,其实仅对饮料行业而言,代工模式在商业上是有很多红利的。 首先是成本优势,依托代工模式可降低企业的投入,毕竟自己不用直接控制工厂和工人,大大节约了固定资产的支出,非常适合资金密集型企业。 其次就是效率问题,对很多行业来说,专业的代工厂分工更细致,可以缩短产品的生产周期,快速响应市场需求。 最后就是规模红利,一些大的头部代工企业,如奥瑞金、中粮包装等,通过集中采购、标准化流程,能将单位成本压低15%到20%。今麦郎本身也是一家大型的代工企业,在为娃哈哈代工纯净水的同时,还为三得利乌龙茶、蜜雪冰城“雪王爱喝水”等品牌生产饮品,代工业务涵盖饮用水、茶饮料、功能饮料等全品类。 ![](https://static.cnbetacdn.com/article/2025/0520/d4e459b03c13609.png) 在国内饮料行业内,最成功的品牌代工案例,当属元气森林。根据《华夏时报》报道,元气森林代工比例高达80%以上,凭借代工模式和品牌营销,只用了三年估值就突破了百亿。 当然,代工也存在不少隐患。最主要的就是质量和配方舆情风险。 代工厂为追求利润最大化,往往采用最低价中标策略,导致质量管控可能存在风险。 对于大部分品牌来说,代工模式也会使他们陷入研发代工质效的不良循环。2020年元气森林的代工厂“0糖0卡”配方泄露,一度还引发品牌信任危机,就凸显了代工模式的弊端。 ![](https://static.cnbetacdn.com/article/2025/0520/4e238566c873663.jpg) 除了容易造成品控危机之外,代工也会导致创新乏力,长期的代工模式会导致品牌与生产端脱节。 消费端的各种反馈很难直接作用于生产。从研发端来说,代工厂不愿投入柔性生产线,导致新品测试成本高;在生产端,代工厂为确保订单量,更倾向于推荐成熟配方而非创新配方。这些都会导致产品创新乏力,在饮料行业产品严重同质化,价格战导致利润持续下滑的困局的背后都有代工模式的影响。 **情怀溢价疑云:品牌代工后的抉择** 这次的舆论的焦点集中在了娃哈哈的情怀溢价是否真实上,实际上,娃哈哈的持续发展的关键在于构建起品牌代工和消费者的价值共生体。毕竟在消费的感情层面,选择一家企业的产品,往往会带着某种感情倾向,甚至是有立场的。 ![](https://static.cnbetacdn.com/article/2025/0520/b56788938883cfa.png) 同时这次的代工风波,本质上是因为产品代工超出了消费者的认知,娃哈哈找行业内的知名品牌或竞品代工确实容易让人很尴尬的感觉。 在一个更宏观的行业层面,代工模式也会继续存在,快消品企业始终在规模扩张与质量把控、短期效益与长期价值之间寻求动态平衡。这种平衡的艺术,将深刻影响中国饮料行业的未来竞争格局。 对于娃哈哈和宗馥莉而言,除了厘清股权纠葛和企业经营理念之外,既然未来还是要坚持自有生产模式,那就扎扎实实地建好自有供应链,并将自有工厂的优势发挥到极致,为用户创造更多健康、受欢迎的饮品,这才是品牌成功的关键。 对于头部企业来说,在消费理性化、产品日趋内卷的今天,一个品牌不仅仅是符号和标签,有时候还要承担更多的情绪价值和产品信任感。 [查看评论](https://m.cnbeta.com.tw/comment/1501114.htm)

2025-05-20 14:05:23 · 0次阅读
 
 
欧盟拟对网上订购的小包裹征收统一费用

媒体援引一份提议草案报道,欧盟正考虑对进入该地区的小包裹征收统一费用。该提案未设定费用水平,但据熟悉此事的人士向《金融时报》透露,费用可能约为2欧元。 [![](https://static.cnbetacdn.com/article/2023/1226/c11e719084c5d7e.webp)](https://static.cnbetacdn.com/article/2023/1226/c11e719084c5d7e.webp) 部分收入将用于覆盖海关成本,但也可能纳入欧盟预算。 [查看评论](https://m.cnbeta.com.tw/comment/1501112.htm)

2025-05-20 14:05:13 · 0次阅读
 
 
马来西亚成为中国以外首个部署华为Ascend芯片的国家 可能违反美国出口管制政策

人工智能已经从大型科技公司扩展到如今各国政府,他们纷纷加入到人工智能的浪潮中。马来西亚已启动一项战略性人工智能基础设施项目,以打造一个在中国技术支持下的生态系统,从而加大了在人工智能竞赛中的竞争力。 正如黄仁勋在台北国际电脑展 (Computex) 主题演讲中所说,世界正朝着建设人工智能基础设施的方向发展,其重要性将与电力基础设施相媲美。同样,据[MCIGroup](https://mcigroup.my/top-news/malaysia-launches-regions-first-sovereign-full-stack-ai-infrastructure/)的一份报告称,马来西亚政府已主动“本地化”人工智能发展,通过在该地区国内托管服务器,确保数据完整性和该国在技术领域的领先地位。 ![](https://static.cnbetacdn.com/article/2025/0520/aa48f9f491e1ee4.jpg) 这项计划最有趣的部分是,据报马来西亚将成为首个在其项目中采用华为AI芯片的国家。虽然马来西亚政府尚未明确表态,但表示该国将成为中国境外首个使用华为芯片和服务器以及DeepSeek大语言模型的国家,这间接表明马来西亚将使用华为的Ascend加速器。 这可能意味着马来西亚违反了美国的出口管制规定,最新的规则是任何被发现使用华为芯片的实体都将受到处罚,因此,美国政府对此作何反应值得关注。 马来西亚素来以玩“双打”游戏而闻名,此前该国曾被指控利用美国贸易漏洞向中国供应英伟达的人工智能芯片。而如今,由于马来西亚正在使用华为的芯片,他们可能会面临特朗普政府的更严格的审查。 华为芯片在中国以外的应用清楚地表明,NVIDIA 在中国面临着强大的竞争,而华为的影响力有可能扩展到中国以外。鉴于该公司的机架级解决方案(例如 CloudMatrix 300)据称可以与 NVIDIA 的 Blackwell 产品相媲美,华为距离扳平比分已不远。 [查看评论](https://m.cnbeta.com.tw/comment/1501110.htm)

2025-05-20 13:35:57 · 0次阅读
 
 
欧盟推进与英国的反垄断合作

华尔街日报报道,欧盟和英国正在敲定一项协议,该协议将使两个地区的竞争监管机构在新的贸易和安全协议的支持下更紧密地合作。欧盟委员会周二表示,该协议将为英吉利海峡两岸的监管机构在执行欧盟规则时就竞争事务开展合作提供清晰的框架,并规定他们将相互通报重要的反垄断和并购调查。 该协议还允许监管机构协调跨境调查。 欧盟执委会表示,欧盟监管机构和英国竞争与市场管理局仍需获得公司同意才能获取机密信息。 此前,欧盟与英国于周一签署了一项协议,旨在简化贸易并加强安全合作,此举将显著改善英国脱欧以来双方的关系。 欧盟和英国都处于执行新反垄断法的初期阶段,旨在控制全球最强大的科技公司的市场力量。 欧盟最高反垄断执法人员特蕾莎·里贝拉表示: “这项协议表明了我们共同的坚定承诺,即继续共同努力,在数字领域等实现有效、平衡的竞争执法,并确保欧洲的公平竞争环境。” [![](https://n.sinaimg.cn/finance/transform/59/w550h309/20250519/1e4c-cae6c141963a3c465e1d765d6423c7e8.png)](https://n.sinaimg.cn/finance/transform/59/w550h309/20250519/1e4c-cae6c141963a3c465e1d765d6423c7e8.png) [查看评论](https://m.cnbeta.com.tw/comment/1501108.htm)

2025-05-20 13:35:45 · 0次阅读
 
 
Red Hat Enterprise Linux 10.0 正式发布 并加入 RISC-V 开发者预览版

Red Hat Enterprise Linux 10.0 GA 镜像自上周起即可下载, 而Red Hat 本周在波士顿举行的 Red Hat 峰会上正式宣布 Red Hat Enterprise Linux 10 正式发布。RedHat Enterprise Linux 10现已可用,可用于处理现代企业级 Linux 工作负载。 Red Hat Enterprise Linux 10 附带 RHEL Lightspeed,这是一项基于 AI 的服务,旨在简化 RHEL 的使用体验。使用 RHEL Lightspeed,您可以向其询问诸如“帮我解决 SSHD 启动失败的问题?”之类的问题,以获得有关管理 RHEL 10 服务器的帮助。 Red Hat Enterprise Linux 10.0 还改进了 Cockpit Web 控制台,添加了新的系统角色并进行了多项软件包更新。RHEL 10 包含 PHP 8.3、Nginx 1.26、Git 2.47、MySQL 8.4 等软件包。Red Hat Enterprise Linux 10 基于 Linux 6.12 LTS 内核构建。 ![image.webp](https://static.cnbetacdn.com/article/2025/0520/06619d24a8895cb.webp) 有关 Red Hat Enterprise Linux 10.0 可用性的更多详细信息,请访问[RedHat.com](https://www.redhat.com/en/blog/whats-new-rhel-10)。 ![image-1.webp](https://static.cnbetacdn.com/article/2025/0520/4364f1ee7c1a4d3.webp) Red Hat 还宣布与 SiFive 合作,推出适用于 RISC-V 的 RHEL 10 开发者预览版。有关适用于 RISC-V 的 Red Hat Enterprise Linux 10 开发者预览版的详细信息,请参阅[此博客文章。](https://www.redhat.com/en/blog/red-hat-partners-with-sifive-for-risc-v-developer-preview-for-red-hat-enterprise-linux-10) [查看评论](https://m.cnbeta.com.tw/comment/1501106.htm)

2025-05-20 13:35:32 · 0次阅读
 
 
钟睒睒回应代工传闻:不反对代工 但农夫山泉产品无法代工

**近期,今麦郎代工娃哈哈纯净水产品事件多次冲上热搜,而随后,市场上也传出农夫山泉产品代工的传闻。**今日,在农夫山泉2024年年度股东大会上,公司董事长钟睒睒对此回应称:**“我们不反对代工,但农夫山泉目前的所有产品是无法代工的。”** [![](https://static.cnbetacdn.com/article/2025/0520/860f31fa71f5700.png)](//img1.mydrivers.com/img/20250520/82e9d721-0dc4-42da-ab34-0fa07a8a8dfc.png) 钟睒睒进一步解释称,在工业体系中,代工是普遍存在的协同方式,但对农夫山泉而言,代工在根本上几乎是行不通的。 他表示:“农夫山泉对水源地有极高依赖,其生产系统高度定制,从管线铺设、原水处理、灌装设备到每一瓶标签的粘贴,背后是极其复杂的标准流程。” 截至目前,农夫山泉已布局14大水源地、30余个先进生产基地,持续在核心水源地投资扩建。 农夫山泉方面表示,**“水源地-工厂-市场”的路径虽然是高成本,但也意味着高质量和不可复制。** [查看评论](https://m.cnbeta.com.tw/comment/1501104.htm)

2025-05-20 13:35:17 · 0次阅读
 
 
《超级机器人大战Y》公布最新实机演示,定于8月28日发售

![](https://image.gcores.com/0a197b6afd8aff035184c0da1e18ed29-800-421.webp?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 在今日举行的《超级机器人大战Y》的开发者特别直播中,官方公布了游戏的最新实机演示视频。同时,游戏将于6月21日、22日在日本举行试玩会。 本作是一款让各种动画作品中登场的机器人,超越作品界线而齐聚一堂,与共同敌人进行战斗的策略模拟RPG游戏。 &lt;内嵌内容,请前往机核查看&gt; ![](https://image.gcores.com/ba63c264ef3520cfaac63cb7efa7fe90-1280-720.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/a31adb85de6709264137327911bb0df7-1280-720.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/a2b8e42c2b9dba5be4363500594ec989-1280-720.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/a4319d7acf32f599171d97a8f9b03226-1280-720.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) 玩家可以在冒险部分欣赏到战斗为止的故事,并在模拟部分分别操控配置于地图上的机器人,击败敌人。战斗将分为我方行动回合和敌方行动回合,首先会由玩家移动机器人并进行战斗后,会轮到敌方行动。 当玩家破坏地图中配置的所有敌人,即通过该关卡,并可进入战略部分。在战略部分中,玩家将可运用战斗获得的资金和点数,强化并培育机器人或驾驶员。战略部分结束后,将进入下一个剧情的冒险部分。 【参战作品】 - 《超电磁机器人 孔巴德拉V》 - 《圣战士丹拜因》 - 《机动武斗传G高达》 - 《机动战士高达 水星的魔女 第一季》 - 《银河机攻队 庄严王子》 - 《超时空要塞Delta 激情的Walküre》 - 《Code Geass 复活的鲁路修》 - 《盖塔机器人ARC》

2025-05-20 13:33:04 · 0次阅读
 
 
迷雾鹰组织利用DNS记录劫持CDC及企业域名传播恶意软件

迷雾鹰劫持CDC等机构废弃域名,传播恶意软件牟利!

2025-05-20 13:23:00 · 0次阅读
 
 
信邦智能并购踩雷后欲二进宫,资金潜伏重组被疑内幕交易

股价抢跑,陷内幕交易质疑。

2025-05-20 12:50:26 · 0次阅读
 
 
《命运》首款移动端游戏《命运:群星》首曝PV,国服开启预约

![](https://image.gcores.com/a76ac01bd5be09cc666cb50f3fccc2bd-10630-5979.jpg?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 《命运》首款移动端游戏《命运:群星》首曝PV,国服预约现已开启。 ![](https://image.gcores.com/9b89c296a07338c20fbf389b01852099-10630-5979.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) &lt;内嵌内容,请前往机核查看&gt; <blockquote>在过去的时代接受光能,于守护者诞生之前带来希望。拯救人类文明,书写命运全新篇章。 </blockquote>

2025-05-20 12:50:25 · 0次阅读
 
 
富士康董事长刘扬伟:生成式AI只能替代80%工作 工厂仍需要熟练工人

**富士康董事长刘扬伟近日表示:“生成式AI只能处理下一代工厂80%的制造工作量,而剩余的20%需要熟练的人类工人。”** [![富士康董事长刘扬伟:生成式AI只能替代80%工作 工厂仍需要熟练工人](https://img1.mydrivers.com/img/20250520/be15ee48-30de-4735-a557-92c0cd1cf3d3.png)](//img1.mydrivers.com/img/20250520/be15ee48-30de-4735-a557-92c0cd1cf3d3.png) 他解释称,在进行了两三次内部模拟后,富士康发现其AI代理能够捕捉缺陷解决和设备调校等领域的专业知识,并完成大约80%的工作,但之后学习曲线就趋于平缓。 因此,刘扬伟暂时得出一个结论:**借助Gen AI,我们可以完成80%的工作,剩下的20%仍然需要由熟练的工人或技术人员来完成。** 据悉,富士康正在利用英伟达的Isaac平台打造下一代机器人,并通过数百万次模拟训练机器人“大脑”,以确保它们在现实世界部署时能够立即发挥作用。 去年6月,富士康还借助英伟达Omniverse平台,打造工厂的数字孪生。 工厂数字孪生被用作虚拟训练环境,为富士康的团队提供了模拟、测试和验证自主移动机器人以及AI机器人操纵臂的平台。 刘扬伟认为未来的制造业将在很大程度上依赖于数字模拟和AI工厂,生成式AI和机器人技术可以解决发达国家正在努力实现经济再工业化的劳动力短缺问题,使它们减少对“进口移民劳动力”的依赖。 [查看评论](https://m.cnbeta.com.tw/comment/1501102.htm)

2025-05-20 12:06:00 · 0次阅读
 
 
苹果的大尺寸可折叠设备可能面临亚马逊的竞争

据行业分析师郭明錤称,亚马逊正在开发一款类似于华为周一发布的大尺寸可折叠设备MateBook Fold。[郭明錤在X(Twitter)的](https://x.com/mingchikuo/status/1924786064914579735)一篇帖子中表示:“我的研究表明,亚马逊也在内部开发一款类似的产品,但尚未正式启动。” 他还补充道,如果开发进度按计划进行,该设备预计将于2026年末或2027年投入量产。 据传,苹果正在计划推出一款类似的可折叠设备。据传,这款双屏折叠设备折叠后尺寸约为 13 英寸,展开后尺寸约为 18.8 英寸。关于它应该被归类成 iPad 还是 MacBook 传言不一,决定性因素很显然将是操作系统。 郭明錤认为,苹果的大尺寸可折叠手机预计将于 2027 年末或 2028 年投入量产。苹果目前正在同时开发一款可折叠 iPhone,预计将于 2026 年底推出。 ![](https://static.cnbetacdn.com/article/2025/0520/bb9a05392381b00.jpg) 华为MateBook Fold [查看评论](https://m.cnbeta.com.tw/comment/1501098.htm)

2025-05-20 12:05:46 · 0次阅读
 
 
法国禁止Telegram创始人帕维尔·杜罗夫前往美国

法国当局拒绝了 Telegram 创始人帕维尔·杜罗夫前往美国“与投资基金谈判”的请求。巴黎检察官办公室表示,其于 5 月 12 日做出这一决定,“理由是此类出国旅行似乎没有必要或没有道理。” [![](https://static.cnbetacdn.com/article/2024/0906/2fa555479faad23.jpg)](https://static.cnbetacdn.com/article/2024/0906/2fa555479faad23.jpg) 杜罗夫于 2024 年 8 月在法国机场被捕,自去年 9 月以来一直受到严格的法律控制,当时他被指控与其运营的消息应用程序上的非法活动有关的六项指控。 检察官办公室表示,他被禁止未经授权离开法国,不过他之前曾获得授权,于3月15日至4月7日前往迪拜。杜罗夫出生于俄罗斯,同时拥有法国和阿联酋等国的公民身份。  杜罗夫在法国的律师尚未回应POLITICO的置评请求。 自被捕以来,杜罗夫对法国当局的批评日益激烈。周日,当选民前往投票站参加罗马尼亚总统选举决选时,杜罗夫声称,法国政府( [包括法国对外情报机构负责人尼古拉斯·勒纳](https://x.com/durov/status/1924187940122431572))要求他在投票前禁止 Telegram 上发表保守派言论。 巴黎强烈否认杜罗夫的说法。 [查看评论](https://m.cnbeta.com.tw/comment/1501096.htm)

2025-05-20 12:05:34 · 0次阅读
 
 
给Manus七分钟,它可以做什么?

NVIDIA特供的H20芯片被禁止向中国销售,黄仁勋批评美国的人工智能出口管制政策,认为应让美国技术在全球范围内普及。而大洋彼岸的另一面,Manus大方选择了开源。作为全球首个通用AI智能体,Manus于5月13日宣布开放注册,所有人均可使用。 在此之前,这款国产AI Agent产品实行邀请码机制,由于“一码难求”,其邀请码一度被炒至数万元,被网友质疑为“饥饿营销”。据其合伙人在社交媒体上发布的解释,实行邀请码制度是因为服务器容量有限,并“正在全力输出,让大家早日体验上更好的产品”。 此次开放使用的虽仅限海外预览版,但也意味着,Manus认为自己“准备好了”。 Manus是一款通用型AI智能体,核心理念是“知行合一”,与传统AI助手不同,它能够自主规划并执行复杂任务,直接交付完整成果。主要功能包括自主执行、多领域应用、多智能体协作架构以及记忆与学习能力,在GAIA基准测试中,Manus取得了SOTA(State-of-the-Art)的成绩,显示其性能甚至超越了OpenAI。 ![](https://static.cnbetacdn.com/article/2025/0520/8c12307aa083e9d.png) 另一方面,Manus由中国境内的北京蝴蝶效应科技有限公司全资控股,创始人肖弘毕业于华中科技大学。或许也由于它的“民族身份”,2025年3月6日,Manus一经官宣便迅速走红,它的出现一度被称为“中国的第二个DeepSeek时刻”,并引起了人们对AI Agent的广泛关注。 在官宣视频中,肖弘表示,这是完全不同的、下一代人工智能。一种新的人机协作的范式。 ![](https://static.cnbetacdn.com/article/2025/0520/34a46b659652005.png) “Manus不只是一个聊天机器人或者工作流,还是一个真正自主的主体,相比以往只是产生想法的人工智能,Manus直接交付成果,弥合了概念和执行之间的差距。或许,还可以从中一瞥AGI。”肖弘说到。 他通过简历筛选、股票分析、房地产调研3个场景演示了Manus的任务执行情况。总结下来,首先,Manus支持在云端异步运行,用户可关闭设备,任务完成后自动通知结果。并且,Manus采用“规划代理+执行代理+验证代理”的分工模式,是一种多智能体协作架构。此外,它还有着记忆和学习能力,能够根据用户偏好优化任务策略,目前一共涵盖60多个应用场景,包括教育、数据分析、内容创作等。 其创始人肖弘表示,“知识必须应用到现实中,对世界产生有意义的影响”。 ![](https://static.cnbetacdn.com/article/2025/0520/b7f1e4bb9d4c20f.png) 不过,也有不少网友表示,“它的表现也没比OpenAI的产品好多少。” 揭下Agent的面纱 今天我们就一起来看看,作为一款AI Agent产品,Manus到底有什么特别的表现。 ![](https://static.cnbetacdn.com/article/2025/0520/5fba2747df8ff04.png) 首先,Manus支持两种推理深度,标准版和高阶测试版。首次登录赠送1000积分,Manus提供了使用案例参考,分为生活、研究、教育、数据分析、生产力和内容创作者几个板块,社区中展示的所有任务和网站均由用户自愿分享。 根据官方发布的简历筛选、股票分析、房地产调研演示的经验,预期中Manus将直接交付完整成果。因此,此次测试将上传四张图片附件,再写一段描述文字给Manus,要求它根据小红书、Instgram、X等平台的特点,分别生成爆款文案,整理成一个word给我。 prompt:我是一个内容创作者,假期我去了一个可以听虫鸣鸟叫、夜里看到星星的地方,那里的樱桃熟了。请结合图片,根据小红书、Instgram、X平台的特点,分别生成爆款文案,整理成word文件。 图片附件如下: ![](https://static.cnbetacdn.com/article/2025/0520/aa6afaacc12baef.png) 我首先就遇到了困难。 Manus似乎并不支持图片文件,无论是heic格式还是jpg格式都无法上传成功,于是,我将四张图片合成了一个pdf文件,完成了上传。 ![](https://static.cnbetacdn.com/article/2025/0520/5328e3053cd082a.png) 发送成功后,Manus立刻开始了工作,并生成了6个步骤。 对话框上,Manus正在使用终端,看起来非常迷人,于是我点进去,看到了以下的步骤图。 ![](https://static.cnbetacdn.com/article/2025/0520/486e4aa67ec17aa.png) Manus使用自己的计算机,像一个Agent一样工作。并在大约2分钟左右,进行到了第三步。 出于好奇,又点开了它的缩略图,界面分为了两部分,右边的窗口呈现出如下图所示更具体的工作路径。 ![](https://static.cnbetacdn.com/article/2025/0520/24633cb790e79cc.png) 可以看到,它根据我的prompt,形成了任务清单,拆解出8个步骤,并逐一完成。 又过了4分半钟,Manus表示已经完成任务,提交了pdf格式的文件给我,我随时可以下载下来查看。 ![](https://static.cnbetacdn.com/article/2025/0520/8dd7c2b54ef5b9e.png) 我注意到,Manus还提供此任务中所有文件的查看。 点开可以看到,它分为了文档、图片、代码文件、链接几个大类,并且按照时间顺序倒序排列,可以实现步骤上的溯源。 ![](https://static.cnbetacdn.com/article/2025/0520/f38b8f1ce195b1a.png) 当然,作为一个Agent,最重要的还是用结果说话,接下来我们就一起来看看这个pdf文件。 ![](https://static.cnbetacdn.com/article/2025/0520/a236ec025b018e8.png) 不得不说,“emoji表情+种草文+技巧tips”的行文思路很“小红书”,其对小红书平台的内容特点有着较好的判断,大体合格。 ![](https://static.cnbetacdn.com/article/2025/0520/c50665cbf7b9719.png) Manus为Instagram写的文案则直接切换成了英文,包括tag,但也明显可以看到,文字字号大了很多,标题和正文的内容没有区别开来,不免有点遗憾。 ![](https://static.cnbetacdn.com/article/2025/0520/201faeed44d83ab.png) 而Twitter的文案则简单得多,文字风格上更加注重互动性,不过,这里的tag也存在和Instagram一样的问题。 看到这里我们或许会产生这样的错觉:如果把同样的prompt在chatgpt的窗口发送出去,或许能更快地得到反馈。 我不仅这样想,还这样做了,Kimi和ChatGPT确实分分钟都给了我和Manus差不多的“不完美结果”,文字我自己复制整理后一样能用。 头脑和手 但根据官网显示,这并不是Manus的全部本领,因此接下来再上点难度。 prompt2为:根据以上内容帮我生成一个30秒短视频拍摄脚本,并画出分镜,要求以表格的形式呈现。 我注意到,一开始Manus仍然是熟悉的6个步骤,15秒之后变成了5个步骤。 ![](https://static.cnbetacdn.com/article/2025/0520/3ca429c254cf24f.png) 也就是说,大致可以猜测,Manus的程序底层设置里基本涵盖:理解prompt-读取附件-分析附件-核心任务处理-整理为prompt所要求的结果形式-校验检查-发送给用户等几个步骤。 并且,由于我要求画出分镜,Manus还生成了png图片,看起来很未来可期。 ![](https://static.cnbetacdn.com/article/2025/0520/41fa32d3a48748f.png) 上一个文本任务耗费共计6分半钟,而这一次,等待的时间更长,大约8分半钟我拿到了以下结果。 ![](https://static.cnbetacdn.com/article/2025/0520/a70a643f95d32ea.png) Manus帮我画成了分镜,也提交了表格形式的短视频拍摄脚本和分镜。 打开这次任务中的所有文件,相比上次的纯文本任务,图片分类下完整显示了此次生成的分镜图。 ![](https://img.huxiucdn.com/article/content/202505/19/161629539823.png?imageView2/2/w/1000/format/png/interlace/1/q/85) 脚本分镜文件直接下载是txt格式的,同时也支持导出为pdf文件直接交付。 pdf文件内容截图如下: ![](https://img.huxiucdn.com/article/content/202505/19/161629609129.png?imageView2/2/w/1000/format/png/interlace/1/q/85) 给Manus七分钟 总的来说,在测评任务中,Manus 支持多种任务类型,例如文案生成、短视频脚本及分镜创作,并且能够输出多种形态的交付结果,一定程度上降低了普通内容创作者的门槛,也能提供一些创作灵感。 这整个过程,耗时大约七分钟。 对比目前各家模型所呈现的“思考路径”,Manus工作流程更加清晰,其任务被拆解成多个步骤,用户可以追踪进度并了解每个步骤的具体内容。不仅如此,Manus 还提供任务文件管理功能,用户可以查看任务中生成的所有文件,包括文档、图片、代码文件和链接,操作界面相当流畅。 不过,就七分钟的处理速度而言,Manus生成结果相对较慢,与 ChatGPT 等工具相比,在简单文本任务上可能没有明显优势。 肖弘表示,Manus其名称来自“头脑和手”,Manus一直在解决现实世界的问题,“知识必须应用到现实中,对世界产生有意义的影响”。 事实上,就以上的表现,Manus距离这个愿景还有一段距离,但它仍然呈现出 AI Agent起步阶段的大致轮廓。现在,它的速度还不够快,生成的结果还不够精确,还不够懂人类。 但它也展现了一种想象:在等待的这七分钟里,人们可以暂时停下来,喝一杯水,看看远处,回复回复家人和朋友的讯息,暂时脱离像机器一样作业的感觉,不必担心,Agent帮你接住了一切。 等你短暂恢复过来,它已经“准备好了”。 或许有一天,当开源变得稀松平常,知识最广泛地被应用到现实中,Agent将真正做到:扩展你的能力,放大你的影响力,成为将你的思想愿景变为现实的手。 [查看评论](https://m.cnbeta.com.tw/comment/1501094.htm)

2025-05-20 12:05:24 · 0次阅读
 
 
全国大停电后西班牙又出现大规模断网 影响数百万人

对于大多数当代国家而言,一旦断电断网,绝对会造成难以想象的影响。据英媒体报道,**当地时间周二上午,西班牙多地遭遇电话与网络大规模中断,影响数百万人的电话信号和移动网络**。 事故发生后,一些地区的应急通话系统也受到波及,有报道称部分试图与医院联系的求助者在通话过程中被意外切断。 **为保障民众在紧急情况下的联络需求,部分地区紧急启用备用联系方式,以缓解服务中断带来的影响。**![](https://static.cnbetacdn.com/article/2025/0520/b04885794f54235.png) **报道称,此次通讯故障由西班牙电信巨头电信公司在进行系统升级时操作失误所致。** 按市值和客户数量计算,总部位于马德里的电信公司是世界上最大的电信公司之一,截至目前,总市值为283.86亿美元。 然而,此次断网不仅影响了其旗下的Movistar用户,其他运营商如Orange、Vodafone和O2的用户也在社交媒体上报告了类似问题。 **值得一提的是,此次事故发生之际,距离上月席卷西班牙、葡萄牙及法国南部的大规模停电事件仅数周时间。** 据悉,4月底西班牙出现大规模停电,当时停电波及约5000万人,导致公共交通系统、关键基础设施、ATM机和电话服务大面积瘫痪。 [查看评论](https://m.cnbeta.com.tw/comment/1501092.htm)

2025-05-20 12:05:09 · 0次阅读
 
 
沪深量能11697亿,较昨日增量832亿|日日龙虎榜

涨跌停家数比值为99:9,非ST涨跌停家数比值为75:8。

2025-05-20 12:00:23 · 0次阅读
 
 
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142