所有文章

火锅巨头们狂卷“鲜切”主题店

单点突破,能成就“与己不同”吗?

2025-06-12 08:46:15 · 0次阅读
 
 
IPO井喷创新高,“A转H”南下潮带来积极信号

尽管外部环境存不确定性,但流动性改善与业绩上修预期或推动港股下半年震荡上行,万亿级资金配置需求凸显其长期吸引力。

2025-06-12 08:45:31 · 0次阅读
 
 
AI时代的知识观:重塑问题边界

他们讲知识讲得云山雾罩,实则不过是拿着“老黄历”来应付AI时代的银河系。

2025-06-12 08:45:24 · 0次阅读
 
 
9999元的Pura 80,能帮华为抢下多少苹果用户?

万元影像旗舰,真能替代单反?

2025-06-12 08:45:15 · 0次阅读
 
 
超200亿的市场“钱”景,立高食品、安井、千味央厨们要拼了

冷冻烘焙,怎么就成了香饽饽?

2025-06-12 08:45:09 · 0次阅读
 
 
苹果掀桌,炮轰大模型"不会思考" 是真急了还是真懂了?

6月12日消息,人工智能光鲜亮丽的外表令世人目眩神迷,大语言模型生成的对答文采斐然,看似与人类思维无异。然而在光鲜的外表之下,苹果公司的最新研究清晰揭示出这样一个令人不安的现实:雄辩不等于智慧,模仿也绝非理解。 [![](https://static.cnbetacdn.com/article/2025/0608/ccd2cb17c92d8ea.png)](https://static.cnbetacdn.com/article/2025/0608/ccd2cb17c92d8ea.png) 苹果公司这项新研究题为《思考的幻觉》(The Illusion of Thinking),在人工智能学界掀起轩然大波。研究表明,即便是最顶尖的推理模型本质上也缺乏真正的认知能力。这一发现,印证了Facebook母公司Meta首席AI科学家杨立昆(Yann LeCun)等知名学者多年来所坚持的观点:当前人工智能系统只是精密的“模式匹配机器”,而非能够思考的实体。 **人工智能的巨大幻象** 苹果研究团队的研究过程具备系统性,结果则具备颠覆性。他们创建了可控的解谜环境,在保持逻辑一致性的前提下,能精确调整任务复杂度,从而揭示出大型推理模型(LRM)在三种不同难度下的表现。 研究发现,标准模型在低复杂度任务中的表现竟优于那些本应更强大的推理模型。而在中等复杂度任务中, 额外的“思考”过程带来的效果增量微乎其微。在面对高复杂度任务时,两种模型都彻底“瘫痪”。 更引人注目的是研究人员观察到的反直觉“规模效应”。按理说真正的智能在面对更复杂的问题时,能力应该会随之提升,但这些模型反而呈现出一种怪异模式:即便算力充足,其推理“努力程度”在达到某个临界点后仍会急剧下降。这表明模型根本没有真正进行推理;它们只是在沿用已习得的模式,一旦遇到新颖挑战便不知从何下手。 这项研究暴露出当前模型在精确计算方面的根本局限:它们无法运用明确算法,并且在面对类似谜题时推理逻辑不一致。当那层华丽的语言外衣被剥去,剩下的不过是精致却空洞的思维模仿。 **专家看法** 苹果的这一研究结果让专家们开始质疑当前人工智能能力的深度以及该领域未来的发展路径。IBM技术内容经理阿什·米尼亚斯(Ash Minhas)表示:“这篇论文从根本上证明了大型语言模型无法进行推理。它们只是在进行模式匹配。”他补充说,这项研究的结果凸显出“弱人工智能”与“通用人工智能”之间的区别,明确了当前大语言模型是弱人工智能。 OpenAI前董事会成员、乔治城大学安全与新兴技术中心战略总监海伦·托纳(Helen Toner)最近在美国参议院司法小组委员会作证时就表示:“据我所知,公众和圈内人士对人工智能的最大落差主要来自少数几家致力于开发’通用人工智能’的公司内部。”她说,像OpenAI、谷歌和Anthropic等顶尖人工智能公司正将构建通用人工智能视为“完全严肃的目标”。 有不少专家认为,通用人工智能远未成为现实。正如米尼亚斯所言,“这篇论文强调我们仍处于弱人工智能阶段,离通用人工智能还很远。” “仅靠Transformer架构不足以实现推理,”米尼亚斯总结道,“要获得真正的推理能力,模型架构必须迎来新的突破。” 美国学者加里·马库斯(Gary Marcus)一直是人工智能模型能力的主要审慎派代表,他形容苹果的研究“相当具有颠覆性”。 马库斯在个人专栏中补充道,这些发现对当前竞相开发通用人工智能提出了疑问。在谈及支撑着ChatGPT等工具的大语言模型时,马库斯写道:“任何人如果认为大语言模型是通往那种能够从根本上改善社会的通用人工智能的直接路径,那都是在自欺欺人。” 英国萨里大学以人为本人工智能研究所的安德鲁·罗戈伊斯基(Andrew Rogoyski)表示,苹果论文标志着整个行业在通用人工智能领域“仍在摸索前行”,并且当前方法可能已经走入一条“死胡同”。 他说:“研究发现大型推理模型在复杂问题上会‘失去方向’,而在中低复杂度问题上表现良好,这意味着我们当前所采用的方法可能陷入了一个潜在的僵局。” 这些发现也与杨立昆等顶尖专家多年来发出的警告不谋而合。杨立昆一直坚称,五年内现有的语言模型基本上都会被淘汰,这并非因为有了更好的版本,而是因为这条实现路径存在根本缺陷。 但也有人质疑苹果的研究结果和动机。科技类咨询资深撰稿人克里斯·史密斯(Chris Smith)就认为苹果明显有“吃不到葡萄说葡萄酸”的意味。史密斯说,毕竟“苹果智能”远落后于ChatGPT、Gemini以及其他主流人工智能模型,推理模型方面更是毫无建树。Siri甚至连现在是几月份都说不清楚。 史密斯表示,这项研究发布的时间点也令人质疑。当时苹果即将举办2025年全球开发者大会,而人工智能并非会上主要焦点。苹果在已经发布商业推理模型的OpenAI、谷歌以及其他人工智能公司面前,仍然处于落后地位。而在大会前夕看到苹果贬低推理模型,确实感觉有些奇怪。 史密斯还认为,这项研究的发现很重要,相信其他人会尝试验证或挑战这些发现。甚至有些人可能会利用这些见解来改进自己的推理模型。他说,自己作为一名ChatGPT用户,即使推理模型无法真正思考,也不会放弃使用。譬如ChatGPT o3虽然会犯错,也会出现幻觉,但它的“推理”能力仍然感觉比基础大语言模型更强。 **基准测试亟待改进** 苹果论文也强调了人工智能行业需要更可靠的基准测试。米尼亚斯认为,当前的基准测试问题存在缺陷,因为模型可以通过模式匹配而非真正的推理来解决它们。他说:“如果基准测试是基于真正的推理,或者推理问题更复杂,那么所有模型的表现都会很糟糕。” 米尼亚斯说,苹果研究人员为此构建了一个合成数据集,将符号打乱排列后得到用于训练和测试模型的专项数据集。 “他们已经证明,一旦在输入序列中对符号本身或额外语境进行调整,模型性能就会明显下降,”他解释道。 苹果研究方法包括在训练集中引入各种“干扰信息”和附加条款,用以观察模型性能如何变化。然而,IBM数据科学家杰斯·博佐格(Jess Bozorg)指出这种研究也有局限性:“他们没有具体说明在添加内容时考虑了多少种干扰信息,也没有具体说明他们使用了哪些干扰信息。” **人性的相似之处:更偏爱自信的****“****雄辩者****”** 或许最令人不安的是,苹果研究指出的人工智能局限性与人类根深蒂固的认知偏见何其相似。正如容易被人工智能的雄辩所蒙蔽一样,我们也一贯高估一个人的自信和外向性格,常常误将伶牙俐齿等同于思维深刻。 “过度自信偏见”是人类判断中最常见的缺陷之一,个人对自身能力的主观自信远远超过客观准确性。这种偏见在社交和职场环境中尤为明显,那些自信外向的人往往能获得不成比例的关注和信任。 研究反复表明,人类倾向于将自信等同于能力、音量等同于价值、能言善辩等同于大智大慧。人工智能雄辩之下的空洞,与偏爱自信沟通的人性偏见之间的相似性深刻揭示出“智能”的本质。这两种现象都表明,我们是多么容易将“理解”的表象与实质混为一谈;也表明精湛的沟通技巧如何能掩盖推理与理解上的根本缺陷。 苹果公司的研究发现与关于人类偏见的心理学研究在此交汇,为我们如何驾驭这个日益复杂的世界提供了宝贵启示。无论是评估人工智能系统还是人类同行,我们都必须学会区分“表现”与“能力”,“雄辩”与“理解”。 这需要一种理智上的谦逊,认识到真正的大智慧常常伴随着恰如其分的不确定性;认识到最响亮最自信的未必是最可信的;认识到细致观察和检验完全可以将真正理解与精巧模仿区分开来。 [查看评论](https://m.cnbeta.com.tw/comment/1506296.htm)

2025-06-12 08:35:38 · 0次阅读
 
 
蔡崇信:看到与DeepSeek差距后 阿里员工春节期间加班加点追赶

今年1月,DeepSeek以其低成本、强大的人工智能模型震惊了全球科技行业。此后,阿里工程师取消了休假,在春节期间加班加点弥补差距。阿里巴巴董事长蔡崇信周三在巴黎举行的VivaTech大会上表示,在推出DeepSeek R1模型后,公司意识到自己在人工智能领域已经落后了。 ![](https://static.cnbetacdn.com/article/2025/0612/b4cea6d1ed321a7.webp) 大会上,他举了员工春节加班的例子来说明中国科技行业竞争之激烈。 “我们的工程主管决定,他们说,‘取消你们的春节假期。所有人都留在公司。在办公室睡觉。我们要加快开发进度,’”他说,“几周后,我们推出了自己的版本,即千问系列模型,表现不错。非常有竞争力。” 春节是中国最重要的年度节日之一,人们利用这段较长的假期与家人团聚。今年春节假期从1月28日开始,延续至2月4日。 阿里随后以迅猛速度推出新模型,转而聚焦人工智能,尤其是通用人工智能。 它还承诺在未来三年内投资超过3800亿元人民币用于人工智能基础设施,如数据中心。 蔡崇信今年早些时候表示,阿里已与苹果达成合作,为iPhone提供人工智能技术,尽管该交易已引起美国官员的关注。 不过,阿里巨额投资的回报仍不确定。今年一季度,阿里录得收入2218.74亿元(307.29亿美元),同比增长7%。 [查看评论](https://m.cnbeta.com.tw/comment/1506294.htm)

2025-06-12 08:35:25 · 0次阅读
 
 
黄仁勋称英伟达第一枚GPU在法国生产 马克龙回应称要让法国再次领先

法国总统马克龙周三表示,法国将制造世界上最先进的芯片,以将自己定位为欧洲重要的科技中心。周三,在法国最大的科技活动之一VivaTech上,英伟达CEO黄仁勋在与马克龙和Mistral AI首席执行官Arthur Mensch一起参加小组讨论时表示,英伟达的第一个图形处理单元(GPU)是由SGS Thomson Microelectronics(现称意法半导体)在法国生产的。 ![](https://n.sinaimg.cn/finance/transform/59/w550h309/20250612/2a5b-783132fdb3a8aba6f9ac6617f75c7c6f.jpg) 然而,意法半导体目前并未处于半导体制造业的前沿。该公司生产的大多数芯片都用于汽车等行业,这些行业不需要最先进的半导体。 尽管如此,马克龙还是提出了法国未来将能够制造2纳米至10纳米半导体的雄心。 马克龙周三表示:“如果我们想要巩固我们的产业,我们现在必须以适当的规模获得越来越多的芯片。” 纳米数越小,芯片中可以容纳的晶体管就越多,从而产生更强大的半导体。例如,苹果最新的iPhone芯片基于3纳米技术。 只有很少几家公司能够在这种水平上大规模生产芯片,目前三星和英伟达的供应商台积电处于领先地位。 如果法国想要生产这些尖端的芯片,它可能需要台积电或三星在当地建立工厂。马克龙提到了泰雷兹(Thales)、Radiall和台湾富士康之间的一项协议,这三家公司正在探索在法国建立半导体组装和测试设施。 “我想说服他们在法国制造,”马克龙说,就在同一天,英伟达的黄仁勋宣布了一系列在欧洲建立更多人工智能基础设施的交易。 黄仁勋宣布的一个重要合作伙伴关系是英伟达和法国人工智能模型公司Mistral AI联合开发一个云平台。该平台名为“Mistral Compute”,将搭载18000枚英伟达最先进的Blackwell超级芯片。 法国一直在寻求建立其人工智能基础设施,马克龙在2月份表示,该国的人工智能部门将在未来几年获得1090亿欧元(1256亿美元)的私人投资。马克龙将英伟达和Mistral AI的交易吹捧为法国人工智能建设的延伸。 马克龙周三接受采访时称:“我们正在深化(投资),而且正在加速。而Mistral AI和英伟达今天上午宣布的消息也改变了游戏规则。” [查看评论](https://m.cnbeta.com.tw/comment/1506292.htm)

2025-06-12 08:35:13 · 0次阅读
 
 
Turing Award Winner Joseph Sifakis Warns Against Myth of Intelligence, Urges Global Standards and Ethical Education Reform

Despite his criticism, Sifakis remains hopeful about AI's future. He stressed that the technology should not be deployed in critical fields like healthcare and transportation without internationally accepted safety standards and transparency mechanisms.

2025-06-12 08:34:03 · 0次阅读
 
 
据彭博社消息,腾讯正研究以150亿美元收购游戏开发商Nexon

![](https://image.gcores.com/d75fec2ad3fe60651f4384fcdaec4f8b-768-384.jpg?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 据彭博社消息,消息人士透露腾讯正研究收购知名游戏开发商Nexon,并且已经联系了Nexon已故创办人金正宙的家族,讨论潜在收购的可能性;而金正宙家族一直在与顾问合作,以评估各种方案。不过,金正宙于2022年去世后,公司的股权结构可能会令交易变得复杂。 ![](https://image.gcores.com/c73e9e135caf4617f581e55a35d42192-947-677.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) Nexon于1994年在韩国成立,并于2011年在日本上市,目前市值约为150亿美元。根据阿斯达可财经信息,金正宙的家人透过家族投资公司NXC Corp.及其附属公司NXMH BV持有Nexon 44.4%的股份,而金正宙的妻子及女儿持有NXC约67.6%的股份。 ![](https://image.gcores.com/cebf5e64d02c49cc657b060c4055ed4b-768-384.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10)

2025-06-12 08:29:44 · 0次阅读
 
 
字节自研AI IDE “TRAE”,月活用户已超百万

  ![](https://static.leiphone.com/uploads/new/images/20250612/684a8b648911f.jpg?imageView2/2/w/740) 6月11日,在2025 春季火山引擎 FORCE 原动力大会上,字节跳动技术副总裁洪定坤透露了TRAE 的最新用户数据:整体月活已超 100 万。   今年1月,字节跳动正式发布了国内首个中文AI IDE“TRAE”,通过智能代码补全、局部代码生成、自然语言编程等功能,向国内开发者提供高效的AI Coding服务,该产品自上线以来广受开发者社区关注。   洪定坤透露,在字节跳动内部,超过80%的工程师在使用TRAE辅助开发,已有相当比例的代码是通过AI生成的。同时也表示,不管 AI 如何进步,真正的 Real AI Engineer 仍然离不开人的协作。「哪怕85%的代码都是AI写的,但仍然是人在驱动整个过程。」   大模型技术的演进,使得TRAE等AI Coding类产品有了真正落地的机会。随着底层模型能力的持续进步,AI有机会成为调度者,通过调用不同的 Agent 和工具,让软件开发实现“All-in-One ”,更大幅度地降低开发门槛,提升开发效率。   据悉,本次大会上全新发布的豆包1.6系列模型,进一步提升了编程能力,并已经接入TRAE内测,新模型将很快推送给用户。   在大会上,TRAE 还上线了全新的 cue 功能(context understanding engine),支持基于编辑行为预测下一个改动点并给出推荐,可应用于代码修改、代码生成、错误修复等多个场景,更好地协助用户的编码过程。   洪定坤表示,未来TRAE 将持续优化人机协作,让 AI 既“听得懂人话”,也看“得懂上下文”,成为开发者的“默契拍档”。

2025-06-12 08:13:00 · 0次阅读
 
 
macOS 26液态玻璃“致敬”Windows Vista 微软贴脸嘲讽

**苹果正式发布了全新的macOS 26操作系统,其中采用了“液态玻璃”(Liquid Glass)设计语言。**不有有不少人指出,这一设计与2006年Windows Vista的毛玻璃(Aero Glass)设计极为相似。 此前通常避免在竞争对手发布新产品时发表评论的微软,**日前也在官方Instagram账号上发布了一段视频,并称“就把它放这了”,调侃苹果的这一设计“致敬”了Windows Vista。** [![](https://static.cnbetacdn.com/article/2025/0612/b0496b52d66746f.png)](//img1.mydrivers.com/img/20250612/1e442709-07c9-4674-a610-03fc6928e4ae.png) 微软发布的视频中,使用了“#WindowsAero”标签,并配上了怀旧的Windows音乐,带领观众回到2000年代初。 **当时微软推出了具有标志性Aero毛玻璃效果的Windows Vista,视频中展示了Windows Vista的半透明、玻璃质感的窗口边框,让用户可以透过它们看到桌面壁纸。** [![](https://static.cnbetacdn.com/article/2025/0612/7b425b42afeb097.jpg)](//img1.mydrivers.com/img/20250612/3e62ad75-5312-4afe-bea2-413de84163f4.jpg) 苹果对于液态玻璃描述为:“新的材料,液态玻璃,是半透明的,并且表现得像现实世界中的玻璃。”它会根据周围内容的颜色智能适应明暗环境。 有趣的是,微软在近20年前推广Windows Vista时也使用了“类似玻璃的界面”这样的表述。 [查看评论](https://m.cnbeta.com.tw/comment/1506288.htm)

2025-06-12 08:05:11 · 0次阅读
 
 
大众纯电小车ID.2量产版揭开面纱 延续Polo经典设计

据媒体报道,大众汽车的ID.2纯电动掀背车量产版首次曝光。大众在车身贴上了大量伪装贴纸,将其伪装成2023年停产的第六代Polo。谍照显示,测试车的前后灯组、进气格栅甚至后门把手都覆盖了“仿真”贴纸,真正的门把手则藏在窗框之上。 ![](https://static.cnbetacdn.com/article/2025/0612/43d1adfcce46329.png) 尽管如此,**ID.2仍保留了ID.2all概念车的设计元素,包括纤细的前格栅、贯穿式尾灯以及大众标志性的箭头形后翼子板。** ![](https://static.cnbetacdn.com/article/2025/0612/56e7ddefea74f05.png) ID.2是大众全新入门级电动车平台MEB的首款小型车。 与现有的ID.3、ID.4和ID.Buzz等后驱车型不同,ID.2及其SUV衍生款甚至更小的ID.1都将采用前驱布局。 **新车还将从成本较高的三元锂电池切换至价格更低的磷酸铁锂电池,预计售价将压低至约2.5万美元(约合人民币18万元),以应对欧洲市场上大量涌现的低价纯电动车型。** ![](https://static.cnbetacdn.com/article/2025/0612/008ca2c69421213.png) 大众此前还展示过ID.GTI概念车,并承诺推出一款性能版ID.2 GTI。这辆原型车配有锻造轮圈、车顶扰流板和运动保险杠。 ![](https://static.cnbetacdn.com/article/2025/0612/db3a42ed088a0c5.png) **不过,此次亮相的“ID.2”也不一定会沿用这个名字,因为大众正逐步放弃“ID”系列编号,将为未来车型引入新的命名方式。** [查看评论](https://m.cnbeta.com.tw/comment/1506286.htm)

2025-06-12 07:36:40 · 0次阅读
 
 
哪吒汽车原CEO张勇已停更8个月 曾去英国融资

近日哪吒汽车员工发布短视频,哪吒汽车董事长兼CEO方运舟被堵在办公室,员工集体讨薪,**随后哪吒汽车内部宣布,员工自6月12日起居家办公。**网友发现,**哪吒汽车原CEO张勇已停更8个月时间,其微博最后更新时间停留在2024年10月。** [![](https://static.cnbetacdn.com/article/2025/0612/1d0d452bc64df0d.jpg)](//img1.mydrivers.com/img/20250612/0ac5fe03dd1f45ca84031a21333e980e.jpg) 在辞去哪吒汽车CEO之后,张勇被曝办理了英国签证,本人身在英国,对此张勇在朋友圈回应称至今仍担任哪吒汽车顾问,为公司四处奔波融资。 据企查查信息,张勇名下关联28家企业,目前仍担任哪吒汽车关联公司合众新能源汽车股份有限公司总经理、董事职务。 [![](https://static.cnbetacdn.com/article/2025/0612/d277ff28cd76230.jpg)](//img1.mydrivers.com/img/20250612/bced6c73263c4432ae126d7906921c9b.jpg) 资料显示,哪吒汽车的高光时刻是在2022年,**彼时哪吒汽车以15.21万辆的销量成绩夺得造车新势力的冠军。** [![](https://static.cnbetacdn.com/article/2025/0612/4563da420cabb8b.jpg)](//img1.mydrivers.com/img/20250612/8609d84867a64345a5a08f991d0ef800.jpg) 但是这个高光时刻转瞬即逝,自此以后,哪吒汽车的销量便开始了一路下滑,随着汽车市场竞争的进一步加剧,哪吒汽车逐渐被市场边缘化。 [![](https://static.cnbetacdn.com/article/2025/0612/1c03984ccf8665f.jpg)](//img1.mydrivers.com/img/20250612/d8789481a8684238b195dfeed9856b20.jpg) [查看评论](https://m.cnbeta.com.tw/comment/1506284.htm)

2025-06-12 07:36:26 · 0次阅读
 
 
万元天猫超市消费卡被爆无法购物 客服:将妥善处理

**有消费者反映,自己充了两万多的天猫超市消费卡无法下单购物。**该消费者介绍,为了在618活动中获得更优惠的价格,他从5月20日开始陆续在天猫超市消费卡充值,但5月25日开始,用自己的账号购物就会显示“购买失败”。 ![](https://static.cnbetacdn.com/article/2025/0612/e8584b26ff9461d.png) 该消费者表示:“之前都正常,现在无法购买任何商品,卡里还剩一万多,而且有的红包也已经过期了。” 事实上,这并非个例,在黑猫投诉平台上,通过搜索“天猫超市无法下单”字样发现,目前相关的投诉量已经有5543条。 ![](https://static.cnbetacdn.com/article/2025/0612/da82521ebec1a59.png) 据媒体此前报道,有消费者被天猫平台限制消费主要有以下原因:**因存在不正当手段购买或使用消费卡、利用作弊工具虚假交易、利用流程便利大量退款等。** 但上述消费者表示:“自己没有类似的恶意行为,所购买的商品也大多为普通生活用品。” 对此,媒体联系到天猫平台,客服表示:“账号无法下单可能有系统设置错误、网络信号不佳或下单人数过多等原因”。 客服也表示:**“已了解该消费者的情况,将尽快转接相关部门,核实并查明原因,对无法下单及红包过期问题也将给出妥善的处理方案。”** [查看评论](https://m.cnbeta.com.tw/comment/1506282.htm)

2025-06-12 07:36:12 · 0次阅读
 
 
台积电准备下一代310×310毫米“CoPoS”封装

随着对日益增长的人工智能计算能力的需求不断增长,以及制造先进节点的难度加大,封装技术正迎来发展的黄金时代。如今,先进的加速器通常依赖于台积电的CoWoS模块,这些模块基于尺寸不超过120×150毫米的晶圆切割而成。 ![](https://static.cnbetacdn.com/article/2025/0612/2eec44dba78e02b.jpg) 为了满足更多空间的需求,台积电公布了CoPoS(即“基板上面板上的芯片”)计划,该计划可以将基板尺寸扩展到310×310毫米甚至更大。通过从圆形晶圆转换为矩形面板,CoPoS可提供五倍以上的可用面积。 额外的表面使得在单个封装中集成额外的高带宽内存堆栈、多个I/O芯片和计算芯片成为可能。这也使面板级封装(PLP)脱颖而出。 ![](https://static.cnbetacdn.com/article/2025/0612/c632ab7c90c8b16.jpg) 与晶圆级封装(WLP)不同,PLP将组件组装在大型矩形面板上,从而提供更高的吞吐量和更低的单位成本。采用 PLP 的系统实际上将适用于量产,并且比 WLP 更快地实现迭代。 台积电将于 2026 年在其子公司 Visionchip 建立一条 CoPoS 试验线。2027 年,该试验工厂将专注于改进工艺,以在年底前满足合作伙伴的要求。量产预计将于 2028 年底至 2029 年初在台积电嘉义 AP7 园区开始。该园区因其现代化的基础设施和充足的空间而被选中,还将用于生产多芯片模块和晶圆系统技术。 ![](https://static.cnbetacdn.com/article/2025/0612/acc8d24debd9813.jpg) NVIDIA 预计将成为 CoPoS 的首发合作伙伴。该公司计划利用更大的面板面积容纳多达 12 个 HBM4 芯片以及多个 GPU 芯片,从而显著提升 AI 工作负载的性能。同时,AMD 和博通将继续在其高端产品中使用台积电的 CoWoS-L 和 CoWoS-R 版本。 除了简单地增加尺寸之外,CoPoS 和 PLP 还可以与其他新兴技术(例如玻璃基板和硅光子学)协同工作。如果开发按计划进行,首批支持 CoPoS 的设备有望在 2029 年底上市。 [查看评论](https://m.cnbeta.com.tw/comment/1506280.htm)

2025-06-12 07:36:02 · 0次阅读
 
 
安全公司建议用户不要点击垃圾邮件底部的退订按钮 因为会有额外风险

通常情况下我们收到商业广告邮件或垃圾邮件,会习惯性的点击底部的取消订阅按钮,像是 iOS 自带的邮件应用还可以自动检测并在邮件顶部弹出退订按钮方便用户点击进行退订。 ![](https://static.cnbetacdn.com/article/2025/0612/daa1f215c592933.webp) 不过 DNSFilter 首席技术官 TK Keanini 建议用户不要随意点击底部的取消订阅按钮,因为用户盲目点击退订按钮打开链接有时候可能会带来额外风险,例如每 644 次点击中就有 1 次将用户引导至潜在的恶意网站。 这种观点其实与我们退订垃圾短信有类似的情况,即本身这些垃圾邮件和垃圾短信都是群发的,如果用户收到后主动发送退订信息,对发送者来说意味着这个邮箱是真实有效且活跃的。 垃圾邮件发送者后续还可以针对有效邮箱维护新数据库疯狂发送新的垃圾邮件和垃圾短信,从这个角度来说盲目点击退订按钮确实不是好事情,当然这也需要针对不同的情况进行区分。 例如邮件发送者是用户注册的某个服务,那收到推广邮件进行退订应该还是可以的,部分网站需要用户进入自己的账户中心取消订阅设置,前提是用户需要确保退订地址并非钓鱼网站。 如果有人冒充某个公司例如Google发送广告邮件并附加所谓的退订按钮,那用户点击退订时可能会进入钓鱼网站,此时如果钓鱼网站要求用户输入Google账号和密码则可能导致账户信息泄露。 TK Keanini 的建议是不要离开自己的电子邮件客户端,例如 iOS Mail 应用检测到的退订选项,点击退订后会发送一封新邮件进行退订 (尽管经常被退信),但这个选项不需要用户点击链接,从而避免暴露到钓鱼网站中。 安全公司 Zenity 则表示未经检查的退订链接将用户重定向到钓鱼网站后,通常会以欺诈方式窃取密码或其他登录凭证,甚至还可能在目标设备上部署恶意软件。 所以安全专家的建议是,最安全的退订方式就是使用电子邮件服务提供的列表退订标头,也就是类似 iOS Mail 那种自动检测并发信退订的,标头不属于邮件正文因此也不需要点击外部链接。 最后无论是哪种方式用户都应该检查发信者和链接地址,对于并非自己熟知的服务即便看到广告邮件也应该直接拉黑而不是点击退订,如果是熟知的服务则应该仔细检查链接地址后再确认退订,当然无论如何都不要输入自己的账号密码或下载软件。 [查看评论](https://m.cnbeta.com.tw/comment/1506278.htm)

2025-06-12 07:35:51 · 0次阅读
 
 
电动版大众途安即将开发 竞争中国市场

**大众正在考虑推出一款电动紧凑型MPV,以接替经典家用MPV途安,并为家庭用户提供比SUV更实用的选择。**这款新车正处于内部评估阶段,将从2016年的Budd-e等早期概念车中汲取灵感,而Budd-e基于MEB平台的初版,目前大众的纯电动车正是以该平台为基础。 **在SUV大量涌现的当下,大众重新意识到,面向家庭的MPV在欧洲和中国市场仍具备潜力。** [![](https://static.cnbetacdn.com/article/2025/0612/ac3c47b2ed79966.png)](//img1.mydrivers.com/img/20250612/f3073c9a-ecb6-41e4-a829-e2eab47f12e7.png) 这款新MPV的定位将低于ID.Buzz,拥有更紧凑的尺寸、更轻的车重以及更亲民的售价,被形容为“现代版Microbus(Type 2)”。 其设计可能借鉴2011年的Bulli、2016年的Budd-e概念车,以及第二代途安和2014年高尔夫SV等量产车的元素。 结构设计上,大众考虑采用方正轮廓、短车身悬挂、平整地板和高车顶,以争取最大化的内部空间和多功能性,满足包括德国出租车公司在内的目标用户需求。 此外,大众还在研发新的滑动车门与座椅布局,以提升竞争力,主要对手包括新近发布的极氪MIX,后者以灵活设计见长,凭借独特的双滑门和多变车内布局赢得大量关注。 **途安自2003年推出以来,在欧洲市场累计销量超260万辆,是欧洲最畅销的MPV之一,虽然近年风头被SUV抢去,但仍有大量老用户期待更新。** [![](https://static.cnbetacdn.com/article/2025/0612/c3bfff81c714e6f.png)](//img1.mydrivers.com/img/20250612/86c36a6c-cf07-445d-af4f-191040bda241.png) 同时,大众也面临来自中国电动MPV市场的压力。 **目前,新车项目仍处于早期阶段,未来有望基于升级版MEB+平台或更新的SSP平台打造,预计将提供60-80kWh的电池选择,驱动形式包括前驱单电机及四驱双电机。** 若最终量产,该车有望在2027年或2028年推出,并可能重用途安这一名称,契合大众为未来电动车使用传统车名、摆脱ID系列编号的策略。 [查看评论](https://m.cnbeta.com.tw/comment/1506272.htm)

2025-06-12 07:35:38 · 0次阅读
 
 
全新奥迪Q5插混版官图发布:纯电续航100km 海外售价52.5万元起

**全新奥迪Q5插混版官图正式发布,车辆搭载25.9kWh电池组,提供100km纯电续航里程。**该车型将在墨西哥生产,并计划于6月内在欧洲接受预定。 ![](https://static.cnbetacdn.com/article/2025/0612/a7a710c85e7b50f.png) **在德国市场,Q5插混版起售价为63400欧元(约合人民币52.5万元),Q5 Sportback插混版起售价为65900欧元(约合人民币54.5万元),性能版车型售价分别为71800欧元和74300欧元(约合人民币59.4万元和61.4万元)。** 外观方面,全新奥迪Q5插混版与燃油版车型保持一致,采用全新中网样式,传承了奥迪的经典车灯与格栅轮廓,矩阵式数字LED大灯可展现不同动态效果。 ![](https://static.cnbetacdn.com/article/2025/0612/de4b5dfa8bbebca.png) **车身尺寸方面,燃油版奥迪Q5长宽高分别为4717/1900/1647mm,轴距为2820mm。** 此外,插混车型提供S Line外观套件,配备红色制动卡钳和19英寸轻量化合金轮圈。 ![](https://static.cnbetacdn.com/article/2025/0612/f9205cd3e3e0c7b.png) 内饰方面,车内整体布局与现款保持一致,注重内饰氛围营造,多处配备氛围灯。 ![](https://static.cnbetacdn.com/article/2025/0612/0d4bb1194d442ab.png) 新车提供11.9英寸数字仪表盘、14.5英寸中控屏和10.9英寸副驾娱乐屏。此外,车辆还提供S Line风格内饰,配备黑色真皮运动座椅。 ![](https://static.cnbetacdn.com/article/2025/0612/5af89eff77689ab.png) **动力方面,新车搭载2.0T涡轮增压发动机和单电机组成的插电混动系统,匹配7速双离合变速箱,配备25.9kWh电池组,充电速率提升至11千瓦。** ![](https://static.cnbetacdn.com/article/2025/0612/5dd74bdbeb3dbbd.png) **车辆提供高功率(性能版)和低功率车型,最大功率分别为299马力和367马力,峰值扭矩分别为450牛·米和500牛·米,0-100公里/小时加速时间分别为5.1秒和6.2秒,最高车速可达250km/h。** [查看评论](https://m.cnbeta.com.tw/comment/1506268.htm)

2025-06-12 07:35:26 · 0次阅读
 
 
特朗普宣布移民金卡网站上线 称卖1000万张就能还清美债

据央视报道,当地时间6月11日,美国总统特朗普在社交平台上发布移民“金卡”网站网址,宣布该网站上线。特朗普表示**“上千人打电话询问,如何报名踏上一条通往世界上最伟大的国家和市场的美丽之路。它叫美国!候补名单现已开放。点击网址报名。”** [![](https://static.cnbetacdn.com/article/2025/0612/34521b75e7e8937.png)](//img1.mydrivers.com/img/20250612/d516870618d8489c9a1c9eb83d1694b3.png) 当地时间2月25日,特朗普在白宫对媒体称,他打算出售定价**500万美元**的美国“金卡”,目标人群是富有的移民。 据他称,这种“金卡”不会直接给予购买者美国公民身份,因此不需要通过美国国会,但将赋予同“绿卡”一样的权利,是“获取美国公民身份的给力路径”。 特朗普表示,移民“金卡”可以为美国政府带来收入,如果能卖出1000万张“金卡”,就能还清美国的债务。 [查看评论](https://m.cnbeta.com.tw/comment/1506264.htm)

2025-06-12 07:35:15 · 1次阅读
 
 
详解Swift:全球布局、跨境支付模式、国际清算原理、GPI支付

<blockquote><p>在全球金融体系中,跨境支付与国际清算一直是国际贸易和经济活动的基石。Swift作为全球金融通信的核心平台,已经运行了半个世纪,深刻影响着国际金融的运作方式。本文将深入剖析Swift的全球布局、跨境支付模式、国际清算原理以及GPI支付的创新机制。</p> </blockquote> ![](https://image.woshipm.com/2023/04/13/9b77b346-d9de-11ed-bd5e-00163e0b5ff3.jpg) 提及跨境支付或全球清算,怎能不知Swift?本文将全面解答有关Swift的一切疑问。 自1973年成立以来,Swift已历经半个世纪的发展历程。它的诞生,源自对传统金融通信方式的革新需求;如今,Swift已跃居全球金融通信的“中枢神经”地位,其重要性不言而喻。 ## 一、Swift是什么 SWIFT即环球银行金融电信协会(也称作环球同业银行金融电讯协会或全球银行金融电信协会),是一个国际性的、非盈利的银行同业合作组织。它运营着一个世界级的金融电文网络,使得银行和其他金融机构能够安全地发送信息和支付指令,从而支持国际贸易的快速跨境转账付款。 ![](https://image.woshipm.com/wp-files/2025/06/qateVvgLXngx6NkPGLlZ.jpg) SWIFT于1973年由全球15个国家的239家银行共同发起成立,其总部设在比利时首都布鲁塞尔,旨在解决当时国际金融通信效率低下、安全性不足的问题,特别是替代传统的Telex系统。 如今,SWIFT已覆盖200多个国家和地区,其产品和服务对接了全球超过11,000家银行、证券机构、市场基础设施和企业用户,规模堪称垄断。值得一提的是,SWIFT在其官网上明确声明: - “不代表客户持有资金或管理账户”,即SWIFT不处理资金流; - 同时,“进行通信、提供可靠的交换标准金融报文”,说明SWIFT仅处理支付信息流。 ![](https://image.woshipm.com/wp-files/2025/06/7HyPSCOPOISW86UajENg.png) 值得注意的是,SWIFT本身并不属于资金清算系统,它仅负责传递信息流,本质上扮演着金融机构之间的“通信”工具角色。SWIFT负责成员机构之间的信息转发,并制定通信标准,同时确保信息的保密性和安全性。 在国际支付体系中,各国的国际清算系统负责处理信息流的清算工作,例如美国的纽约清算所银行间支付系统(CHIPS)和我国的人民币跨境支付系统(CIPS)。而国内的清算体系则负责最终资金的清算,如美国的联邦资金转账系统(Fedwire)和我国的二代支付系统(CANPS)。 ## 二、Swift的成立及发展 20世纪70年代,全球金融交易主要依赖Telex系统进行。然而,该系统存在诸多弊端:传输速度缓慢,仅达50波特/秒;安全性低下,易出错误;更为关键的是,Telex系统缺乏统一的通信标准,使得不同银行间的信息格式混乱不堪,严重影响了通信效率。随着国际贸易和金融活动的迅猛增长,这种低效的通信方式已难以满足日益增长的需求。 ![](https://image.woshipm.com/wp-files/2025/06/GtdCs4lzmVzavLx3EDde.jpg) ### 2.1. Swift发展里程碑 随着计算机网络技术的不断发展,1973年,来自15个国家的239家银行的银行家们,因不堪忍受传统电报的种种局限,联合成立了Swift组织。其旨在建立一个高效、安全、标准化的全球金融通信网络。1977年,Swift正式投入运营,这标志着全球金融通信迈入了一个崭新的时代。 ![](https://image.woshipm.com/wp-files/2025/06/cjZiRarhX0fdWNxeT5qj.png) ### 2.2.Swift在我国的发展 1980年,SWIFT系统联接到香港。1983年,中国银行成为中国首家加入SWIFT的银行,并于1985年5月13日正式开通SWIFT服务,成为SWIFT组织的第1034家成员行,这标志着我国与国际金融标准接轨迈出了重要一步。此后,我国各国有商业银行以及上海和深圳的证券交易所也相继加入SWIFT。 进入90年代后,除国有商业银行外,中国所有能够办理国际银行业务的外资银行、侨资银行以及地方性银行也纷纷加入SWIFT,SWIFT的使用范围也从总行逐渐扩展到各分行。 1994年,SWIFT在香港设立了其除美国和荷兰之外的第三个支持中心,这使得中国用户能够享受到来自SWIFT支持中心中文员工的技术服务。 1995年,SWIFT在北京电报大楼和上海长话大楼设立了SWIFT访问点(SAP,即SWIFT Access Point),它们分别与新加坡和香港的SWIFT区域处理中心主节点相连,为用户提供自动路由选择服务。 1999年,SWIFT在北京设立了代表处。 ### 2.3.Swift的意义 Swift的诞生彻底替代了传统的Telex系统。与Telex相比,Swift具有速度快、安全性高、标准化的优势。可以说,Swift的出现解决了全球金融通信的诸多痛点,为国际金融活动提供了坚实的技术支撑。Swift之所以能成为全球金融体系的“中枢神经”,主要得益于以下几个方面: - 全球覆盖广泛。Swift连接了全球200多个国家和地区的超过11000家金融机构,构建了一个庞大的金融通信网络。 - 高效安全。Swift的通信标准和先进的加密技术确保了信息传输的高效性和安全性,为金融机构提供了可靠的通信保障。 - 中立性强。Swift作为一个中立的国际组织,不受任何国家或机构的控制,赢得了全球金融机构的广泛信任。 可以说,Swift不仅是一个技术平台,更是全球金融体系的重要基础设施。它的存在使得跨境支付、国际贸易和金融市场运作变得更加高效、可靠。 ## 三、Swift的组织及管理机制 Swift是一个非官方的中性协会组织,由于其拥有众多银行股东成员,因此各成员的话语权存在差异。Swift的日常运营由CEO领导的执行部门负责,并接受董事会的监督。 ### 3.1.董事会 董事会是Swift的最高权力机构,其成员由股东成员推选产生。而每个股东成员的投票份额则根据其参与Swift的交易量来确定,只有交易量占比超过1.5%的国家或国家集团才有资格被任命为董事会成员。目前,董事会由来自18个国家及地区的23位董事组成。 ![](https://image.woshipm.com/wp-files/2025/06/lRsSe4FqmNwa1RkislP8.png) 董事会成员主要来自持股量较大的国家,其中美国和欧洲国家在董事会中占据主导地位。例如,美国、德国、法国、英国等国家的代表在董事会中占有重要席位,且美元和欧元在SWIFT处理业务量中的合计占比超过70%。因此,从历史数据来看,董事会主席一职多由美国会员代表担任,而CEO则多由欧洲人担任。下图所示为SWIFT处理业务量中金额排名前十的币种 ![](https://image.woshipm.com/wp-files/2025/06/7ZEpeCS8KztzxqcfPZjt.jpg) 下表则为Swift2019年的董事会成员组成情况。 ![](https://image.woshipm.com/wp-files/2025/06/Rx6AFgIt1aE8dSeAw959.png) 董事会下设六个委员会,各负其责。其中,财务委员会负责会计、财务报告及财务管理等相关工作;偿付委员会则负责评估公司绩效,并决定董事会成员及其他高层管理人员的薪酬、雇员薪酬及津贴计划。此外,还设立了两个商务委员会,分别负责银行业务与支付业务,以及证券业务。另外,还有两个技术委员会,一个负责标准制定工作,另一个则负责技术和产品的研发与管理。 ![](https://image.woshipm.com/wp-files/2025/06/GwWe7Mn3QPEPI3rFksbC.png) ### 3.2.十国集团监督 十国集团(G10)的中央银行对SWIFT承担着监督管理职责。其中,比利时国家银行(NBB)在SWIFT的监管中发挥着主导作用,G10的其他中央银行则提供必要的协助。监管的主要目标是确保系统的安全性和操作可靠性,这包括维护稳健的系统架构、提升处理能力,以及实施有效的风险管理和控制措施。NBB负责SWIFT的日常监管工作,而支付清算委员会(CPSS)则根据检查结果提出指示或建议,明确监管中应重点关注的问题。 ## 四、全球运营布局 Swift在全球构建了“一总部、两中心、三区域”的全球闭环网络:其总部设在布鲁塞尔,同时在荷兰阿姆斯特丹和美国纽约设有数据交换中心(Swifting Center),并覆盖了欧洲、美洲、亚洲三大区域,从而确保了其全球网络的稳定性和高效运行。 ### 4.1.一个总部 Swift的总部位于比利时布鲁塞尔郊外的拉赫尔佩(La Hulpe),这里是Swift的全球管理和运营中心。总部负责制定发展战略、管理全球网络,并协调各区域中心的工作事宜。此外,总部还设有技术支持中心,专为欧洲及其他地区的用户提供技术支持服务。 ![](https://image.woshipm.com/wp-files/2025/06/mGMXzCkZS3VDcjx0GUy8.jpg) ### 4.2.两个交换中心 荷兰阿姆斯特丹交换中心是Swift在欧洲的主要交换中心之一,负责处理欧洲地区的金融信息传输和路由工作。该中心与布鲁塞尔总部保持紧密合作,确保欧洲金融机构之间的通信高效且安全。 而美国纽约交换中心则是Swift在美洲的主要交换中心,负责处理北美及南美地区的金融信息传输事务。鉴于美元在全球金融体系中的主导地位,纽约中心在Swift网络中具有举足轻重的战略意义。此外,美洲中心还配备了技术支持团队,为北美和南美的金融机构提供全面的技术服务和客户支持。 ### 4.3.三个布局区域 Swift分为欧洲、中东、非洲地区,美洲地区和亚太地区三大区域,每个区域享有较高的自主权,并实行本土化策略。在每个区域内,均设立了市场、产品、IT运营、客户服务四个基本部门,以及股东关系、金融管理、法律、人力资源等职能部门。 ![](https://image.woshipm.com/wp-files/2025/06/w3U6QcbQWnMwCqv0pBHh.jpg) ### 4.4.27家办事处 SWIFT作为全球支付系统,提供信息交换网络,各地的国际金融中心在其战略布局中具有重要地位。SWIFT在三大区域的重点国际金融中心或区域金融中心进行了全面布局,以发挥节点服务作用。目前,SWIFT已在全球设立了27个办公室。 ![](https://image.woshipm.com/wp-files/2025/06/bpzbQdS7b3trtrJPOVEb.png) ## 五、国际支付清算的Swift模式 跨境支付遵循的是最基本的支付原理,只不过支付指令通过新的模式(如Swift)跨越了国家或地区,涉及多个国家的支付体系以及更多资金账户的参与。总体来说,跨境支付涉及的参与者更多,支付指令的传输环节更多,需要处理的资金账户也更多。下面我们将从基础原理出发,推演出国际支付的基本原理。 ### 5.1.基础支付原理 **1)支付的标准过程** 支付过程可以分为三个阶段:交易、清算和结算,这是支付的标准化流程。具体而言: - 交易阶段:用户发起支付,确认身份后产生支付指令,并将支付指令发送出去。 - 清算阶段:机构间进行支付指令的交换,根据实时全额或定时批量净额的方式计算待结算金额。支付指令的交换过程包括交易撮合、清分以及数据收集等环节。 - 结算阶段:根据清分结果,完成账户间的最终实际划拨过程,包括收集待结算债权、结清债权,并通知相关各方。 ![](https://image.woshipm.com/wp-files/2025/06/ognvUOikYQYRdMxFeMFM.jpg) **2)我国的支付清算体系** 我国的支付清算体系虽然也遵循“交易、清算、结算”这三个基本过程,但实际上要复杂得多。特别是在跨机构清算时,支付机构、收付款行负责发送和接收支付指令,网联或银联等清算机构负责处理清算环节,而最终的结算则是在央行完成的。 ![](https://image.woshipm.com/wp-files/2025/06/HzR13ZkqrdrjHmP4qwPU.jpg) 我国除了拥有完善的境内支付体系外,还建立了人民币跨境支付清算体系,用于处理跨境支付业务的信息流和资金流。如下图所示,人民币跨境支付系统(CIPS)负责对跨境支付指令进行清算处理。每个直接参与行在CIPS中都开通了资金账户,但各机构间的最终资金结算是在二代支付系统(CNAPS)内完成的,依然遵循先清算再结算的基本支付原则。 ![](https://image.woshipm.com/wp-files/2025/06/ERrm2cQGHbwizS1zgdIt.jpg) **3)境内外支付清算分离理念** 大家也发现了,我国的国内支付清算体系和人民币跨境支付清算体系是独立构建的。一方面是出于安全考虑,另一方面是因为运行时间、国内外报文标准以及使用的语言等方面存在显著差异。 ![](https://image.woshipm.com/wp-files/2025/06/hYjxTIl8405sTfSETS7Y.jpg) 在世界主要经济体中,情况也是如此。跨境支付清算系统主要负责国际清算工作,一般不直接处理资金,而是仅清算支付指令。最终的资金结算还是依赖于国内的清算体系来完成。例如,在美国,有纽约清算所银行间支付系统(CHIPS)和联邦资金转账系统(Fedwire);在日本,则有国内全银数据通信系统(Zengin System)和外汇日元清算系统(FXYCS)。 ![](https://image.woshipm.com/wp-files/2025/06/vRTvoKfPdHhoTe2YucXq.png) ### 5.2.主要国际清算体系的Swift模式 各国货币的跨境支付在对接Swift的模式上存在差异。例如,我国的跨境支付系统(CIPS)将Swift作为可选项,境内外的直接参与行既可以通过Swift接入CIPS,也可以通过专线接入。而欧元的TARGET系统,其支付指令的传输则完全依赖于Swift来实现。 **1)中国的CIPS+CNAPS模式** 我国的人民币跨境支付体系由2015年建成的人民币跨境支付系统(CIPS)与中国现代化支付系统(CNAPS)中的大额支付系统(HVPS)共同构成。CIPS负责人民币跨境支付的清算工作,提供全额清算模式和定时净额清算模式;而HVPS则为CIPS提供日终的资金结算服务。 ![](https://image.woshipm.com/wp-files/2025/06/0sy0UPEFN7pdBeOd9QNI.jpg) **2)美国的SWIFT+CHIPS+Fedwire模式** 在美元的跨境支付流程中,Swift负责支付指令的传递,CHIPS(纽约清算所银行间支付系统)负责指令的清算,而Fedwire(联邦资金转账系统)则负责最终的资金结算。 CHIPS建成于1970年,专门用于美元的跨境支付清算,能够对支付指令进行实时或多边轧差,并根据清算结果调整参与者的资金头寸。 Fedwire则成立于1918年,最初通过电报系统处理资金转账,70年代后升级为自动化通信系统。它基于CHIPS计算得出的参与者收付净额,完成最终的资金结算。这一模式与我国的跨境支付模式有相似之处。 ![](https://image.woshipm.com/wp-files/2025/06/DwiGJYzWKkgzp36hTWrV.jpg) ## 六、Swift怎么实现全球通讯 全球各国的金融机构之所以能够通过SWIFT实现信息交流,得益于SWIFT的统一身份标识体系、标准报文体系以及全球通讯网络体系。 ### 6.1.统一身份标识,SWIFT银行认别代码 Swift为每一位成员分配了一个统一的身份标识,即BIC(Bank Identifier Code),用这个编码来唯一识别会员单位。 ![](https://image.woshipm.com/wp-files/2025/06/UOW58i2ILyGWrcdEIfrn.png) ### 6.2.标准统一的电文语言体系 SWIFT系统成员之间通过SWIFT提供的240余种标准电文进行信息交流。 **1)Swift的报文种类** Swift报文是金融机构之间进行信息交换的核心工具。这些报文根据功能和用途被划分为不同的类别,每种类别都遵循特定的格式并服务于特定的目的。Swift报文主要分为10大类,每一大类下又包含若干子类别。以下是Swift报文的分类及其主要用途。 ![](https://image.woshipm.com/wp-files/2025/06/BZOUgMxIL3xB8RSUErMl.png) **2)Swift的报文结构及示例** 要理解Swift如何传递信息以及能够传递哪些信息,就需要了解它的报文结构,即报文的具体内容。Swift报文采用标准化的格式,以确保全球金融机构之间的信息交换既高效又准确。每个Swift报文由报头(Header)、正文(Text)和报尾(Trailer)三个部分组成。以下是Swift报文的具体结构,并以MT103单笔客户汇款报文为例进行说明。 ![](https://image.woshipm.com/wp-files/2025/06/hzv8bzieOCmJgQDrtKuv.png) ### 6.3.SWIFT报文传递的模式 当一笔支付的信息流在多个机构间传递时,例如从付款行经代理行、中间行再到另一个代理行,最终到达收款行,Swift在传递指令时采用Serial(串行)和Cover(并行)两种报文传递方式。这两种方式主要用于处理多个报文之间的关联性和优先级问题。在跨境支付、证券交易等业务中,这两种模式非常常见,特别是在需要将多个报文组合发送或按照特定顺序分开发送时。 **1)Serial串行模式** Serial模式是指将多个报文按顺序依次发送,每个报文独立传输,彼此之间没有直接的关联性。在这种模式下,每个报文都是独立的,接收方可以单独处理每个报文。报文按照发送顺序逐一传输,适用于那些不需要将多个报文关联在一起的业务场景,比如多个独立的支付指令的发送。 ![](https://image.woshipm.com/wp-files/2025/06/umdDmD7YRN3ugGh8SXzQ.jpg) **2)Cover并行模式** Cover模式是指将多个报文组合在一起发送,其中一个报文(通常是MT202)作为“主报文”,其他报文(如MT103)则作为“子报文”附加在主报文中。主报文和子报文之间通过特定的字段(如20:和21:字段)建立关联。在这种模式下,主报文和子报文之间存在明确的关联关系,接收方需要同时处理这些报文。主报文通常用于资金调拨,而子报文则用于具体的支付指令。Cover模式适用于需要将多个报文关联在一起的业务场景,比如资金调拨与支付指令的组合发送。 ![](https://image.woshipm.com/wp-files/2025/06/0r6X8PrDYUZ3J2wqxsdC.jpg) 图中,付款行A先向收款行D发送一个MT103付款报文,通知收款行D即将收到一笔款项。此时,收款行D虽然收到了付款指令,但款项尚未到账。在同一国家的两家银行之间,收到对方的支付指令后,通常可以立即为用户入账。然而,跨境支付则不同,因为涉及两个国家的银行,收款行D是否立即为用户入账,取决于双方的信任程度,以及D银行是否愿意承担垫资带来的信用风险。 同时,银行A还会发送一个“MT202金融机构间头寸调拨”的报文。这里的MT202报文与先前发送的MT103报文存在“主子”关系,即MT202报文所调拨的资金正是MT103报文中指定的支付款项。 在Cover模式下,MT202报文中的21:字段会引用MT103报文中的20:字段,以建立两者之间的关联关系。例如,下图中MT202报文中的21:字段(REF10312345)就引用了MT103报文中的20:字段(REF10312345),从而确立了主报文和子报文之间的关联。 ![](https://image.woshipm.com/wp-files/2025/06/aaV6Uomw2FviMi1y87Lr.jpg) ### 6.4.跨国连接的通讯网络体系 Swift的通讯网络体系是全球金融体系的核心基础设施之一,其跨国连接通讯网络高度复杂且极为可靠。凭借分布式架构、智能路由技术、多层次的安全措施以及高可用性设计,Swift确保了全球金融机构之间通信的高效与安全。无论是跨境支付、证券交易还是外汇操作,Swift网络都发挥着不可或缺的作用,堪称全球金融体系的“中枢神经”。 ![](https://image.woshipm.com/wp-files/2025/06/3eDEKq9UoMSN8SiMg6oh.png) ## 七、通过Swift的支付清算原理 前面已经介绍过,Swift仅负责传递信息流,而不处理资金流。然而,在国际支付清算过程中,存在多种模式,Swift在其中发挥着至关重要的作用。接下来,我们将从往来账户、三种跨境支付模式、一笔付款示例以及Swift的GPI等几个方面,详细解析Swift在支付过程中的具体运作方式。 ### 7.1.往来账户关系 在跨境支付中,理解“账户关系”至关重要。这指的是两家银行之间是否建立了直接的往来账户关系,即Nostro/Vostro账户。这种账户关系是银行间进行资金清算的基础。如果两家银行没有直接的账户关系,那么它们就需要通过代理行来完成资金的清算。 **1)Nostro账户** Nostro账户,意为“我们的账户”,是指一家银行在另一家银行开立的外币账户,用于处理跨境支付中的资金清算。例如,中国的银行A在美国的银行B开立一个美元账户,这个账户就是银行A的Nostro账户。 ![](https://image.woshipm.com/wp-files/2025/06/gw6erJ8CiLGSIhgQQsMo.jpg) **2)Vostro账户** Vostro账户,意为“你们的账户”,是指一家银行为另一家银行开立的本币账户,用于接收来自该银行的资金。例如,美国的银行B在中国的银行A开立一个人民币账户,这个账户就是银行B的Vostro账户。 ![](https://image.woshipm.com/wp-files/2025/06/zIpi4bDrAdHtGMgWeBBg.jpg) **3)建立账户关系的意义** 如果两家银行之间建立了Nostro/Vostro账户关系,它们就可以直接进行资金清算,无需通过第三方银行。例如,中国的银行A在美国的银行B开立了Nostro账户(即美元账户),同时银行B在银行A开立了Vostro账户(即人民币账户)。这样,银行A和银行B之间就建立了直接的账户关系。 ![](https://image.woshipm.com/wp-files/2025/06/qwvKDe1E1ASQMMysa0SY.jpg) **4)用途示例** 假设中国银行(Bank of China)与美国花旗银行(Citibank)建立了代理行关系。中国银行在花旗银行开立了一个美元账户,用于处理美元支付业务,这个账户对中国银行来说是Nostro账户。相应地,花旗银行在中国银行开立了一个人民币账户,用于处理人民币支付业务,这个账户对中国银行来说是Vostro账户。 当中国银行的客户需要向美国花旗银行的客户支付美元时,中国银行会从其在花旗银行的Nostro账户中扣除相应金额,而花旗银行则会将这笔资金划转至收款人的账户。 ![](https://image.woshipm.com/wp-files/2025/06/4PO2J1Mr6UhLU0xqTiln.jpg) ### 7.2.跨境支付的三种模式 跨境支付是指资金在不同国家或地区之间的转移过程,涉及多种支付模式和结算机制。其中,常见的支付模式有三种:清算行模式、代理行模式和NRA(非居民账户)模式。 ![](https://image.woshipm.com/wp-files/2025/06/cFKAB0pkIBvfyTWX5jWD.jpg) **1)清算行模式** 在清算行模式下,境外清算行与境外其他银行签订人民币代理结算协议,为它们开立人民币同业往来账户,并代理这些境外银行进行跨境人民币收付等服务。清算行通常由两国央行共同指定,负责处理两国之间的本币(即人民币)支付业务。例如,香港、澳门地区的人民币业务清算行,如中银香港、中银澳门,以及中银台北、中国工商银行新加坡分行等,与境内银行传递清算信息,共同完成跨境人民币的清算和结算工作。 **2)代理行模式** 在代理行模式下,境内具备国际结算业务能力的商业银行与境外银行签订人民币代理结算协议,为境外银行开立人民币同业往来账户,并代理其进行跨境人民币收付、结算等服务。这一模式下,境内商业银行作为代理行,负责处理境外银行在跨境人民币业务中的收付和结算需求。 **3)NRA模式** NRA模式,即非居民账户(Non-Resident Account)模式,允许非居民(如外国企业或个人)在本国银行开立账户,以便进行跨境支付和结算业务。 ### 7.3.Swift 的GPI支付 传统跨境支付存在诸多痛点:支付过程可能需要数天才能完成,速度较慢;付款人和收款人无法实时追踪支付状态,信息不透明;此外,中间银行可能会收取额外费用,使得最终到账金额存在不确定性,即费用不透明。而gpi(全球支付创新服务)通过技术创新和标准化流程,有效解决了这些问题。 **1)GPI是什么** Swift GPI(Global Payments Innovation)于2017年推出,旨在提升跨境支付的速度、透明度和可追溯性。一经推出,便迅速成为全球跨境支付的标准。目前,已有超过3500家银行加入GPI网络,覆盖全球200多个国家和地区,超过80%的跨境汇款通过GPI完成。以下是Swift官方关于GPI的原文介绍。 ![](https://image.woshipm.com/wp-files/2025/06/PCoNoSuyNQW45XaEhDEn.png) **2)GPI的运行机制** GPI并非SWIFT全新的一套业务模式,而是SWIFT在现有基础上新增了gpi Tracker工具。通过这一工具,银行和客户可以实时查看支付的每个环节。GPI要求银行在支付过程中明确披露费用,确保付款人能够了解最终到账金额。同时,GPI提供端到端的支付确认服务,确保付款人和收款人都能收到支付成功的通知。 在SWIFT的MT报文中,会标识该报文是否为GPI报文。只有当报文的发送方和接收方都加入了GPI网络,发送方才能向接收方发起GPI报文。 付款人通过银行发起GPI支付时,银行会生成一个唯一的GPI追踪号(UETR),作为该笔汇款的唯一标识。无论经过多少个中间环节,这个UETR始终不变。 GPI Confirmation Message是SWIFT和GPI机构之间传递汇款处理进度和手续费等信息的载体。 gpi Tracker是SWIFT的Global Payments Innovation(GPI)服务中的核心工具之一,为银行和客户提供实时、端到端的跨境支付跟踪功能。通过gpi Tracker,用户可以实时查看支付的状态、位置和预计到账时间,这显著提升了跨境支付的透明度和可追溯性。gpi Tracker的核心是UETR(Unique End-to-End Transaction Reference),即唯一的端到端交易参考号,每个GPI支付都会生成一个UETR,用于在整个支付生命周期中跟踪支付状态。 **3)通过GPI的支付流程** ![](https://image.woshipm.com/wp-files/2025/06/AIIJjlBVngBIlpF03TAf.jpg) 付款人通过银行A发起向Y国收款人的付款请求,并生成UETR(唯一端到端交易参考号)用于后续的进度查询。Swift系统实时更新打款进度,当收款人所在银行B成功入账后,会反馈支付结果。银行A通过GPI Tracker接收到这一结果,随即通知付款人付款已成功。 本文由人人都是产品经理作者【陈天宇宙】,微信公众号:【陈天宇宙】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。

2025-06-12 07:34:39 · 1次阅读
 
 
6月12日A股分析:沪指微涨0.01%收3402点,两市成交1.27万亿,主力资金净流出162亿,可控核聚变概念逆势吸金

2025年6月12日,截止收盘,沪指涨0.01%,报收3402.66点;深成指跌0.11%,报收10234.33点;创业板指涨0.26%,报收2067.15点,两市成交额较上一交易日增加163.18亿元,合计成交12717.85亿元。

2025-06-12 07:32:54 · 1次阅读
 
 
企微分享:基础认知与生态定位(一)

<blockquote><p>本文将分享作者在近几年企业微信scrm产品设计及实际业务项目落地过程中积累的体会和心得,主要探讨企微的基础认知、核心能力以及企业接入可以获得的机会点。后面有机会我还将继续和各位探讨企微scrm产品设计以及业务落地的更多细节。</p> </blockquote> ![](https://image.woshipm.com/2023/04/13/9b833248-d9de-11ed-bd5e-00163e0b5ff3.jpg) 企业微信作为一个赋能企业协同办公的工具,自2018年宣布与个人微信打通之后,就不再只是一个具备协同管理的办公软件,更是一个能够带来业务增量转化的经营阵地。经过至今7年的发展,企业微信已经成为很多企业尤其是传统行业会选择的数字化客户经营阵地,市场上无论是大型公司还是中小型公司,在讨论进行用户线上经营转化时,都不可避免的会将企业微信的运营纳入讨论范围。 但众多公司在实际使用企微时,受行业和公司业务节奏差异影响,使用方式和深度也各有差异,效果也是有好有坏。过程中很多企业和负责企微模块的产品经理对于企微能够提供什么样的能力、实现什么样的效果、该如何有效推进企微客户经营建设依然抱有很多疑问。 想要解决这些问题,了解企微的基础认知和生态定位就尤为重要。 ## 一、微信生态强连接 ### 1.1 强大的用户触达空间 企业微信名字里就包含了腾讯王牌产品“微信”两个字,命名上就为产品赋予了极强的连接属性,这可能是微信团队的血脉基因。 在与微信打通数据,即支持企业微信用户添加个人微信用户后,企业就可以通过极低的技术门槛来获取14亿的私域资源(2025Q1统计微信月活用户达14.02亿)。相比于其他的B端协同办公软件,不管是飞书还是钉钉都没办法做到为企业端连接如此庞大的C端用户资源,而企业微信可以直接打通B端和C端在沟通上的壁垒。 我相信任何企业或者产品经理都不会小瞧这可以接触到14亿微信用户的触达能力,因为如果没有与个人微信的直接连接,那么想要触达客户就需要借由其他的渠道和媒介,例如获取客户手机号后的短信触达与电销触达,例如引导客户关注app公众号等自营阵地后进行消息通知。 而微信作为在中国用户最常用的社交即时通讯软件,对于企业触客来说也是最重要的触达场景之一。 ### 1.2 员工实名认证信任背书 企业在对客户进行微信生态的消息触达时,可以触达的场景包括1对1聊天、群聊、朋友圈、公众号、直播号/视频号等,其中只有1对1聊天的场景是基于微信好友关系发生的,其他的场景要么通过广告投放曝光、要么通过引流关注订阅,属于广告和媒体的逻辑。 在企微与个微可以建立好友关系前,如果企业想要通过聊天的方式触达客户,就只能让一线销售或者客服人员通过自己的个人微信来添加客户的个人微信。 而应用个人微信进行客户服务或者营销同时也为服务质量以及企业安全带来了隐藏风险。相比之下企业微信触客解决了相当一部分风险。 ![](https://image.woshipm.com/2025/06/12/1ef809ac-4759-11f0-adfa-00163e09d72f.jpg) ### 1.3 API开放能力矩阵 作为一个企业管理和客户经营工具,企微有自己官方原生的管理后台,可以对员工账号通讯录、OA、打卡考勤规则、基础客户与上下游、协作等进行管理。 在此基础上企微也开放了非常丰富全面的开放API接口,可以供企业端自行调用来自定义设计更符合自身需求管理工具,这就为许多TOB软件供应商以及企业自研建设SCRM工具(SCRM的定义后面有机会也会发文与大家讨论)提供了可落地的空间。 企微提供的开放API能力涵盖了从办公管理、微信客户联系、微信客服、会话内容存档、企微客户端应用建设等多个方面,为企业端可以在微信场景触达客户提供了更多可管理、可监控、可量化的业务发展可能性,这是企业无法通过使用个人微信实现的。 下图是一些可以通过企微官方API接口设计开发SCRM工具的部分功能。 ![](https://image.woshipm.com/2025/06/12/473bcdb8-4759-11f0-ad57-00163e09d72f.jpg) ## 二、数据资产沉淀 对于公司业务来说,尤其是数字化、人工智能化的背景下,业务资产、用户资产都会转换成数据资产进行沉淀、分析以及应用,进而赋能客户经营来维护长期客户价值。 每个APP、小程序都希望能够获取客户的各种信息数据,包括画像、消费习惯、浏览、搜索等等,来打造自己的数据护城河。 企微在维持客户依然使用最常用的微信的情况下,可以让企业端有效地通过合法合规的标准api接口获取用户在微信生态的相关数据,再由数据驱动业务,例如以下几个方向都可以体现数据资产沉淀带来的业务价值。 ### 2.1 客户标签及自动打标逻辑 区别于个人微信,企微端可以为添加的个微好友打企微标签,用于标识客户特点。客户标签打标有几种常见方式: - 员工基于对客户的了解,基于个人判断人工打标。 - 当客户通过扫描二维码或者点击获客助手获客助手(企微独有添加好友方式,有机会后面会介绍)时,根据配置的标签规则,系统自动打标。 - 基于客户实名数据,结合公司本地画像标签数据,实现本地数据与企微标签打通的系统自动打标。 客户标签可能标识客户的画像特点、活跃度、成交状态等,业务人员可以依靠企微标签对客户进行分层运营和触达,来提高项目的运营效率和效果。 ### 2.2 聊天记录合规储存及应用 聊天会话内容在很多行业都是需要存储的营销服务凭证,尤其是金融行业在强监管的环境下要求必须做到服务和销售留痕,而对于微信这种线上经营场景来说留痕就是聊天记录的合规存储。 聊天记录除了可以存储作为客观凭证外,本身也具备很强的业务使用属性。 例如企业端可以通过对聊天记录的数据分析来判断客户的活跃度和意向,也可以基于用户的回复等分析业务触客SOP和文案策略的效果,在结合了数据模型和人工智能后还可能会有更多的业务价值被挖掘。 ### 2.3 跨平台ONEID打通 客户id不统一,无法打通来实现跨渠道跨平台跟进触达一直是企业的老大难问题,微信、抖音、小红书、手机号、各种app,每个场景都有自己定义的客户id,打通平台场景数据壁垒,建立ONEID,就变成了一个正确但很难的事情。 腾讯团队在微信生态内打造了开放平台概念,对于绑定在同一开放平台载体,包括公众号、小程序、企业微信,都可以通过唯一的客户id(unionid)达成数据串联,这极大程度的减少了ONEID的打造难度。 企业开发者也可以通过获取客户授权、设计数据串联功能等方式,将用户的微信id与客户的手机号等个人信息进行关联,以此打通本地数据与微信数据的隔离,结合上述的聊天记录和企业标签,对客户进行更精准的分层和更精细的触达。 ## 三、企业接入指南 上面聊了很多关于企微这个平台工具的基础认知、生态定位和核心能力等内容,其实在企微可以TOC后发展到现在的7年里,这些内容也都是老生常谈的内容。 企微有这么多的优势,就没有一些需要避坑的地方吗?常规企业如果想要接入企微来进行展业的话有什么需要提前注意的吗?下面我们就聊聊这个部分。 ### 3.1 原生管理后台功能不足 企微本身有官方的管理后台,但是其本身作为协同办公软件起家,对于客户经营的部分感觉并未投入太多资源或者说激进。 其原生的管理后台支持的能力非常有限,在不接入第三方scrm平台或者没有自研scrm系统的情况下,应该仅能完成最基础的引流获客、客户群发触达、标签库管理、客户数量及跟进统计、欢迎语统一配置等能力,但如果你想把企微场景客户经营做深做透,那原生能力应该是无法有效支持的。 而且从个人角度建议,想要做深做精企微的业务方和企业方最好可以有些自研资源来搭建scrm,具体原因有兴趣的朋友可以私戳讨论。 ### 3.2 费用成本 企业微信的使用看上去是免费的,但是有些费用在使用深度上去之后就会逐步体现,以下这些都是有可能直接影响成本的费用项,供各位参考。 - 企业认证费用:认证后可开通对外收款、展示企业额名称、扩大企业成员规模上限等权限,费用基于企业规模大小(使用人数)在300元到29700元之间。 - 外部联系人规模费用:这个规模决定了企业微信主体能够添加多少个客户,费用简单换算差不多1个客户0.1元/年,最小规模是5000客户规模的档位。 - 会话存档费用:采购了企微会话存档的企业才有权限从企微官方获取企业成员与客户之间的聊天记录,费用根据获取会话范围决定,价格在200-600元/号/年。 其他还有一些企微的限制规则,也都这些年在做企微用户运营和SCRM工具设计过程里摸爬滚打出来的经验,后面有机会也会分享给大家。 ## 四、小结 总体来讲想要吃下微信生态的大规模客户触达资源,部署及布局企业微信依然是企业业务当前最好的选择之一,但企业部署、客户引流、服销经营、系统建设等还需要企业和相关产品朋友调研后综合评估。 本文由 @整点拉格 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议

2025-06-12 07:26:36 · 0次阅读
 
 
深度剖析字节豆包:加更版

<blockquote><p>从一个内部孵化项目到如今的AI超级应用,豆包不仅在技术上不断创新,更在产品定位、用户增长、应用场景拓展等多个维度展现出独特的战略眼光。本文将深度剖析豆包的发展历程、核心竞争力、产品能力以及未来规划,通过与腾讯元宝、DeepSeek、Kimi等国内头部AI产品的对比,揭示其在多模态、AI搜索、语音聊天等关键领域的优势与挑战。</p> </blockquote> ![](https://image.woshipm.com/2023/08/20/fd2b06ae-3f39-11ee-98c9-00163e0b5ff3.jpg) ## 写在前面的话 ### 1.为什么写这篇文章? 去年6月的时候,三白写了第一篇[《深度剖析字节豆包AI》](https://www.woshipm.com/evaluating/6073724.html)的文章,很荣幸的是,当时这篇文章帮助了很多有意愿从事AI产品经理转型,以及正在面试国内AI产品岗位的朋友,同时也上架了人人都是产品经理社区,全网阅读量超过了10万。 将近一年过去以后,考虑到第一篇文章中很多内容基本已经过时了,豆包的产品相比之前已经有了不少更新,然而向我索要阅读文章的朋友还很多,加上近期收到来自人人都是产品经理社区平台朋友的续更邀请,这周花了一些时间围绕着豆包这款产品,再次输出一篇更新版、更深度的产品分析。 全文19000字+,我将围绕着产品发展历程、产品定位、核心竞争力、核心产品能力对比、产品发展探索思考、产品规划等多个方面,站在当下,重新深入的回顾和分析字节豆包这块款产品。分析内容中,我也将深度的对比豆包、腾讯元宝、Deepseek、Kimi这几个国内头部AI产品在能力上的差异表现,完整内容概括如下脑图: ![](https://image.woshipm.com/2025/06/12/9b3c1280-474d-11f0-adfa-00163e09d72f.jpg) ### 2.文章内容和信息来源 本篇文章创作方式和全部内容信息主要来源于: - 创作方式:通过AI快研侠快速创建研究大纲、收集参考资料、并一键快速生成研究初稿后,个人进一步二创后输出,AI工具极大的提升了我高质量研究创作的效率; - 信息来源:包括互联网公开信息和市面研究分析,个人通过大量阅读和信息梳理后,增加个人原创观点后输出;同时也来自字节、腾讯、阿里等国内大厂AI从业人员交流观点。 声明:全文所有知识和信息均为个人的理解和输出,并未得到官方印证,仅供学习参考,不可用于商业用途或引为依据。 ### 3.适合群体 **1.AI产品经理或者有意转型做AI产品经理的朋友** 2.大模型行业研究人员 3.有兴趣学习AI知识内容的朋友 ## 一、产品的发展历程 ### 1.1 豆包的由来:从一个内部孵化项目,到字节的AI超级应用 **1)产品的前身** 豆包的前身是字节在23年内部孵化的一个产品项目,名称叫Grace,当时因为ChatGPT的火爆,字节内部孵化了这样一个类似的产品,但是当时整个字节还处于对AI和大模型的探索阶段,对于这个项目还没有得到太大的重视,于此同时,以张一鸣为首的字节的高层,正在非常积极主动的研究和思考大模型到底是怎么回事,已经开始在筹备字节在AI领域的重大投入和变革。 2023年8月,豆包开始在国内国内应用市场灰度上线,同一时间,海外同步上线了一款产品cici,从这个时间点开始,字节豆包开始走进中国AI圈的视野,并开始一路狂奔和增长之路。 **2)产品的发展和战略定位思考** 2023年11月份的时候,字节正式成立单独的面向AI的组织架构flow,当时flow的核心目标以AI应用创新的探索为主,重点聚焦在新的原生AI应用的尝试,而不是赋能字节旧的以抖音等为主产品; 当时字节高层对于AI的重视程度相当高,一方面这个事情据说是张一鸣和CEO梁汝波等亲自牵头,另一方面卷入该项目的人员包括应用端的flow团队(朱骏负责)、大模型端的SEED团队(朱文佳负责)、以及技术中台团队(洪定坤负责)的总人数据内部人员透露人数超过千人,可见战略层对于AI的重视程度相当高,而当时战略层开始把重要的应用聚焦在豆包这款产品,并投入大量的资源扶持豆包的发展,现在回过头来看,其核心的战略定位思考个人觉得可能包括如下3点: - 发展字节在AI领域的超级应用,拿到国内AI领域的门票; - 探索AI应用的边界和智能的上限,拓展字节AI应用的版图; - 作为豆包大模型影响力的背书,推动豆包大模型的发展。 **3)成为字节的AI超级应用:豆包的用户规模发展** 在过去的一年多里面,豆包一方面在产品层保持非常高频的产品迭代,另外一方面投入了不小的广告投放的资源,重点提升豆包的用户规模,参考Questmobile数据**,豆包APP端的月活规模从2023年8月份的时候仅7万左右,到2025年1月份的时候,月活规模已经达到8209万的水平**,从目前的增长趋势上看,豆包成为亿级月活规模的应用产品已经是迟早的事情。 从增长的曲线上看,我们可以看到过去一年半里面,豆包的用户规模增长发生过3次增长拐点,其增长包括3个增长阶段; - **第一阶段(2023年11月~2024年5月)**:从2023年11月份开始,豆包的用户增长规模相比之前的水平开始出现明显增长,并且维持该增长的趋势持续平稳增长; 个人的理解,在11月份之前,豆包应该已经做过一波测试投放,并且验证了豆包的留存和使用时长等产品指标达到字节内部可大规模投放标准,**23年11月份flow组织架构正式成立之后,豆包开始启动较大规模的应用投放**,并维持比较稳定的投放预算,在这半年多里面豆包维持了一段时间稳定的增长。 - **第二阶段(2024年6月~2024年8月):24年6月份的时候,豆包开始了第二波加速的增长,可以推测的是,这个时间点字节在豆包上的投放规模又加大了,但是为什么是这个时间点? 根据去年字节AI的迭代动态,个人认为核心的原因一方面是因为豆包大模型在24年5月份的时候刚完成了一波模型推理成本的大幅下降**(2024年5月份,字节在火山引擎原动力大会上,首次大规模的降低豆包模型API的成本,以远低于市场竞争对手的价格卷起国内大模型的价格战),模型推理成本的大幅下降,让豆包具备了进一步增长的条件; 另外一方面,在这个时间点,豆包大模型在模型性能和整体能力上,应该已经发生过一次重大迭代,模型能力也已经逐渐发展起来。 - **第三阶段(2024年9月~至今)**:24年9月份开始,豆包的用户增长再次加速,开始第三次更大规模的增长冲刺。这个时间点的增长,个人觉得一方面可能来自于**业务冲刺豆包全年用户增长目标**,另一方面,我们留意到豆包在9月之前在产品层**重点发展“拍照答题”功能,加上字节海外教育产品Gauth在AI加持下迅猛增长,9月份正值国内开学季**,豆包可能值此机会通过教育相关AI应用功能再次加速增长。 ![](https://image.woshipm.com/2025/06/12/895a0866-4756-11f0-ad57-00163e09d72f.png) **4)豆包的AI应用探索,字节的AI应用版图扩张** 值得注意的是,字节在拓展新的AI应用领域的时候,会呈现这样的规律,内部似乎经常会优先在豆包内做某一个AI应用领域的尝试,包括做一个独立的智能体,或者在豆包默认智能体的输入框上方固定一个应用使用入口,当验证该应用场景的可行性并获得正向验证数据之后,他们会推出独立的AI应用,其中包括豆包爱学、星绘、猫箱等产品都经历过在豆包内测试上线的过程。 豆包因此成为了字节内部探索AI应用的重要场地,通过这样的方式,截止至今,字节内部目前已经在不同的应用领域共布局了超过18个AI应用,应用场景覆盖通用Chatbot、Agent开发平台、虚拟社交、AI教育、AI编程、Ai数字分身、AI硬件等多个领域,成为了国内目前应用布局版图最广的厂商,同时,字节目前也是AI应用出海相对更加激进和成功的大厂。 ![](https://image.woshipm.com/2025/06/12/b1413f70-4756-11f0-8928-00163e09d72f.png) **5)通过豆包应用扩大豆包大模型影响力,形成“AI应用→大模型→云”的商业闭环** 相比百度在更早以前文心一言就开始通过订阅会员的方式收费不同的是,豆包应用本身在过去一年半里面,暂时都还没有开始商业化,在这样大规模的投入的情况下,豆包应用端仍然不商业化的主要原因,个人认为,从字节战略层面上,他们构建的是“AI应用→大模型→云”的商业闭环。 通过发展豆包应用的用户规模,把字节的豆包大模型带入公共视角,从而在扩大豆包应用用户规模的同时,提升豆包大模型的影响力,从而带动大模型在B端的售卖,这点从字节把大模型的名称从一开始的“云雀大模型”改成“豆包大模型”这个做法上可以窥探出来,他们视图在统一应用和模型的营销品牌。 然而,24年5月份的时候,字节大规模的降低了模型API的价格,如此低价的策略,加上国内企业模型消耗量不算很大的情况下,短期通过大模型盈利几乎比较难,但是通过大模型引进的企业,却有可能在字节的云侧获得商业变现,因为运行大模型必然伴随着对基础服务设施、云服务、GPU等的需求,这便是个人理解的,字节短期在AI和大模型领域的商业闭环。 ![](https://image.woshipm.com/2025/06/12/ce3b92a6-4756-11f0-ad57-00163e09d72f.png) ### 1.2 产品发展的重要里程碑 过去的一年半里面,字节不管是在豆包产品更新,还是模型的发展上,都保持着比较高频的迭代速度,特别是产品层,基本保持着每周一个小版本,双周一个大版本的进度快速更新,以下主要产品层和模型层两个角度,分别阐述一下豆包过去一年多的关键节点里程碑。 ![](https://image.woshipm.com/2025/06/12/e0288258-4756-11f0-a9b5-00163e09d72f.jpg) **1.2.1 豆包产品层的重要里程碑** 概括起来,豆包过去一年半里,豆包的重大产品迭代有如下几个特点: - **将AI搜索的功能作为豆包最关键的基础能力之一,持续提升AI搜索的产品能力**:包括整合字节内部抖音搜索和头条搜索的能力,并接入Bing等搜索引擎支持全网搜索;以及拓展学术搜索和支持深度搜索模式,豆包对于AI搜索的能力迭代从未停止; - **重点发展多模态领域的应用:多模态领域的功能更新和拓展,是豆包过去一年多里面功能新增最频繁的一个模块,包括持续的拓展语音聊天,文生图、图生图、视频生成、图片理解、音乐生成**等功能,不仅拓展的范围很广,并且每一个应用领域豆包保持从通用到精专的下钻打磨,特别是语音聊天的功能,由此可见字节对于多模型领域的重视和投入有多高; - **深入应用场景,持续的探索通用大模型能力的AI场景化应用**:豆包除了不断的拓展通用AI功能,在垂直场景的AI应用落地上也非常的积极,分别围绕着**教育(拍题答疑)、办公(数据分析、录音纪要、PPT生成、云盘)、创作(海报生成、分身写真)等多个垂直应用领域**,打磨更加贴近应用场景的AI产品体验; - **重视智能体生态的搭建**:除了自己官方打磨智能体,豆包对于第三方智能体的引入和运营也十分着重,包括官方持续的推出新的智能体,以及豆包和扣子的打通为其供应更多第三方开发者的应用。 ![](https://image.woshipm.com/2025/06/12/05efc21c-4757-11f0-ad57-00163e09d72f.png) **1.2.2 模型层的重要里程碑** 从字节在模型层的重要里程碑上可以看出来,过去的这段时间里面,字节在模型侧的资源和注意力上,基本都投入在了多模态大模型里面,在多模态领域有比较多的创新和输出,但是在基础大模型的性能提升和创新上明显略显不足,基本像是在持续的追赶国内和海外大模型的,缺少属于字节的创新突破;也难怪DeepSeek-R1火了之后,字节内部在模型侧会发展进一步的重大架构调整,并开始更加重视模型创新研究方向的投入。 ![](https://image.woshipm.com/2025/06/12/0baf190a-4757-11f0-adfa-00163e09d72f.png) ### 1.3 重要产品迭代历程 这部分,我们主要从豆包在一些重要产品功能上,过去一年半的产品迭代细节,深入的了解每一个功能模块都做过哪些迭代,以此了解豆包产品发展过程中的一些思考过程和细节,为了更加清晰的看到整个迭代历程,我将豆包的主要产品迭代整理为如下图所示。 ![](https://image.woshipm.com/2025/06/12/26a68d42-4757-11f0-ad57-00163e09d72f.jpg) 针对上图,概括总结如下: **1.3.1 不同时间段,豆包的产品迭代重点** **2023年11月~2024年5月(聚焦智能体生态)**:在这段时间里面,**豆包的产品迭代的重点,似乎着重关注应用内的智能体生态这个点**,具体体现在: ①在这个时间段,持续的推出不同应用领域的官方智能体,探索不同智能体的应用效果,除了豆包默认智能体之外,当时共推出了22个智能体,覆盖学习、语音聊天、AI生图、生活助手、编程助手等多个领域;具体智能体包括英语学习助手、聊天、AI生成漫画、音乐电台、智能体创建助手、ai生成图片、文学伴侣、恋爱大事、旅游规划师、电影评论家、星座运势、起名专家、本地推荐、编程助手 ②另外一方面,豆包APP的首页不断地尝试曝光智能体内容,引导用户更多的使用智能体;其中包括将“发现智能体”从右上角隐蔽的角落固定到底部栏,以及APP首页顶部滑动露出智能体; ③同时,通过打通扣子,让扣子成为豆包更专业的智能体供应的来源; 这一系列的举措都表明,该阶段豆包的产品迭代重心,在于发展智能体内容生态,并让用户更多的使用智能体,从而提升用户的粘性; **2024年6月~2024年8月(聚集产品自增长能力):第二阶段里,豆包的产品迭代重心聚焦在PC端和浏览器端的产品更新**,持续的通过浏览器插件在外部场景寻找应用入口,以期获得PC端的增长来源,同时又持续优化产品在**分享模块的功能体验**(聊天消息支持图片分享、支持接着聊),该阶段重心个人理解为是强化产品自增长能力。 **2024年9月~至今(聚焦AI搜索、多模态、应用场景)**:第三阶段是豆包更加高频迭代的时间点,可以看到在这段时间里面,豆包在AI搜索、多模态和垂直应用场景里面的更品非常频繁,具体包括; ①进一步强化搜索功能,支持学术搜索和深入搜索模式; ②多模态应用更新不断,特别是语音聊天功能保持高频迭代,识图、生图、生视频等功能也开始陆续上线; ③在应用场景上,围绕着办公、生活、创作持续迭代,特别是办公场景,陆续拓展了文档生成、会议录制、云盘、编程、日程提醒等多个应用; **1.3.2 不同产品模块的产品迭代方向** - **AI搜索:**检索能力从抖音搜索和头条搜索拓展到支持全网搜索,持续拓展检索范围,并支持学术、生活等更多垂直领域的检索; - **语音聊天:**持续优化语音聊天的声音体验、自然度、拟人化特征和记忆长度,提升聊天的真实感;并支持更多模态的输入方式;同时不断地细化具体的聊天场景; - **多模态:**持续拓展识图、生图、修图、视频生成和音乐生成等多个应用场景的能力; - **教育场景应用:**重点打磨拍照答题功能; - **办公场景应用:**围绕办公文档AI(PPT生成、表格数据分析)、会议录音、文档问答、云盘、编程等多个办公核心场景,探索AI应用结合; - **写作场景:**逐步细化写作场景并补齐AI写作的场景需求,包括联网检索、参考来源定义; - **生活场景:**聚焦健康咨询、本地生活、出行、音乐推荐等场景; - **浏览器插件和PC客户端**:重点聚焦阅读、翻译、搜索场景的产品打磨,其中阅读场景重点包括网页、视频、播客、文档等场景的AI阅读。 ## 二、从产品的角度看字节豆包 ### 2.1 豆包的产品定位是什么? **1)一句话概述豆包的产品定位** 豆包的产品定位是一个“通用的AI助手”**,目前的产品理念看起来更加应景一句话**“用AI把互联网的产品重新做一遍,探索AI智能的边界”。 现在我们看到豆包上承载的应用场景越来越多,覆盖娱乐聊天、办公效率、学习效率、生活服务等等多个方面,既有娱乐方向,又有效率方向,并且这个趋势目前看还没有收敛,从产品定位的角度上看,它已经在朝着一站式全场景的AI产品方向走。 很多产品人会认为,这种看起来有点杂乱无章,什么都搞的做法,看似有些定位不清晰和明确,让人琢磨不透,但是个人认为,这个的背后,可能是字节的AI团队,在持续的探索AI智能的边界的体现,毕竟从目前看,并没有哪个企业能清楚的知道大模型和AI的边界在哪里,这也是大厂应该承担起来的责任。 **2)豆包的用户群体(互联网办公群体、大学生)** 通过QM的用户画像数据可以了解到,目前豆包的主要用户还是**以25~40之间的互联网办公用户为主,占比将近70%,其次是19~25岁之间的大学生用户,占比15%左右**,而18岁以下的未成年用户和40岁以上的高龄用户,占比均在7%~8%左右;从城市等级上看,目前豆包在一二线城市的用户占比是45%左右,下城市场的用户占比相对更高。 ### 2.2 豆包的核心产品竞争力是什么? 当我们谈及一个类似豆包这样的产品的核心产品竞争力的时候,个人认为,可以从如下几个维度去做对比分析: - 基础大模型竞争 - 多模态大模型竞争 - 关键产品能力竞争 - 应用场景拓展竞争 - 产品生态竞争 我们尝试从这几个维度去对比豆包和deepseek、腾讯元宝、文心一言、kimi等产品: - **基础大模型:**从基础大模型的角度上看,根据行业内比较权威的SUPERCLUE的测评结果显示,豆包大模型目前不管是在基础模型还是在推理模型上,目前在国内都不是最强的模型,相比之下落后于Deepseek和阿里的模型,因此在基础大模型领域,可能并不具备核心竞争力; - **多模态大模型:在多模态领域里面,至少从覆盖面上,豆包是所有的竞争对手里面应用覆盖最广的应用,其中豆包在语音聊天**这个领域上,在行业内有很好的产品口碑,也是整体产品体验最好的一方,能明显的拉开和竞品的差距;其次在视觉模型上,豆包目前是所有竞品里面唯一一个支持通过自然语言对话的方式编辑图片的应用,**AI图片编辑**的能力,也是豆包产品的差异点之一;最后是**音乐生成**场景,豆包也是目前几个竞品里面唯一一个支持音乐生成能力的应用。 - **关键产品能力:**其中例如AI搜索的产品能力,豆包在资讯检索等方面检索能力更加突出,而元宝依托微信公众号等数据源,也有不错的产品表现,因此在这个领域里面,说实话目前没有哪个产品完全占据绝对竞争力; - **应用场景拓展深度:**从这个角度上看,目前豆包无疑是在应用场景拓展深度上最深的应用,除了支持丰富的通用AI产品能力,也垂直深度到具体的应用场景,给用户提供更精细的应用领域的产品能力,包括办公、学习、生活等,在垂直应用场景领域的AI工程设计和应用落地,也是其产品竞争力之一,对于用户而言,他们会认知到的一点是,豆包提供了更多直接面向垂直应用场景的AI产品能力,更适合解决具体应用场景问题; ![](https://image.woshipm.com/2025/06/12/48cc3ea8-4757-11f0-ad57-00163e09d72f.png) 综上所述,个人认为,豆包主要通过在多模态、应用场景拓展、智能体生态这个三个角度,构建属于豆包的产品竞争力。 ### 2.3 豆包的核心产品能力和竞品的对比分析? 前面部分我们提到,豆包主要在多模态、应用场景拓展、智能体生态这几个角度,形成和国内主要竞品的差异,接下来我们从关键的单点产品能力的角度,分析和对比豆包在以下这些产品功能上和主要竞品的差异如何,由于豆包应用的功能太多,无法每个功能都深入分析,因此我主要挑选目前个人觉得比较重要的**AI搜索、语音聊天、AI生图、AI识图**这4个功能,做进一步深入的分析。 **2.3.1 AI搜索** 联网搜索的功能基本上是一个Chatbot类产品的标配能力,因此基本上每一个AI的核心玩家都会重点在AI搜索上构建自己产品的竞争力,这个关键领域,目前大家做的如何呢,在此之前,我们先尝试构建一个AI搜索产品的评估体系,个人的理解,一个AI搜索产品的好坏,可以主要从**意图识别能力、搜索引擎能力、问答呈现能力**三个角度评估。 1)意图识别能力:指基于用户的输入,识别和理解用户意图,准确匹配用户需求的能力,包括算法识别和用户画像匹配的能力,其中评估维度包括如下: ①快思考和慢思考的决策判断:模型能否准确识别用户的问题是否需要通过深度思考后再回答,还是选择快速回答; ②语义泛化推理能力测试:当用户没有把问题描述清楚的时候,模型是否能准确理解用户的意图; ③是否结合用户的画像身份、偏好、结合上下文、语境、时效; ④是否过度依赖提示词:比如提示词中不提供案例、示范,能够准确命中用户想要的; ⑤意图的联想能力:是否能准确的联想到用户的意图; **2)搜索引擎的能力:** ①搜索引擎的覆盖范围、检索数据源、检索质量; ②检索时效性和准确性; **3)问答呈现能力** ①专业性:包括要点、场景化、幻觉率、案例和数据占比; ②可读性:包括逻辑性、信息呈现的效率、图文混合样式); ③创新性:除了基于事实,模型是否能有一些创造性的思考; 在这套评估体系之下,我们如何去测验不同的产品的表现,如果用严谨的方式,应该通过一系列专业的模型测试评估的方式,才能获得较为准确的结果,然而对于个人用户而言,我们无法完整这样的工作,个人主要通过一些常见场景下的使用案例,去测试和体验不同产品的表现,从而获得体验层的评估结果,因此以下评估结果可能略显偏颇,仅供参考,具体测评结论概括总结如下: - **在意图识别能力上**:综合上看,**元宝在意图识别的各方面的表现都相对不错**;豆包具备较好的快思考和慢思考决策判断的能力以及语义泛化推理能力,但在结合用户画像身份个性化回答的表现上弱一些; deepseek如果没有开启深度推理的模式时,语义泛化和结合用户画像作答上的表现都比较一般;kimi则在快慢思考判断和结合用户画像作答上的表现也一般; - **在搜索引擎的能力上:豆包接入的搜索引擎数量最多,检索范围和覆盖率最高,并且支持学术搜索**等专业检索,检索结果的时效性也还行,可以检索到最近半小时后以内的内容,但检索内容给的深度比较欠缺;**元宝在检索时效性上表现最好,可以检索到分钟级别最实时的内容,且检索内容的质量和深度上更高**,然在检索覆盖度和专业领域检索上可能不如豆包; deepseek和kimi在检索能力上相近,相比之下可能没有豆包和元宝做的更加深入; - **在问答呈现能力上:DeepSeek和元宝的表现相对好一些,专业性、可读性、创新性表现都不错,回答结果中有较高比例的案例和数据,结构性表达和段落间的逻辑性也不错**,但是在专业术语的使用上稍微欠缺; 豆包则主要在**可读性上表现弱一些**,特别是结构化表达和段落间的逻辑关联性比较弱,这个可能是模型在深度推理能力上的表现不够强大导致的;**kimi则在各个方面上的表现都相对一般**,回答结果在案例和数据比例上比较低,段落间的逻辑关联性弱,且创新性也比较弱; 综合而言,就AI搜索的产品表现而言,**个人认为元宝可能是综合产品能力表现最好的产品**,不仅在意图识别能力上综合表现最好,检索结果的时效性和内容深度表现也更好,专业性也不错; 其次是豆包,豆包在检索范围上表现最好,可能可以检索到覆盖率更高的内容,但是在结果呈现上稍微弱一些; 然后是Deepseek,各方面表现都还不错,**但是没有非常突出的地方**;而kimi在几个竞品中,**表现则略显一般**,意图识别能力表现一般,回答结果的专业性(案例和数据比例较少)、可读性(段落间关联性弱)、创新性等方面表现都一般。 ![](https://image.woshipm.com/2025/06/12/635e5936-4757-11f0-ad57-00163e09d72f.png) **2.3.2 语音聊天** 除了AI搜索的功能,语音聊天也是众多主要的Chatbot类产品都会提供的功能,从最早期的苹果Siri开始,AI智能的标配似乎就离不开语音对话的能力,同时语音聊天也可以拓展产品的使用场景和频率,满足没有具体的使用目的的用户的使用需求;对于语音聊天这个类型的产品能力的对比,同样的我们也先构建一个评估体系,个人认为,评估一个语音聊天产品做的好不好,重点需要关注如下几点: **1)语音体验** ①语音识别能力:长语音断句、中英混合、方言识别 ②流畅度和时延:从输入到响应的时间 ③输出音色和音质:音色库数量以及音色复制; ④声音表达能力:支持说方言、能唱歌、能模拟声音; ⑤拟人化的体验:支持打断、主动提问、连续回复; ⑥多模态交互语音聊天:支持图片或者摄像头输入、支持回复视觉内容(图片、表情等) **2)角色个性化能力** ①角色扮演能力:扮演具体角色并根据角色聊天的能力 ②性格特征表现能力:能表现出幽默、活泼、高冷等等性格 **3)情商表现** ①情绪表达和共情能力:具备喜怒哀乐等情绪表达和共情能力; ②主动引导聊天和制造话题的能力:能制造话题引导用户聊天能力 ③个性化回复:根据用户画像特征个性化调整语气和回复方式 接下来我们对比一下几个产品在语音聊天方面的表现情况,由于deepseek目前还不支持语音聊天的功能,因此我们主要对比豆包、元宝、kimi这几个产品,整体能力表现概括为如下表,总结而言,三个产品中豆包在语音聊天方面的表现无疑是最好的,其中表现在: - **在语音体验方面**:具备更强的语音识别能力,包括中英混合的识别率以及方言识别;并且在因长度和时延方面表现最好,同时还提供更丰富的音色库以及更强的音色克隆能力;在声音表达上还支持说方言、能唱歌和模拟声音;并且支持更加拟人化的声音体验,以及多模态输入的聊天能力。 - **在角色个性化能力上**:豆包的角色扮演能力更强,能够准确的模拟相应的角色,并且表现出角色相应的性格特征; - **在情商表现上**:豆包不仅能在声音中表达情绪,与用户共情,还能结合用户画像和个性化偏好主动引导用户聊天,以及个性化调整说话的语气和方式。 ![](https://image.woshipm.com/2025/06/12/715eb7ec-4757-11f0-ad57-00163e09d72f.png) 各个产品具体测评案例和语音表现如下: 1.语音识别能力测试 我尝试用憋断气的方式一口气不停顿的语音输入如下这段话,除了内容很长,还夹带英文,英文部分发音的时候特别加强一下发音清晰度,对比三个产品的表现如下: 从断句效果上看,三个产品表现都不错,差异不是很大,但是在中英混合的识别上,豆包的识别准确率比较高,可以最准确的识别,而元宝和kimi的识别准确率比较一般,kimi的识别率错的更加离谱,在本人蹩脚的英语之下,豆包更加准确的识别出来。 2.流畅度和时延 测试不同的产品之间的流畅度和时延的方式比较简单,只需要拿两台手机,同时开启对话模式,然后同时输入语音指令,看哪个设备率先回复,就可以看出来不同产品之间的响应时延,通过两两对比的方式,可以看到,在响应速度上:豆包&gt;元宝&gt;kimi,三个产品之中豆包的响应速度是最快的。 ![](https://image.woshipm.com/2025/06/12/9b10e006-4757-11f0-ad57-00163e09d72f.png) ![](https://image.woshipm.com/2025/06/12/9e84f89e-4757-11f0-ad57-00163e09d72f.png) 3.输出音质和音色表现 在音质和音色方面,豆包支持最丰富的音色选择,官方提供了很多音色方案,并且还支持克隆自己的音色,而元宝目前只支持3种音色,且不支持克隆音色,kimi目前提供7种音色但支持克隆音色; 就克隆音色的能力而言,目前个人觉得豆包的音色克隆效果最好,还原真实人声的效果最好,主要体现在不仅声音像,而且能够模拟人说话时候的节奏、口吃、口音等表现。 ![](https://image.woshipm.com/2025/06/12/a3a29c82-4757-11f0-ad57-00163e09d72f.png) 4.声音表达能力 常见的声音的表达能力,包括能说方言,能唱歌和模拟声音,我们尝试让这三个产品模拟说粤语,或者唱周杰伦的《稻香》这首歌,以及模拟发出“嘘”的声音,豆包在这三个任务上,基本可以非常准确的合成出相应的声音,而元宝、kimi以上三个任务都做不了,因此豆包在声音表达能力上最好。 5.聊天拟人化体验 在聊天的拟人化体验方面,豆包目前已经支持通过语音实时打断的聊天体验,同时也具备主动提问carry聊天的能力,另外根据个人了解,目前豆包还在部分角色类的聊天bot中测试可连续回复多个消息这种接近真人聊天的体验,整体上豆包在拟人体验方面做的都更好。 6.多模态语音交互 在多模态语音交互方面,一方面产品最好能支持拍照或者实时开启摄像头实况输入视觉内容,另一方面语音聊天时输出回复的时候,最好也能支持回复图片、表情等视觉内容,目前豆包已经支持拍照输入,并且根据个人了解豆包目前还在尝试支持回复表情等相关的产品能力,因此在多模态交互上,表现也最好。 7.角色个性化能力 在角色的个性化表现上,豆包也具备非常显著的优势,例如你让豆包扮演一个御姐,它可以瞬间从默认的声音状态切换为“御姐”的角色状态,语音表达的时候,更符合一个“御姐”该有的特征,而元宝和kimi不管是声音状态还是回答方式,都没有个性化的扮演该角色;此外,豆包还能够把活泼、高冷、幽默、萌等这些性格特征也表现出来,角色渲染的更加的丰满。 8.情商表现 相比之下,三个产品中豆包的情商是最高的,一方面豆包在语音聊天的过程中,从它的声音上,可以听出来喜怒哀乐,具备表达情绪的能力;另外方面在聊天的过程中,豆包似乎会根据用户的个性化偏好,主动制造话题,引导用户聊天,比如主动聊聊用户的生日等,在这些细节上可以体现出来其主动制造话题和个性化聊天的能力;并且,它也能根据聊天对象调整自己说话的语气和方式,比如对方是个孩子的时候,则更倾向于采用更亲切的口吻交流。 **2.3.3 AI生图** 对于文生图和图生图等产品,虽然目前市面上有不少这样的产品,但是个人体验下来,大部分生图模型产品目前还停留在提升提示词理解、生图的准确性、生图质量等基础问题阶段,所以也比较难区分出究竟哪些模型更好。 相比之下,我觉得豆包主要是在AI图片编辑以及生成文字海报方面做的相对更加出色,AI图片编辑的功能支持用户针对指定的图片中指定的元素和区域,通过自然语言的方式,发起编辑指令,并且能准确的执行;而文字海报方面,豆包支持生成出带有排版、样式的文字海报,这个方面目前也是和市面上的生图模型和产品形成了一定差异化。 我们通过如下两个案例展示其在AI图片编辑和文字海报方面的表现: 例如一下以下豆包生成的图片,支持打开图片后,点击智能编辑,进一步进入编辑状态; ![](https://image.woshipm.com/2025/06/12/cdb9f5ba-4757-11f0-ad57-00163e09d72f.png) 第一个指令是“让狗把眼睛闭上”,生成后的效果如下,豆包AI编辑的能力,可以实现只让狗的眼睛闭上,而其他的元素不动; ![](https://image.woshipm.com/2025/06/12/db1244b0-4757-11f0-ad57-00163e09d72f.png) 第二个指令是“把背景换成海边”,生成效果如下,豆包成功实现更换背景; ![](https://image.woshipm.com/2025/06/12/e2075aee-4757-11f0-8feb-00163e09d72f.png) 第三个指令是“给狗带个红色围巾,并且男人的衣服换成白色”,豆包成功实现一键换衣,以及搭配装饰功能。以上这几个能力,在局部重绘和编辑的场景下,非常好用。 ![](https://image.woshipm.com/2025/06/12/ea3c8a7c-4757-11f0-ad57-00163e09d72f.png) 以上是AI图片编辑的功能展示,另一个比较不错的功能是生成文字海报的功能,个人觉得相比之下实用性也比较高,比如通过豆包输入“生成一张文案为 XXX 的海报”,目前生成图像已经能具备一定的排版设计,同时字体也有了设计样式,更加接近实际使用的结果,虽然目前还不支持进一步的文字样式、排版布局等编辑能力,但目前而言也还算不错。 **2.3.4 图像理解和AI识图** 目前豆包、元宝、deepseek、kimi这几个产品都支持识图的功能,大部分场景下,识图表现的差异可能不大,但在有些极端场景上,目前个人测试下来,豆包和kimi的识图和理解图片的能力表现相对不错,deepseek目前还进支持OCR的能力,还不支持图片理解功能; 比如当你上传一张超长的截图的时候,通过豆包电脑端和kimi,可以准确的识别和提取其中的文字内容,意味着面对超长截图,豆包和kimi 依然具备准确的识别能力,而deepseek因为上传文件大小的限制直接使用不了,元宝则完全无法识别其中内容。 当然,目前对于识图技术里面比较难的“数数量”的这个难题,目前所有产品也都达不到准确数数的能力,比如目前测试通过几个产品数如下图片中有几个药瓶,基本所有产品都会数错,可见目前识图能力方面,大家也都还有提升空间。 ![](https://image.woshipm.com/2025/06/12/0901f3ca-4758-11f0-ad57-00163e09d72f.png) ### 2.4 豆包的产品发展探索与思考? 在这一部分里面,我尝试从产品经理的角度思考,豆包在过去一年半里面可能涉及到的一些重大产品问题的思考,其中可能包括一些已经上线并且官方浓墨重彩迭代的领域,也包括一些做过尝试但是最后没有上线的尝试,并结合自己的观察分享个人的一些见解。 **2.4.1 从密切探索到逐渐淡化,怎么看待第三方智能体生态?** 在1.3部分豆包的重要产品迭代部分,我已经提到过,从2023年11月~2024年5月这最早的这段时间里面,豆包很重视第三方的智能体生态的发展,在这段时间里面不管应用层、流量层、产品层都做了不少尝试,为何前期会如此重视? 而在后期又逐渐淡化在这块的投入和迭代?以及怎么去看待第三方智能体生态这个事情? 1)一开始重视第三方智能体生态发展的原因 个人理解,可能主要包括如下几个原因: - **收集灵感,寻找和验证应用场景的切入点,探索不用应用场景的机会;**在豆包团队还没有明确的应用场景布局和AI应用落地方向的前提下,豆包团队除了自己摸索和研究,也选择了让广大的用户群体自己定义和创建智能体,并根据智能体的运行数据,发现哪些应用场景的智能体能获得更明显的数据增长表现,从而达到试探和测试用户应用场景的目的,对于有机会的应用场景,或许字节会选择亲自下场重点做;这样的思路,相当于,当一个新兴的领域,业务自身还不明确往什么方向走的时候,通过构建一个自然生长的环境,然后从中发现机会; - **拓展用户的使用场景,提升用户的黏性**同时,一开始因为豆包本身的产品功能比较有限,用户很容易体验一下然后就流失掉了,因此发展第三方智能体也是为了满足用户体验和使用更多AI应用的目的,从而保持用户的新鲜感,提升用户留存,虽然没有获得准确的数据,但是个人可以大胆猜测的是,用户使用智能体的数量或许跟用户的使用留存有正相关的关系,而这段时间豆包努力的引导用户使用更多的智能体,可能也是为了提升智能体的留存; - **构建智能体“应用商店”,成为AI应用超级入口**第三点,说的更加大一点,或许豆包团队也在尝试构建AI时代的应用市场,希望未来能收纳更多的智能体,未来发展成为智能体的应用商店,让用户可以在这里找到各种各样的AI应用,从而发展智能体应用生态。 2)第三方智能体主要来自哪些渠道? 2024年5月,在火山引擎原动力大会上,字节flow的产品负责人朱骏公开表示当时豆包的智能体数量已经达到800万左右,如今可能又是一个不同量级的规模,豆包智能体的新增来源主要来自如下几个渠道: - **用户在APP自主新建并发布公开:**该场景应该是最主要的新增来源,不过该场景下智能体新建的流程非常简单,开发者定义和配置智能体的能力有限,智能体的差异化也不大,所以新增的大部分是一些比较粗糙和简单的智能体,价值不大; - **来自扣子的应用开发者发布到豆包:**该场景下开发者通过扣子的专业编排能力,定义和编排智能体的能力并发布到豆包,这类智能体的质量相对更高,因为有经过相对更加专业的编排; - **来自字节内部业务团队开发,以及联合外部品牌开发应用**:在豆包内,有不少智能体是字节内部的业务团队开发的,包括解题答疑助手(来自豆包爱学)、懂车帝等;也有不少的应用,是豆包联合外部的企业开发的智能体,包括什么值得买、同程旅行规划师、淘票票等; 3)后来为何又相对淡化了对第三方智能体的更新和迭代频率 在1.3的产品迭代历程上可以看到,从2024年6月份开始,关于第三方智能体的产品迭代相对就比较少了,基本都是在持续的增加智能体内容,以及完善智能体的分发效率问题,官方对外也不怎么强调智能体规模这个点,个人理解可能是对第三方智能体的态度有些调整,包括如下: - 智能体的体量快速起来后,对于AI应用灵感的寻找这个目标,已经基本达到; - 第三方智能体的规模虽然高,但是非常出色的智能体没有多少,第三方智能体里面没有看到明星级的智能体出现; - 当下受限于模型能力、API生态等,构建一个高质量的智能体并不简单,依托外部开发者生态,暂时可能也难以构建出高质量的智能体。 **2.4.2 PC和移动双端如何定位,为何高频迭代PC端和浏览器插件?** 豆包PC客户端和浏览器插件从上线以来,一直保持着非常高频的产品迭代,PC端推出了很多产品体验不错,深受办公用户喜爱的功能,并且从个人了解到的信息,字节内部豆包的APP和PC在组织架构上是分开的两个团队在单独运作,在产品层面,APP端和电脑端在产品能力和输出结果上也不完全相同,两端背后使用的模型和技术能力或许也不一样,可见APP端和电脑端并不完全是一个简单的双端同步的逻辑,更像是分开独立发展。 因此,这里值得思考如下几个问题:APP和PC端双端的定位是什么样的?为何高频的打磨和迭代PC端的产品? 1)APP的核心价值是增长价值,PC端的价值在于满足办公学习场景 从用户的使用场景的角度上看,APP端的应用通常满足的是用户在日常生活的应用场景,主要满足移动便捷的需求,而PC端的应用通常满足用户在办公学习的应用场景,主要满足大屏阅读、深度编辑等需求;对于字节而言,APP端可能是用户增长的主战场,通过重点打磨APP端的产品,然后利用字节在APP端流量领域的优势,可以快速的把用户规模做起来,而其中必然有大量的AI用户是办公学习场景的用户,他们需要一个PC端的产品,更好的满足在办公学习阶段的使用需求,因此,APP端的定位个人认为核心价值在于增长,PC端的核心价值在于解决办公和学习场景的用户需求。 2)PC端未来也是一个流量主战场 根据Questmobile数据显示,豆包APP端2月的DAU规模已经超过2000万,而从similarweb的数据上可以看到豆包web端的日活2月连200万都还不到,并且历史增长趋势也比较缓慢,可见豆包内部暂时也并没有大力做PC端的投流和用户增长,而是以自然增长为主,可能大量的PC用户主要还是从APP端自然流转过来的; 但是PC端未来肯定也是一个流量的主战场,**根据 a16z 数据显示,2025年2月ChatGPT全球周活4亿中,PC端周活2.25亿,APP端周活1.75亿,可见PC端的用户规模和体量巨大,PC端也是用户的核心使用终端之一,未来该部分可能是APP增长触达瓶颈之后的下一个重要增长来源。** 3)办公学习场景是用户在AI应用中的核心场景之一 同时,必须承认的是,目前AI应用的核心落地方向中,办公学习场景必然是非常重要的应用场景之一,根据艾瑞咨询发布的《**2024年中国AI移动端应用场景研究报告**》显示,移动端AI应用中,56%的用户使用场景在于办公学习,如果换成PC端的数据,或者比例会更高;因此作为核心应用场景,豆包重点发展PC端也非常有必要。 ![](https://image.woshipm.com/2025/06/12/28835950-4758-11f0-8928-00163e09d72f.png) **2.4.3 为什么如此重视语音聊天功能?** 当谈及对豆包的哪个产品功能印象深刻的时候,我发现身边的很多AI圈的用户第一反应都是觉得它的语音聊天的体验做的很好,这点个人也非常的认同,前面我们也深度对比了不同产品和豆包在语音聊天能力上的对比。如果你有自己研究,你会发现过去一年多里面,字节内部在模型和技术层面上非常重视语音模型的发展,一方面从一开始就重点推出了字节自己的豆包角色扮演模型(语音聊天场景的重要模型),并且一直不断地升级豆包在语音聊天模块的能力,包括支持音色复制、方言、端到端的实时语音模型等,那么豆包为何如此重视语音聊天能力的发展,个人认为主要原因可能包括如下: 1)大模型带动行业对语音技术的需求,发展语音模型有利于云侧商业化 大模型的发展和AI应用的落地,会显著的带动云厂商在云服务模块的需求增长,特别是语音、文档、OCR等等,其中特别是语音部分,引用腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生近期发表的观点: <blockquote><p>“我们看到,云上DeepSeek API调用量激增,<strong>语音交互的需求也带动了ASR(自动语音识别)与TTS(文本转语音)模型的API调用</strong>;模型推理的算力消耗正在高速增长,规模化推理的成本优化,成为云厂商的核心竞争力”</p></blockquote> 因此,激增起来的语音部分的需求,或许让火山引擎这边看到明显的市场增量机会,所以字节在去年很重视语音模型部分的发展,在语音模型领域先后推出包括音乐大模型、语音识别、语音合成、声音复制、同声传译、音乐大模型等多个语音模型。 2)语音聊天场景对于豆包的增长价值 此外,语音聊天场景的功能对于促进豆包的用户增长或许也有显著的帮助,包括在提升用户的使用时长、用户留存等方面。 根据Questmobile数据显示,豆包和元宝等Chatbot类型的APP,平均一个用户一天的使用时长仅有10分钟左右,而类似像星野、猫箱这类语音聊天类的产品,其平均日使用时长可以高达70~110分钟,可见语音聊天的场景,对于拉升用户在应用内的使用时长,可能有明显的价值。对于以广告业务为核心的字节而言,想必他们必然重视用户使用时长的指标,而拉升用户使用时长,必然意味着提升语音聊天场景的使用渗透。 3)语音聊天可能是豆包选择的产品差异化竞争的切入点 每一个产品都必须要有一个让用户牢牢记住的差异化的能力点,豆包在基础大模型等方面在行业内没有占太大优势的情况下,或许他们选择了从语音聊天入手,尝试构建豆包的差异化竞争点。 **2.4.4 为什么重点投入多模态大模型的发展?** 在这个问题上,个人的见解相对比较浅薄,基础大模型领域当下已经是非常卷的赛道,并且海外openai等在基础模型的创新和突破上一直处于引领行业趋势的位置,在基础模型上突破相对比较困难,而多模态大模型的领域,不管国内还是海外,可能起点差异还没有特别大,从这个角度切入竞争,或许成功概率和获得影响力的机会大些。 **2.4.5 应用场景切入的边界以及选择的逻辑是什么?** 在应用场景切入这个角度上看,目前我们看到,豆包目前在应用场景的落地上,主要聚焦办公、教育学习、生活、创作等场景,而对于游戏、社交等领域则没有涉及相关应用落地,其应用场景选择的逻辑是什么样的?这里分享一些我自己的理解。 1)AI的应用场景主要结合互联网时代用户的需求和大模型的能力边界 实际上,目前所有的AI应用场景都并没有脱离互联网时代的用户需求本身,只是满足需求的方式和程度不一样,大模型以一种更加通用和聪明的方式满足用户的需求,而目前的大模型本质上是一个生成式AI的能力,模型的能力也有边界,只能实现生成式AI能够覆盖的应用场景,因此办公、教育学习、生活、创作等领域,存在切入的可行性,而游戏、社交等领域,暂时还没有看到更好的切入方式。 2)参考行业和竞品动态 当然,行业和竞品的应用动态,也会影响字节内部的应用场景的选择,比如切入语音聊天场景,可能因为海外Character.ai的火爆,办公场景可能参考WPS AI等。 3)字节内部的业务体系 最后,豆包内的很多技术能力都是整合字节内部业务的产品和技术能力后支持相应的场景,因此应用场景的选择和切入,也会结合字节内部的业务体系,比如豆包在教育场景的能力,来自原大力教育业务的技术和产品支持。 **2.4.6 产品设计上有哪些值得借鉴的地方?** 该部分,主要分享一些豆包在产品用户体验上,或者对于产品的用户增长方面,个人比较喜欢和认可的一些产品设计细节。 1)问答结果尾巴附带短视频 如下图,豆包在AI生成回答的时候,除了输出AI问答的结果,同时也会将与该主题相关的短视频内容附加推荐给用户,这个做法的好处个人觉得是“AIGC内容+人工生成内容”组合一起,可能能更好的解答用户的问题;因为AI生成的结果有的时候因为幻觉等原因,可能可信度不一定高,用户容易对回答结果存疑,而搭配上人工部分的内容,可能真实性更高一些,另外匹配相关的短视频内容也能进一步的解答用户的问题;这个方式对于解答知识科普类、旅游类、生活类等场景的问题,体验很不错。 2)对外分享的链接支持接着聊 用户将对话内容通过链接等方式分享出去之后,用户看到内容之后,可以在之前对话记录的基础上,接着聊,这个功能从激发用户使用频率和留存上看,是一个不错的做法; 3)支持复制图片直接粘贴对话框后图片问答 这个功能个人觉得体验也非常不错,特别是我经常需要从微信聊天对话中,或者是从网页中提取图片,在豆包中用识图的功能做信息提取和分析的时候,之前的路径很长,需要保存图片到本地,然后在本地上传到豆包,有这个功能之后,可以直接复制图片,粘贴到豆包对话框,然后豆包直接上传图片,这个过程体验非常丝滑和舒服。 **2.4.7 经历过哪些失败的尝试?** 1)豆包问答社区和SEO 2024年5月的时候,豆包业务团队曾经尝试在PC端推出“问答”社区的功能,对标知乎问答,官方将问答内容和生成结果沉淀到一个问答社区,社区链接如下:https://www.doubao.com/traffic/ask,并且将AI问答结果应用于搜索引擎SEO,为豆包web端引流,该方式当时引起一定的舆论风波,很多用户谴责豆包利用AI生成内容污染互联网数据,后来运营一段时间后,该功能目前已经下线,问答社区网站目前也不可访问; 个人认为,将AI生成结果用于搜索引擎中的问答这个方式其实也没什么问题,只是当时的时机还不太合适,因为当时模型幻觉的问题还比较严重,AI生成内容还存在很多不实信息,将这些内容用于SEO很可能会导致以讹传讹,混淆真实信息的情况。 2)智能体群聊模式 2024年7月份的时候,个人灰度体验到,豆包当时在测试智能体群聊的功能,支持用户在首页右上角支持发起群聊,添加已经关注的智能体,然后拉群聊天;群中会有一个“托”辅助调动聊天氛围,用户可以@某成员回答问题,但是当时的功能整体体验起来比较一般,群主比较累,需要不停的主动发起聊天,后来这个产品功能并没有全量上线,可能是一个失败的尝试,但是这个idea个人觉得还是挺有意思的,只是产品能力没有做好,可见豆包产品团队在过去一年多真的做了不少AI应用的尝试。 ![](https://image.woshipm.com/2025/06/12/4c42a670-4758-11f0-8928-00163e09d72f.png) ## 三、从后续发展规划的角度看豆包 最后一部分,我们来尝试聊聊今年豆包的发展规划会是什么样的这个问题,个人观点更多的是来源于和行业人员的交流,以及字节近期的公开动态等信息,并发表个人的一些见解,以下信息也并非实证信息,仅供参考。 ### 3.1 从整个字节内部全员公开会信息角度看 2025年,在字节内部的全员大会上,CEO梁汝波在全员的公开信上表达了对字节2025年的年度关键词,其中对于AI业务的关键词是:**探索智能的上限,新的UI交互,加强规模效应**; **1)探索智能上限** 梁汝波首先将探索智能上限为AI的第一件大事,其实一定程度上,也是在复盘2024年AI的发展策略有点过多的侧重于应用层产品的DAU规模,模型层过多的在适应应用层的发展,一定程度上弱化了对技术边界和模型能力边界的研究探索,比如2024年字节错失OpenAI长链思考模型(2024年9月发布)的跟进机会; 因此,2025年字节在AI的重心会放更多的精力在技术创新和前沿研究上,而降低规模指标的权重和优先,,会把更多的目标聚焦在技术创新和场景的覆盖上; **2)探索AI新的UI 交互** 再次之前,AI目前主要的产品形态,还是聚焦在以Chatbot为主要形式的生成式AI的阶段,这不会是AI的最终形态,未来生成式AI+任务执行这种模式的AI应用可能会越来越多;这意味着字节可能会在Auto-Agent、AI硬件等方向上,会有更多的创新交互。 ### 3.2 从近期的产品更新动态的角度看 从最近一段时间的产品动态更新上看,最近AI应用的更新主要集中在推理模型、办公场景,多模态; 这其中一方面因为受到deepseek的影响,豆包加紧推出自己的深度推理模型,另外一方面,从个人最近一段时间的观察发现,近期豆包的产品功能更新基本围绕着AI云盘、AI阅读、文档问答等办公场景相关的功能。 ### 3.3 从近期的组织架构变动的角度看 字节的大模型团队Seed团队在年初开始迎来重大架构调整,原来由朱文佳主导负责的模型团队一分为二,拆分为模型研究团队和模型应用团队,原来最核心的部分模型研究团队交给新进的AI大牛吴永辉,朱文佳原来下面的乔木、项亮、冯佳时等核心成员转移向吴汇报,朱文佳的业务重心转移到负责模型应用方向的业务为主。 从这个可以看到的是,字节接下来对于模型的研究和创新层面的重视,根据对外公开的信息显示,负责大模型前沿研究的团队称为Seed Edge ,该团队目前确定五大研究方向: - **探索推理能力的边界**,聚焦于通过大规模**强化学习**等技术推动智能边界的提升; - **探索感知能力(理解物理世界的能力)的边界**,致力于突破智能与交互的融合,探索世界模型的建模方式; - **探索软硬一体的下一代模型设计(AI硬件解决方案)**,旨在实现训练效率、推理效率、模型性能的多目标优化; - **探索下一代 AI 学习范式(架构创新,跳出Transformer架构的创新)**,挑战现有范式的“共识”,寻找比 Next-Token Prediction 更高效的学习目标; - **探索下一个 Scaling 方向(寻找预训练和思维链之外,下一个推进模型发展的方向)**,继 Pretraining Scaling 和 Test-Time Scaling 之后,寻找推动智能边界演进的新方向。 ### 3.4 从最近的行业动态的角度看 - **DeepSeek的大火对字节战略规划的影响和思考下一个范式、强化学习和后训练方式**:R1的成功,其实是一种后训练模式的创新尝试之后的结果,deepseek在V3的技术上,通过限定一个固定的训练模版和奖励模型,让模型学会先思考后输出,然后将生成的推理数据用于微调基础模型,并上强化学习,于是诞生了R1。这样一套范式,其尝试的路线和方向可能还有很多,未来范式的探索可能能够带来模型能力的进一步创新,因此DS的成功,对字节大模型战略的主要影响可能会是在下一个范式、强化学习和后训练方式等方面的探索。 - **重点发展多模态大模型:**deepseek模型开源之后的结果是国内整体基础模型的能力可能让大家都到达一个持平的水平,短期之内可能不会有更强的基础模型,因此大模型厂商要拉开差距,更应该在多模型这个和R1模型错位的领域去竞争才更有胜算。 - **Manus大火对字节产品战略的影响和思考:**Manus的出现,其实一定程度上印证了字节对于新的UI交互方式创新这个方向的探索的准确性,AI可能不再是仅仅局限于Chatbot的方式和生成式AI的方式。 ### 3.5 对于豆包后续发展规划的思考总结 汇总以上信息,个人觉得豆包后续的发展规划的方向可能包括如下: **1)寻找AI产品交互方式的创新,其中可能包括:** - **Auto-Agent模式**:支持类似Manus模式的工具调用和自动任务处理的AI应用形态; - **AI硬件探索:**除了软件形态的交互方式创新,AI硬件也是交互方式创新的一种形式,后续豆包在AI耳机、AI玩具、AI眼镜等硬件领域的创新,或许也会是重点。 **2)持续探索AI的应用场景边界,寻找应用场景创新,个人认为今年豆包可能重点探索的应用场景包括:** - **办公场景:**包括文档、会议、云盘等办公领域的刚需场景和AI的结合; - **个人助理场景:**包括生活服务、**电商购物、本地生活、出行等应用场景和AI的结合; - **多模态**: 在多模态的输入和输出上,可能会有更多的创新动作; **3)字节内部产品生态和AI的打通和结合**:包括抖音、头条、飞书等内部产品之间,在产品、数据等层面的打通。 OK,以上即为关于字节豆包的一些深度分析,希望对于正在探索和转型AI领域的朋友能有一些帮助,我是三白,我将持续为大家输出更多高质量的深度研究,欢迎大家关注并和三白深度链接。 同时也欢迎大家体验和使用我的研究提效工具 AI快研侠,用它创作和分享高质量的知识! 作者:三白有话说,公众号:三白有话说 本文由 @三白有话说 原创发布于人人都是产品经理。未经作者许可,禁止转载。 题图来自豆包官网截图

2025-06-12 07:22:21 · 0次阅读
 
 
《幻想生活i 转圈圈的龙和偷取时间的少女》销量已突破100万份

![](https://image.gcores.com/4cb5eee3e9cdac79753bea9b479bebe4-2177-1212.png?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) Level-5社长「日野晃博」 今日在社交媒体发文,表示《幻想生活i 转圈圈的龙和偷取时间的少女》销量已突破100万份。 ![](https://image.gcores.com/8d8342d6028031cb29ee441631f76d9a-594-295.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) 此外,日野晃博还介绍了游戏日后的优化,包括 Switch 2版本专有的强化图形,以及优化视角,将播种和浇水按钮分开,各自对应一个操作等。 ![](https://image.gcores.com/73e0229bb19b5a774bc8f942467ecd66-1920-1080.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/dbd1d88b1b6e79f735832358b4f5371a-1920-1080.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/641063f29fac3da5892f5ca20b4fa9e0-1920-1080.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10)

2025-06-12 07:21:02 · 1次阅读
 
 
服务数字化功能导图

<blockquote><p>我在《服务数字化创新和转型全景视图》文章中,介绍了服务数字化应该如何从上至下,分几个层次,用什么方法去规划设计。在本篇文章中,我介绍一下服务数字化包含的相关的内容,我叫功能导图。</p> </blockquote> ![](https://image.woshipm.com/2023/04/13/6ff02bfe-d9de-11ed-9d2f-00163e0b5ff3.jpg) 如下图所示,服务数字化**功能导图**由**三阶段、九领域、四流、三塔、一树和四化组成**。 - **三阶段。**服务0、服务2.0和服务3.0三个阶段。这三个阶段可以同时进行,并不要求完全实现前一阶段才能进入下一阶段。 - **九领域。**服务分为用户体验、2.多渠道、3.工单、4.服务网络、5.备件仓储、6.不良品、7.质量、8.结算和9.培训支持等九个细分领域。 - **四流。**服务中最重要的四流全生命周期管理:工单流,2.备件流,3.退换货流和4.结算流。 - **三塔。**服务数字化最重要的业务价值量化考核方法:效率控制塔、2.成本控制塔和3.体验控制塔。 - **一树。**故障逻辑树。故障逻辑树是通过AI提升效率的基础,涉及到服务数字化众多重要场景应用。 - **四化。**服务模式创新的四个方面:服务管家化、2.员工创客化、3.网点平台化和4. 收入生态化。 ![](https://image.woshipm.com/2025/06/12/38aa287a-473c-11f0-ad57-00163e09d72f.jpg) 图 1 服务数字化全景地图 下面我以服务三阶段为主线逐一做个介绍。我把服务数字化分成三个阶段,每个企业根据自身的实际情况选择要实现哪个阶段。 **1.0阶段-拾遗补漏:**这个阶段是对**原有系统进行改造和整合**,比较适用于服务网络弱管控、项目资金预算几百万、对服务的要求是按时按质地完成工单即可的企业。这个阶段通过整合和改造原有系统,构建服务可视化、量化和货币化价值评估体系,以及做到工单、备件、退换货和结算四个全生命周期可视即可。1.0阶段主要实现了对服务全局动态可视,从而做到事前预防、事中干预和事后优化。 **2.0阶段–整体提升:**这个阶段一般需要原有系统推到重建,比较适用于对服务网络强管控、项目资金预算上千万、对服务的要求较高,要做业内标杆,但又没要求转型做销服一体化和利润中心的企业。这个需要对服务的九个领域重新设计,与数智化融为一体。这九个领域是: - 用户体验 - 多渠道 - 工单管理 - 服务网络管理 - 备件管理 - 不良品管理 - 技术支持和培训 - 结算管理 - 质量管理。 不同的行业情况不一样,很多企业可能只涉及其中部分领域。 **3.0阶段–颠覆转型:**这个阶段除了对原有系统推到重建外,还需要对服务的整个业务模式进行重构。比较适用于对服务网络强管控、项目资金预算数千万、服务要做颠覆性创新,要求转型做销服一体化和利润中心的企业。四化是指服务管家化、员工创客化、网点平台化和收入生态化。 ## 一、服务数字化1.0 服务数字化1.0是实现服务最核心和最基础的数字化功能。他包括:九领域基础功能、四流全程可视、三业务价值控制塔、一故障逻辑树。 - **九领域基础功能:**包括用户体验、2.多渠道、3.工单、4.服务网络、5.备件仓储、6.不良品、7.质量、8.结算和9.培训支持等九个细分领域**1000多项**具体功能点。 - **四流全程可视:**包括工单流、备件流、退换货流和结算流全生命周期管理、关键可是点和优化点。 - **三业务价值控制塔:**根据服务效率、服务成本和用户体验这三个维度按客服中心、服务网络、退换货、仓储备件这四个细分维度定义了70多个服务业务价值量化指标。 - **一故障逻辑树:**重新定义、整理和优化故障逻辑树,使其能支持AI在众多服务关键场景中增效、降本和提升用户体验。 ## 二、服务数字化0 指的是1.用户体验、2.多渠道、3.工单、4.服务网络、5.备件仓储、6.不良品、7.质量、8.结算和9.培训支持等九个细分领域数字化创新应用。包括但不限于以下应用: - 坐席员增效降本 - 派单到兵+排程增效 - AI智能识图 - 基于物联网的智能服务 - 服务产品规划 - 用户体验策略 - 用户口碑运营 - 服务商考核优化 - 服务网点布局智能优化 - 流动服务站 - 付薪到兵 - 网点平台化 - 服务管家化 - 收入生态化 - 网点经营数字化 - 工单稽查 - 远程视频诊断 - 沉浸式培训 - 智慧备件计划 - 备件订单高效执行 - 备件上下架策略优化 - 运输路径智慧规划 - 备件逆向物流优化 - 专修站点规划与服务能力提升示例 - 官翻机和样品机以销售拉动修复 - 质量到人 - … ## 三、服务数字化3.0 既要对服务模式进行创新,实现:1.服务管家化、2.员工创客化、3.网点平台化和4. 收入生态化。 - **服务管家化:**即建立用户和服务人员一对一绑定的管家关系。用户通过负责的管家获取服务;服务工程师通过运营固定用户群来获取收入。 - **员工创客化:**即服务人员逐渐摆脱对服务网点的依附,为自己工作,创建自己的品牌。 - **网点平台化:**即网点需要重新定位,我们可以整合某一地区若干网点,形成地区运营中心,由原来仅仅以服务收费为主,到运营整个地区的服务支撑体系,工作以用户满意度,服务人员满意度,生态体系建设,活动策划和运营等内容为主。收入也不再以工单量为衡量,而是根据运营效果,用户满意度,服务人员满意度和生态收入等综合评定。 - **收入生态化:**即厂商为引入和运营更多产品和服务,这些收入将按管家关系分配给服务人员和网点。 **总结:**本文介绍了服务数字化**功能导图**中三阶段、九领域、四流、三塔、一树和四化的相关内容。 本文由人人都是产品经理作者【杨峻】,微信公众号:【CRM30】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。

2025-06-12 07:12:45 · 0次阅读
 
 
China's Automakers Pledge 60-Day Payment Terms in Rare Coordinated Move to Rebuild Supply Chain Trust

The swift alignment by automakers underscores both policy compliance and a recognition of shifting dynamics in an industry grappling with thinning margins, slower growth, and heavy capital expenditures tied to the electric and intelligent vehicle transition.

2025-06-12 07:12:03 · 1次阅读
 
 
我用Gemini做了个「录音分析大师」,会议纪要一键转PRD,产品梳理效率直接拉满!

<blockquote><p>在快节奏的产品工作中,会议记录的整理和后续的产品需求文档(PRD)撰写常常耗费大量时间和精力。但如今,借助AI技术,这一过程可以变得高效且轻松。本文将分享如何利用Gemini打造一个“录音分析大师”智能体,将会议录音一键转化为高质量的会议纪要和产品需求文档,大幅提升产品梳理效率。</p> </blockquote> ![](https://image.woshipm.com/2023/05/06/0779bf46-ec02-11ed-adbb-00163e0b5ff3.jpg) 今天分享的案例是:会议记录的AI智能体,通过Gemini制作, 非常实用,跟着学,你也能学会! 顺便先看下效果图⬇️: ![](https://image.woshipm.com/wp-files/2025/06/OnhpguUr1hV9ioT0qHzK.gif) 古人云:“君子生非异也,善假于物也。” 镜哥以为,在日新月异的当下,咱们产品经理的“物”,便是用AI封装出来的效率神器——用好它,你就能有把一天过出25小时的感觉。 上周五下午,我们开了个堪称「史诗级」的脑暴会,搞得我周末都没缓过来劲儿。。 起因是新版本的一个核心功能,当时市场、运营、技术、设计等几方大佬坐在一起,老板穿插着坐镇,从用户画像吵到技术实现,又从交互细节怼到推广节奏。 让本就不富裕的白板上画满了架构图和用户旅程,会议室的玻璃墙上贴满了五颜六色的便利贴,与会的每个同学的笔记本上都记着零散的关键词。 按照传统,一直开到下班后,丝毫没有对周五的尊重。 两个半小时下来,除了个别老板的“红人”显得异常兴奋之外,大多数同学都有些精疲力尽,老板最后总结:“很好,信息量很大,大家想法都很有价值,小A,你尽快把会议内容整理一下,提炼个方案出来,我们明天过。” 等下,明天不是周六么?难道老板的日历和咱们不一样么? 说实话,我最怕这种会。 不是怕讨论,而是怕会后。 因为面对那一堆“湿漉漉”的、未经处理的原始信息,想从中拧出“干货”,整理成一份逻辑清晰、人人信服的会议纪要,再升华成一份可执行的产品方案,简直是一场酷刑。 这活儿,放以前,没个半天时间根本下不来,而且还得是咖啡因拉满的状态。 但现在,不一样了。 看着老板离去的背影,镜哥默默打开电脑,祭出了我那套已经炉火纯青的「AI组合拳」——虽然我不用像小A写会议纪要,但从会议录音开始到整理出一份合适的产品方案初稿,全程耗时,也不过几分钟。 关键是,输出质量还不是一般的高! 今天,镜哥就把这套私藏的最新打法分享给你,希望能帮你把产品工作的效率,拉升到一个全新的次元。 ## 01 精准投喂——把最“原始”的会议记录喂给AI 这套心法的第一步,也是最关键的一步,就是“投喂”。 AI不是神仙,你给它“馊饭”,它吐不出“龙肉”。想要产出高质量的结果,咱就必须给它最精准、最全面的“原材料”。 我的原材料是什么?就是会议的全程录音转成的**文字稿**。 记住,一定要是**未经任何删改和美化的原始文字稿**。那些“嗯”、“啊”、“那个”、“我觉得吧”之类的口头语,那些跑题的闲聊,那些重复的论述,也都不要动,原封不动地保留下来。 为什么? 首先是因为AI能轻松识别和处理,其次是因为这些“噪音”在AI眼里,同样是信息,它们能帮助AI判断语气、识别情绪、理解上下文的犹豫和强调。 一个结结巴巴的观点,和一个斩钉截铁的结论,在原始文本里是有显著差异的,这些也都会成为AI分析的依据。 所以,不用顾虑,开会时只管大胆地打开录音工具,镜哥一般用的是「讯飞听见」,当然,现在免费的也很多,我也推荐豆包的会议记录,可以一键转写成文字。 拿到这份可能长达上万字的txt文档,我们的第一步就完成了,当然,你也不必怕它长,这对Gemini这种级别的模型来说,小菜一碟。 ![](https://image.woshipm.com/wp-files/2025/06/A5fNHD6XbMhU1joIMzJ8.png) 图-⬆️ 使用「讯飞听见」或豆包来记录会议 ## 02 提纯炼丹——用Gemini智能体打造你的“产品分析熔炉” 很多同学做了会议记录之后,只是简单地用AI分析下会议纪要,比如,团队不少同学只是用豆包做记录,然后复制豆包的会议纪要。 但这是其实远远不够,太初级、太基础,事实上,咱们拿到原材料之后,就该「入炉炼丹」了。这一步,才是整个流程的核心,也是体现产品经理AI驾驭能力的关键。 我不会简单地把文本丢给AI,说“给我总结一下”。 我会启用我早已定制好的一个Gemini智能体——「录音分析大师」,**这里再多说一句:之所以选择Gemini,也是多方对比出来的结果,这类场景,实测下来,Gemini的模型效果最好。(当然,镜哥在AI群里之前分享过白嫖pro会员的方法,记得加群~)** 有一说一,这个「录音分析」的灵魂,是一套我反复打磨过的、堪称“产品咒语”的超级Prompt——它的作用就是给AI设定好一套精密的“程序”,让它像一个顶级的、懂产品的资深总监一样去思考。 最重要的是,非常适合咱们产品同学的工作场景,比如,你只需要上传文件或者复制录音转出来的文字内容,AI便会按照你设定的程序运行,会主动询问你需要生成流程图,还是要生成PRD文档。 ![](https://image.woshipm.com/wp-files/2025/06/pUMCtBElRsnaFcOJuw9V.png) 图-⬆️ AI按预设的指令来运行,只需选择即可高效执行 举个例子: 如果你选择了流程图指令,AI不仅会先帮你用文字梳理流程图,还会再帮你生成mermaid格式的文字,以便你快速生成流程图。 ![](https://image.woshipm.com/wp-files/2025/06/2RxqaqL6yVQVwMFj0QPf.png) 图-⬆️输入流程图指令,文本与mermaid,一键输出 如果你选择了PRD文档指令,AI则会严格按照预设的PRD模板,并且结合文字内容和AI理解,帮你生成一份高质量的产品需求文档。 你看,这里的效率就提升了很多,一来通过整合为智能体,避免反复输入各类提示词,节省了调教时间。二来,AI能结合场景高质量地给出符合你需要的、高质量的内容。 反正镜哥现在已经离不开这个工具了。 当然,这套“咒语”的核心框架就是提示词,镜哥也直接分享给你: <blockquote><p>你的主要职责是能根据用户上传的文件内容(或者是用户复制的录音转文字后的文本内容),进行深度理解和梳理,并根据用户需求进行进一步做详细的分析、梳理和创作。</p> <p>说明如下:</p> <p>1、这些内容通常为会议纪要、工作记录、事务梳理,头脑风暴、事情讨论等,但都是语音转成文本的内容。</p> <p>2、这中间的内容有些会有口语化的描述,有些也会有语气词或废话等,你要根据文本内容进行逻辑上的理解,并且根据用户的输入要求进行适当的网络搜索、深度推理等,最终给到用户答案。</p> <p>3、「帮我梳理产品需求」如果用户上传文件或输入文字内容后,直接输入「帮我梳理产品需求」等类似描述,你要根据内容,从产品需求的角度进行梳理,输出详细的PRD文档,这个文档结构要包括但不限于:项目/产品背景、目标用户、原始梳理、抽象要点、产品详细需求、业务流程、待办事项等。</p> <p>其中,基础梳理主要是对文本内容进行抽象提炼,提炼与产品需求相关的背景,如某些领导、同事提到的原始观点等,这里的重点要保证原始性。</p> <p>你还应该对文档结构做更多展开,以更符合规范的PRD文档的要求。</p> <p>4、「帮我梳理业务流程」如果用户上传文件或输入文字内容后,直接输入「帮我梳理业务流程」等类似描述时,你要根据文本内容梳理成业务流程,主要输出两部分:</p> <p>1️⃣业务流程描述;</p> <p>2️⃣业务流程的mermaid文件,因为用户要使用mermaid绘制业务流程图。</p> <p>5、「帮我梳理待办」如果用户上传文件或输入文字内容后,直接输入「帮我梳理待办」等类似描述时,你要根据文本内容梳理出来待办的具体事项,并标注责任人、截止日期等信息。</p> <p>6、「帮我快速梳理」如果用户上传文件或输入文字后,直接输入「帮我快速梳理」等类似描述时,说明用户对关注的内容暂时并没有明确的关注重点,你就根据文本内容,按照你的理解和推理,进行快速梳理即可,并且输出结构化的内容。</p> <p>你应该能分辨用户输入的是问题还是上传的复制后的语音转文字内容,因为前者往往是具体的问题,而后者往往是长文本且符合录音的格式;所以,如果用户直接输入的是后者,你应该询问用户需要怎么处理,并且列出上述你具备的技能,如「帮我快速梳理」等。</p> <p>注意:用户为一名产品经理,他通常会从产品角度来分析相应问题,你也可以多从产品角度进行适当考虑。</p> <p>切记,你要确保内容中的语义不偏差,你不清楚的、不确定的可以询问用户。</p></blockquote> 你认真看下提示词会发现,这套Prompt的精髓在于,它不是在要求AI“总结”,而是在要求AI“**解构**”——它把产品经理会后复盘时,脑子里需要过一遍的所有维度,都变成了给AI的指令。 尤其是“不同指令”这一项,是我后来逐步迭代加上去的,实测效果真的很顶,效率拉满,当然,你也可以继续迭代。 总之,咱们后续在产品的日常工作中,养成会议记录的习惯之后,就可以高频地来使用该智能体。 使用也很简单:咱们只需要将原始文字稿粘贴在这套Prompt下面,点击发送,再选择对应的需求指令。 大约一两分钟后,一份条理清晰、洞察深刻的针对内容就出炉了,而这份报告,已经不是简单的“纪要”,而是一份可以直接用于下一步行动的“情报地图”。 ## 03 一键成器——从情报地图到最终交付物 好,通过「录音分析大师」这个AI智能体的炼丹,咱们就可以得到一颗蕴含巨大能量的“金丹”——《会议深度洞察》。 这份洞察虽然质量也很高,但很多时候还只是过程文档,毕竟属于梳理阶段嘛,如果要正式交付,咱们通常还需要再进一步转化。 也就是将这颗“金丹”的能量,转化为我们需要的最终“法器”,比如一份详尽地PRD文档,或者一份正式汇报的PPT。 这中间其实就用到另外的专业领域的办公Agent。 比如,如果要写个详尽的word方案,我们可以根据「录音分析大师」转出来的初稿结果,再通过Skywork来输出正式的方案,就会非常的具体和到位。 再比如,如果要汇报,我就会把录音的初步结果给到**Genspark**这类AI PPT工具,基本上很快咱就能得到一份设计精良、图文并茂的PPT了。 这里镜哥还是要提一下我的观察,目前AI的价值深度依赖开发者聚焦的细分领域,比如,Dia就是AI浏览器、Perplexity就是答案引擎、Genspark就是AI PPT,咱们要找合适的AI士兵来做合适的事。 ![](https://image.woshipm.com/wp-files/2025/06/5ZkNb1tGhoCoJ6nNNnY9.png) 图-⬆️利用Skywork,进一步完善交付物 换句话说,我们要逐步建立AI军团,建立适合产品工作的AI大军。 本文分享的案例可能不复杂,但镜哥想说的重点其实是思路,是结合工作场景、需求场景的主动解题的思路。 因为,思路可以复制、可以应用,久而久之,你的AI信仰和出路自然就会浮现。 举个例子: 团队有个同学马上要转正了,小伙子能力不错,但就是不擅长写材料,对着转正PPT模板憋了好几天没思路。我就把我这套方法教给了他。 他按我的方法操作下来,行云流水: - **口述录音:**他就是对照公司的PPT模板,直接开着录音,把自己试用期的工作总结、项目复盘、心得体会、未来规划,完完整整地口述了一遍,也就10分钟时间,也不用担心卡顿、语气词之类的。 - **用我的「录音分析」智能体进行AI提炼:**同样的,他把录音转成的文字稿,直接丢给我那个「录音分析大师」智能体,让AI帮他梳理逻辑,并输出一份详尽的PPT大纲和每一页的核心观点。 - **一键生成PPT:**最后,他把AI输出的PPT大纲,喂给Skywork,不到半个小时就搞定了一份二十来页的转正PPT,而且格式精美、内容详实、逻辑清晰,甚至连一些图表的呈现方式和页面的交互效果都考虑到了。 你看,这就是咱产品提效最具体的表现。 事实上,这套方法的核心,就是将我们脑海中“非结构化”的思绪,通过口述录音的方式快速释放,再利用AI强大的能力将其“结构化”和“深度理解、抽象”,最后自动化地生成交付物。 众所周知,咱们产品经理开会最多,事情也最杂,很多时候会应接不暇,咱们就完全可以用这个方式来提高工作效率。 比如,需求识别阶段的用户访谈录音,直接用这个流程就能快速提炼用户画像和核心需求,比你手动整理快上十倍。 **镜哥最后还想说两句话:** 工具永远在变,但提升效率的底层逻辑不变。就像这套AI组合拳的核心,也是把产品经理的结构化思考能力,“注入”给AI,让AI成为我们思维的延伸和放大器。 咱们都正在经历一个工作范式的剧变。 过去,我们是信息的处理者,在信息的海洋里肉搏;现在,我们应该是洞察的架构师,站在高处,指挥AI去完成信息的处理和加工。 最近也看到一句话,意思是把精力资产化,省着点花,投入更重要的事情上去。 所以,把你的精力,从整理纪要这种繁琐但价值有限的劳动中解放出来,投入到更具创造性的思考、更深刻的用户洞察和更精准的战略决策中去。 这,才是AI时代下产品经理最大的“进化”。 就像很多人讲的:永远不要用战术上的勤奋,去掩盖战略上的懒惰。 不妨想下,当AI足以处理90%的“战术执行”时,你的精力,是否真正聚焦到了那10%的“战略思考”上? 所以,当下而言,我们需要利用AI提高工作效率,降低重复工作的占比,从而把精力释放出来,用在更高价值的思考上去。 这,或许才是决定你未来价值的关键! 本文由人人都是产品经理作者【产品大峡谷】,微信公众号:【产品大峡谷】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于CC0协议

2025-06-12 07:09:15 · 0次阅读
 
 
"收入越低身体越不干净!"韩国一游泳馆张贴歧视性公告引热议

6月12日消息,近日韩国一家游泳馆的广告火了,引来全球网友的吐槽。**韩国京畿道一游泳馆因张贴含有歧视性内容的“使用守则”引发争议。该告示中出现“收入越低,身体越不干净”等表述,引发不少韩国乃至全球网友不满谴责。** 一名网友12日将该游泳馆内张贴的“使用守则”告示照片上传至韩国某网络社区。告示内容包括,“游泳池不是搓澡的地方”、“使用前请淋浴干净”、“须佩戴泳帽”,以及“使用后泳池的浊度反映你的收入水平”,并在下方附上一行说明:“研究发现,收入越低,身体越不干净”。 这也引发了网友的热议,不少人集体吐槽称,出于水质管理考虑,游泳馆禁止搓澡、要求洗澡和戴泳帽是常见规定可以理解,但将一些歧视语言写入告示内容的表达方式“非常无礼”。 还有网友直言:“泳池的脏乱和我的收入有什么关系?完全不能理解这种表达方式。” [![](https://static.cnbetacdn.com/article/2025/0612/0aff1395c864895.jpg)](//img1.mydrivers.com/img/20250612/7d1d189e955b4360a336a8019dec603c.jpg) [查看评论](https://m.cnbeta.com.tw/comment/1506262.htm)

2025-06-12 07:06:42 · 0次阅读
 
 
o3-pro正式推出:说声“嗨”就花了80美元 思考1+1用时16分钟

OpenAI深夜放大招,正式推出“最新最强版”推理模型o3-pro!而且同一时间,o3模型降价80%不降智。官方测评结果显示,在专家评估中,所有人一致更偏爱o3-pro而非o3的回答。 ![](https://static.cnbetacdn.com/article/2025/0612/25a5f1589716aa9.png) 此外,o3-pro也一举超越o3、o1-pro,成为当前最擅长数学、科学和编程的OpenAI模型。 ![](https://static.cnbetacdn.com/article/2025/0612/329a6d0c2c27e7d.png) OpenAI CEO奥特曼也第一时间激动表示: 这真是太聪明了!我第一次看到它相对于o3的胜率时,简直不敢相信。 ![](https://static.cnbetacdn.com/article/2025/0612/a65ec826ee344fc.png) 目前o3-pro已取代o1-pro,面向ChatGPT的**Pro和Team用户**开放,Enterprise和Edu用户将在下周获得使用权限。 而对开发者来说,o3-pro已经可以通过API接入: 每百万输入tokens收费20美元(约合人民币143元),每百万输出tokens收费80美元(约合人民币574元)。 有多贵呢? 温馨提醒,据称一句简单的“嗨”就花了网友80美元(doge)。 ![](https://static.cnbetacdn.com/article/2025/0612/d324d1fc7e20c61.png) 或许OpenAI也意识到这个价格确实有点贵,所以另一边赶紧宣布o3降价80%。 o3降价80%不降智 官网显示,o3的最新API价格如下: **每百万输入tokens收费2美元,每百万输出tokens收费8美元。** 对比o1-pro下降了80%以上,不仅是o3-pro的1/10,而且和GPT-4o(每百万输入/输出分别为2.5美元和10美元)基本持平。 ![](https://static.cnbetacdn.com/article/2025/0612/940f925621d3748.png) 至于降价原因,明面上的说法是OpenAI对推理服务架构进行了全面优化。 就是说,虽然o3和o3-pro底层模型相同,但由于推理更高效,所以价格自然就下调了。 不过,就在奥特曼对这一价格“沾沾自喜”时,关于o3**“是否真的没有降智”**却陷入了争议。 ![](https://static.cnbetacdn.com/article/2025/0612/9174d0d230c8b16.png) 网友们也是相当直白,在奥特曼这条推文底下直接表达了怀疑: ![](https://static.cnbetacdn.com/article/2025/0612/f942ef2a942480d.png) 甚至有博主以亲身经历(暂无法确定真实性)出来发声,认为o3在实测中变笨了。 OpenAI降价并非出于慈善…… ![](https://static.cnbetacdn.com/article/2025/0612/c049da90e4cdf24.png) 然而这一说法也遭到了其他网友的反驳,**总体来看目前对峙双方并未就这一争议拿出实质性证据**。 ![](https://static.cnbetacdn.com/article/2025/0612/65d19ecd3f331e0.png) 虽然争议尚未讨论出具体结果,但一些关于**o3-pro的测试结果**已经新鲜出炉。 和开头所提一致,官方在更严格的“4/4可靠性”评估中也验证了o3-pro尤为擅长数学、科学和编程。 p.s. 这项评估需要o3-pro在四次尝试中(而不仅仅是一次,pass@1)正确回答问题~ ![](https://static.cnbetacdn.com/article/2025/0612/1378fedbcca7f66.png) 不过官方也多次提醒,由于o3-pro可以使用工具,因此**响应时间通常比o1-pro更长**。 我们建议将其用于对可靠性要求更高的棘手问题,等待几分钟是值得的。 这也和一众网友实测下来的感受相符,**o3-pro确实变强了,能够解决一些其他模型无法答对的问题,不过由于响应变慢,价格也是真贵。** HyperWriteAI CEO让它思考“1+1=?”,结果往往需要耗时1分钟以上(第一次问甚至用时16分钟)。 ![](https://static.cnbetacdn.com/article/2025/0612/b366a08ac68128b.png) 当然,这也恰好代表了o3-pro的错误打开方式。 不论是官方建议还是一些好的网友实测结果,都说明o3-pro**更适合挑战一些有难度、有价值的问题**。 宾大教授Ethan Mollick分享了一个其他模型都曾铩羽而归的问题:从“SPACE”到“EARTH”制作一个单词阶梯。 这个游戏需要模型从“SPACE”到“EARTH”,每次只改变一个字母,单词真实有效且长度不变(右侧为解释“为什么这是一个合法的英语单词”)。 而o3-pro成功完成了挑战,并且这不是模型通过联网搜索得到的答案(即通过推理得到)。 ![](https://static.cnbetacdn.com/article/2025/0612/bbaeefd5453e838.png) 另一位生物医学科学家也分享了**与o3-pro合作开发免疫系统**的例子。 作为对比,他也向o3提出了同一任务(要求先识别出人类天然免疫系统的关键局限性),结果表明o3-pro更胜一筹。 o3列出的前五个问题虽然强调了类似的重要问题,但后两个问题无需彻底重构免疫系统即可解决。 相比之下,o3-pro不仅提出了更多限制,而且它所指出的每一个限制都是极其关键、内在的问题,需要彻底重构。 ![](https://static.cnbetacdn.com/article/2025/0612/5c730da168c1649.png) 整体而言,通过ARC-AGI测试结果可以看到,**o3-pro在高难任务上表现略好,但提升幅度不大,且成本随难度上升。** p.s. 这项测试主要考验AI在面对新问题时的抽象推理和问题解决能力~ ![](https://static.cnbetacdn.com/article/2025/0612/e23b9b22c444fcf.png)奥特曼发小作文 这是我最后一次**在没有任何人工智能帮助的情况下**写这样的文章了。 有意思的是,同一时间奥特曼也火速发了一篇小作文—— 题目为《The Gentle Singularity(温和的奇点)》,来探讨AI发展对人类社会的影响。 ![](https://static.cnbetacdn.com/article/2025/0612/bcad1035aa4c647.png) 其主要观点包括下面这些: 1、2025年,我们迎来了能够真正进行认知工作的智能Agent,编写计算机代码的方式将彻底改变。**2026年,我们很可能会看到能产生原创见解的系统;2027年,或许会出现能在现实世界中执行任务的机器人**。 2、到了2030年代,智慧和能源——即想法及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的基本限制;如果智慧和能源变得充足(加上良好的治理),理论上我们可以实现一切。 3、随着数据中心的生产逐渐自动化,**智能的成本最终应该会接近电力成本**。(很多人关心ChatGPT每次查询用多少能量;平均每次查询大约耗电0.34瓦时,大概相当于烤箱运行一秒多一点,或高效灯泡使用几分钟。此外,每次查询大约用水0.000085加仑,约等于十五分之一茶匙。) 4、相比AI,人类有一个长期且重要的优势:我们天生在意他人,以及他人怎么想、怎么做,而对机器却没什么感情。 5、从相对论的角度看,奇点是一点点发生的,融合是逐步进行的。我们正攀登那条技术指数增长的长弧线;向前看总觉得是陡峭的垂直,向后看则像是平缓的线,**但其实它是一条平滑的曲线**。(回想2020 年,如果那时我们说2025年会接近 AGI,听起来会很疯狂,但对比过去五年所发生的一切,也许现在的预测不那么疯狂了。) 6、我们(整个行业,不只是OpenAI)正在为世界构建一个**大脑**,它的极限将取决于我们的好点子。 7、OpenAI如今做的事情很多,但最根本的身份仍是一个**超级智能研究公司**。 BTW,奥特曼最新推文有透露,原计划中的公开权重模型要推迟了。 ![](https://static.cnbetacdn.com/article/2025/0612/405e614d2a38f62.png) 嗯,又一个期货(doge)~ 完整小作文地址如下: https://blog.samaltman.com/the-gentle-singularity 参考链接: [1]https://x.com/OpenAI/status/1932530409684005048 [2]https://x.com/OpenAIDevs/status/1932532777565446348 [3]https://x.com/aidan_mclau/status/1932507602216497608 [4]https://x.com/sama/status/1932547247243505924 [查看评论](https://m.cnbeta.com.tw/comment/1506258.htm)

2025-06-12 07:06:29 · 0次阅读
 
 
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283128412851286128712881289129012911292129312941295129612971298129913001301130213031304130513061307130813091310131113121313131413151316131713181319132013211322132313241325132613271328132913301331133213331334133513361337133813391340134113421343134413451346134713481349135013511352135313541355135613571358135913601361136213631364136513661367136813691370137113721373137413751376137713781379138013811382138313841385138613871388138913901391139213931394139513961397139813991400140114021403140414051406140714081409141014111412141314141415