今日,**软银集团宣布与OpenAI建立合作伙伴关系,共同开发和销售名为“Cristal intelligence”的高级企业人工智能。**据悉,软银将每年斥资30亿美元在其集团公司中部署OpenAI的解决方案。 此外,**软银和OpenAI还宣布成立一家新的合资企业,名为“SB OpenAI Japan”,将专门向日本的大型企业推广OpenAI的企业技术,双方各占50%股份。** 软银首席执行官孙正义表示,他相信通用人工智能(AGI)将在不到10年的时间内成为现实,并相信“AGI可以首先在大型企业业务中实现”。 **他补充说,要实现这一目标,“需要相当巨额的资金”,而这些资金“目前只有大型企业才有”。** 孙正义认为,“Stargate(星际之门)”项目已经不仅仅是一个私营企业的活动,而是提升为一个国家战略上非常重要的项目。我们相信这个项目将在未来对人类产生重大的影响。 2025年1月22日,特朗普宣布软银、OpenAI、甲骨文联合成立一家新AI公司Stargate(星际之门),计划在未来四年投资5000亿美元,并将立即投资1000亿美元,为OpenAI建设新的AI基础设施。 Stargate的初始股权投资者包括软银、OpenAI、Oracle和MGX,其中软银负责财务,OpenAI负责运营,Arm、微软、NVIDIA、Oracle和OpenAI是该项目的关键初始技术合作伙伴。  [查看评论](https://m.cnbeta.com.tw/comment/1475690.htm)
苹果将推出一项新的 iCloud 服务,旨在管理活动和邀请。 据马克-古尔曼(Mark Gurman)在其为彭博社制作的最新每周播客"On Demand"中报道,这项服务将有别于日历,并将于"下周"推出。  据报道,这项服务的代号为"Confetti",将是一种"邀请用户参加聚会、活动和会议的新方式"。 该服务的推出与 iOS 18.3 的推出息息相关,iOS 18.3 已于上周一月的最后几天开始推出。 新的邀请服务已经出现在操作系统的测试代码中,似乎将集成到 iCloud 应用程序中,并将在 iCloud.com 上推出网络版。 该应用的作用是邀请人们参加活动,用户将能看到哪些人已回复。 与日历应用相比,该应用可能拥有"更有趣的界面",因为日历应用已经具备邀请他人参加活动的基本功能。 [查看评论](https://m.cnbeta.com.tw/comment/1475684.htm)
当地时间2月1日,美国总统特朗普签署行政令,对进口自中国的商品加征10%的关税,同时也向邻国墨西哥、加拿大挥动关税大棒。最新的关税政策将于2月4日起生效。中国外交部、商务部2月2日回应称,中方对此强烈不满,坚决反对,将采取反制措施维护正当权益。 [](https://static.cnbetacdn.com/article/2023/1226/c11e719084c5d7e.webp) 值得关注的是,特朗普此次签署的行政令取消了美国对价值低于800美元的小额货物的“最低限度”关税豁免,这预计将对Temu和Shein等廉价在线零售商的销售产生影响,并削弱中国电商的全球竞争力。 目前美国对800美元以下进口商品采取免税措施,这也助推了Shein和Temu等电商公司在美发展迅速,这些平台每天向美国运送数百万个小包裹。 “最低限度”关税豁免条款自1930年代就已存在。2016年,美国国会对《1930年关税法》第321条进行修订,将小额免税的最低额度从200美元提高至800美元。但近年来,其使用受到越来越多的审查。去年9月,拜登政府采取措施遏制过度使用和滥用“最低限度”条款。 根据美国海关和边境保护局的数据,在过去10年中,进入美国的申请“最低限度”关税豁免的货物数量出现指数级增长,从2015财年的每年约1.39亿件增加到2023财年的每年超过10亿件,增幅超过600%。在2024财年,“最低限度”货物数量再次上升至超过13.6亿件。 记者查询Temu、Shein以及AliExpress等美国网站,它们提供了大量的低价服装、家居用品以及电子产品等,例如15美元的智能手表以及3美元的运动鞋。其中Temu和AliExpress背后分别是中国电商巨头拼多多以及阿里巴巴。 这些廉价商品网站过去几年来受到美国消费者的欢迎。2024年,Temu连续第二年跃居苹果美国下载量最大的免费应用榜首。 中国低价电商平台的崛起也对美国电商巨头亚马逊形成冲击。亚马逊去年推出了自己的低价电商平台Haul,并将于2025年起大规模招商。该平台允许第三方卖家直接从中国向消费者运送商品,平台上的商品价格都在20美元或以下,为卖家拓展了有低价商品购买需求的新客群。 针对美国日益收紧的“最低限度”条款,Temu此前曾回应过,该公司否认其增长依赖于“最低限度”条款。而Shein最新回应称,进口合规是“首要任务”,该公司支持美国对“最低限度”条款的改革努力。 而随着“最低限度”条款的豁免终止,Temu和Shein也寻求其他战略。例如从去年起,Temu已经开始吸引在美国仓库有库存的中国卖家入驻其网站,以便将包裹从美国当地运送给美国购物者。Shein还在美国开设了配送中心和供应链中心。 除了中国的电商公司外,美国公司亚马逊、沃尔玛等零售商也在通过小额包裹关税豁免机制进口商品。美国对外贸易委员会此前发出警告称,削弱小额包裹关税豁免机制将使消费者损失数十亿美元。 [查看评论](https://m.cnbeta.com.tw/comment/1475682.htm)
**海外硬件网络零售平台 Newegg 近日报道称,在前几天英伟达 RTX 50 系列显卡上架销售后,仅在 20 分钟内就售罄。**平台还分析了 RTX 5080 以及 5090 的用户活跃激增。平台产品管理副总裁 Jim Tseng 表示:“对英伟达 RTX 50 系列的反应非凡。压倒性的需求再次展现了游戏和 PC 社区对最尖端技术的热情。” 网站的流量在 20 分钟的内提升了 8 至 10 倍,前十的搜索中有 9 个都是显卡,而访问量最高的 25 个页面中,有18个是显卡的产品页面。 虽然对于平台来说这是好消息,但消费者对于显卡稀缺感到非常失望,而且正如我们之前的报道,一些网站的竞标已经出现了天价的显卡,包括标价 6000 美元的 5090——这是原版显卡价格的 2 倍。  英伟达目前已经回应了这种不满,公司发言人 Tim 在官方论坛上保证,英伟达正“与合作伙伴每天运送更多的显卡,以帮助将显卡送入游戏玩家手中”。 [查看评论](https://m.cnbeta.com.tw/comment/1475674.htm)
台积电最先进的1nm制程新厂传将落脚台南沙仑,规划打造可容纳六座12晶圆厂的超大型晶圆厂(Giga-Fab),借此放大现有南科先进制程生产聚落综效,并北接嘉义,南连高雄、屏东等国科会积极推动的科学园区,成为“大南方新硅谷推动方案”的核心指标投资。 [](https://static.cnbetacdn.com/article/2025/0113/d21661eeae53fa6.jpg) 对于1nm新厂落脚台南沙仑的传闻,台积电表示,设厂地点选择有诸多考量因素,该公司以台湾作为主要基地,不排除任何可能。 台积电已在新竹宝山和高雄楠梓兴建新厂,作为2nm生产基地,消息人士透露,台积电内部将台南沙仑1nm新厂命名“晶圆25厂”。业界解读,台积电在台湾投资最先进的制程,展现公司完成美、日、德等海外布局后,根留台湾的决心。 台积电在台投资不停歇,未来兴建新厂重心将南移,台积电董事长魏哲家日前在主持法说会后受访时证实此说法。此外,台积电本月中旬的董事会将“远征”美国亚利桑那州举行,据了解,届时也可望通过新增屏东投资案。 台积电1nm厂址撤离桃园龙潭后,其他县市极力争取。消息人士透露,台积电感受到嘉义、台南、高雄和屏东等绿营县市提出的配合蓝图和整体规划,尤其高雄极力打造从南科台南园区向南延伸高雄、白埔、桥头、楠梓等科学园区或产业园区,连接仁武产业园区、和发产业园区再到高雄最南端的新材料循环产业园,再与亚湾智慧科技创新园区及晶创计划IC社计中心,形成完整的产业聚落,也就是高雄市长陈其迈不断提倡的“半导体S廊带”。 台积电1nm落脚台南沙仑,等于扩大S廊带的重要性,预料将吸引更多的材料和周边设备供应链投资。 据了解,台积电已向南科管理局提出在台南沙仑设立1.4nm及1nm用地需求,这也意味着六座厂的规划,初期前三座厂、即P1到P3将作为1.4nm生产使用,后三座为1nm。若中科厂能顺利交地,中科厂优先列入1.4nm生产规划蓝图后,台积电在台南沙仑建厂也可能改为前三座为1nm,后三座为0.7nm。 南市府经发局昨日回应,因应厂商建厂需求,南科管理局计划在沙仑园区新设AI生态科学园区,目前相关土地仍在规划中,详细资讯以南科管理局说明为主。 南科管理局指出,沙仑生态科学园区目前依“科学园区新设及扩建园区作业须知”规定办理可行性评估并征求民众意见,将纳入民众意见审慎评估后持续推动。 **台积电,疯狂扩产** 台积电今年将在台湾、美国、日本与德国同步扩产,市场预期,台积电今年新建与在建中的厂区将高达10 座,主要扩充2 nm、CoWoS- L 与海外产能,为有史以来兴建最多厂区的一年,也让厂务工程供应链大啖工程订单。 业界指出,台积电今年持续扩大投资台湾,其中,新竹宝山F20P1 已经完工并开始投产2 nm,F20P2 正持续兴建中;高雄F22P1 也已完工并装机中,预计第二季就可开始量产,P2 、P3 正兴建中,P4、P5 则预计在年后补件闯关环评,期望在今年动工,等同光2 nm就有7 座厂,高雄更成为2 nm生产的大本营。 台积电也因CoWoS 先进封装产能供不应求,积极在嘉科猎地、并买下群创南科厂,期望满足客户需求,其中,嘉科AP7 正兴建中,预计今年第三季完工;南科AP8 也正进行改建,目标将在今年下半年投产,大幅扩充CoWoS-L 产能,以满足英伟达GB200/300 系列产品所需。 另外,为因应地缘政治风险,台积电也稳步推进海外布局,日本熊本第二座厂今年第一季开始兴建,德国德勒斯登第一座厂与美国亚利桑那州第二座厂也投入建厂,可望进一步增加客户投产选择。 业界看好,台积电不仅在台大举扩产,且时程表相当积极,在整体大环境缺工的背景下,也以金钱换取时间,给予较优的工程报价,期望加速完工时间,满足客户需求,也让厂务工程产业环境大好,不少业者正与其他客户协调完工时间,以台积电工程为优先,可望大幅挹注今年营运。 **参考链接** https://news.cnyes.com/news/id/5845810 https://money.udn.com/money/story/5612/8522964 [查看评论](https://m.cnbeta.com.tw/comment/1475672.htm)
这几天,DeepSeek 全球爆火,但由于这家公司过于低调,未有宣发,使得大众对这家极具潜力的科技企业知之甚少——无论是其创立背景、业务范围,还是产品布局。在整理完所有材料后,我便撰写了此篇**江湖录 **:**目前的 AI 玩家,是怎样的背景,在卷那些事儿,以及在招哪些人** 以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。—— DeepSeek 创始人梁文锋 本篇是江湖录的第二篇,也可能是有关 DeepSeek 的最全的历史过往。 本文所有 DeepSeek 相关图片,除非备注,均源自官方发布渠道及其应用程序截图。特别鸣谢“暗涌”发布的两篇对梁文锋先生的深度访谈,其中的真知灼见为本文提供了宝贵的研究素材。 去年此时,幻方量化的朋友找到我,问:“要不要在国内做大模型?”而我,只单纯的喝了半下午的咖啡。果然,人生还是看选择的。 这里所提的**幻方量化,便是 DeepSeek 的出资方**,或者说母体。  所谓量化,便是不由人力,而用算法来进行决策的投资机构。幻方量化的成立时间不算长,起步于 2015 年。到了 2021 年,时年六岁的幻方量化,其资产管理规模便已突破千亿,被誉为中国 “量化四大天王” 之一。 **幻方的创始人梁文锋,也正是日后 DeepSeek 的创立者**,是个“非主流”的 80 后金融领导者:他没有海外留学经历,也不是奥林匹克竞赛获奖者,毕业于浙江大学电子工程系人工智能专业,土生土长的技术专家,行事低调,每天“看论文,写代码,参与小组讨论”。 **梁文锋的身上没有传统企业老板的习气,更像一位纯粹的 “技术极客”**。多位业内人士和 DeepSeek 的研究员,给了梁文锋极高的评价:“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,同时有着“令人恐怖的学习能力”。 **早在成立 DeepSeek 之前,幻方便已开始在 AI 行业进行了长远布局**。2023 年 5 月,梁文锋在接受暗涌采访时提到: “2020 年 OpenAI 发布 GPT3 后,人工智能发展的方向已经非常清晰,算力将成为关键要素;但即便 2021 年,我们投入建设萤火二号时,大部分人还是无法理解”。 基于这一判断,幻方开始构建起自己的算力基建。“从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。几百张卡之前,我们托管在IDC,规模再变大时,托管就没法满足要求了,就开始自建机房。” 之后,《财经十一人》报道,“**国内拥有超过 1 万枚 GPU 的企业不超过 5 家,而除几家头部大厂外,还包括一家名为幻方的量化基金公司**”。而通常认为,1 万枚英伟达 A100 芯片是做自训大模型的算力门槛。 梁文锋在之前的采访中,还提到了一个很有趣的点:**很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动。** **DeepSeek 初见** 在 2023 年 5 月接受暗涌采访时,当被问及 **“前不久,幻方发公告决定下场做大模型,一家量化基金为什么要做这样一件事?”** 梁文锋的回答掷地有声:“**我们做大模型,其实跟量化和金融都没有直接关系。**我们独建了一个名为深度求索的新公司来做这件事。幻方的主要班底里,很多人是做人工智能的。当时我们尝试了很多场景,最终切入了足够复杂的金融,而通用人工智能可能是下一个最难的事之一,所以对我们来说,这是一个怎么做的问题,而不是为什么做的问题。“ 并非出于商业利益驱动,也非追逐市场风口,单单只是对 AGI 技术本身的探索渴望, 以及对 “最重要、最困难的事” 的执着追求,**“深度求索” 这一名称在 2023年5月已被正式确认**。2023年7月17日, “杭州深度求索人工智能基础技术研究有限公司” 注册成立。 **2023年11月2日,DeepSeek 交来了首篇答卷:DeepSeek Coder 代码大模型开源发布**。这个模型包括 1B,7B,33B 多种尺寸,开源内容包含 Base 模型和指令调优模型。  在当时,在开源模型中,Meta 的 CodeLlama 是业内标杆。而 DeepSeek Coder 一经发布,比起 CodeLlama,便展示出多方位领先的架势:在代码生成上,HumanEval 领先 9.3%、MBPP 领先 10.8,DS-1000 领先 5.9%。 要知道,DeepSeek Coder 是 7B 模型,而 CodeLlama 却是 34B。另外,经过指令调优后的 DeepSeek Coder 模型更是全面超越了 GPT3.5-Turbo。  不仅在代码生成上可圈可点,DeepSeek Coder 也在数学和推理上秀了一波肌肉。  3日后,也就是 2023 年 11 月 5 日,DeepSeek 通过其微信公众号,连续发布了大量招聘内容,岗位包括:AGI 大模型实习生、数据百晓生、数据架构人才、高级数据采集工程师、深度学习研发工程师等招聘信息,开始积极扩充团队规模。 正如梁文锋所言,**DeepSeek 在人才招聘上 “必卡的条件” 是 “热爱,扎实的基础能力”**, 并且强调**“创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。”** **模型频发,践行开源** 在 DeepSeek Coder 一鸣惊人之后,DeepSeek 将目光投向主战场:通用大模型。 **2023年11月29日,DeepSeek 发布了其首款通用大语言模型 DeepSeek LLM 67B。**这款模型对标的是 Meta 的同级别模型 LLaMA2 70B,并在近20个中英文的公开评测榜单上表现更佳。尤其突出的是推理、数学、编程等能力(如:HumanEval、MATH、CEval、CMMLU)。  DeepSeek LLM 67B 同样选择了开源路线,并支持商用。为了进一步彰显其开源的诚意和决心,DeepSeek 史无前例地同步开源了 7B 和 67B 两种不同规模的模型,甚至将模型训练过程中产生的 9 个 checkpoints 也一并公开,供研究人员下载使用。这种近乎 “倾囊相授” 的操作,在整个开源社区都极为罕见。 为了更全面、更客观地评估 DeepSeek LLM 67B 的真实能力,DeepSeek 的研究团队还精心设计了一系列 “新题” 进行 “压力测试”,这些题目涵盖了匈牙利高中数学考试题、Google 指令跟随评测集、LeetCode 周赛题等高难度、高区分度的测试。测试结果令人振奋,DeepSeek LLM 67B 在样本外泛化能力方面表现出了惊人的潜力,其综合性能甚至直逼当时最先进的 GPT-4 模型。  **2023年12月18日,DeepSeek 开源了文生 3D 模型 DreamCraft3D**:可从一句话生成高质量的三维模型,实现了 AIGC 从 2D 平面到 3D 立体空间的跨越。比如,用户输入:“奔跑在树林中,搞笑的猪头和孙悟空身体的混合形像”,DreamCraft3D 便可以输出高质量的内容:  从原理上来说,这个模型先完成了文生图,然后再根据 2D 概念图,脑补出整体的几何结构:  在之后的主观评比中,相较于之前的生成方法,超过 90% 的用户表示 DreamCraft3D 的生成质量更具优势。  生成质量用户主观评价 **2024年1月7日,DeepSeek 发布了 DeepSeek LLM 67B 技术报告。**这份报告有 40+ 页,内容包含了 DeepSeek LLM 67B 的多项细节,包括自建 Scaling Laws、完整的模型对齐实践细节、以及全方位的 AGI 能力评估体系等等。 报告地址:https://arxiv.org/abs/2401.02954  **2024年1月11日,DeepSeek 开源了国内首个 MoE(混合专家架构)大模型 DeepSeekMoE:全新架构,支持中英,免费商用。**MoE 架构在当时被普遍认为是 OpenAI GPT-4 性能突破的关键所在,而 DeepSeek 自研的 MoE 架构,在 2B、16B、145B 等多个尺度上均领先,同时其计算成本也非常值得称道。  **2024年1月25日,DeepSeek 发布了 DeepSeek Coder 技术报告。**这份报告对其训练数据、训练方法、以及模型效果进行了全面的技术剖析。在这份报告中,我们可以发现其首次构建了仓库级代码数据,并用拓扑排序解析文件之间依赖,显著增强了长距离跨文件的理解能力。而在训练方法上,增加了Fill-In-Middle方法,大幅提升了代码补全的能力。 报告地址:https://arxiv.org/abs/2401.14196  **2024年1月30日,DeepSeek 开放平台正式上线,DeepSeek 大模型 API 服务启动测试。**注册即送 1000 万 token,接口兼容 OpenAI API 接口,有 Chat/Coder 双模型可用。此时,DeepSeek 开始在技术研发之外,开始探寻技术服务商的道路。 **2024年2月5日,DeepSeek 发布了又一款垂直领域模型——数学推理模型 DeepSeekMath**。这款仅有 7B 参数的模型,却在数学推理能力上直逼 GPT-4,在权威的 MATH 基准榜单上,力压群雄,超越了一众参数规模在 30B-70B 之间的开源模型。DeepSeekMath 的问世,充分展现了 DeepSeek 在垂直领域模型研发上的技术实力和前瞻布局。  **2024年2月28日,为进一步扫除开发者使用 DeepSeek 开源模型的顾虑,DeepSeek 发布了开源政策 FAQ**,对模型开源许可、商业使用限制等常见问题进行了详细解答,以更透明、更开放的姿态拥抱开源:  2024年3月11日,DeepSeek 开源发布了多模态大模型 DeepSeek-VL。这是 DeepSeek 在多模态 AI 技术上的初步尝试,尺寸为 7B 与1.3B,模型和技术论文同步开源。  **2024年3月20日,幻方 AI & DeepSeek 再次受邀参加 NVIDIA GTC 2024 大会,创始人梁文锋发表了题为《和而不同:大语言模型价值观对齐解耦化》的技术主题演讲**。探讨了如”单一价值观的大模型与多元社会文化之间的冲突“,“大模型价值观对齐解耦化”,“解耦化价值观对齐的多维度挑战” 等问题。展现了 DeepSeek 在技术研发之外,对 AI 发展的人文关怀和社会责任的思考。 **2024年3月,DeepSeek API 正式推出付费服务,彻底引爆了中国大模型市场的价格战的序幕:每百万输入 Tokens 1 元,每百万输出 Tokens 2 元。**  **2024年,DeepSeek 顺利通过中国大模型备案,为其 API 服务的全面开放扫清了政策障碍。 ** **2024年5月,DeepSeek-V2 通用 MoE 大模型的开源发布,价格战正式打响。** DeepSeek-V2 使用了 MLA(多头潜在注意力机制),将模型的显存占用率降低至传统 MHA 的 5%-13%,同时,也独辟蹊径地研发了 DeepSeek MoE Sparse 稀疏结构,将模型的计算量大大压缩。凭借于此,而这个模型保持着以“1元/百万输入,2元/百万输出”的 API 价格。 DeepSeek 的影响力非常大。对此,SemiAnalysis 首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。同样的,OpenAI 前员工 Andrew Carr 则认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。 **需知:这是一个对标 GPT-4-Turbo 的模型,而 API 价格只有后者的 1/70**  **2024年6月17日,DeepSeek 再度发力,开源发布了 DeepSeek Coder V2 代码大模型**,并宣称其代码能力超越了当时最先进的闭源模型 GPT-4-Turbo。DeepSeek Coder V2 延续了 DeepSeek 一贯的开源策略,模型、代码、论文全部开源,并提供了 236B 和 16B 两种版本。DeepSeek Coder V2 的 API 服务也同步上线,价格依旧是“1元/百万输入,2元/百万输出”。  **2024年6月21日,DeepSeek Coder 支持代码在线执行。**在同一天,先是 Claude3.5 Sonnet 发布,并上新 Artifacts 功能,自动生成代码并直接在浏览器上运行。同一天的,DeepSeek 官网的代码助手也上线了同样的功能:生成代码,一键运行。  回顾一下这段时间的大事记:  **持续突破,全球瞩目** 2024 年 5 月,DeepSeek 通过 MoE 开源模型 DeepSeek V2,一战成名:对标 GPT-4-Turbo 的性能,但价格只要 1块钱/百万输入,这是 GPT-4-Turbo 的 1/70。那时,DeepSeek 成了业内知名的“价格屠夫”,进而,智谱、字节、阿里...等主流玩家迅速跟进,纷纷降价。也是那时,适逢又一轮 GPT 封号潮,大批 AI 应用,开始初尝国内模型。 在 2024 年七月,DeepSeek 创始人梁文锋,再次接受暗涌的报道,对于这次价格战进行了正面回应:**“非常意外。没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”** 可见,与众多牌桌选手掏钱做补贴不同的是,DeepSeek 在这个定价下,是有利润的。 有人会说:降价很像在抢用户,互联网时代的价格战通常如此 对此,梁文锋也回应到:**“抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论 API,还是 AI,都应该是普惠的、人人可以用得起的东西。”** 那么,故事也就由着梁文锋的理想主义,继续展开。 **2024年7月4日,DeepSeek API 上线128K上下文 价格不变。**模型的推理成本,与上下文长度密切相关。所以很多模型,对于这个长度,限制严苛:初版 GPT-3.5 只有 4k 的上下文。 而此时,DeepSeek 在保持价格不变的前提下(每百万输入 Tokens 1 元,每百万输出 Tokens 2 元),将上下文长度,从之前的 32k 提升到了 128k。  **2024年7月10日,全球首届 AI 奥数竞赛(AIMO)结果揭晓,DeepSeekMath 模型成为了 Top 团队的共同选择**,获奖的 Top4 团队不约而同地选择了 DeepSeekMath-7B 作为其参赛模型的基础,并在竞赛中取得了令人瞩目的成绩。  **2024年7月18日,在 “全球大模型竞技场”(Chatbot Arena)榜单上,DeepSeek-V2 荣登开源模型榜首**,超越了 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等一众明星模型,成为开源大模型的新标杆。  **2024年7月,DeepSeek 持续广纳贤才**,面向全球招募 AI 算法、AI Infra、AI Tutor、AI 产品等多个方向的顶尖人才,为未来的技术创新和产品发展储备力量。 **2024年7月26日,DeepSeek API 迎来重要升级,全面支持续写、FIM(Fill-in-the-Middle)补全、Function Calling、JSON Output 等一系列高级功能。**其中的 FIM 功能非常有趣,即:用户给出开头和结尾,大模型来填补中间的,非常适合编程的过程中,填充准确函数代码。以撰写斐波那契数列为例:  **2024年8月2日,DeepSeek 创新性地引入了硬盘缓存技术,使得 API 价格斩向脚踝。**之前 API 价格,每百万 token 只需 1 元。而现在,一旦命中缓存,API 费用直接降至 0.1 元。  这个功能,在连续对话,以及批量处理任务时,非常实用。   **2024年8月16日,DeepSeek 开源发布了其数学定理证明模型 DeepSeek-Prover-V1.5**,这款模型在高中和大学数学定理证明测试中,均超越了多款知名的开源模型。  **2024年9月6日,DeepSeek 开源发布了 DeepSeek-V2.5 融合模型。**之前,DeepSeek 主要提供的是款模型:Chat 模型聚焦通用对话能力,Code 模型聚焦代码处理能力。而这次,两款模型合二为一,升级成了 DeepSeek-V2.5,更好的对齐了人类偏好,并还在写作任务、指令跟随等方面实现了显著提升。  **2024年9月18日,在 LMSYS 最新榜单上,DeepSeek-V2.5 再次上榜,并领跑国内模型**,在多个单项能力上,也都刷新了国内模型的最好成绩。  **2024年11月20日,DeepSeek 在官网上线了 DeepSeek-R1-Lite**,这是一款推理模型,媲美 o1-preview,也为之后 V3 的后训练,提供了足量的合成数据。  **2024年12月10日,DeepSeek V2 系列迎来收官之作——DeepSeek-V2.5-1210 最终微调版发布。**该版本通过后训练,全面提升了包括数学、代码、写作、角色扮演等在内的多方能力。  DeepSeek 的网页 APP 也随着此版本的到来,开放了联网搜索功能。  **2024年12月13日,DeepSeek 在多模态领域再次发力,开源发布了多模态大模型 DeepSeek-VL2。**DeepSeek-VL2 采用了 MoE 架构,视觉能力得到了显著提升,有 3B、16B 和 27B 三种尺寸,在各项指标上极具优势。  **2024年12月26日,DeepSeek-V3 开源发布:训练成本估算只有 550 万美金。**DeepSeek-V3 在性能上全面对标海外领军闭源模型,生成速度也大幅提升。  API 服务定价进行了调整,但同时为新模型设置了长达 45 天的优惠体验期。   这里有一份来自“赛博禅心”的详实解读:DeepSeek-V3 是怎么训练的|深度拆解 **2025年1月15日,DeepSeek 官方 App 正式发布,并在 iOS/Android 各大应用市场全面上线。**  **2025年1月20日,临近春节,DeepSeek-R1 推理模型正式发布并开源。**DeepSeek-R1 在性能上全面对齐 OpenAI o1 正式版,并开放了思维链输出功能。与此同时,DeepSeek 还宣布将模型开源 License 统一变更为 MIT 许可证,并明确用户协议允许 “模型蒸馏”,进一步拥抱开源,促进技术共享。 当日,“赛博禅心”便提供了一份详实解读:DeepSeek-R1 是怎么训练的|深度拆解 后面,这个模型大火,开创了时代: DeepSeek 完全指南:这到底是怎样的存在? **于是,截止到了 2025年1月27日,DeepSeek App 成功超越 ChatGPT,登顶美国 iOS 应用商店免费应用下载榜首,成为了现象级的 AI 应用。 **  **2025年1月27日,除夕凌晨1点,DeepSeek Janus-Pro 开源发布。**这是一个多模态模型,名称来源于古罗马神话中的双面神“雅努斯”(Janus):它同时面向过去与未来。这也代表了模型的两种能力——既要进行视觉理解,又要进行图像生成,并在多个排行中霸榜。  **DeepSeek 的爆火,旋即引发了全球科技震动,甚至直接导致了 NVIDIA 股价暴跌 18%,全球科技股市市值蒸发了约 1 万亿美元。 **华尔街和科技媒体纷纷惊呼,DeepSeek 的崛起,正在颠覆全球 AI 产业格局,对美国科技巨头构成了前所未有的挑战。  除夕之夜,美股上演了一出中国红 DeepSeek 的成功,也引发了国际社会对中国 AI 技术创新能力的高度关注和热烈讨论。美国总统特朗普罕见地公开赞扬 DeepSeek 的崛起是 “积极的”,并认为这是一个给美国敲响的 “警钟”。微软 CEO Satya Nadella 和 OpenAI CEO Sam Altman 也对 DeepSeek 表示赞赏,称其技术 “非常令人印象深刻”。 当然,我们也要知道,他们的赞扬一方面是对 DeepSeek 实力的认可,另一方面则是各有心思磨刀霍霍,比如 Anthropic 一遍认可着 DeepSeek 的成绩,一边号召美国政府加强对华芯片管制。  Anthropic CEO 发万字檄文:DeepSeek 崛起,白宫应加码管制 **总结与展望** 回顾 DeepSeek 的这两年,真所谓一部 “中国式奇迹”:从名不见经传的创业公司,到如今在全球 AI 舞台上大放异彩的 “东方神秘力量”,DeepSeek 用实力和创新,书写了一个又一个 “不可能”。 这场技术远征的深层意义,早已超越商业竞争的范畴。DeepSeek用事实宣告:**在人工智能这个关乎未来的战略领域,中国企业完全有能力攀登核心技术高地。** 特朗普口中的"警钟",Anthropic暗藏的忌惮,恰恰印证了中国AI力量的不可忽视:不仅能乘风破浪,更在重塑潮水的方向 **产品发布大事记** 2023年11月2日: DeepSeek Coder 代码大模型 2023年11月29日: DeepSeek LLM 67B 通用模型 2023年12月18日: DreamCraft3D 文生 3D 模型 2024年1月11日: DeepSeekMoE MoE 大模型 2024年2月5日: DeepSeekMath 数学推理模型 2024年3月11日: DeepSeek-VL 多模态大模型 2024年5月: DeepSeek-V2 MoE 通用大模型 2024年6月17日: DeepSeek Coder V2 代码大模型 2024年9月6日: DeepSeek-V2.5 融合通用与代码能力模型 2024年12月13日: DeepSeek-VL2 多模态 MoE 大模型 2024年12月26日: DeepSeek-V3 全新系列通用大模型 2025年1月20日: DeepSeek-R1 推理模型 2025年1月20日: DeepSeek 官方 App (iOS & Android) 2025年1月27日: DeepSeek Janus-Pro 多模态模型 **职业机会** 截止到 2025年2月2日,DeepSeek 有以下岗位在招,看看是否会与你有缘。 简历投递:**[[email protected]](/cdn-cgi/l/email-protection)** 你可以说是看到赛博禅心的招聘信息而来的,毕竟咱公众号的读者本就都很硬核。 但这并没什么用,DeepSeek 挑人,还是更看价值观和技术。  [查看评论](https://m.cnbeta.com.tw/comment/1475670.htm)
据《金融时报》报道,Meta在虚拟现实(VR)和增强现实(AR)领域的总投资将在今年超过1000亿美元。此前,Meta CEO马克·扎克伯格(Mark Zuckerberg)已宣布,2025年将是该公司智能眼镜的“决定性一年”。  扎克伯格佩戴智能眼镜 Meta在2014年收购了VR头显制造商Oculus,开启了VR和AR投资计划。根据分析师的估算以及《金融时报》基于Meta所披露信息的计算,自那以来,Meta在VR和AR产品开发及收购方面的累计投资已超过800亿美元。 与此同时,Meta在其最新年报中表示,去年对其现实实验室部门投资了199亿美元,创下新高。Meta预计2025年对该部门的投资将进一步增加,这意味着今年将再增加逾200亿美元,总投资突破1000亿美元。该部门负责开发Meta与雷朋合作的智能眼镜以及Quest VR头显。扎克伯格上周称,雷朋智能眼镜是“真正的爆款”。知情人士透露,该公司在2024年售出了100万副雷朋智能眼镜。相比之下,Quest VR头显的普及速度较慢。 扎克伯格此前表示,预计Meta 2025年的资本支出将在600亿美元至650亿美元之间,将大力发展人工智能。未来几年,Meta还将投入“数千亿美元”继续建设人工智能基础设施。 [查看评论](https://m.cnbeta.com.tw/comment/1475666.htm)
据路透社消息,当地时间2月2日,美国休斯顿机场一架准备起飞的客机引擎突然失火,包括机组人员在内的109人被紧急疏散。报道援引美国联邦航空管理局(FAA)的消息称,发生故障的是一架美联航的客机,当时这架飞机正在跑道上准备起飞,随后引擎故障并引发火情,机组人员收到发动机故障提示后,在跑道上紧急中止了起飞。 图片来源:路透社报道截图 报道称,机上当时共有104名乘客和5名机组人员。美联航随后在一份声明中表示:“乘客通过滑梯和楼梯组合的方式,从跑道上的飞机上撤离,并由大巴车转运至航站楼。”据称,此次事件中无人受伤。 [查看评论](https://m.cnbeta.com.tw/comment/1475664.htm)
OpenAI推出AI Agent“深度研究”,分析师要失业了?当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名称叫做“深度研究”(Deep Research),旨在帮助用户利用ChatGPT进行深入、复杂的研究。  OpenAI表示,该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计,提供全面、精准、可靠的研究支持,并且,该功能同样适用于需要进行细致调研的大宗消费决策,例如汽车、家电、家具购买等。 简单来说,ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要,而是需要综合考虑多个网站及其他信息来源,不断深入挖掘直到找到最合适的答案的任务。  Altman写道: “它可以去互联网,做复杂的研究和推理,然后给你一份报告。它真的很好,可以完成需要数小时/数天且花费数百美元的任务。” “它计算量很大且速度很慢,但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”  对此,网友们跃跃欲试,有人“已经准备好使用它了”,还有人自报账号请求先一步用上ChatGPT的“深度研究”功能:  也有人提出疑问,ChatGPT的“深度研究”功能比Google的“深度研究”功能更强吗?会不会存在隐私问题?能不能把报告中每句话的首字母大写?  限定发布,未来将拓展至更多用户 Altman表示,ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放,每月限额100次查询,随后将逐步推广至Plus和Team用户,最终扩展至企业级(Enterprise)用户。预计Plus版本将在约一个月后推出,并且未来付费用户的查询限制将“显著提高”。  对此,许多网友表示,200美元/月的ChatGPT Pro订阅费用太贵了: 不是免费的谁在意啊。  还有网友猜测道,等之后实现了AGI,是不是要每月收取2000美金,限额使用10次?  其实,Altman表示,免费用户也能使用,但额度非常少。  需要注意的是,“深度研究”功能目前仅在特定地区推出,OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区(EEA)用户开放。 目前,ChatGPT 深度研究的输出仅限于文本格式。不过,OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外,OpenAI还表示,未来将支持接入“更多专业化的数据源”,包括“订阅制”数据库和内部资源。 **研究精度如何?AI仍存局限** 分析师要大面积失业了吗?关键在于,ChatGPT“深度研究”功能的精准度能否满足专业研究需求?毕竟,AI并不完美,仍然存在“幻觉”(hallucination)问题,即生成错误或虚假信息的可能性。 考虑到这一点,OpenAI透露,每次深度研究的输出都将“完整记录,附带清晰的引用来源及推理摘要,便于用户参考和验证信息”。 不过,分析认为,这一举措是否足以避免AI误导用户仍待观察——此前,OpenAI在ChatGPT内推出的AI搜索功能(ChatGPT Search)已被曝出存在错误回答的问题。TechCrunch评测发现,ChatGPT Search在某些查询上甚至不如Google搜索可靠。 **增强精准度:使用专门优化的o3版本AI模型** 为了提高深度研究的准确性,OpenAI采用了一种特殊版本的o3“推理”AI 模型,该模型经过强化学习(reinforcement learning)训练,专门针对“需要使用浏览器和Python工具的实际任务”。 OpenAI表示,该版本的o3模型“针对网页浏览和数据分析进行了优化”,可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF,并根据新获取的信息灵活调整策略。” 该模型还可以浏览用户上传的文件,绘制并迭代调整图表,在回答中嵌入生成的图表及网页图片,并引用来源中的具体句子或段落。 为了测试该模型的效果,OpenAI采用了一项名为“人类终极考试”(Humanity’s Last Exam)的评估方法,该测试涵盖3000多道高难度学术问题,远超其他AI评估基准,以确保测试难度始终领先于模型的进步水平。 ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高,但相比之下,已经远超其他AI模型的得分: <blockquote><p>Google Gemini Thinking:6.2%</p><p>xAI Grok-2:3.8%</p><p>OpenAI GPT-4o:3.3%</p></blockquote> 不过,尽管如此,OpenAI仍然承认,ChatGPT“深度研究”功能存在局限性,可能会出现错误推断、误解权威信息与谣言的情况,并且,在面对不确定性时往往无法明确表述。 [查看评论](https://m.cnbeta.com.tw/comment/1475662.htm)
负责领导特朗普政府效率部门工作的亿万富翁埃隆·马斯克当地时间周一早上绍了这项工作的最新情况。他说,他们正在努力关闭美国对外援助机构美国国际开发署。  马斯克在X平台上的一次谈话中,讨论了政府效率部(DOGE)的工作。这次谈话的参与者包括前共和党总统候选人维韦克·拉马斯瓦米和共和党参议员乔尼·恩斯特。马斯克一开始就说,他们正在努力关闭美国国际开发署(USAID)。 “它无法修复,”马斯克说,并补充说特朗普总统同意应该关闭它。 这次在线对话发生在人们对马斯克进入美国财政部系统的担忧之际,该系统每年代表联邦机构支付超过6万亿美元的款项,其中包含数百万从政府领取社会保障金、退税和其他款项的美国人的个人信息。 美国参议院财政委员会成员、民主党人彼得·韦尔奇(Peter Welch)要求解释为什么马斯克可以进入支付系统,以及韦尔奇所说的包括纳税人敏感数据的内容。 韦尔奇在一份电子邮件声明中说:“这是一个未经选举的官僚严重滥用权力,这表明在特朗普的白宫里,金钱可以买到权力。” 马斯克得到了特朗普的支持。当地时间周日,当被问及马斯克是否做得很好时,特朗普表示同意。“他是个大幅削减成本的人。有时我们不同意,我们不会去他想去的地方。但我觉得他做得很好。他是个聪明人。非常聪明。他非常热衷于削减联邦预算。” [查看评论](https://m.cnbeta.com.tw/comment/1475660.htm)
韩国首尔高等法院当地时间2月3日就三星电子会长李在镕不当合并与会计造假案进行二审宣判,维持一审判决,认定李在镕无罪。韩国检方指控李在镕涉嫌违反《资本市场法》和渎职,并提请法院判处李在镕有期徒刑5年、罚金5亿韩元(约合人民币259万元)。  李在镕以及三星集团未来战略室前室长崔志成、未来战略室前次长张忠基、未来战略室前战略组长金钟重等人涉嫌在2015年三星集团旗下第一毛织和三星物产两家公司的合并过程中,故意发布虚假信息哄抬第一毛织股价、压低三星物产股价,以帮助李在镕以最低费用继承经营权并强化他在三星集团内的影响力,韩国检方于2020年9月对他进行了起诉。 首尔中央地方法院2024年2月就此案做出一审判决,认定三星集团旗下两家公司合并目的并不仅限于强化李在镕在集团内的影响力,从总体上看,无法将其视为不当行为,且没有证据可证明此举给股东造成损失,该案所有指控均无确凿证据。因而认定李在镕及崔志成等人均无罪,检方不服判决提起抗诉。(总台记者 张昀) [查看评论](https://m.cnbeta.com.tw/comment/1475658.htm)
OpenAI发布了一款新的人工智能工具“Deep Research”,旨在为用户执行耗时的在线研究任务,涵盖从复杂科学问题到汽车推荐等众多领域。这一新工具进一步丰富了这家初创公司的人工智能代理阵容。 Deep Research可能需要 5 到 30 分钟来完成其工作——在你离开或处理其他任务时深入挖掘网络。最终输出以报告的形式出现在聊天中,很快用户还将看到嵌入的图像、数据可视化和其他分析输出,以增强清晰度。这次的时间大大提升了它的能力。例如,在“人类的最后考试”中,Deep Research取得了令人印象深刻的 26.6% 的准确率——远远超过了其最接近的竞争对手 DeepSeek R1,后者的得分低于 10%。这一飞跃凸显了系统的迭代优化和结构化综合能力,证明了在人工智能快速发展的步伐中,有些任务确实需要时间。  在上周日的博客文章中,OpenAI宣布,这项名为“Deep Research”的服务将通过其ChatGPT在线聊天机器人向特定付费客户开放。该工具能够根据用户的指令,在线搜索文字、图像、PDF文件以及用户上传的文件,进而生成一份详尽的报告。OpenAI将这一功能比作研究分析师,并强调它能够在“几十分钟”内完成通常需要一个人“数小时”才能完成的工作。 不过,OpenAI也提醒用户,“Deep Research”仍处于早期阶段,可能会将虚构信息误认为事实,且在区分谣言和准确信息方面可能存在困难。此外,这款研究工具“非常耗费计算资源”,初期用户每月仅能提交100次查询。 [查看评论](https://m.cnbeta.com.tw/comment/1475654.htm)
韩国有关部门周一对釜山航空(Air Busan)一架飞机起火事件展开联合调查。一周前,这架飞机在韩国一座机场起飞前不久起火,导致乘客紧急逃生。韩国国土交通部和负责民用航空事故技术调查的法国民航安全调查分析局等机构正在首尔东南323公里处的釜山金海国际机场进行联合调查。 上周二,釜山航空一架飞往香港的飞机在起飞前在机场起火。机上176人全部通过逃生滑梯安全撤离,但有7人受轻伤。 起火原因尚未确定,但一些乘客和机组人员认为,火灾可能是由手提电池或头顶行李架中的其他物品引起的。  [查看评论](https://m.cnbeta.com.tw/comment/1475652.htm)
据路透社报道,一名加拿大政府高级官员2月2日表示,加拿大将通过相关国际机构,针对美国对加拿大多数产品征收25%关税的举措采取法律行动,并称这一关税“非法且不合理”。  报道称,该官员表示,加拿大政府认为美国特朗普政府这次加征关税属于“非法”,并称此举违反了两国在自由贸易协定和世界贸易组织下达成的贸易承诺。 “我们显然将根据我们与美国达成的协议,采取我们认为可以采取的法律手段。”该官员在渥太华向记者介绍说,“如果有其他对我们来说可行的合法途径,也将被纳入考虑。” 报道称,该官员还表示,美国加征关税以及加拿大采取的反制措施将对加拿大经济产生影响。但他拒绝说明相关细节。 特朗普1日签署行政令,将对进口自加拿大的商品加征25%的关税,路透社提到,该关税措施将于4日开始生效。其中,石油、天然气和电力等能源产品将只被征收10%的关税,并于18日开始生效。 对此,加拿大总理特鲁多1日宣布将对价值1550亿加元(1美元约合1.45加元)的美国输加产品加征25%的报复性关税。特鲁多表示,首批报复性关税将于4日起征收,涵盖价值300亿加元的美国产品。在此21天后,加方将对价值1250亿加元的美国产品征收报复性关税。特鲁多称,加方还在考虑采取非关税手段进行反制。 [查看评论](https://m.cnbeta.com.tw/comment/1475650.htm)
美国总统特朗普周末宣布征收关税,加密货币交易员以削减一系列加密货币头寸作为回应。数据显示,亚洲时间周一上午,以市值计算第二大加密货币以太币一度下跌26.53%,至2135美元,随后跌幅缩窄。这是该加密货币自2021年5月以来的最大盘中跌幅。 预计这些关税将影响美国从加拿大进口的价值数十亿美元商品,并可能扰乱全球贸易。 市场的负面情绪对其他加密货币造成压力,比特币一度下跌近6%,小型加密货币的跌幅更大。  BTC Markets首席执行官Caroline Bowler表示,“特朗普的关税战正在影响整个市场”。 “以太币受到的打击比比特币、Solana和Ripple更大,主要是因为人们预期后三者可能会被纳入美国的数位资产储备,”做市商Acheron Trading高级量化交易员Jonathan Yark说。 截至新加坡上午,以太币交易价格为 2,495美元,比特币交易价格为93,747美元,Ripple下跌近14%,至2.25美元。 [查看评论](https://m.cnbeta.com.tw/comment/1475648.htm)
美国消防员上周五表示,洛杉矶伊顿大火(Eaton Fire)已完全受到控制。在大火持续超过三周后,这是具有象征意义的里程碑。这场大火烧毁了洛杉矶东部超过14,000英亩(约合57平方公里)的土地。 [](https://n.sinaimg.cn/spider20250127/213/w2048h1365/20250127/335a-8dc64e013336b44e7234e2b64c52eaa0.jpg) 加州消防局表示,帕利塞德大火(Palisades fire)也完全受到控制。这场大火在洛杉矶西侧烧毁了23448英亩(95平方公里)的土地。 加州消防局表示,两场大火加上几场小火造成了洛杉矶县历史上最严重的自然灾害,造成28人死亡,16000多座建筑受损或被毁。据洛杉矶县官员称,一度有18万人接到疏散命令。 气象机构AccuWeather预计,火灾造成的破坏和经济损失超过2500亿美元。 [查看评论](https://m.cnbeta.com.tw/comment/1475646.htm)
Mozilla 于 2023 年收购用于检测电商网站虚假评价的 Fakespot,该工具能够对用户提交的评论进行评分以显示准确度,例如刷评价之类的评论就可能会被标记出来,现在Mozilla将其改造成 Fakespot Deepfake Detector 扩展程序,利用 Fakespot 的基础知识和 AI 相关能力来检测文章是否为 AI 生成的。 与其他在线检测 AI 文本工具类似,该扩展程序会分析文本以识别 AI 生成的文本中的某些惯用格式、特征和暗示等,同时使用 Mozilla ApolloDFT 引擎以及其他开源检测模型对内容进行识别。 [](https://img.lancdn.com/landian/2025/02/107711.png) 从用户角度来说我在参考某些内容时希望这是真人撰写的而非 AI 生成的,因为 AI 生成的内容可能缺乏洞察力、创造力或实质内容,以及可能还存在不准确的东西。 从这个角度来说 Fakespot Deepfake Detector 扩展程序可能有些用,但问题是按照蓝点网的观察,这个扩展程序可能要不了多久就会被放弃,原因很简单:没法赚钱。 对谋智基金会来说开发这类工具也需要投入,如果这类工具无法赚钱的话最终下场就是被关停,Fakespot Deepfake Detector 目前来看存在这种窘境,毕竟指望用户付费订阅和检测不太现实。 另一方面是实用性问题,至少目前 Fakespot Deepfake Detector 无法实现自动检测,而是用户选中内容后在右键菜单中进行识别,这种略过于繁琐的操作 (即每次使用都需要手动操作) 可能会让用户放弃使用。 有兴趣的用户可以安装 Firefox 浏览器和 Fakespot Deepfake Detector 试试看,目前该扩展程序仅支持 Firefox 浏览器,不支持 Chromium 系列浏览器。 Fakespot Deepfake Detector:[https://addons.mozilla.org/en-GB/firefox/addon/deep-fake-detector/](https://addons.mozilla.org/en-GB/firefox/addon/deep-fake-detector/) [查看评论](https://m.cnbeta.com.tw/comment/1475644.htm)
2024 年 10 月 Linux Kernel 项目将 11 名俄罗斯内核开发者除名,这种做法在开源社区引起激烈讨论,最终 Linus Torvalds 都下场发布回应。  Linus Torvalds 称除名原因主要是因为各种合规要求,对开发者来说这意味着要谨慎对待贡献者提交的代码,因为稍有不慎就可能引起复杂的法律问题,显然对大多数开源项目开发者来说这些法律问题可能会引起非常麻烦的后果,所以 Linux Kernel 项目的做法就是直接将俄罗斯开发者除名避免引发可能的法律争议。 日前 Linux 基金会发布综合指南帮助开源开发者应对美国外国资产控制办公室 (即 OFAC) 制裁的复杂局面,该基金会称监管合规和网络安全风险增加都给开源社区带来了负担。 大多数 OFAC 的制裁都豁免于信息材料,这些材料通常包括开源代码,但这仅适用于现有代码,即已经提交的代码无需处理,而提交的新代码和修改请求则需要进行审查。 例如当你的项目有俄罗斯开发者提交补丁就可能存在法律风险,按照 OFAC 的制裁要求,虽然被制裁地区的贡献者主动提交的补丁有时候是可以接受的,但如果让这些贡献者积极参与讨论或进行改进则可能引起法律问题。 Linux 基金会虽然无奈但也提到开发者要注意试图通过第三方间接做出贡献的受制裁尸体或单独行动的开发者,也就是受制裁地区的个人和企业 / 组织提交的代码都需要进行审查。  **目前受到 OFAC 制裁的国家或地区包括:**(不含被单独制裁的企业/组织) - 俄罗斯 - 古巴 - 朝鲜 - 伊朗 - 叙利亚 - 乌克兰的以下地区:克里米亚、顿涅茨克、卢甘斯克 Linux 基金会曾表示,OFAC 的制裁规则是严格责任规则,这意味着你是否了解这些规则并不重要,违反这些规则则可能受到严重的处罚,因此了解这些规则可能如何影响你的开源工作非常重要。 **当然现实情况是小公司通常会忽略这些问题,开源许可律师 Heather Meeker 表示:** 说实话小公司通常会忽略这样的规则,因为他们没有资源来分析这些法规,美国政府通常也会忽略小公司,因为美国政府也没有足够的资源来对他们实施强制措施,受到关注的大公司通常需要专业顾问提供帮助。 以上内容全文详见 Linux 基金会官方博客。 [查看评论](https://m.cnbeta.com.tw/comment/1475642.htm)
不知不觉,中国人的春运已经40年了,也见证了中国交通的飞速发展,尤其是铁路与火车,从最早又挤又慢的绿皮车,直到如今舒适快捷的复兴号动车组。在这个特殊的时刻,中国中车精选了10余种具有代表性的车厢型号,一起回顾中国铁路装备的发展史。 今年春运期间,中国中车有**超过4400组动车组、2万台机车**投入到春运服务保障工作。 要说大家印象最为深刻的,自然就是“绿皮车”,也就是**北京型液力传动内燃机车,或者说是22型客车,时速120公里,定员118人,3+2座椅排列。** **这是中国铁路第二代主型客车,总产量达2.6万辆左右,在上世纪从50年代一直用到90年代,直到如今仍然会在春运执行临客任务。** 它拥有多种衍生型号和车种,包括硬座YZ22/YZ22B/YZ22C、软座RZ22、硬卧YW22、软卧RW22、餐车CA22、邮政车UZ212、行李车XL22。 **1985年4月1日,13/14次京沪特快列车升级为直达特快,使用的就是22型客车,北京至上海需要约17小时。**   **担当北京-乌兰巴托-莫斯科国际列车的NY7内燃机车(YW18)、我国第一款准高速列车东风11+25Z、京九直通车SS8 25K客车(RW19K)、京沪直达特快东风11G+BSP25(RW25T)、高速卧铺动车组CRH1E、非统型动车组CRH380A、纵向卧铺动车组CRH2E、卧铺动车组CRH5E、智能动车组CR400BF-C/Z……** 不知道你认识几个?又坐过几个呢?                     [查看评论](https://m.cnbeta.com.tw/comment/1475640.htm)
NorthridgeFix是一家阅历极为丰富的硬件维修机构,见过各种各样奇奇怪怪的损坏产品,但最近收到的一块RTX 3090却相当疯狂,直呼离谱。收到该卡后,维修人员将它插入开机后,却检测不到任何信息,之后拆开惊讶地发现,**GPU芯片、显存芯片统统不见了,有明显的拆卸痕迹。** 同时,**各种元件要么丢失,要么扭曲位置错乱,就像龙卷风现场似的,一片凌乱, 惨不忍睹。**  诡异的是,送修的用户坚称,这块卡放在一台闲置电脑里好几年了,从来没有挖过矿,然而事实上,即便是“矿渣”也不至于如此。 一再追问之下,**用户终于承认,他是低价从一个黄牛那里买的这块卡,黄牛对他保证不是矿卡,只是一直闲置,而他只是把黄牛的原话转发给了维修人员,还希望修一修就能用。** 这事儿搞的,维修人员都不好意思告诉他真相了。 所以,还是那句话:**贪便宜是没有好结果的。**  [查看评论](https://m.cnbeta.com.tw/comment/1475636.htm)
随着Windows 10主流支持临近结束,Windows 11的市场份额正在加速增长。根据Statcounter的最新数据,Windows 10虽然仍占据主导地位,但Windows 11正在迅速缩小差距。 **截至2025年1月,Windows 10的市场份额为60.33%,较上月下降了2.37个百分点,而在2024年1月,Windows 10的份额为66.47%。** 这意味着在过去一年中,Windows 10的份额已经下降了超过6个百分点。  **与此同时,Windows 11的市场份额在2025年1月达到了36.65%,较上月增长了2.53个百分点,创下了历史新高,与去年同期相比,Windows 11的份额增长了8.82个百分点。** 这一增长趋势表明越来越多的用户开始转向Windows 11,尤其是在微软向Windows 10用户全面推送Windows 11 24H2之后。 在其他Windows版本方面,Windows 7的市场份额为2.24%,较上月下降了0.17个百分点;Windows 8.1的市场份额为0.3%,较上月增长了0.03个百分点;而Windows XP的市场份额为0.27%,较上月增长了0.03个百分点。 [查看评论](https://m.cnbeta.com.tw/comment/1475634.htm)
近一周以来,DeepSeek不仅引发了美国硅谷的恐慌,也让很多原本不关心AI的人感受到了中国AI大模型的震撼。不过,国外老牌硬件网站Tomshardware发文称,**DeepSeek可能没有宣传的那么具有颠覆性,在AI领域不存在奇迹。** **以下为文章节选:** 中国初创公司DeepSeek最近因其先进的AI模型R1的计算资源使用量惊人地低,而成为科技界的焦点。 该公司声称DeepSeek的训练成本仅为600万美元以及2048个GPU,其最新的R1模型可以与Open AI的o1相媲美。 **然而,行业分析公司SemiAnalysis报告称,DeepSeek背后的公司花费了16 亿美元的服务器成本,并拥有50,000 个NVIDIA Hopper GPU。 ** 报告称,DeepSeek运营着一个拥有约50,000个Hopper GPU的庞大计算基础设施。根据 SemiAnalysis 的数据,其中包括10,000个H800和10,000个H100,另外还购买了H20芯片。 这些资源分布在多个位置,用于AI训练、研究和财务建模等。SemiAnalysis的数据显示,该公司在服务器上的总资本投资约为16亿美元,估计运营成本为9.44亿美元。 DeepSeek 起源于High-Flyer(幻方),这是一家中国对冲基金,很早就采用了人工智能,并在GPU上投入了大量资金。 2023 年,High-Flyer成立了 DeepSeek,作为一家专注于人工智能的独立企业。与许多竞争对手不同,DeepSeek 仍是自筹资金,这使其在决策方面具有速度和灵活性。 DeepSeek的一个主要优势在于它能够运行自己的数据中心,而大多数其他AI初创公司则依赖外部云提供商。这种独立性允许其完全控制测试和AI模型优化。 此外,它能够快速迭代而不受外部瓶颈的影响,这使得DeepSeek与业内传统参与者相比效率极高。 根据SemiAnalysis的数据,DeepSeek只在中国境内招聘,注重员工的技能和解决问题的能力,而非资历。 DeepSeek面向北京大学、浙江大学等知名高校招聘人才,并提供极具竞争力的薪水。**根据研究,DeepSeek的一些人工智能研究人员的薪酬超过130万美元(约合942.7万元人民币),超过了 Moonshot(月之暗面)等其他领先的中国人工智能公司的薪酬。** SemiAnalysis报告称,由于人才的涌入,DeepSeek率先推出了MLA等创新技术。DeepSeek 强调效率和算法改进,而不是蛮力扩展,重塑了人们对AI模型开发的期望。 出于多种原因,这也让大家相信,技术的快速进步可能会减少对高端GPU的需求,从而对NVIDIA等公司产生利空应影响。 最近有消息称,DeepSeek 仅花费600万美元训练其最新模型,但这个数字仅指总训练成本的一部分——不包括研究、模型改进、数据处理或整体基础设施费用。 事实上,自成立以来,DeepSeek在人工智能开发上花费了超过5亿美元。SemiAnalysis认为,与受官僚主义困扰的大型公司不同,DeepSeek 的精益结构使其能够积极推动人工智能创新。 DeepSeek的崛起凸显了一家资金雄厚的独立AI公司如何挑战行业领导者。但现实情况要复杂得多:SemiAnalysis 认为DeepSeek的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。 **这意味着没有什么奇迹。正如埃隆·马斯克一年前指出的那样,如果你想在AI领域具有竞争力,你就必须每年投入数十亿美元**。  [查看评论](https://m.cnbeta.com.tw/comment/1475632.htm)
据澎湃新闻,台湾女演员、歌手、主持人徐熙媛(大S)**因流感并发肺炎去世**,年仅48岁。流感(Influenza)在中文中称为“流行性感冒”,由于其中带有“感冒”两个字,所以很多人以为它是普通感冒(Common Cold)在流行,对流感掉以轻心,但其实,**得了流感有可能引起严重后果,甚至可能会有生命危险。** 据 WHO 估计,流感在全球每年可导致 300 万~500 万的重症和 29 万~65 万呼吸道疾病相关死亡。一项全球的研究数据估算了 1999~2015 年 33 个国家的死亡率,估计每年流感相关死亡率平均值如下:  **肺炎** **流感最常见的并发症** **临床上把小于 5 岁、大于等于 65 岁**(也有指南界限在大于 50 岁)**、孕妇、产后 2 周内和有慢性基础疾病的人群列为并发症高危人群。**健康的中青年人群流感出现并发症风险低,但也不能因此忽视风险。 图源:参考文献 **肺炎是流感最常见的并发症**,典型表现是咳嗽伴呼吸困难、呼吸急速(> 24 次/分)、缺氧和发热(> 3 天)。肺炎类型包括: **原发流感病毒性肺炎:**流感发作 3~5 日后仍持续存在高热,以及有上述肺炎表现。通常很严重,进展可能很快,不积极干预会有生命危险,特别是有肺部或心血管疾病的人群。 **继发细菌性肺炎:**流感症状有所好转(包括热退)后,再次出现发热和咳脓痰。通常出现在流感数天后(7~14 天),最常见,在重症流感中约占 1/3,继发金黄色葡萄球菌肺炎往往危重。 **细菌和病毒混合感染性肺炎:**参考上两者,可表现为症状逐步加重,也可表现为短暂好转后加重。 **这些流感并发症也要注意** 除了肺炎,流感还有这些并发症也要当心: **1 心脏并发症** 心肌缺血、心肌梗死、心力衰竭,约占成人流感的 12% ,但流感性心肌炎和心包炎罕见。 **2 中枢神经系统并发症** 癫痫发作多见于儿童和癫痫患者,流感相关性脑病更常见于儿童,流感导致成人脑炎、脑血管意外、急性播散性脑脊髓炎和吉兰-巴雷综合征,总体上不常见。 **3 肌肉骨骼并发症** 重度肌炎和横纹肌溶解(极度肌痛、无力、尿色加深)更常见于儿童。虽然肌痛是流感的突出特征,但真正的肌炎并不常见。 **4 中毒性休克** 在最近几年的甲型和乙型流感暴发期间,既往健康的儿童和成人中出现了中毒性休克样综合征,多跟继发产毒葡萄球菌感染有关。 **5 合并感染 ** 包括肺炎(其它病毒、细菌、真菌)、菌血症、脑膜炎和曲霉菌病。对于发热超过 3~5 日、退热后再次发热,或病程 3~5 天后症状仍持续加重的流感患者,需要警惕。 **流感是什么?** **和普通感冒有什么区别?** **1 普通感冒症状** 典型的普通感冒通常表现为鼻涕、鼻塞明显,其他常见症状包括咽干、痒或痛,咳嗽和不适感,成人感冒很少发热或低热。咳嗽较常见,往往出现在鼻塞、鼻涕症状之后;鼻分泌物可能清稀,也可能呈脓性(不一定是细菌感染)。 **2 流感症状** **流感和普通感冒的最大的差异在于其严重性。**不同人感染流感后的症状轻重不一。轻者症状跟感冒类似,重者则会有上文提到的并发症。 **<strong>对流感掉以轻心,可能导致高危人群忽视疫苗接种或抗病毒药物的及时使用,进而引发严重的、不可逆转的后果。</strong>**例如,因忽略疫苗接种,使流感引发严重综合性疾病,导致儿童死亡;对于老年人来说,这个问题可能更为隐匿,但在临床,不少时候我们可以看到,一场看似普通的感冒可能导致老年人身体状况急转直下,甚至无力回天。 从症状上分辨流感和感冒,有时不会很准确。**最快速、最精确的方法是病原检测,**在临床,如果非要鉴别是由何种病毒造成的感冒,方法可以有病毒培养、抗原检测和 PCR。但是,如果没有办法及时进行检测,随着疾病的发展,**两者的<strong>症状上还是可能出现一些差异:</strong>**  在全球范围内,**流感每年导致大量住院和死亡,属于严重的公共卫生问题。**即使是健康成年人,流感感染后可能出现剧烈的疼痛,由此造成和引发的暂时性劳动力丧失或生活质量下降,也更强烈一些。 **得了流感后怎么办?** **A **自我判断 对于平素身体健康的年轻人(15~65 岁),在流感季节,自己的小区、学校、办公场所等有流感病例,突然出现发热、咳嗽、肌痛或无力症状时,临床可以疑诊流感。 此时不需要流感检测来确诊。自购抗原家庭检测也是一种选择,但受采样技术影响,阳性的准确率可能达不到预期的 50%~70%,有需要明确诊断时,在 1~2 天内多次采样有助于提高阳性的准确率。 - 无并发症的流感,成人的发热和呼吸道症状通常持续约 3 天,随后大多会改善,完全康复可能需要 10~14 日(年纪大、免疫力低下恢复时间更长),部分患者的乏力症状会持续数周。 - 出现并发症的流感,或者有脱水(口渴、疲倦、尿少黄)、心肺功能受损、精神状态改变的情况,通常属于重症,应住院治疗 **B 疑诊或确诊流感时**,符合以下任一情况,需要积极抗病毒治疗: **① 并发症高危人群:**高危人群流感,无论症状轻重、病程是否超过 2 天,都建议抗病毒治疗。 **② 高危人群接触者:**非高危人群流感,但会接触到高危人群(比如家里有小孩、老人等),无论症状轻重、病程是否超过 2 天,也建议抗病毒治疗。 **③ 流感持续或重症:**流感样症状持续进展,超过 3 天,或者出现流感并发症、重症时。重症或病程超过 2 天时建议遵循医嘱选用对应抗病毒药物及时治疗。 **C 不属于以上三种情况,用药前先权衡利弊:**病程在 48 小时内,可以根据自身生活、工作或学习等需要,跟医生沟通后决定是否给予抗病毒治疗,因为轻症流感可以自愈,药物可以缩短病程,但同时有增加耐药风险。 如果病程已经超过 48 小时,又不符合上面三点需要用药的情况,不建议抗病毒治疗。 **划重点** 流感危害可以很大,易引发严重并发症,对高危人群尤为致命,因此,**一定要重视流感疫苗接种!!!** 每年的 9 月和 10 月通常是接种流感疫苗的好时机,但即便在 10 月底前没有打上疫苗,在整个流感季都是可以接种的。而且,由于流感病毒易发生变异,每年流感流行株可能发生变化,因此,**流感疫苗每年都要接种!!!** [查看评论](https://m.cnbeta.com.tw/comment/1475630.htm)
据业内消息人士称,美国人工智能(AI)企业OpenAI的创始人兼CEO萨姆·奥特曼将于本周访问韩国,与韩国本土开发人员一起举行活动。据悉,OpenAI将于周二在首尔举行由韩国人工智能企业和创业公司参加的“建设者实验室”(Builder Lab)活动,届时奥特曼将出席。 [](https://n.sinaimg.cn/tech/transform/725/w464h261/20250129/9470-29f3b0d6768fb7439fd0cb5646bd4d72.webp) 这将是奥特曼第三次访问韩国,他上一次访问韩国是在2024年1月,当时他参观了三星电子公司位于首尔以南平泽的生产设施。 在全球人工智能(AI)产业发生巨大变化的情况下,特别是最近中国人工智能创业公司DeepSeek推出最新大模型后,奥特曼的首尔之行备受关注。 奥特曼预计将于周二宣布与韩国科技企业Kakao的合作。Kakao首席执行官Chung Shin-a将于当天举行记者招待会。 Kakao去年推出了新的综合人工智能品牌Kanana,并计划在2025年晚些时候推出这项服务。业界预测,Kakao将把OpenAI的模式整合到自己的人工智能平台中。 除此了这些活动之外,奥特曼预计还将会见SK集团会长崔泰源等韩国商界领袖,探讨人工智能合作的可能性。 据悉,奥特曼还将与三星电子相关人士进行会谈,但是否会见三星电子会长李在镕还不清楚。 [查看评论](https://m.cnbeta.com.tw/comment/1475626.htm)
**OpenAI CEO(Sam Altman)奥特曼即将开启全球巡演,积极启程拜会投资人、产业领袖。**据报道,奥特曼在30日一场闭门会议向政策制定人士提出他的担忧,认为DeepSeek凸显“Stargate计划”的必要性。本周起,**奥特曼将前往日本、韩国、印度、德国、法国、迪拜,与投资者、开发商及业界领袖会面。** [](https://static.cnbetacdn.com/article/2024/0928/837988c4a41a8de.webp) 据悉,奥特曼周一于东京将拜访软银集团创办人暨社长孙正义,日本总理石破茂也与OpenAI总裁布洛克曼(Greg Brockman)会面。 然后奥特曼将前往首尔,去新德里与投资人洽谈合作,然后周五参加柏林工业大学的AI专题演讲。 接着下一周,奥特曼将参加巴黎AI高峰会,包括Google DeepMind执行长哈萨比斯(Demis Hassabis)、Anthropic共同创办人暨执行长阿莫迪(Dario Amodei)也会出席。 随后奥特曼前往迪拜参加世界政府高峰会,同场还有 Google 执行长皮蔡(Sundar Pichai)、甲骨文董事长艾利森(Larry Ellison)及阿里巴巴集团主席蔡崇信。 “人们对OpenAI的技术非常感兴趣,包括我们下一代 AI Agent如何实现经济价值。”OpenAI 31 日声明表示,“我们将在未来几周与多个国家的商业领袖、开发者及合作伙伴会面。” **2025年1月22日,特朗普宣布软银、OpenAI、甲骨文联合成立一家新AI公司Stargate,计划在未来四年投资5000亿美元,并将立即投资1000亿美元,为OpenAI建设新的AI基础设施。** Stargate的初始股权投资者包括软银、OpenAI、Oracle和MGX,其中软银负责财务,OpenAI负责运营,Arm、微软、NVIDIA、Oracle和OpenAI是该项目的关键初始技术合作伙伴。 [查看评论](https://m.cnbeta.com.tw/comment/1475624.htm)
上月9日,参与美国加州南部山火灭火工作的一架CL-415“超级舀子”灭火飞机在空中与一架私人无人机相撞受损,左机翼产生一个10x15厘米的大洞,不得不停飞。该型号飞机在水面滑行时只用12秒就能吸进6000升水,然后直飞火场,在水源地与火场之间来回穿梭灭火,**加州消防局仅拥有两架该型号飞机,而且是从加拿大租赁的。**  事后美国联邦调查局、美国联邦航空管理局等部门展开调查,近日,调查有了新进展。 涉嫌操作无人机的男子名为彼得·特里普·阿克曼 (Peter Tripp Akemann) ,是Treyarch工作室联合创始人,空舞互动娱乐前总裁。 当前他已对“不安全操作无人机”这一罪名认罪,**承认鲁莽操作自己的大疆Mini 3 Pro无人机,造成消防飞机损坏,维修费用至少为65169美元(当前约47.5万元人民币)**。 阿克曼同意向提供这架飞机的魁北克政府和修理这架飞机的飞机维修公司支付全额赔偿,并完成150小时社区服务,而美国检察官办公室将降低其罪行级别。  [查看评论](https://m.cnbeta.com.tw/comment/1475622.htm)
美国总统唐特朗普对加拿大和墨西哥征收的关税将威胁到北美汽车制造商的生产,并使创纪录的汽车价格进一步上涨,大约2500亿美元的贸易将受到影响。特朗普周六兑现了他的警告,对从这两个国家进口的商品征收25%的关税,并将此举归咎于移民和毒品流入美国边境,以及巨额贸易逆差。 除非出现意外,否则关税将于当地时间周二凌晨12:01生效,给制造商不到48小时的时间来考虑该怎么做。 [](https://n.sinaimg.cn/spider20230303/576/w881h495/20230303/fdd8-9c558ae5fedac321dded728dec43c1fb.jpg) “汽车行业将在一周内关闭,”加拿大汽车零部件制造商协会主席Flavio Volpe表示,“如果是25%,我们的业务中绝对没有人能长期盈利。” 根据汽车咨询公司艾睿铂(AlixPartners)的研究,这些关税将立即影响到美国每年销售的1600万辆汽车中的近四分之一,以及这些汽车的零部件。2024年,美国进口汽车和零部件市场的规模达到2250亿美元。研究显示,关税将给该行业增加600亿美元的成本,其中大部分可能会转嫁给消费者。 墨西哥汽车经销商协会(AMDA)主席罗萨莱斯(Guillermo Rosales)表示,墨西哥的汽车制造商一直在做准备,先发制人地进口更多零部件和车辆,这可能会在头几周缓解冲击。在那之后,前景就不那么确定了。“一切都取决于特朗普政府在这件事上采取的路线,”他说。 汽车零部件在生产过程中可能在美国边境来回运输多达8次,给依赖这三个国家材料的庞大行业增加了关税。Wolfe Research分析师表示,在供应链的消费者端,一辆新车的平均价格可能会攀升约3000美元,在价格已经接近历史高位的情况下,这将进一步挤压消费者的负担能力。 零部件供应商大陆集团北美业务首席执行官Aruna Anand在接受采访时表示:“这将产生很大的影响。问题是谁在吸收价格,这就变成了,我们有能力吸收这个价格,还是它会转移到终端消费者身上?” [查看评论](https://m.cnbeta.com.tw/comment/1475620.htm)
NVIDIA DLSS 4带来了全新的Transformer大模型、MFG多帧生成技术,后者可以为每一帧画面额外生成3帧,再加上超分技术,帧率最多可提升8倍,但它仅支持RTX 50系列。其实,NVIDIA还低调推出了一种名为**“Smooth Motion”(平滑运动)**的帧生成技术,**一种基于驱动的全新AI模型,通过在两帧之间插入由AI推理而生成的帧,可以让帧率翻倍。** 换言之,它和AMD AFMF技术是同样的原理。 **它的好处是可以用于几乎任何DX11、DX12游戏,无需特殊适配支持DLSS,坏处就是画质、帧率比较一般,不可能和DLSS相提并论。** [](//img1.mydrivers.com/img/20250203/16e563219da14283afea5e5555f864bf.jpg) 目前,最新的NVIDIA App和驱动都已支持Smooth Motion,在图形设置中找到相应的游戏,打开即可,但是暂时仅限RTX 50系列显卡。 **NVIDIA官方确认,Smooth Motion技术正在更多产品上进行测试、验证,未来会下放到RTX 40系列显卡上。** 不过,具体时间没有说,也不确定是否会进一步下放给RTX 30系列。 [](//img1.mydrivers.com/img/20250203/616ec5beefeb4a5ca908d639aa0b57eb.png) [查看评论](https://m.cnbeta.com.tw/comment/1475618.htm)
就在开源的DeepSeek-R1被整合进各路AI搜索工具之际,OpenAI临时举行小型发布会。4点27通知,8点开始直播。ChatGPT上新“Deep Research”,把推理大模型的思考能力用于联网搜索。  据介绍,Deep Research功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。  在“人类最后的考试”上,DeepResearch刷新了最高分,比o3-mini高推理设置分数高出一倍。 该测试包括3000多个多选和简答题,涵盖从语言学、火箭科学到生态学的100多个主题。 与o1相比,Deep Research最突出的地方在化学,人文和社会科学以及数学中,表现出类似人类的“在必要时寻找专业信息”的能力。  另一项测试GAIA,在现实世界问题上评估AI的公开基准测试,Deep Research在3个级别的难度上均刷新记录,平均完成一个问题花费60-70秒。  出于保护基准测试的目的,OpenAI只展示了Deep Research在完成这些任务时的搜索过程,隐去了最终答案。  Deep Research功能接下来将对Pro、Plus和Team用户开放。 奥特曼后面补充,目前版本基于o3构建,Plus用户(20美元/月)每个月能用约10次,且正在构建一个更高效的版本。 此外,免费用户也能获得非常少量的使用额度。  推理Agent的第一步 OpenAI表示,Deep Research专门为在金融/科学/工程等领域从事高强度知识工作、需要深入精确且可靠研究的人群而设计。 它由OpenAI o3驱动,通过基于真实任务(涉及浏览器和Python工具的使用)的训练,采用了与o1相同的强化学习方法。 只需一个提示,它就会查找分析并整合数百个在线资源,生成一份达到研究分析师水平的综合报告。 Deep Research对于OpenAI的重要性,官方原话是: <blockquote></blockquote> Deep Research标志着我们在开发AGI的宏伟目标上迈出了重要一步。我们长期以来一直设想AGI能够进行新颖的科学研究,而Deep Research正是这一愿景的重要进展。 使用方法,点击输入框下方的Deep Research按钮即可,支持上传文件添加额外资料。  例如prompt: <blockquote></blockquote> Compile a research report on how the retail industry has changed in the past 3 years. Use bullets and tables where necessary for clarity.(写一份关于过去三年零售业变化的研究报告,并运用项目符号和表格来提升内容的清晰度) ChatGPT线会确认一下问题细节信息,比如“您能具体说明您最感兴趣的零售业方面吗?”“您需要全球视角还是特定地区的分析?”  然后,它就开始分析+挖掘信息了:  侧边栏会显示所采取的步骤摘要和使用的信息来源。 完成任务的时间大概是5-30分钟,最终结果将以报告的形式输出。  OpenAI表示,接下来几周内,还将为这些报告添加嵌入式图片、数据可视化和其它分析输出。 和GPT-4o等相比,Deep Research对于需要深度和细节的多方面、特定领域的问题,能够进行广泛探索并引用每个观点。 不过,OpenAI也指出了Deep Research存在的局限性。 <blockquote></blockquote> 它有时会在回复中产生事实幻觉或做出错误的推断,尽管根据内部评估,其错误率明显低于现有的ChatGPT模型。 它可能在区分权威信息和谣言方面遇到困难,并且在自信度校准方面目前表现出弱点,常常无法准确传达不确定性。 报告和引用中可能会有轻微的格式错误,并且启动任务可能需要更长的时间。 下一步,OpenAI表示将在本月内将Deep Research推到移动和桌面APP端。目前,Deep Research可以访问公开网络和上传的文件,未来将能够连接到更多专业化的数据源,使其输出更加稳健和个性化。 <blockquote></blockquote> 我们预见ChatGPT将实现Agent体验的融合,用于异步、现实世界的研发和执行。Deep Research(可进行异步在线调查)与Operator(可进行现实行动)的结合,使ChatGPT能够执行越来越复杂的任务。 AI深度搜索是互联网的新界面 OpenAI研究员Jason Wei分享了他对这项新研究的看法: <blockquote></blockquote> 它不仅是出色的Agent,也可以看成是互联网的新界面 人类使用互联网需要大量时间来搜索和点击,受到时间和注意力的限制。 AI永远不会累,一次可以浏览许多网站,并拥有几乎无限的世界知识。 <blockquote></blockquote> 将来,通过浏览器手动浏览互联网将过时,就像手动计算数字而不使用计算器一样。  OpenAI toG业务负责人Felipe Millon则分享了一个个人故事。  10月底,Millon的妻子被诊断出患有双侧乳腺癌,病情很严重,在12月初做了双乳房切除手术,晚些时候开始化疗。 他们遇到一个新问题,是否应该接受放疗,对于她的具体病情来说,这是一个模糊问题,不同的专家给出不同的建议。 Millon在OpenAI已经获得了Deep Research的测试权限,就尝试上传了手术报告,并询问ChatGPT的建议。 ChatGPT不仅证实了人类专家提到的内容,还搜索出了全新的参考研究。 MIllon认为,这是一个将改变世界的工具。  此外也有少数第三方团队提前获得了Deep Research的测试资格,并在今日分享测试结果。 Every团队介绍,一些问题要花费30分钟才得到结果,答案可能超过1万个单词。  他们做的测试包括: 撰写从2020年到今天每一天的历史 阅读《战争与和平》的第1章,分析托尔斯泰的人物描写,回答他对人性的看法是什么? 仔细查阅近期的 10-K 报告以发现未报告的财务违规行为…… 测试中发现的局限性包括: 有时信息缺失引用来源 没有“停止”按钮,如果搜索歪了只能重头开始 [查看评论](https://m.cnbeta.com.tw/comment/1475614.htm)