作者|朱可轩 编辑|陈彩娴 春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性...... 在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。利好在于 DeepSeek 会把整个应用的可能性都打开,换言之就是以后发现 ChatGPT 不用这么贵。 这点在近日 OpenAI 的频繁动作中也可以窥见,其为应战 DeepSeek R1 首次向免费用户提供推理模型 o3-mini,并也在后续升级公开了 o3-mini 的推理思维链,不少海外网友在评论中向 DeepSeek 表示感谢,不过这一思维链仅为总结版。  同时能乐观看到的是,DeepSeek 这一波无疑又将国内拎成一股绳。 在其将模型降本按下加速键后,以其为圆心,上游芯片厂商、中间层云厂以及一众创业公司都在积极加入生态中,为 DeepSeek 模型使用的降本增效持续添砖加瓦。 据 DeepSeek 论文介绍,V3 模型完整训练仅需 278.8 万 H800 GPU 小时,且训练过程十分稳定。 在这背后,MoE 架构是 V3 相比 Llama 3 405B 预训练成本降低十倍最关键的原因,当前,V3 是在公开领域第一个证明 MoE 的稀疏度可以做到这么高的模型。此外,MLA 同样相辅相成,这部分则主要体现在推理侧。 “越稀疏的 MoE 在推理的时候需要越大的 batch size 才能充分利用算力。而限制 batch size 的最关键因素就是 KVCache 的大小,MLA 大幅度缩小了 KVCache 大小。”趋境科技研究员向 AI 科技评论分析道。 从整体上来看,DeepSeek 的成功在于各项技术的组合,而非单一技术。业内评价,DeepSeek 团队工程能力极强,其在并行训练、算子优化等方面也都做得很好,把每个细节做到极致后才实现了最终的突破性效果。 而 DeepSeek 开源也意味着能为大模型整体发展再添一把柴,其现阶段成果还体现在语言模型,业内判断,后续如有类似路线的模型在图像、视频等领域发力,将会进一步带动行业整体需求。 **第三方推理服务的机遇** 据数据显示,DeepSeek 自发布后,截止一月末上线仅 21 天,其日活跃用户 DAU 2215 万,达 ChatGPT 日活用户的 41.6%,超过豆包的日活用户 1695 万,成为全球增速最快的应用,并收割了苹果应用商店 157 个国家/地区第一。 用户大量涌入之余,外网黑客也在疯狂攻击,DeepSeek APP 目前服务器繁忙已有多时,这背后在业内看来,其实也与 DeepSeek 将卡投入训练,用在推理侧的算力不太够有关。 业内人士向 AI 科技评论分析道,“服务器频繁的问题其实很好解决,收费或者融资买更多机器,不过这要看 DeepSeek 的选择了。” 这也是专注技术和产品化的抉择博弈,一直以来 DeepSeek 都在依靠幻方量化实现自我供血,几乎未接受过外部融资,在现金流方面压力不大,所以其技术氛围也相对纯粹。 当前,面对前述问题,一部分用户在社交平台呼吁 DeepSeek 增高使用门槛、加设付费项目来提升自身的使用舒适度。 另外,也有开发者选择调用官方 API 或者使用第三方 API 获得部署优化。不过,日前,DeepSeek 开放平台又发布消息称,“当前服务器资源紧张,已暂停 API 服务充值。”  这无疑为 AI Infra 层的第三方厂商提供了更多机会。 近日,国内外数十家云巨头已纷纷上线了 DeepSeek 的模型 API——海外云厂两大巨头微软、亚马逊于 1 月底便抢先接入。 国内华为云率先出击,在 2 月 1 日与硅基流动合作上新 DeepSeek R1 & V3 推理服务,当前,据 AI 科技评论了解,硅基流动平台服务已被大量用户涌入“打爆”。 BAT 三巨头以及字节跳动也纷纷在 2 月 3 日陆续打出低价限免牌,这波狂欢如同回到去年 DeepSeek 在发布 V2 模型时点燃的云厂价格战,自那时起 DeepSeek 就开始被称为“价格屠夫”。 云厂的疯狂“抢食”和早些年微软云强绑定 OpenAI 的逻辑也有些相似之处: 2019 年,微软云便已早早压注 OpenAI 并注资 10 亿美元,并在 2023 年后者发布 ChatGPT 后吃到了红利。但二者的亲密关系则在 Meta 开源 Llama 后出现了裂痕,开源模型的出现意味着微软云外的其他厂商也能布局自己的大模型。 此次 DeepSeek 不仅在产品侧比 ChatGPT 当年热度更甚,更是在 o1 之后相对应推出了开源模型,这就如同当年的 Llama 开源复现 GPT-3 所引发的轰动一般。 实际上,云厂也是在压注 AI 应用的流量入口,换言之,和更为开发者深入绑定意味着能够抢占先机。据悉,百度智能云在上线 DeepSeek 模型首日,便已有超 1.5 万客户通过千帆平台进行调用。 另外,也有不少小厂给出了解决方案,除硅基流动外,潞晨科技、趋境科技、无问芯穹、PPIO 派欧云等 AI Infra 厂商也已陆续上线对 DeepSeek 模型的支持。 AI 科技评论了解到,目前,针对 DeepSeek 的本地化部署优化空间主要存在于两方面: 一是针对 MoE 模型稀疏性的特性,能够采用混合推理的思路优化,在本地部署 DeepSeek 671B 大小的 MoE 模型,GPU/CPU 混合推理是非常重要的方向,二是 MLA 的优化实现。 不过,DeepSeek 的两款模型在部署优化上还有些许难点问题。 “因为模型大、参数多,优化确实有一定的复杂度,尤其需要本地化部署的话,如何做到效果和成本的最优平衡会有难度。”趋境科技研究员告诉 AI 科技评论。 其中最大难点在于如何克服显存容量的限制。“我们采用异构协同的思路是充分利用 CPU 等其余算力,仅将非Shared 部分的稀疏 MoE 矩阵放在 CPU/DRAM 上并通过高性能的 CPU 算子进行处理,剩余稠密部分放在 GPU 上。”他进一步介绍。 据了解,趋境的开源框架 KTransformers 主要是通过一套注入模板将各种策略和算子注入到原本的 Transformers 实现中,同时,通过通用的 CUDAGraph 等方法大幅度提升 Transformers 的推理速度。 DeepSeek 也为这些创业公司带来了生存空间,当前增长效益已开始初显成效,上线 DeepSeek API 后,不少厂商在与 AI 科技评论交谈中提到,其均得到了明显客户增长,许多客户找上门提出优化诉求。 有相关业者发文表示,“以往稍具规模的客户群体,往往早已被大厂的标准化服务套牢,被他们规模效应带来的成本优势牢牢绑定。然而春节前完成 DeepSeek-R1/V3 的部署后,我们突然接到多家知名客户的合作需求,连此前一度沉寂的老客户也主动联络,希望引入我们的 DeepSeek 服务。” 目前来看,DeepSeek 这波让模型的推理性能变得更加重要,而且大模型普及更为广泛,这会持续影响 AI Infra 行业的发展,如果能够低成本地在本地落地一个 DeepSeek 级别的模型,将会对政府和企业智能化的发展有很大的帮助。 但与此同时,挑战也是存在的,也会有部分客户可能会对大模型的能力期待比较高,在实际的部署使用中,大模型的使用效果、成本这些要做到平衡的挑战更明显了。 **「颠覆英伟达」的冷思考** 当前,除华为外,摩尔线程、沐曦、壁仞科技、天数智芯等数十家国产芯片厂商也纷纷跟进适配了 DeepSeek 两款模型。 有芯片厂商向 AI 科技评论表示,“DeepSeek 在结构上有创新,但还是 LLM,我们适配 DeepSeek 都是聚焦推理应用,所以技术实现上并不难,实现得都很快。” 不过,MoE 这一路线对存储和分布式有更高的要求,再加上使用国产芯片部署也需要考虑一些系统兼容问题,在适配过程中仍有许多工程上的难题需要解决。 “当前,国产算力在使用的便利性和稳定性方面与英伟达仍存较大差异,软件环境、故障排查、涉及底层的性能优化等都需要原厂参与解决推进。”从业者在实践过后告诉 AI 科技评论。 同时,“由于 DeepSeek R1 参数规模较大,国产算力也需要更多节点的并行才能使用。另外,国内在硬件规格上也还存在些许落后,例如,华为 910B 当前还不能支持 DeepSeek 所引入的 FP8 推理。” DeepSeek V3 模型的亮点之一便是引入了 FP8 混合精度训练框架,并在超大规模模型上验证了有效性,这点作为首次公开验证具有重大意义。此前,微软、英伟达等巨头都曾提及过相关工作,但业内一直以来都有声音对此表示质疑。 据了解,相比于 INT8 而言,FP8 的最大优势在于其后训练量化能够获得几乎无损的精度,同时显著提升推理速度,与 FP16 相比,在英伟达 H20 上可以实现 2 倍的加速效果,在 H100 上可获得超过 1.5 倍的加速。 值得一提的是,近期,随着国产算力+国产模型这一趋势的讨论愈发热烈,关于英伟达是否会被颠覆、CUDA 护城河将会被绕开的声音也甚嚣尘上。 一个不可否认的事实是,DeepSeek 确实凭借一己之力让英伟达市值暴跌,但这背后实则是英伟达高端算力方面受到质疑,过往受资本裹挟的算力堆砌论被打破,而目前来看,英伟达卡在训练方面被替代仍旧有难度。 从 DeepSeek 对 CUDA 的使用深度中可以发现,类似用 SM 做通信甚至直接操纵网卡这种灵活性其实不是一般的 GPU 可以支持的。 业内观点也强调,英伟达的护城河是 CUDA 整个生态,并非 CUDA 本身,DeepSeek 所使用的 PTX(并行线程执行)指令仍是 CUDA 生态的一环。 “短期来看,英伟达算力还无法绕开,这点在训练层尤为明显,推理上国产卡的推行会相对容易些,所以进度也会快些。大家做国产卡适配也都是推理侧,没人能用国产卡大规模训练出 DeepSeek 这种性能的模型。”有从业者向 AI 科技评论分析。 整体从推理上来看,对于国产大模型芯片是利好的。国内芯片厂商的机会在推理会更为明显,训练由于要求太高所以很难进。 业内看来,推理国产卡就可以,再不济多买一台机器,训练不一样,机器多了管理起来会累,而且失误率高会影响训练的效果。 训练对集群规模也有要求,推理对集群要求则没那么高,对 GPU 的要求也相对低,当前,英伟达 H20 单卡的性能其实并没有华为、寒武纪强,强在集群。 从算力市场的整体影响情况上来看,潞晨科技创始人尤洋告诉 AI 科技评论,“DeepSeek 这波短期内可能会打击超大训练算力集群的建设和租赁,长期来看,由于其显著降低了大模型训练、推理、应用的成本,市场需求高涨,以此为基础的AI迭代,会继续推动算力市场的持续需求。” 同时,“DeepSeek 在推理和微调侧的需求提升,也更适合国内算力建设比较散、国产算力相对弱情况,减少集群建设后的闲置浪费,这是全国产化的算力生态各层级厂商有效落地的机会。” 潞晨科技也和华为云合作推出了基于国产算力的 DeepSeek R1 系列推理 API 及云镜像服务,尤洋乐观表示,“有 DeepSeek 给大家国产化的信心,后续大家对于国产算力的热情和投入也会更多。”雷峰网雷峰网
**沙江创投主管合伙人朱啸虎在接受采访时透露,若DeepSeek开放融资机会,他明确表示将会进行投资。**值得一提的是,朱啸虎去年曾对AGI(通用人工智能)持谨慎态度,直言“今天谁还在忽悠AGI都是有另外想法的”。 **然而,DeepSeek的出现却让他改变了看法,他认为DeepSeek所展现出的价值意义非凡。** 朱啸虎进一步指出,当前一个类似安卓的开源生态已经崛起,且发展势头迅猛,其他竞争者想要追赶已十分困难。 他强调,**DeepSeek这种聊天机器人将彻底取代传统搜索引擎。**任何一个时代都是重复着同样的韵律——PC互联网时代,搜索是第一个出来的Killer App(杀手级应用),今天也一样,AI时代第一个出来的Killer App也是搜索。 [](//img1.mydrivers.com/img/20250207/530e079fcb0542959bde7a55240e8aa4.jpg) [查看评论](https://m.cnbeta.com.tw/comment/1476874.htm)
**微软联合创始人比尔·盖茨,今天推出了他的个人回忆录《源代码》。**这本自传体作品不仅让读者一窥这位计算机巨匠年轻时的生活片段,也展现了他对技术和创新的无限热情。  盖茨还晒出自己年轻时的老照片,他提到:翻阅我年轻时的老照片既充满乐趣,也有点让人尴尬。 **那时的他,只是沉迷于解决问题、编写代码和享受披萨带来的简单快乐。然而,正是这份纯粹的热爱,最终让他走上了创办微软、推动个人电脑革命的道路。** 值得一提的是,为了纪念自己的母亲,比尔盖茨决定将《源代码》一书的全部作者收益捐赠给全球联合劝募组织。 比尔盖茨称其母亲是最慷慨的人之一。她毕生致力于慈善事业,成为金县联合劝募协会的第一位女会长,后来又担任国际联合劝募协会的董事会主席。  [查看评论](https://m.cnbeta.com.tw/comment/1476872.htm)
极越汽车今日发布用户关心问题说明,感谢用户对品牌的关注与支持,并详细说明了购车定金退款及充电桩安装的最新进展。**截至2月6日,极越已成功为61名用户完成购车定金及全款购车款的退款工作。** 由于退款过程涉及信息收集、审核、确认及打款等人工操作,需要一定时间和人力,因此提醒用户耐心等待并确保填写信息准确无误。 常见的信息错误包括银行卡号填写错误、未填写具体银行名称以及下单人、购车人、手机号归属人信息不一致等。 针对这些问题,极越将通过400客服电话与用户联系,告知后续处理方式。 退款流程为:用户填写信息收集表,极越收到信息后二次确认无误,推送协议,用户签署后极越盖章确认,再次核对付款信息和材料,财务打款,打款结果分为成功或失败,失败则重新收集信 息并启动打款流程。 **在充电桩安装方面,极越已协调首批100名车主的充电桩安装工作,并在春节前通过电话告知相关用户。** 近期将再次与用户沟通确认具体安装流程。充电桩安装流程包括预约上门时间、首次上门勘测、预约施工安装以及完成安装并测试。  [查看评论](https://m.cnbeta.com.tw/comment/1476870.htm)
Meta 公司周五宣布了[PARTNR](https://ai.meta.com/research/publications/partnr-a-benchmark-for-planning-and-reasoning-in-embodied-multi-agent-tasks/),这是一项旨在研究人机交互 (HRI) 的新计划。 该研究特别关注人类和机器人如何在家庭环境中进行协作。 这包括清洁、烹饪和取餐等琐碎工作。  自动化家务劳动是人们几十年来的梦想,《杰森一家》中的罗西就是其中最突出的代表。 60 多年前,机器人女仆首次出现在黄金时段的电视节目中,但在讨论先进机器是否有可能减轻部分家务负担时,它仍然是一个广受欢迎的试金石。 然而,迄今为止,只有机器人真空吸尘器在市场上取得了重大进展。 其他家用机器人未能成为主流的原因有很多,包括价格、可靠性和有限的功能。 这当然不是因为没有尝试,也不是因为消费者不感兴趣。 只是在成本和功能设置方面,还没有其他机器人能达到要求。 要在家庭中看到更多的机器人,很可能需要与拥有它们的人加强合作。 第一波家用机器人不太可能单枪匹马地处理家务。 即使是好的机器人真空吸尘器也时不时需要帮助。 Meta 将 PARTNR 定位为一个基准和数据集,用于确定人与机器人如何合作完成家庭中的各种任务。 "我们的基准包括 10 万项任务,其中包括收拾碗碟和玩具等家务,"Meta 写道。"我们还发布了 PARTNR 数据集,其中包括人类在模拟中演示的 PARTNR 任务,可用于训练体现型人工智能模型。"  仿真已成为机器人部署中越来越有用的工具,使企业能够在几秒钟内测试在现实世界中可能需要数小时或数天才能完成的任务。 不过,Meta 公司表示,在模拟之外部署 PARTNR 模型也取得了成功。 它已经被波士顿动力公司的 Spot 机器人用于测试。 Meta 还建立了一个混合现实界面,旨在为机器人的决策过程提供可视化呈现。 "人机协作领域的创新和发展潜力巨大,"Meta 补充道。"通过 PARTNR,我们希望将机器人重新想象为未来的合作伙伴,而不仅仅是代理,并启动这一令人兴奋领域的研究。" [老年技术](https://agetechcollaborative.org/)在该类别中也蕴藏着巨大潜力。 例如,Labrador的自动上菜车让人们深入了解了技术帮助老年人继续独立生活的方式。 不过,在此类系统获得主流认可之前,还需要取得许多与 Meta 目标相同的进步。 人形机器人是近年来出现的另一个令人感兴趣的领域。 这些双足机器人背后的大多数公司都预见到,未来它们终将为家庭提供帮助。 尽管如此,价格还需要大幅降低,可靠性也需要飞速提高。 这也是大多数制造商希望首先满足企业需求的主要原因。 通过适当的扩展和人工智能的进步,我们可以想象这样一个世界:仿人机器人以一种既能帮助工厂又能帮助家庭的方式处理通用任务。 要实现这一目标,必须在人机协作方面取得长足进步。 Meta 公司在广泛的人工智能研究中一直在探索机器人技术,希望 PARTNR 能够帮助他们实现这一目标。 [查看评论](https://m.cnbeta.com.tw/comment/1476868.htm)
**Meta 正在与联合国教科文组织合作推出一项新计划,收集语音录音和转录,该公司表示这将有助于未来开放式人工智能的发展。**该计划名为"语言技术合作伙伴计划",正在寻求能够提供 10 小时以上的语音录音和转录、大量书面文本以及"各种语言"的翻译句子集的合作者。 据 Meta 称,合作伙伴将与该公司的人工智能团队合作,将这些语言整合到人工智能语音识别和翻译模型中,这些模型在最终确定后将开源。  目前的合作伙伴包括努纳武特地区政府,这是加拿大北部一个人口稀少的地区。 努纳武特地区的一些居民使用统称为"伊努克图特"的因图特语言。 Meta在一篇博客文章中写道:"我们的努力尤其集中在服务不足的语言上,以支持联合国教科文组织的工作。最终,我们的目标是创建能够理解和响应人类复杂需求的智能系统,无论其语言或文化背景如何。" 作为新计划的补充,Meta 表示将发布开源机器翻译基准,以评估语言翻译模型的性能。 该基准由语言学家精心设计的句子组成,支持七种语言,可从人工智能开发平台 Hugging Face 访问并贡献。 Meta 将这两项举措都归结为慈善事业。 但该公司将从升级后的语音识别和翻译模型中获益。  Meta 将继续扩大其人工智能助手 Meta AI 所支持的语言数量,并试行为创作者提供自动翻译等功能。 去年 9 月,Meta 宣布将开始测试在 Instagram Reels 中翻译语音的工具,允许创作者为其语音配音并自动同步。 Meta 对其平台上英语以外语言内容的处理方式一直备受批评。 据一份报告称,Facebook 对近 70% 的意大利语和西班牙语 COVID 不实信息 没有标记,而类似的英语不实信息只有 29%。 公司泄露的文件显示,阿拉伯语帖子经常被错误地标记为仇恨言论。 Meta 表示正在采取措施改进翻译和审核技术。 [查看评论](https://m.cnbeta.com.tw/comment/1476866.htm)
今日,词条#为什么苹果能把十年前的照片变成live#登上微博热搜,词条阅读量超2800万,引起网友热议。有网友表示,翻到十年前妈妈用iPhone 6拍的老照片,疑变成了live图(实况照片)。 据媒体报道,苹果客服对此表示,**拍摄实况照片是iPhone 6S及更新机型推出的功能,iPhone 6并不具备此功能,**一般静态图不会自动变成live图片格式,live图拍摄之初就是动态。  客服称,可能是网友记错或借助其他AI技术照片动起来,网络言论真实性有待考量。  据了解,**使用iPhone拍摄实况照片时,相机会录下拍照前后各1.5秒所发生的一切。** 用户可以将喜欢的实况照片转变为循环视频,或进行长曝光,创造出以前只能由数码单反相机实现的精美效果。 2024年9月,**微信宣布朋友圈正式支持iPhone实况照片,苹果用户打开朋友圈-从手机相册选择,即可选中并发布实况照片,照片将包含动态画面和声音。** 用户发布时也可以点击关闭实况效果,支持静态照片与实况照片混合发布。 [查看评论](https://m.cnbeta.com.tw/comment/1476864.htm)
美国独角兽公司、人工智能处理器芯片制造商Cerebras Systems周四(2月6日)发表声明称,它已经与法国的Mistral AI公司达成合作,并帮助后者造就了一个响应速度最快的开源人工智能助手。 据了解,Mistral AI是法国的一家开源人工智能技术制造商,它的主要竞争对手包括了Meta平台、中国人工智能初创公司DeepSeek等。后者在上月底发布了开源的DeepSeek-R1模型,以低成本实现了尖端性能,震惊了全球市场。 周四,Mistral AI乘着DeepSeek浪潮,发布了一款名为Le Chat的应用程序版本。该应用程序支持自然语言对话、实时网页搜索、文档分析和图像生成等功能,其基础版免费向用户开放,而Pro版本每月的订阅费为14.99美元。  此次Mistral的发布又恰巧赶在下周巴黎举办的人工智能峰会之前。预计在该峰会上,人工智能的欧洲玩家们将向全球观众展现它们的重要性。 **速度是一大亮点** 该聊天机器人的一大亮点在于,它可以以每秒1100个tokens的速度响应用户的问题,接近GPT-4o速度的10倍。  这一速度背后,是Cerebras公司为其提供的计算能力。根据Cerebras的声明,Le Chat是世界上最快的人工智能助手,领先于OpenAI和DeepSeek。 Cerebras首席执行官Andrew Feldman指出,随着市面上更多的大模型越来越向OpenAI的chatGPT靠拢,它们向用户提供答案的速度就开始变得愈发重要。Feldman补充道,“为了得到更好的答案,往往需要在推理时进行更多的计算。” 去年8月,Cerebras Systems基于其自己的芯片计算系统发布了号称世界上速度最快的AI推理服务,并声称比使用英伟达H100 GPU构建的系统快10到20倍。 Cerebras公司是英伟达在训练人工智能模型方面为数不多的挑战者之一。该公司自2019年推出首款AI芯片以来,便一直专注销售AI芯片和计算系统,致力于在AI训练领域挑战英伟达。 该公司的一大金主是阿联酋国有人工智能公司G42。目前其已申请首次公开募股(IPO),但由于美国官员审查G42与该公司的合作,Cerebras的IPO进程被推迟。 [查看评论](https://m.cnbeta.com.tw/comment/1476862.htm)
最近,一则铁路版的贪吃蛇短视频在网络上走红,只见火车蛇形走位一般连续变道,不少网友感慨怎么蛇里蛇气的?小青是你吗?据悉,**这一场景发生在陕西省西安市临潼区新丰镇境内的新丰镇站**,一列列编组完成的货运列车满载民生物资,驶出新丰镇编组站六场。   新丰镇站是中国铁路西安局管辖的一等站,是全国办理量最大的铁路编组站之一,24小时不间断运转,**平均每4分钟就有一趟列车驶出。** 新丰镇站衔接了**陇海线、宁西线、西康线、西安北环线**等重要铁路干线,还是中欧班列等货运列车的关键技术作业站点,在全国铁路网运输中占据着举足轻重的地位。 春运以来,截至2月5日,新丰镇站办理货物列车共计71.8万辆,**日均办理3.26万辆。**     火车之所以能在钢轨上如此丝滑地“蛇形走位”,关键就在于菱形道岔。 **菱形道岔主要用于连接两条不同的铁路线路,通过特殊的转辙机,使列车能够在线路之间灵活转换,广泛应用于铁路枢纽、编组站等区域。**   **所谓铁路编组站,就是各种货车的中转集散地,来自四面八方的货物列车在此汇集、解体,再按照不同的货物类型、去向重新编组成列,由机车牵引发往全国各地。** 比如**郑州北站,就是亚洲作业量最大的列车编组站**,投用于1963年,站型为双向纵列式三级八场,被称为全国设计布局最科学的编组站,有“编组站教科书”之称。 这里担负着南北京广、东西陇海四个方向货物列车和郑州枢纽地区小运转列车的到达、解体、编组及出发作业和装载鲜活易腐货物车辆的加冰上水任务。  [查看评论](https://m.cnbeta.com.tw/comment/1476860.htm)
According to Ctrip, a leading consolidator of hotel reservations, air ticketing and packaged tours in China, flight cancellations to Japan spiked by 178% within 48 hours of the news of Hsu's death, with hotel bookings in Hokkaido plunging by 80%.
The “God’s Eye” system is a high-level smart driving assistant developed by BYD. What sets it apart is its integration of both pure visual driving solutions and LiDAR (Light Detection and Ranging) technology.
据知情人士称,英国安全官员要求苹果公司建立一个所谓的“后门”,允许他们检索全球任何苹果用户上传到云端的所有内容,但这一要求可能遭到苹果拒绝。 [](https://static.cnbetacdn.com/article/2025/0204/9abe619894a6288.jpg) 据未具名的消息人士称,苹果可能会停止在英国提供加密存储服务,而不是违背其对全球用户做出的安全承诺。 据《华盛顿邮报》报道,英国内政大臣办公室向苹果公司提供了一份名为“技术能力通知”的文件,命令其提供访问权限。 今年1月,英国利用其监管权力对苹果和谷歌的智能手机操作系统、应用商店和浏览器展开调查。 [查看评论](https://m.cnbeta.com.tw/comment/1476858.htm)
国产AI硬件、云服务、智算服务与DeepSeek的对接还在深入,现在龙芯中科也加入了这一行列,在一众国产CPU处理器中居于前列。据龙芯中科官方消息,**搭载龙芯3号CPU的设备已于近日成功启动运行DeepSeek R1 7B模型,实现本地化部署。** 经测试,适配后的平台**性能卓越,成本优异**,可提供更快、更强、更省的训推体验。  龙芯3C6000/D双路服务器成功启动DeepSeek  龙芯3C5000服务器+OpenCloudOS Stream23成功启动DeepSeek 据悉,**龙芯联合太初元碁等产业伙伴,仅用2个小时,就在太初T100加速卡上完成了DeepSeek-R1系列模型的适配工作,并快速上线了DeepSeek-R1-Distill-Qwen-7B等多款大模型服务。**  DeepSeek-R1系列模型上线 此外,**采用龙芯3A6000处理器的诚迈信创电脑、望龙电脑,也已完成DeepSeek的本地部署,不再依赖云端服务器。** 这可以有效避免因网络波动或服务器过载导致的服务中断,从而高效完成文档处理、数据分析、内容创作等,显著提升工作效率。  DeepSeek成功部署于诚迈信创电脑 目前,龙芯正积极携手**太初元碁、寒武纪、天数智芯、算能科技、openEuler等**合作伙伴,全力打造DeepSeek系列模型的多形态推理平台。 已适配DeepSeek的国产AI芯片:华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯。 云服务厂商:华为云、天翼云、腾讯云、阿里云、百度智能云、火山引擎(字节跳动)、京东云、联通云、移动云,等等。 智能计算企业有:无问芯穹、硅基流动、云轴科技ZStack、PPIO派欧云、超算互联网、青云科技、算力互联、并济科技、优刻得、神州数码,等等。  [查看评论](https://m.cnbeta.com.tw/comment/1476856.htm)
据彭博社报道,根据美国西点军校发布的最新视频,**埃隆·马斯克(Elon Musk)在去年夏天的一次对话中表示,未来的战争将由人工智能(AI)和无人机主导。**  马斯克在西点军校 去年8月16日,马斯克与西点军校学术委员会主任、准将谢恩·里夫斯(Shane Reeves)进行了一次40分钟的炉边对话。美国当地时间周四晚些时候,马斯克在X上转发了这次对话的视频。 **“当前的乌克兰战争很大程度上已经是一场无人机战争。如果未来爆发大国战争,那很有可能是一场无人机战争。”**马斯克在对话中称。 他表示,**美国需要投资无人机,并提高国内无人机的生产速度。**马斯克称自己经常听着军事历史的有声读物入睡,他告诫国家领导人不要自满。“各国基本上都是依赖过去的战争经验来准备未来战争,而没有针对未来可能出现的新型战争(如无人机战争、AI主导的战争)做好充分准备。”他对在场的军方人员表示。 **马斯克还谈到了星链在战争中的作用。**“星链是乌克兰军方通信系统的支柱,因为它不会被俄罗斯封锁,”马斯克表示,“在前线,所有光纤连接都被切断,手机信号塔被摧毁,地球同步轨道的卫星通信遭到干扰。唯一不会被干扰的就是星链。” [查看评论](https://m.cnbeta.com.tw/comment/1476852.htm)
早在去年 9 月,微软就宣布将在开箱即用体验 (OOBE) 期间的初始设置阶段立即推送 Windows 更新。 几天后,该公司证实,根据IT 管理员和系统管理员的反馈意见,将推迟这一开发计划。今天,该公司公布了有关即将发生的变化的新细节。 这家科技巨头已确认将共享新的组策略和 MDM(移动设备管理)策略,以便管理员能够更好地管理即将到来的 Windows 11 质量更新的部署。  微软写道: <blockquote><p>根据您的反馈,我们将在 2025 年中期发布一项新策略,用于管理组织中的设备是否在 OOBE 期间接收质量更新。 该策略将允许您选择版本为 22H2 及更高版本的新 Windows 11 设备是否在设置期间获得最新的适用质量更新。 您可以通过 Windows Autopilot 和 Windows Autopilot 设备准备配置该设置,从而在 OOBE 中无缝控制更新。</p><p>如果您不通过 Microsoft Intune 使用自动驾驶功能,您仍然可以通过将组策略设置为禁用来禁用 OOBE 期间的质量更新。 该策略将作为移动设备管理 (MDM) 策略和组策略提供。</p></blockquote> 这种情况有点让人联想起去年 5 月推出的另一项变更,这特别与[功能更新部署的管理](https://www.neowin.net/news/it-admins-rejoice-microsoft-to-stop-force-installing-windows-11-feature-updates-on-pcs/)有关。 关于据说将于今年年中推出的新政策,微软[重申](https://techcommunity.microsoft.com/blog/windows-itpro-blog/coming-soon-quality-updates-during-the-out-of-box-experience/4374291),在初始设置时立即推送补丁的想法是为了"开箱即用"地保护设备并确保其安全。 在资源使用方面,该公司指出,"虽然下载和安装时间取决于更新的大小、用户的网络条件和设备的硬件能力,但平均需要 20 分钟"。 [查看评论](https://m.cnbeta.com.tw/comment/1476848.htm)
**苹果公司正在积极考虑为未来的MacBook Pro型号引入无线充电功能**。具体而言,**苹果计划在触控板两侧添加感应线圈,使用户能够直接将iPhone放置在这些区域进行无线充电**。早在2018年,苹果就提交了相关的线圈部署专利技术,并在随后几年不断完善,甚至为外壳材料申请了相关专利。 这一系列动作表明,苹果在这一领域有着深入的布局和研究。 [](//img1.mydrivers.com/img/20250207/4bdf5e52d64f4dd9868c7353bb1260c7.jpg) 然而,将这一功能付诸实践仍面临挑战,将iPhone放置在触控板附近可能影响用户对笔记本的正常操作,尤其考虑到iPhone的尺寸较大。 相比之下,为Apple Watch或AirPods等较小设备进行无线充电可能更为实用。 此外,充电功率也是需要考虑的问题,目前,苹果的无线充电功率最高可达25W,充电速度与有线充电相当。 不过,长时间为iPhone充电可能对MacBook Pro的续航产生影响。 尽管如此,这项技术仍处于苹果的设想阶段,即便苹果决定将其应用于产品,可能也需要等待到明年的新品发布。 [查看评论](https://m.cnbeta.com.tw/comment/1476846.htm)
自 2 月 6 日起日本用户发现无法通过 Apple App Store 搜索或下载部分加密货币交易所应用,受影响的包括但不限于 Bitget、ByBit、MEXC (即抹茶交易所)、KuCoin 以及 Bitcastle 等。  这些加密货币交易所在业界不算是特别出名不过也有众多用户,现在突然无法下载后让日本投资者感到困惑,尤其是如此多的交易所都同时无法下载想必多半是出于日本的监管原因。 除了应用商店里无法搜索和下载外,如果通过日本 IP 地址直接访问 App Store 的链接也会一直显示正在连接中,但无法加载实际页面看不到内容。 日本加密货币相关的媒体 CoinPost 认为苹果下架这些交易所大概率与日本金融服务局 (FSA) 在 2024 年 11 月发布的警告有关,简单来说就是这些交易所不受监管。 日本金融服务局在 2024 年 11 月 28 日向以上 5 家交易所发送了内容类似的警告函,FSA 认为这些交易所未经注册并以日本居民为交易对手,通过互联网开展加密货币交易业务。 按日本在 2017 年的立法规定,只有通过 FSA 颁发许可证的交易所才可以在日本运营,被警告的这些交易所都没有在日本注册自然不可能获得许可证。 不过对用户来说想要绕过这类限制并非难事,只需要换个区域的账号即可,所以通过这种方式进行封锁本质上没有太大的用处,另一方面 Google Play 日区还没有下架这些应用,不知道是不是谷歌还未决定是否处理。 [查看评论](https://m.cnbeta.com.tw/comment/1476844.htm)
今天下午,刘作虎晒出了OPPO Find N5真机照,称“控制折痕这件事你永远可以相信OPPO”。根据刘作虎提供的照片,OPPO Find N5的折痕几乎不可见,像直板手机一样平整,友商三台机型均能看到较为明显的折痕。  除了折痕控制优秀外,OPPO Find N5还做到了全球最薄,其折叠态厚度不到9.2mm,单边厚度在4mm左右。 刘作虎介绍,OPPO Find N5在30个关键部件上采用20种新材料,在不牺牲耐用性的前提下实现了无与伦比的轻薄,而且Find N5主板长度比前代缩短了31.4%,把更多空间留给了电池容量,突破了传统折叠屏的设计局限。 另外,Find N5还搭载高通骁龙8至尊版处理器,支持50W无线闪充,还支持IPX6、IPX8、IPX9防水,这不仅是全球首款骁龙8至尊版折叠屏,也是全球首款支持满级防水的折叠屏。  [查看评论](https://m.cnbeta.com.tw/comment/1476842.htm)
为了应对包括中国人工智能公司 DeepSeek 在内的竞争对手的压力,OpenAI 正在改变其最新的人工智能模型o3-mini传达其逐步"思考"过程的方式。本周四,OpenAI [ 宣布](https://x.com/OpenAI/status/1887616278661112259),该公司的人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的"思维链",其中显示了更多模型的"推理"步骤以及它是如何得出问题答案的。 据 OpenAI 称,在"高推理"配置中使用 o3-mini 的高级 ChatGPT 计划的用户也将看到这一更新的读数。 OpenAI 发言人通过电子邮件表示:"我们为 o3-mini 引入了更新的 [思维链],旨在让人们更容易理解模型是如何思考的。有了这个更新,你将能够遵循模型的推理,让你对它的反应更清晰、更有信心。" 像 o3-mini 这样的推理模型在给出结果之前会对自己进行彻底的事实检查,这有助于它们避免一些通常会让模型翻车的陷阱 。 代价是推理模型需要更长的时间才能得出解决方案,通常需要几秒到几分钟的时间。 DeepSeek的R1模型是一个类似于o3-mini的"推理"模型,它揭示了完整的思维过程,许多人工智能研究人员都认为这是首选的方法。 除了使模型更易于研究之外,推理步骤还能在某些情况下提供更好的用户体验,帮助指示模型何时可能处于正确或错误的轨道上。 部分由于竞争原因,OpenAI 选择不显示 o3-mini 及其前身 o1 和 o1-mini 的完整推理步骤。 相反,用户只能看到推理步骤的摘要--有时是错误的摘要。  不过,OpenAI仍然没有展示o3-mini的完整推理步骤,但该公司表示,它"找到了一个平衡点":o3-mini可以"自由思考",然后将其"想法"整理成更详细的摘要。 "为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,在这个步骤中,模型会审查原始的思维链,删除任何不安全的内容,然后简化任何复杂的想法,"OpenAI 发言人继续说道。"此外,这一后处理步骤还能让非英语用户接收到母语版本的思维链,从而创造出更加易用和友好的体验。" 在上周的一次 Reddit AMA 中,OpenAI 的首席产品官凯文-韦尔暗示这一变化即将到来。 他说:"我们正在努力展示比今天更多的内容--[展示模型的思维过程]很快就会实现。全部待定--展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。" [查看评论](https://m.cnbeta.com.tw/comment/1476840.htm)
 【录音笔】是GPASS推出的一档全新会员专享节目,内容来自机核办公室日程生活和工作中的一些短小记录,每期时长十几分钟左右(大概吧)。内容也许是一些不成体统的碎碎念,也许是一些突然发疯的暴言,还有可能是哪个缺德的把办公室里真实的日常对话(dui ma)偷偷录了下来,总之就连我们自己现在也不知道每期会有哪些人参与,会录些什么。