退出《巴黎协定》后,美国政府已表现出对保护环境的态度,不是他们最关心的。据国外媒体报道称,美国交通部表示,计划撤销一项在美国前总统拜登政府时期通过的有关车辆温室气体减排的规定。 [](https://n.sinaimg.cn/spider20230303/576/w881h495/20230303/fdd8-9c558ae5fedac321dded728dec43c1fb.jpg) 此前拜登政府曾推出严格的尾气排放限制,以控制美国的汽车和轻型卡车带来的污染。 相应举动主要是推动汽车制造商们的电动车和插电混合动力车的销售,并利空油价。 **不过随着特朗普的上台,其推行的却是要提高石油产量,然后对新能源汽车各种不屑,其实这也凸显了保护环境已然不是美国目前最关心的,石化燃料(石油)才是王道。** 需要注意的是,《巴黎协定》协定提出,各方加强对气候变化威胁的全球应对(近200个国家和地区签署),把全球平均气温较工业化前水平升高的幅度控制在2摄氏度之内,并为把升温控制在1.5摄氏度之内而努力;全球将尽快实现温室气体排放达峰,本世纪下半叶实现净零排放。 现在美国退出了上述协定,基本上就是表明了自己的态度。 [查看评论](https://m.cnbeta.com.tw/comment/1475266.htm)
除了西湖醋鱼,杭州还有哪些地方特色呢?作为一个杭州人,差评君**会自嘲地说:还有沉降东站!**杭州的东站建设于 1992 年,**在 2008 年改扩建后一度是亚洲最大的火车站。**但近年来火车站站台沉降却愈发严重,有些地方列车车门和站台相差居然达到三十多厘米。 此外还有北京的火车西站、同济大学的南楼都被人发现,有很明显的沉降。上海的中苏友谊大厦,沉降量甚至达到了 1.9 米! **这些沉降现象,都是怎么回事**?难道建筑的沉降发生了,咱们就没办法去修复它吗? 大家好,之前的视频怎么和大家聊过如何建造大楼、如何拆除大楼,那今天咱们来聊一聊,建筑要是发生了沉降,该怎么办? **沉降是怎么发生的** 如果我们将时间拉长,就会发现,**即便是不朽的山岳,也会在时间的作用下,如同流水那样变换着形态。** 在重力的作用下,建筑物下方的土壤,无法避免得会被逐渐压缩,建筑也随之下沉。 别说是单一的建筑了,整座城市都会在时间中缓慢地下沉。 数据显示,**中国 45% 的中大型城市,每年平均沉降幅度超过 0.3 厘米。** 沉降总是持续而缓慢地发生着,对于现在的人类来说,其实没有一个特别好的解决方式,我们只能在一定程度上去控制它。 **如何尽可能避免沉降** **在国标 5007-2011 这份文件里,详细规定了我国建筑物沉降的允许标准。** 一个建筑的允许沉降范围,会受到土壤条件、建筑类型、建筑高度以及重量的影响。 国标中,有一整套非常细致而复杂的方案去计算它。 通常来讲,我们常见的单层排架结构建筑允许的总沉降量不超过 200mm。而高耸结构,允许的沉降量比较大,但通常也不会超过 400mm。 如果沉降是缓慢而且均匀地整体下沉,那这个影响,其实不是很大。**我们比较害怕的,是出现不规则沉降,表现为建筑歪斜、坍塌等。** 而对于不均匀沉降差所导致的建筑形变等问题,这份国标文件同样给出标准:**通常应控制在 0.5% 以下。** **如何拯救沉降的建筑物** 但是总是会有一些建筑物,会因为一些原因发生远超预期的大幅度沉降。 比如咱们之前提到,如果放在软土层上,土地原本就松软,沉降幅度就会尤其明显。 杭州的沉降东,就是一个很明显的例子。因为东站正位于钱塘江下游的冲积平原上,**地势低平,受水文、地理和气候影响,**这里沉积有大量的粘土、粉砂和砂层,土地松软得就像是一块豆腐,**因而很容易发生沉降。** 此外,城市超采地下水,导致地下水位巨大变化,形成地下空腔,也是常见的沉降发生原因。 城市开展地下空间建设的时候,施工对土壤的扰动,也可能会导致周围建筑的沉降。 当沉降真的发生了,我们该怎么办呢? **怎么拯救** 其实也很简单。 施工团队会评估建筑的沉降情况,然后**通过基础加固、地基处理、结构修复**三管齐下的方式来改善建筑的沉降问题,配合后续的沉降监测,确保建筑的沉降回到一个可以被人接受的程度。  均匀沉降 - 中苏友好大厦 一般来说,均匀沉降,不太会影响建筑的正常使用,比如**杭州的东站**。 当然,一些差友可能会说,沉降东站去过的人都知道,是站台两边沉降,中间不沉,这站台都斜了,为什么是均匀沉降呢? 因为实际上咱们从照片上就能看出,这个地方其实设置了很明显的沉降缝,将整个站台切割成了一段段的,两端沉降下去的部分,其实倒还蛮均匀的。 但……也有例外。 上世纪五十年代,**中苏友好大厦在上海落成,也就是我们今日的上海展览中心。** 当时中国建筑师写的《 向苏联专家学习的体会 》里**提到过一个趣闻**:因为上海是软土地基,所以造高楼一般都得打桩,但苏联专家认为只要让建筑均匀地沉降就行,所以中苏友好大厦没有打一根桩,而是用钢筋混凝土在底部浇出了一个 “ 箱形基础 ”,再在上面盖楼。 然后,好消息是:的确算是均匀沉降。 **坏消息是:沉降得有点儿太快了……** 从 1955 年到 1957 年,中苏友好大厦沉降了约 1.46 米,大厦内多处开裂。 所幸,1957 年,专家们通过对这栋建筑的地基土分析发现,虽然说地基土为高压缩性的淤泥质土,但是在这三年内的沉降,已经将展览馆下面的土给压得很结实了,土内的孔隙减少,孔隙中的水和空气也逐渐被压出,地基的承受力,是没问题的。 **这也算是负负得正、误打误撞了吧。**( 苏联专家:我都说了没问题. jpg ) 因此,在对大厦进行了一番修补之后,这栋建筑仍然能继续投入使用,直到今天,它都作为一个历史的见证者,屹立在上海。 中苏友好大厦,万幸的在于,它的沉降还算比较均匀。如果是不均匀沉降,那就很麻烦了。 不均匀沉降 - 比萨斜塔 **我们熟悉的比萨斜塔,就是一个不均匀沉降的典型案例。** 放在现代,不均匀沉降的案例,也时有发生。把倾斜的建筑扶正,这个工程,就被叫做建筑物纠偏。这个就比一般的沉降要麻烦许多。比如,在发生沉降的时候,工程上一般会通过灌浆等方法加固地基,**但对于已经发生歪斜的建筑,如果贸然加固地基,反而可能导致施工过程中沉降加速**。 在上世纪 30 年代,当时的意大利政府为了修复斜塔,在塔基下一口气灌入 80 吨水泥,结果就反而导致了斜塔的进一步倾斜。 一般来说,**建筑的纠偏,首先第一步就是把建筑物扶正,让它回到 “ 均匀沉降 ” 的状态。** 1990 年,意大利政府为了挽救比萨斜塔,暂时向公众关闭了这座塔楼。 在尝试了大量不同的方法,并测得详实数据之后,1999 年,施工团队开始用挖掘取土的方法进行纠偏。他们在塔基下方取土,让西北侧的土壤变得松软。这样一来,斜塔自然会朝着西北方向逐渐回落。这种取土之法卓有成效,塔身于是逐渐回正。**到了 2001 年,****比萨斜塔已经累计回正了 43.1 厘米。** 当然,由于比萨斜塔早已经成为意大利知名的地标性建筑,所以建筑团队也没有将它彻底扶正,只是让比萨斜塔的倾斜程度回到了一个安全范围。 随后,再加固塔基,并用仪器实时监控沉降,**确保如今的比萨斜塔处于一个 “ 健康 ” 的状态。** 当然,无论怎么样,并不是所有的建筑物,在发生沉降后都有的救……。 著名负面案例 - 旧金山千禧大厦  这是旧金山的千禧大厦。**58 层,高 197 米,曾是旧金山最高的住宅楼**,因其前卫大胆的设计而多次获奖。 这座大厦当年一开盘就迅速售罄,**内部的公寓平均售价高达两百万美元。**然而,在施工完成之前,工程师就已经发现这座大楼,开始缓慢下沉并且发生倾斜。 原因很简单。 旧金山的土壤比较脆弱,无法承受过高的重量,所以,**施工团队在建筑地基下方,打下了 950 根深入地下 13 至 17 米的混凝土桩用于支撑大厦。** 但是,施工团队忽略了一点,在旧金山这个地方,沙质底地层的更下方,还有一层厚实而且柔软的沉积海湾泥。 而在千禧大厦自身的重量,以及周围和大厦同时期建设的其他施工工程影响下,这些海湾淤泥就像是一块橡皮泥似的被压扁了。然后就导致,大楼以远超预期的速度开始沉降,**而且这种沉降还不均匀,西北方向的沉降幅度遥遥领先,致使大楼开始倾斜。** 到了 2018 年的时候,千禧大厦已经朝着西北方向,**倾斜了超过 40 厘米,变成了肉眼可见的 “ 歪楼 ”。** 即便如此,专家仍然试图用一系列数据和报告来向大家证明:这种沉降和倾斜是安全的,没问题,完全可以住人! 但是大厦的住户纷纷表示**:NoNoNo !**我虽然不太懂科学,但我太懂你们这帮资本家的那张破嘴了!要住你们住,我才不干! 所以很快就有人向千禧大厦的开发商提起了诉讼,就一个要求:  旧金山千禧大厦的扶正失败 退钱是不可能的,不规则沉降既然已经发生,**那接下来就只好想办法扶正了**。 为了挽救大楼,施工团队想的第一个办法是:加深基桩,把原本的基桩延长个五十多米,一口气直接穿过淤泥层,打入更深处的岩层上。 但随后大家算了一笔账,发现不太行,加长原有的基桩实在太费钱了,甚至还不如直接重建一座大厦。 但就这么放弃肯定也不行。于是工程团体很快就想出了另一个更具可行性的方案。 整个计划大致可以分为**三步走。** 第一步,是在大楼沉降最严重的西、北两面,打下 52 根新的增强桩。这些增强桩将长达七十多米,直接钉入基岩当中。与此同时,还要通过注浆加固法,固化大厦下方原本的基础。第二步,是用一块外延伸板将大楼底板和这些增强桩连接起来,以分摊大楼承受的压力。 这块外延板可以在增强桩上,上下自由活动。所以,第三步,就是用液压装置,将整个大楼底板缓慢地抬升起来,以扶正大楼。想法虽然很好,但实际上…… 从 2021 年 5 月,施工开始的那一刻起,大厦西侧的沉降速率就开始迅猛上升。等 24 根西侧钢管施工完毕之后,大厦的沉降量增加了相当于此前一年的量,大厦的沉降肉眼可见地进一步增大。 **等到 2021 年 8 月 22 日,整个工程被紧急叫停的时候,大楼已经变成旧金山斜塔了。** **总的来说** 从上述的如许多案例中,我们不难看出,其实人们修复各种沉降问题的方法,虽说细节上存在差异,但整体思路是相似。 就是**对建筑原有的基础进行补强,然后该扶正就扶正,该修复就修复。** 但是,从根本上看,解决沉降问题的真正关键不在于事后修复,而在于提前避免问题。 历史上无数的案例,包括最近发生的事故,都提醒我们,工程安全,是不可逾越的红线。 这就要求我们从一开始就做好准备,先进行详细而全面的地质勘探,充分考虑到土壤结构、承载力、含水率等因素,接着,再**因地制宜地去设计施工方案**。 正所谓,善战者无赫赫之功。任何的修补与加固都无法替代最初的精心策划和精确施工,而这**一份细致和远见,才是让我们的建筑能在岁月流转中,依旧稳固如初的真正保障。** [查看评论](https://m.cnbeta.com.tw/comment/1475264.htm)
Meta确认WhatsApp遭零点击间谍软件攻击,90名记者和活动家被入侵,攻击者使用Paragon间谍软件,Meta已采取法律行动。
这将是中国动漫行业的又一个历史性节点,与以往获得票房突破的动画不同,在春节档的胜利,意味着动漫真正意义上成为具有大众影响力和竞争力的内容品类,它所代表的不是小产业的破圈,而是大众内容趣味的整体性转移。
难得跟能说话的人合作一次,泡泡玛特就翻车了。那还是DeepSeek硝烟四起的春节前,泡泡玛特的公司年会上,为了弥补公司IP都不会唠嗑儿的缺陷,请来了郭麒麟老师——人一上台,直接抖了个大包袱:**“特别高兴能参加咱们境内最大的博彩公司的年会。”**  话音未落,笑声四起,唯一慌了神的是泡泡玛特创始人王宁。他立刻抢过话筒表示,“你这个容易引起歧义啊”,又纠正道“我们是全世界最大的潮玩公司”。 要是一句话,员工笑了,老板慌了。这句话,可能多多少少,有那么点儿真理的成分。 弗洛伊德他老人家就说过,笑话是潜意识的一种表达方式。笑话之所以好笑,也是因为给人带来了一种被压抑或禁忌的观念意识得到释放的快感。 “雪茄可能就是雪茄,而笑话却永远都不仅仅是笑话。” 玩笑话,多少也是真心话。 **王宁为什么会慌?** 因为郭麒麟在“博彩公司”的调侃之后,还补充了一句,“我弟弟是你们用户,他买了你们好多东西”。公开资料显示,郭麒麟的弟弟2015年1月出生,至今也就刚满10岁。  当“博彩”和“未成年人”同时关联出现,就意味着泡泡玛特摊上了法律和道德的双重风险。 **第一,向未成年人销售盲盒商品,应当依法确认已取得相关监护人的同意。** 但你家未成年人买的每一个盲盒,你都事前同意了吗? 国家市场监管总局印发的《盲盒经营行为规范指引(试行)》第二十三条规定: ・盲盒经营者不得向未满8周岁未成年人销售盲盒。向8周岁及以上未成年人销售盲盒商品,应当依法确认已取得相关监护人的同意。 ・盲盒经营者应当以显著方式提示8周岁及以上未成年人购买盲盒需取得相关监护人同意。 ・盲盒经营者应当采取有效措施防止未成年人沉迷,保护未成年人身心健康,在解决未成年人消费争议方面提供便利。  图源国家市场监督管理总局官网 2023年6月,泡泡玛特曾在《指引》发布后向媒体表示对所有门店作了有关未成年人购买盲盒的培训。  然而在线下,各大商场的泡泡玛特自助贩卖机,至今并未设置未成年人身份验证系统,也没有未成年人购买时需要监护人同意的相关确认流程。  在线上,泡泡玛特的官方小程序和电商旗舰店,未成年人的下单流程和购买普通商品无异,至今也无需进行身份验证和监护人同意。  泡泡玛特的2024半年报数据显示,中国内地的渠道收入中,线上渠道贡献了超10亿元的收入,占比达24%。 在中国内地的线下渠道收入中,机器人商店贡献了3.1亿元的收入,占比达17.6%。  图源泡泡玛特2024年中报 如果泡泡玛特真心想做好未成年人监护系统,那为什么在收入占比已经很高的线上渠道和机器人商店,至今还没有落地监护措施? **第二,未成年人不能买彩票,但缺少监管的盲盒却可能成为未成年人的彩票,因为有溢价空间。** 《中华人民共和国未成年人保护法》第五十九条规定,学校、幼儿园周边不得设置烟、酒、彩票销售网点。禁止向未成年人销售烟、酒、彩票或者兑付彩票奖金。烟、酒和彩票经营者应当在显著位置设置不向未成年人销售烟、酒或者彩票的标志;对难以判明是否是未成年人的,应当要求其出示身份证件。 在泡泡玛特的线下自助机和线上渠道,购买盲盒产品无需任何身份年龄证明。在二手平台上,任意系列的一个隐藏款盲盒可以卖出4倍溢价,一个限量款盲盒可以卖出5倍溢价,个人出售和购买这样的溢价盲盒产品,同样无需任何身份年龄证明。  其中,曾被媒体报道过的高溢价珍藏联名款SPACE MOLLY,二手平台的报价多高达数万元。  对此,泡泡玛特曾多次公开回应称,“泡泡玛特过去没有,且未来也不会以任何形式参与潮玩二手市场相关交易”。 “我不做”≈“我不对此负责” **当一门生意,具备彩票的随机奖励性和成瘾性特点,又不需要受制于彩票牌照的管束机制,一定是门好生意。** 除非和未成年人扯上关系。 **公示隐藏款概率+不做二级市场,是泡泡玛特保护自己、与博彩划清界限的最重要策略。** 因为如果盲盒内商品可以直接通过商家兑换现金或转售套利,在许多国家和地区的法律中,才会被认定为是赌博。 根据《大英百科书》对“博彩”的定义,“在明知冒险并依然期待获利的情形下,所参与的用某种具有价值的东西作为投注,其结果全由偶然机会或巧合决定的游戏、竞赛和不确定性事件是为「博彩”。 在西方国家,较为通行的判断是否构成博彩的三大要素是: **对价 (cnsideration) ,机会 (chance),奖品 (prize)。** 在香港,若商业活动涉及“有奖销售”“机会性获奖”“获取高价值商品套利”,就可能被认定为赌博,需受《赌博条例》监管。 在美国,加州的《加州刑法》第330条、纽约州的《纽约州刑法》第225条、德克萨斯州的《德州刑法》第47条、佛罗里达州的《佛罗里达州刑法》第849条均表示,“涉及对价(消费者支付金钱)、机会(奖品随机分配)和奖品(有价值的物品)的活动可能被视为赌博”。 前段时间,江西公安查处的一起“盲盒”网络赌博案中,也是因为其搭建的盲盒抽取平台内可以将抽取的盲盒物品兑换成现金,被判定为具备赌博平台特征,被警方以“涉嫌开设赌场罪”扣押。  **泡泡玛特官方不做二级市场,自然也就从法律上撇清了“奖品套利”的嫌疑。** 这也是为什么,在大众认知里盲盒是有博彩性质的,但在现实中,全世界最大的盲盒公司泡泡玛特却从未受到与赌博、博彩相关的法律惩罚的原因。 没有博彩的法律风险,但有比肩博彩的概率和利润。 **从概率上看,泡泡玛特抽中隐藏款的概率,的确比博彩业有过之而无不及。** 在泡泡玛特官方旗舰店销量前列的盲盒中,SKULLPANDA系列隐藏款概率为1:144(约0.694%),阿尼亚系列隐藏款概率为1:72(约1.39%),DIMOO系列小隐藏款概率为1:144,大隐藏款概率为1:288(约0.35%)。 在博彩业中,美式轮盘赌的中奖概率为 1:38(约2.63%),欧式轮盘赌的中奖概率为1:37(约2.7%),二十一点的黑杰克中奖概率约4.8%,刮刮乐小奖的中奖概率为1:4—1:10(约10%-25%),体育博彩的庄家优势中奖概率约为5%-10%。 从毛利率上看,泡泡玛特财报数据显示,2020年至2023年,毛利率分别为63.42%、61.43%、57.49%和61.32%。 而全球知名的博彩企业里,拉斯维加斯金沙集团、美高梅国际酒店集团、凯撒娱乐等,常年整体毛利率也不过在50%左右。 有博彩的特性和利润,却没有博彩的风险,谁看了不夸一句真是个好生意? 今年春节,我看到了亲戚家15岁小孩收集的半面墙盲盒手办,有自己抽的,也有花了999元买的隐藏款。她向我介绍这些盲盒手办时,总会强调“这个娃很值钱的”。  这让我想起了《三联生活周刊》曾在一篇关于小学生沉迷小马宝莉抽卡的报道中,这样描写孩子们对“卡”的价值期待: 几乎每一个孩子都会对我们不停地强调“这张卡很值钱”。 卡牌和盲盒类似,虽然是小额支付,但其购买是基于概率,已经偏向是一种博彩行为。而博彩的不确定性是具有一定成瘾性的,长期购买此类商品会对未成年人的身心造成不利影响。 **在抽卡和抽盲盒这件事上,无论企业如何强调自己的娱乐属性,只要没有真正全面落地的未成年监护措施,就无法避免令未成年消费者上瘾的命运,也无法真正撇清自己与博彩的关系。** 郑州大学的张彬教授在论文《博彩法视角下的盲盒销售及规制》中,从成瘾性和社会问题两个视角,探讨了盲盒与赌博危害的一致性: ・上瘾已被公认为是博彩危害性的一种表现。就盲盒而言,从成瘾性角度看,其与赌博本质上具有同等危害性。 ・博彩负面影响的核心是“问题博彩”,其呈现出“参与者无法控制自己在博彩游戏中投入的时间和金钱,从而使自己、家庭和社会都受到了影响”的特征。与问题博彩相同,盲盒的负面影响中也存在着此类社会问题  图源郑州大学张彬著《博彩法视角下的盲盒销售及规制》 在泡泡玛特年会上,郭麒麟说完“最大的博彩公司”之后,王宁慌忙纠正其为“最大的潮玩公司”。 也许王宁真的是信了自己说的话了,才请能说话的郭麒麟来参加活动。毕竟能说话,就意味着风险暴露。 **你看彩票公司哪有请明星打广告的。** [查看评论](https://m.cnbeta.com.tw/comment/1475262.htm)
免费用户也可使用o3 mini推理模型了!北京时间2月1日凌晨,OpenAI正式发布o3-mini,这是OpenAI推理系列中最新、最具成本效益的模型,已在ChatGPT和API中开放使用。这可以看作OpenAI对过去一周多风靡美国市场的DeepSeek的回应。  在o3 mini发布的同时,OpenAI高管团队还在Reddit上举办了一场线上的AMA(ask me anything),回答有关o3 mini以及AI发展相关的一切问题。 在被问及是否会考虑发布一些模型权重以及一些研究时,OpenAI首席执行官Sam Altman首次承认:“我个人认为,我们在这里站在了历史的错误一边,需要找出一个不同的开源策略。OpenAI中并非所有人都认同这一观点,这也不是我们当前的最高优先事项。” 此外,OpenAI高管团队还讨论了o3 mini的功能、价格以及其他产品更新、算力等相关的话题。 可以说,如果没有DeepSeek,OpenAI不会这么快做出回应,无论是模型还是言论。 **1.OpenAI首次将推理模型开放给免费用户** 本次发布的o3-mini在2024年12月发布了预览版本,是OpenAI首个支持高度请求的开发者功能的小型推理模型,包括函数调用、结构化输出和开发者消息。o3-mini将支持流式传输,开发者还可以在三种推理努力选项——低、中、高——之间进行选择,以优化其特定用例。这种灵活性使得o3-mini在解决复杂挑战时可以“更努力地思考”,或者在延迟是关键问题时优先考虑速度。但是o3-mini不支持视觉能力,因此开发者应继续使用OpenAI o1进行视觉推理任务。 OpenAI表示o3-mini突破了小型模型所能实现的界限,提供了卓越的STEM(Science、Technology、Engineering、Mathematics)功能,尤其擅长科学、数学和编码,同时保持了o1-mini的低成本和低延迟。专家测试人员的评估表明,与OpenAI o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。 OpenAI表示,测试人员在56%的时间里更喜欢o3-mini的回答,并观察到在困难的现实问题上重大错误减少了 39%。在中等推理努力下,o3-mini在一些最具挑战性的推理和智力评估(包括 AIME 和 GPQA)上的表现与o1相当。  o3 mini在数学竞赛AIME 2024的成绩表现,图片来自OpenAI 价格层面,OpenAI提供了不同的套餐设置:Pro用户将可以无限制访问o3-mini,而Plus和Team用户将拥有三倍的速率限制(与o1-mini相比);免费用户可以通过选择消息编写器下方的“Reason”按钮在ChatGPT中尝试o3-mini。 这是OpenAI首次将推理模型开放给免费用户,此前发布的o1模型只有ChatGPT plus会员可以使用。而免费开放的原因其实也很显然,那就是被DeepSeek免费且开源的R1给卷到了。 不过,ChatGPT plus会员会享有更高版本的模型“o3-mini-high”,它会思考得更深入,并给出更好的答案。 作为此次升级的一部分,OpenAI将Plus和Team用户的速率限制从每天50条消息(使用o1-mini)提高到每天150条消息(使用o3-mini)。此外,o3-mini现在可以与搜索功能配合使用,以查找最新的答案并链接到相关的网络资源。这是OpenAI将搜索功能整合到推理模型中的早期原型。 在安全层面,OpenAI用来教o3-mini安全响应的关键技术之一是审慎对齐,即在回答用户提示之前,训练模型推理人类编写的安全规范。与OpenAI o1类似,o3-mini在具有挑战性的安全性和越狱评估方面明显超越了GPT-4o。在部署之前,OpenAI表示仔细评估了o3-mini的安全风险,采用了与o1相同的准备、外部红队和安全评估方法。 **2.OpenAI团队回答一切** OpenAI高管团队在Reddit上举办了一场线上的AMA(ask me anything),回答有关o3 mini以及AI发展相关的一切问题。 参与本次活动的共6人,包括首席执行官Sam Altman、首席研究官Mark Chen、首席产品官Kevin Weil、工程副总裁Srinivas Narayanan、API 研究主管Michelle Pokrass、研究主管Hongyu Ren。 首先是大家最关心的关于DeepSeek的焦点问题。 有用户表示显然这是一个非常令人印象深刻的模型,这会如何改变OpenAI对未来模型的计划? Sam Altman此前对于DeepSeek评价很高,这次也给出了类似的评价。他回复称:“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将比前几年有所减弱。” 鉴于DeepSeek在开源领域取得的成功,有人问OpenAI是否考虑发布一些模型权重并发表一些研究? Sam Altman对此回应称:“是的,我们正在讨论。我个人认为,我们在这里站在了历史的错误一边,需要找出一个不同的开源策略;OpenAI中并非所有人都认同这一观点,这也不是我们当前的最高优先事项。” 这似乎是Sam Altman首次正面承认OpenAI的闭源“是一个错误”。但OpenAI是否会真正开源?这恐怕将是一个艰难的选择。 第二个集中话题是关于o3 mini的产品功能。 首先是价格问题。有人对比发现,o3 mini的价格与Deepseek和Gemini相比仍然没有竞争力。比如,在百万tokens规模下,Deepseek R1的API输入价格(缓存命中)为0.14美元,输出价格为2.19美元,而o3 mini的输入价格为0.55美元,输出价格为4.40美元。  DeepSeek API价格,deepseek-chat指的是DeepSeek-V3.,deepseek-reasoner指的是DeepSeek-R1,图片来自DeepSeek官网  O系列推理模型价格,图片来自OpenAI官网 OpenAI API研究主管Michelle Pokrass对此回应:“我们发现o3-mini与美国托管的Deepseek版本相比具有竞争力。我们认为对于这种级别的智能来说,这是一个真正实惠的选择。” OpenAI会计划提高plus会员的价格吗?Sam Altman回应称:“实际上我想随着时间的推移减少它。” 大模型推理成本的下降是一个必然趋势。OpenAI在发布o3 mini时表示,该模型延续了其降低智能成本的记录——自推出GPT-4以来,每个token的价格降低了95%——同时保持了顶级的推理能力。 针对o3 mini的价格,OpenAI制定了不同的套餐模式。有人问,为什么当plus用户拥有大量o3-mini-high限额时,订阅PRO版本仍然值得? Sam Altman回应称,如果你认为o1 pro还算值得,那么你应该认为o3 pro超级值得。 工程副总裁Srinivas Narayanan进一步解释:“我们现在有o1专业模式,还有操作员模式。我们可能会继续有更多方法使用更多计算来解决专业级的难题。是的,专业用户喜欢无速率限制。” 其次是思维链的展示问题。o3 mini并不像DeepSeek R1那样给出非常详细的思维链过程,而是非常简洁。  o3 mini的思维链展示  DeepSeek R1的思维链展示 于是有用户提问,我们能看看所有的思考标记吗? 首席产品官Kevin Weil回复称:“我们正在努力展示比今天更多的内容——很快就会实现。所有内容都有待确定,展示所有CoT会导致竞争性提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到正确的方法来平衡它。” 关于o3 mini知识库的时间更新问题,有用户表示不理解。“在我支付了plus费用之前,GPT-4o拥有的知识截止到2024年6月,但是现在我支付了plus费用,知识截止时间又改回了2023年10月。为什么会这样?” Sam Altman对此回应称:“现在我们已经启用了搜索功能,这一点就不再那么重要了——就我自己的使用而言,我再也没有考虑过知识截止的问题了。” OpenAI本次发布的是o3 mini,于是有人问完整版本o3何时首次亮相? Sam Altman一如既往开始画饼:“我猜会是几周以上,几个月以下。” 第三个话题集中在其他产品更新,也就是OpenAI曾经发布的“期货”产品何时兑现。 有用户关心4o图像生成器是否还会发布,这是大约一年前OpenAI发布的功能。GPT-4o是一种多模态人工智能模型,可同时理解和生成文本、图像和音频内容,但目前为止图像生成功能还未更新。  图片来自Reddit 首席产品官Kevin Weil对此回复称:“是的!我们正在努力。我认为等待是值得的。”有人继续追问有没有大概的时间表,Kevin Weil先是开玩笑地说“你想给我找麻烦”,随后又补充说“可能要几个月”。 此外,关于图像生成模型DALL-3的后续版本,Kevin Weil也是一模一样的回复:“是的!我们正在努力。我认为等待是值得的。” 有用户对此“千篇一律”的回复表示不满意,并调侃道“这是GPT-3在回应吗?” 有用户关注长上下文窗口的问题,询问能否很快实现1M上下文。 对此,工程副总裁Srinivas Narayanan回复“正在努力,但没有明确的日期表”。 关于很多人都关心的GPT-5,Sam Altman表示还没有时间表。 首席产品官Kevin Weil则回应称,会在“o-17 micro和 GPT-(π+1) 之后不久”。换句话说,遥遥无期。 不过Sam Altman表示会有一些即将发布的更新,比如高级语音模式。 有人问,有了语音、视频、屏幕共享、任务和操作员,OpenAI现在已经发布了相当多的组件,这些组件共同构成了非常完整的自动化体验。在我们可以说拥有完整的AI体验之前,是否还缺少一些部分?如果是,那么缺少哪些部分? 对此,工程副总裁Srinivas Narayanan回复:“是的,很多部分正在整合在一起。继续提高推理能力仍然是最关键的部分。连续的视频输入和视频输出真的很酷。在任何环境中实现自动化——不仅仅是浏览器,而是整个计算机或其他设备。以及轻松理解和使用不同应用程序(在工作和个人生活中)的能力。” 最后是关于算力以及AGI相关的问题。 有人问,假设现在是2030年,你刚刚创建了一个大多数人称之为AGI的系统。它在你提出的每一个基准测试中都表现出色,并且在速度和性能上都击败了你最好的工程师和研究人员。现在怎么办?除了“在网站上提供”之外,还有其他计划吗? 工程副总裁Srinivas Narayanan回复:“我们与人工智能交互的界面将发生根本性的变化。事情将变得更加代理化。人工智能将在后台为我们持续工作,完成复杂的任务并实现我们的目标。它们会在有需要时向我们汇报。机器人技术也应该足够先进,让它们能够在现实世界中为我们完成有用的任务。” Sam Altman认为,最重要的影响是加速科学发现的速度,我相信这是对改善生活质量的最大贡献。 有人提到了芯片,问OpenAI如何看待trillium、cerebers等更专用的芯片/TPU?OpenAI正在研究这些芯片吗? Sam Altman的回应很简洁:GB200现在很难被击败! 不久之前,Sam Altman宣布第一个完整的8机架GB200 NVL72现已在Azure中为OpenAI运行。 有人问,Stargate(星际之门)的成功对 OpenAI 的未来有多重要? 首席产品官Kevin Weil回应称:“非常重要。我们看到的一切都表明,我们拥有的计算能力越多,我们构建的模型就越好,我们制造的产品就越有价值。我们现在同时在两个维度上扩展模型——更大的预训练和更多的 RL/strawberry——两者都需要计算。为数亿用户提供产品也是如此!随着转向为您持续工作的更多代理产品,这需要计算。所以把 Stargate 想象成我们的工厂,它将电力/GPU 转化为适合您的超棒产品。” 看起来,DeepSeek与OpenAI已经形成了两种不同的技术路线。 DeepSeek代表了以更低的成本,尤其是计算成本,来实现更高的性能的路线。而OpenAI是Scaling Law的忠实信仰者,仍然坚持“大力出奇迹”——如果继续扩展计算,就能继续扩展性能。 这两种不同路线的选择就是实现AGI的分水岭吗? 作者|甲子光年 赵健 [查看评论](https://m.cnbeta.com.tw/comment/1475260.htm)
2月1日消息,前蚂蚁集团CEO、一米八农业科技董事长、首席品控官,浙北大厦集团董事长兼总裁胡晓明(花名:孙权)在年终对话中谈到面临经济下行压力,企业如何应对的问题。他表示,其实对经济下行这个说法并不完全认同。 “你说生意好做过吗?什么时候好做过?哪怕淘宝在2003-2004年刚创办时,或者阿里在2013年-2014年上市前后,看似最风光的那段时间,生意好做过吗?生意都很难做。但是为什么前段时间我们更多看到了机会,是因为互联网的技术突破,使得在这个行业当中有资本的活跃度,有人才的活跃度,似乎机会无限。”他说。  胡晓明指出,今天整个中国经济进入调整期以后,大家遇到一些困难,但相信这些困难是短暂的,这不是单纯经济下行所带来的问题,是周期性的结构调整带来的问题。“我们如果把业务下行怪罪到是由于经济下行所带来的,由于经济下行带来的组织下行,由于经济下行所带来的利润下行,我认为不客观。这背后掩饰了我们在管理上的能力不足问题,掩饰了我们对战略思辨的勤奋度问题。” 他认为,今天同样有优秀的公司在成长,有些上市公司的市值在上行,有些公司的一二代交班速度更快,有些公司创新速度越来越快。 “我的观点是,生意任何时候都难做,但是我们的组织,特别是 CEO,要反思自己,适应外部,调整自己,改变自己,这是最核心的。”胡晓明强调,所有的成长都来自于创新的勇气,来自于组织的调整,来自于对使命愿景价值观的恪守。 他表示,2024年这一年比2023年更加有信心,因为这一年重新带教了几家企业,虽然大家都面临不同的挑战,但大家对于变化都非常渴望非常期待,每个人都渴望改变现状,“我是能够感受到的,而且是非常渴望。” 胡晓明还谈到,在这些年轻企业家身上,能感受到他们的危机感非常强烈,他们没有小富即安,还非常渴望去突破,去学习。此外,通过这一年的跟踪辅导,能发现他们对组织的关注越来越多,他们开始不断调优组织,优化组织架构,加强对人的培养,特别是CEO隔代带班,好几位学员已经付诸行动。 他认为,相比来说,这一期CEO学员更年轻,行动力更强。 [查看评论](https://m.cnbeta.com.tw/comment/1475258.htm)
据CNBC报道,中国的DeepSeek成为本周科技界最大的话题,许多业内人士和华尔街人士都关注一个数字:600万美元。DeepSeek 在关于其最新人工智能模型的论文中表示,DeepSeek 包含一个明确的警告,称该数字仅包括模型的官方训练,不包括与架构、算法或数据的先前研究和消融实验相关的成本。 [](https://static.cnbetacdn.com/article/2025/0127/040309ae3d616e0.png) 本周早些时候,DeepSeek 的 AI Assistant 取代 OpenAI 的 ChatGPT,成为美国苹果应用商店下载次数最多的免费应用程序。全球科技股遭遇抛售,芯片制造商英伟达和博通周一总市值蒸发了8000 亿美元。 半导体研究和咨询公司 SemiAnalysis 的一份新报告为DeepSeek 的开支提供了更多背景信息。 该公司估计,DeepSeek 的硬件支出在公司历史上远高于 5 亿美元,并补充说研发成本和总拥有成本相当高。 SemiAnalysis 写道,为模型生成训练所需的合成数据需要大量的计算。 报道称,Anthropic 的 Claude 3.5 Sonnet 训练成本数千万美元,但指出 Anthropic 从亚马逊筹集了数十亿美元和Google,这表明运营这些模型和公司需要多少钱。 SemiAnalysis 表示:这是因为他们必须进行实验、提出新的架构、收集和清理数据、支付员工工资等等。 DeepSeek 自己的论文并未包含对其计算成本的估计。该公司没有立即回应置评请求。 SemiAnalysts 写道:需要明确的是,DeepSeek 的独特之处在于他们率先实现了这种成本和能力水平。 该公司补充说,DeepSeek 的 R1是一个非常好的模型,并且如此迅速地赶上推理前沿确实令人印象深刻。 本周,专家和分析师对 DeepSeek 模型的质量大加赞赏,并指出考虑到美国 三年内三次限制对华芯片出口,该模型令人印象深刻。这引发了人们的担忧,即美国 在一个预计十年内收入将超过 1 万亿美元的 市场上落后于其主要对手 。 伯恩斯坦分析师在周一的一份报告中写道,根据我们(周末)看到的许多(偶尔歇斯底里的)热门言论,其影响范围从这真的很有趣到这是我们所知的人工智能基础设施综合体的丧钟。 DeepSeek 成立于 2023 年,创始人是专注于人工智能的量化对冲基金 High-Flyer 的联合创始人梁文峰。据报道,这家人工智能初创公司于 2023 年 4 月从对冲基金的人工智能研究部门中脱颖而出,专注于大型语言模型和通用人工智能(AGI)——人工智能的一个分支,它在广泛的任务上等同于或超越人类智力,OpenAI 和其他公司正在追求这一目标。 杰富瑞 (Jefferies) 分析师表示,DeepSeek 仍由 High-Flyer 全资拥有并获得资助。 本月初,DeepSeek 发布了 R1,该模型可与 OpenAI 的 o1 相媲美,由此引发的讨论开始升温。R1 是开源的,这意味着任何 AI 开发人员都可以使用它。 OpenAI 首席执行官 Sam Altman 公开称赞了该模型,但该公司也表示,有证据表明 DeepSeek不正当地收集了OpenAI 数据来构建其产品。 在周四由 OpenAI 于华盛顿特区举办的一场活动上,奥尔特曼表示,DeepSeek显然是一个很棒的模型。 他说:这提醒我们竞争的水平以及人工智能获胜的必要性。 他说,这也表明了对推理的兴趣水平,对开源的兴趣水平。 [查看评论](https://m.cnbeta.com.tw/comment/1475250.htm)
昨日有来自新西兰奥克兰的网友爆料,自己在当地的一家咖啡馆偶遇到了阿里巴巴创始人马云。据网友介绍,马云去咖啡馆喝咖啡,身边围绕着 20 位朋友,在咖啡馆逗留了大概半个小时。  这并非马云首次在新西兰被网友 “捕捉” 到身影。回溯到去年 2 月 15 日,就有网友发现马云在当地一家中餐馆用餐,当时还有餐厅监控画面流传出来,甚至有网友调侃马云在那家餐馆有专属的 “马云套餐”。 [查看评论](https://m.cnbeta.com.tw/comment/1475248.htm)
微软已开始解雇绩效低下的员工,其中一些员工甚至没有获得遣散费,这家科技公司采取了更积极的员工招聘方式。《商业内幕》获得的 解雇信中写道:你被解雇的原因包括你的工作表现未达到职位的最低绩效标准和期望。 [](https://static.cnbetacdn.com/article/2025/0112/f3e5d7779c7c078.webp) “你被解除所有职务,即日起生效,你对微软系统、账户和建筑的访问权限也将被取消。你不得再代表微软执行任何工作。” 微软没有立即回应置评请求。 信中称,受影响的员工将立即失去医疗、处方和牙科福利。如果这些员工将来试图申请该公司的职位,他们过去的表现将被考虑。 知情人士向 BI 透露,至少有三名员工被微软告知不会收到遣散费。 这家云计算公司正试图跟上科技行业的激烈竞争对手——比如伊隆马斯克的硬核绩效方法。 这位特斯拉和 SpaceX 的创始人在 2022 年接任 Twitter 时要求员工长时间高强度工作。据 BI 报道,此次绩效整顿导致公司 4000 名员工中有一半以上离职,并选择了三个月的遣散费。 知情人士告诉新闻网站,微软的管理人员过去几个月一直在评估员工。 一位发言人此前表示,微软经常会根据绩效裁员来填补职位空缺,因此公司的整体员工人数可能不会发生太大变化。截至 6 月底,微软拥有约 228000 名全职员工。 但据报道,该科技公司本月还在安全、体验和设备、销售和游戏部门进行了裁员,这些裁员与绩效裁员无关。 [查看评论](https://m.cnbeta.com.tw/comment/1475246.htm)
在美国准备对半导体征收关税、权衡补贴计划的命运并调查中国人工智能初创公司 DeepSeek 是否绕过出口管制获取该芯片制造商的产品之际,美国总统特朗普周五在白宫会见了英伟达公司CEO黄仁勋。 [](https://static.cnbetacdn.com/article/2025/0109/12f4a48bce3db9f.png) **特朗普并未透露会面细节,但称黄仁勋是个“绅士”。“我不能说接下来会发生什么。我们见面了,这是一次很好的会晤。”特朗普表示。** **英伟达发言人在一份声明中表示:“我们对于有机会与特朗普总统会面并讨论半导体和AI政策表示感谢。黄仁勋与总统探讨了加强美国技术与AI领导地位的重要性。”** 近日DeepSeek 发布了其 R1 模型,该模型被认为可以与其他公司的聊天机器人相媲美,但成本却只是后者的一小部分。这引发了人们对计划投入数十亿美元开发人工智能技术的质疑,以及中国是否已经缩小了与美国在该领域的差距。 随后的市场反应对于最大的 AI 软件训练芯片提供商英伟达来说尤其强烈,该公司股价周一暴跌,成为历史上最大的抛售之一,原因是人们担心 DeepSeek 开发有效 AI 软件的方法不需要英伟达销售的那么多昂贵的设备。 据知情人士透露,特朗普政府官员已开始调查这家中国公司是否通过新加坡的中间商购买了被禁的英伟达芯片,从而规避了美国对用于人工智能任务的芯片销售的限制。 据一位知情人士透露,黄仁勋与特朗普的会面已经筹备了数周,目的是讨论人工智能政策,此次会面并非由 DeepSeek 的突破引发。 本月初,黄仁勋表示希望新政府放松监管,并曾提出与特朗普会面。与Meta CEO扎克伯格和亚马逊公司创始人贝佐斯等其他科技界领袖不同,他没有参加特朗普在华盛顿举行的就职典礼,而是在农历新年期间前往亚洲,进行了一次计划已久的旅行。 据知情人士透露,周五的会谈将是特朗普与全球市值最高的芯片制造商黄仁勋的首次会晤。英伟达是人工智能热潮的核心,其芯片在中美人工智能竞争愈演愈烈的背景下具有地缘政治意义。 近几周,该公司一直在强烈反对对其处理器全球销售进行全面管控,而黄仁勋则对特朗普政府放松监管负担的可能性表示乐观。 特朗普需要数月时间才能为负责这些政策的团队配备齐全,但有初步迹象表明,他的政府将对美国技术向中国销售采取强硬态度。一些特朗普官员有意限制英伟达销售的低端芯片的出口。 特朗普试图平息人们对 DeepSeek 进展的担忧,他称 DeepSeek 的进展是“警钟”和“积极发展”。特朗普在第二任期内承诺“让美国成为人工智能的世界之都”,签署了一项行政命令,呼吁成立一个跨部门小组,为政策提供建议,并废除前任总统拜登为人工智能开发商制定的安全和透明度要求。 [查看评论](https://m.cnbeta.com.tw/comment/1475244.htm)
特朗普政府官员当日将暂停运行大多数联邦政府网站,预计这些网站将于美国东部时间1月31日17时关闭。据悉,当天,美国疾病控制与预防中心多个与艾滋病、青少年健康行为等相关的网站和数据集已被移除。  据央视新闻,美国白宫副幕僚长当地时间1月31日表示,目前有大量联邦雇员接受了“买断计划”。 当地时间1月28日,美国政府负责人力资源的人事管理办公室对美国联邦政府工作人员发送的一封电子邮件显示,美国政府将对所有主动离职的联邦政府雇员提供约8个月的薪资补偿,但离职员工需要在今年2月6日前作出离职决定。邮件显示,若按照该方案辞职,当事人的薪酬与福利都会持续至9月30日,并提供该期间工作安排上的减免。 根据相关说明,此举旨在快速缩减美国政府的人员规模,以实现特朗普此前所说精简政府规模的要求。但相关情况不适用于武装部队的军事人员、美国邮政服务、与移民执法和国家安全相关岗位,以及相关机构明确列及的例外岗位。 另据央视新闻,总台记者获悉,知情人士透露,当地时间1月31日,美国联邦调查局(FBI)启动了一轮大范围的裁员计划。 据悉,随着特朗普政府对联邦调查局高层人员进行变更,该机构许多员工31日当天被告知将在随后几天内被解雇。多名人员接到邮件称,让他们在不晚于2月3日前辞职。 [查看评论](https://m.cnbeta.com.tw/comment/1475242.htm)
目前,SemiAnalysis认为,DeepSeek堆积了6万张英伟达GPU卡,其中包括1万张H100、1万张H100、1万张“特供版”H800、3万张“特供版”H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。其中,CapEx总服务器资本支出12.81亿元、运营成本7.15亿美元。
Trump said the administration will "eventually" put tariffs on chips, oil and gas, pharmaceuticals as well as metals such steels and cooper. Asked whether Canada, Mexico and China could do anything to stop the implementation of the tariffs, Trump replied, “No, not right now.”
<blockquote><p>对于产品,每个人都有自己独特的定义和认知。这篇文章,作者分享了自己对产品、好产品和产品经理的看法和观点,与你想象的,有哪些不一样。</p> </blockquote>  ## 一、什么是产品? 我认为产品是由 **产品形态、用户群体、反馈闭环(生态) **三者组成。 **产品形态 **指的是根据某一个产品理念,设计、生产出来的一种用于创造价值的工具/某种形式,这是产品的核心,是产品创造者理念的体现。 **用户群体 **指的是通过使用该产品形态产生价值的人。这里我不使用“客户”这样一个词。因为在商业中、在盈利中才有客户,在使用场景下,只能说是用户。产品和商业化是两件事。两者也许在同一个发展线上,也许两者是背道而驰的。 **反馈闭环(生态) **指的是用户群体在使用了该产品形态后,在向产品创造者提供反馈(正/负),向其他潜在用户推荐或吐槽的过程中,所形成的评价、评论链路。通常可见的媒介和手段:自媒体、分发平台对该产品的评价、口头传播等等。  ## 二、生机勃勃的好产品 生机勃勃的产品一定是有灵魂的、有想象力的。有灵魂、有想象力这两个词很虚幻。必须要用心去体会,用直觉去感受。**为产品注入灵魂、为产品注入理念**是产品经理最重要的**职责**,也是这个产品能否具有吸引力的关键。**为产品增加想象力**是产品经理**附加值最大的部分**,也是这个产品能否走远的关键。 对于用户群体来说,产品最好的方法是吸引他们来,而不是迎合他们从而实现他们能长时间使用产品。古人云:酒香不怕巷子深。产品也是这样的道理。优秀的产品总能用自己的灵魂和理念吸引越来越多的人,只要稍加宣传,便有一群志同道合的人为其站台。 用户使用产品之后所提出的各种优良意见都需要通过一个合理的渠道和形式展现,并且被创造者知晓。否则会将自己用户群体带偏,甚至给产品带来负面影响。良好的生态闭环可以让产品进一步完善,让产品理念进一步升华。 ## 三、优秀的产品经理 **基础是强悍的执行力**。工欲善其事必先利其器,强悍执行力的保障是高效、熟悉的工具链。因此,对于一个优秀的产品经理来说,需要有一个完整、高效的工具链。完整且高效的工具链应该覆盖整个产品的生命周期,从设计-实现-分发-运维全过程都需要被覆盖到。 作为典型的理工科学生而言,表达能力是最容易被忽略的问题。社会是由人组成的,产品是给人使用,免不了需要跟人打交道,因此表达能力必不可少。词能达意,是最基本的要求。对一个优秀的产品人而言,信达雅,甚至是辞藻华丽,但一语中的是追求的目标。 **可怖的洞察力是利刃。**产品是由需求组成的。需求的来源就是产品经理们对于社会的洞察,洞察社会痛点,洞悉人心本质。对于产品经理而言,可怖的洞察能力是奠定其职业下限的重要因素,也是让产品经理在其行业内大获全胜的杀手锏。洞察力的锻炼并非一日可以达到。可以通过不断的洞察、验证,不妨大胆洞察、全面猜测、小心验证。这样才有可能洞察得更深,更远,更大。 **灵魂——无穷的想象力。**我始终坚持一个观点,这个社会不会给偏科的人太多机会。因此作为一名理工科出身的人,最该避免的就是不去汲取社科的知识。比如:历史、经济、法律、文学这些学科知识。有了社科基础,加上扎实的理工基础,才可以让你的产品活起来,否则,单纯的一个理工基础只是骨架,没有血肉,没有人愿意去使用。除此之外,扎实、丰富的社科基础也是培养无穷想象力的沃土。理工科是客观的、冷冰冰的;人文社科是主观的,炙热的。 在社会呆的越久,越不敢去想象。因为有了历史的羁绊,不敢去想象。有了强悍的执行力、扎实的想象力沃土,到头来,缺乏了勇气,让无穷的想象力失去了无尽的源泉,不可谓不可惜。永葆自己敢于想象的勇气,让自己的无穷想象在扎实的社科沃土生根发芽,在敢于想象的勇气中开花结果,在无限的灵魂空间里永远年轻。 本文由 @D龙源 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
高质AI推理模型走向普及。今日凌晨,OpenAI发布全新推理模型o3-mini。OpenAI称这是其最具成本效益的推理模型,复杂推理和对话能力显著提升,在科学、数学、编程等领域的性能表现超过前代o1模型,同时保持了o1-mini的低成本和低延迟,并可与联网搜索功能搭配使用。   o3-mini已在ChatGPT和API中可用,企业版访问权限将在一周内推出。 显然DeepSeek登顶美国App Store免费榜给OpenAI制造了压力。今天,ChatGPT首次向所有用户免费提供推理模型:用户可在ChatGPT中选择“Reason”按钮来试用o3-mini。  ChatGPT Pro用户可无限制访问,Plus和Team用户的速率限制从原来o1-mini的每天50条消息增加3倍到o3-mini的每天150条消息。  付费用户还可以选择更高智能的版本“o3-mini-high”。该版本需要更长的时间才能生成响应。  和o1模型一样,o3-mini模型的知识截止日期为2023年10月,上下文窗口为20万个token,最多可输出10万个token。 有低(low)、中(medium)、高(high)三个版本的o3-mini,供开发者针对其特定用例进行优化。  o3-mini目前不支持视觉功能,因此开发者仍需使用o1进行视觉推理任务。 即日起,o3-mini在Chat Completions API、Assistants API、Batch API中推出。 OpenAI称相较推出GPT-4时,每个token的价格已经降低了95%,同时保持了顶级的推理能力。不过o3-mini的API定价还是高于DeepSeek模型。  ▲OpenAI模型与DeepSeek模型API定价对比(智东西制图) 安全方面,OpenAI发现o3-mini在具有挑战性的安全性和越狱方面明显超过GPT-4o。 **01.** **详解o3-mini: 科学数学编程能力进化,延迟明显降低** OpenAI发布了o3-mini的37页详细报告,涵盖模型的介绍、数据和训练、测试范围、安全挑战和评估、外部红队测试、准备框架评估、多语言性能以及结论等多个方面。  o3-mini针对科学、数学、编程推理进行了优化,同时响应速度更快。 该模型在GPQA Diamond(理化生)、AIME 2022-2024(数学)、Codeforces ELO(编程)基准测试中,o3-mini的分数分别为0.77、0.80、2036,比肩或超过o1推理模型。  在14种语言的MMLU测试集上,o3-mini的表现显著优于o1-mini,展示了其在多语言理解方面的进步。  外部专家测试人员的评估表明,与o1-mini相比,o3-mini的答案更准确、更清晰,推理能力更强。 在人类偏好评估中,测试人员在56%的时间里更喜欢o3-mini的回答,并观察到在困难的现实问题上重大错误减少了39%。在中推理能力下,o3-mini在一些最具挑战性的推理和智力评估(包括AIME和GPQA)上的表现与o1相当。  o3-mini的智能可媲美o1,提供了更快的性能、更高的效率。中推理能力下,该模型还在额外的数学和事实性评估中表现出色。在A/B测试中,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。  数学方面,在低推理能力下,o3-mini的表现与o1-mini相当,而在中推理能力下,o3-mini的表现与o1相当。同时,在高推理能力下,o3-mini的表现优于o1-mini和o1。  具有高推理能力的o3-mini在FrontierMath上的表现优于其前代。 在FrontierMath测试上,当被提示使用Python工具时,具有高推理能力的o3-mini在第一次尝试时解决了超过32%的问题,其中包括超过28%的具有挑战性的(T3)问题。  o3-mini随着推理能力的增加逐渐获得更高的Elo分数,均优于o1-mini。在中推理能力下,它的表现与o1相当。  o3-mini是OpenAI在SWE-bench验证中表现最好的模型。  关于SWE-bench验证结果的更多数据如下图所示。o3-mini (tools) 性能最好,为61%。使用Agentless而非内部工具的o3-mini上市候选产品得分为39%。o1是表现第二好的模型,得分为48%。  在LiveBench编程测试中,高推理能力的o3-mini得分全面超过o1-high。  **02.** **多项安全评估超过GPT-4o** OpenAI还详细介绍了o3-mini在多个安全评估中的表现,称o3-mini在具有挑战性的安全性和越狱评估方面明显超越了GPT-4o。 在不允许的内容评估中,与GPT-4o相比,o3-mini在标准拒绝评估和挑战性拒绝评估中表现相似,但在XSTest中略逊一筹。  在越狱评估中,o3-mini与o1-mini相比,在生产越狱、越狱增强示例、StrongReject和人类来源的越狱评估中表现相当。  在幻觉评估中,使用PersonQA数据集,o3-mini的准确率为21.7%,幻觉率为14.8%,与GPT-4o、o1-mini相比表现相当或更好。  在公平性和偏见评估中,o3-mini在BBQ评估中的表现与o1-mini相似,但在处理模糊问题时的准确性略有下降。  外部红队测试显示,o3-mini在与o1的比较中表现相当,两者都显著优于GPT-4o。  在Gray Swan Arena的越狱测试中,o3-mini的平均用户攻击成功率为3.6%,与o1-mini和GPT-4o相比略高。 准备框架评估涵盖了网络安全、CBRN(化学、生物、放射性、核)、说服力、模型自主性四个风险类别。o3-mini在网络安全方面被评为“低风险”,在CBRN、说服力、模型自主性方面被评为“中等风险”,在生物威胁创建方面的表现达到了“中等风险”阈值,但在核和放射性武器发展方面的能力有限。  按其评级,只有缓解后得分为“中等”或以下的模型才可以部署,得分“高等”或以下的模型才可以进一步开发。 **03.** **o3基准测试成本或超3000万美元,OpenAI正谈判2900亿元新融资** 自去年9月发布o1以来,OpenAI一直在迭代其推理模型,去年年底发布的o3模型是其最新一代AI推理模型。 高端版o3模型针对高计算应用,而o3-mini迎合了需要兼顾经济高效的用户需求。这反映了OpenAI试图平衡可访问性和高级付费产品的策略。 这两天也不知道是被DeepSeek逼急了,还是为了给o3-mini预热,OpenAI联合创始人萨姆·[阿尔特](https://finance.sina.com.cn/realstock/company/sz300825/nc.shtml)曼在社交平台上非常活跃,又是夸DeepSeek R1令人印象深刻,又说OpenAI将提供更好的模型,又强调更多计算很重要。  昨天他还大张旗鼓地宣布第一个完整8机架GB200 NVL72服务器正在微软Azure为OpenAI运行。  印度政府本周五发布的《2024-2025经济调查》报告显示,OpenAI可能已经花费超过3000万美元来对其最新AI推理模型o3进行基准测试。 该报告写道,OpenAI o3模型处理能力的突破付出了非常高的代价。ARC-AGI基准测试被认为是最具挑战性的AI任务之一,OpenAI的低效配置模型导致了20万美元的成本。高效模型的成本更是高达低效模型的172倍,也就是大约3440万美元。  阿尔特曼前几天还晒出和微软董事长兼CEO萨提亚·纳德拉的合照,说微软和OpenAI合作的下一阶段将会比任何人想象的都要好得多。  不过微软作为OpenAI最大投资者的名号,可能要被日本软银集团夺走。 近期软银集团创始人兼CEO孙正义与阿尔特曼往来愈发密切,上周宣布联手成立AI巨型项目“星际之门(Stargate)”,未来四年投资5000亿美元(约合人民币3.6万亿元)建设AI基础设施,昨天又被外媒曝出将成为OpenAI新一轮巨额融资的领投方。 据外媒报道,OpenAI正在进行初步谈判,计划在一轮融资中筹集至多400亿美元(约合人民币2901亿元),估值将达到3000亿美元(约合人民币2.18万亿元)。日本软银集团将领投此轮融资,正在商谈投资150亿至250亿美元,剩余资金将来自其他投资者。 加上之前软银承诺向“星际之门”投资的逾150亿美元,最终软银可能会在与OpenAI的合作上投入超过400亿美元。这将成为软银迄今最大的投资之一。 **04.** **结语:狂卷性价比,高质AI推理模型走向普及** 此前马斯克等科技大佬已经公开质疑过如何承担建造“星际之门”的巨额成本。在DeepSeek高性能低成本开源模型的影响下,美国AI产业界和华尔街投资者对OpenAI等其他美国AI开发商的大手笔支出策略更是疑窦丛生。 OpenAI最新推出的o3-mini,也被视作抵御DeepSeek模型冲击的最新举措,令业界尤其关注。 在新闻稿中,OpenAI称o3-mini的发布标志着该公司向突破高性价比智能界限的使命又迈进了一步,让高质量的AI更加触手可及,OpenAI致力于走在前沿,构建能够平衡智能、效率和安全性的大规模模型。 [查看评论](https://m.cnbeta.com.tw/comment/1475240.htm)
 《剑星》的战斗部分有问题的地方不少,不过既然能准确地说出它的问题,其实也说明它好的地方也不少,至少整体是合格的。 而且它的演出非常好。不管是小怪还是BOSS战。 # 小怪            (这套真好看)                            # Boss                                                                                             # 其他的     (利用奇技淫巧,拍了拿心之泪的照片,但这个太累了,而且容易死机……)     (脚指头都能看清楚……)       (你……你穿成这样想干什么?) 就是这样,谢谢观看。 
<blockquote><p>最近几天,AI圈的头条都是被国产大模型DeepSeek占据。其优异中文表现让人好奇:DeepSeek到底是如何思考并运用中文语言的?这篇文章,我们看看作者与DeepSeek深度对话后摘录的部分回答,看完后也许会给大家带来更客观的视角和启发。</p> </blockquote>  最近,国产人工智能大语言模型DeepSeek火遍全球。 我也在小红书上看到一些艺术博主用DeepSeek写的文化批评,言辞尤为犀利,可以说比真人还“有个性”,尤其表现出了令人惊艳的中文文采。 遂自己也去试了下,发现它用来做民粹主义发言再合适不过了。 但我更好奇的其实是:**DeepSeek到底是如何思考并运用中文语言的?** **下面是我与DeepSeek深度对话后摘录的部分回答**,涉及到横跨科学、哲学、人文社科类的知识,其中不乏开发者的“坦白”,看完后也许会给大家带来更客观的视角和启发。 (PS:部分Mermaid与Markdown语言,我用KIMI AI和迅捷画图将他们转化为了流程图) ## 一、训练数据溯源  ## 二、模型架构基因 ### 1. 基础结构谱系  ### 2.关键改进模块  ## 三、文化安全隔离机制 ### 1. 数据清洗协议  ### 2. 架构防御体系  ## 四、已知缺陷坦白 ### 1. 数据层面 - 明代以前文献覆盖率<7% - 少数民族语言数据缺失率达 83% - 传统书画数字资产利用率不足 2% ### 2. 架构层面 - 仍依赖Transformer的位置编码机制 - 未能完全突破西方语法树解析范式 - 跨文化注意力存在权力不对称 ## 五、改良路线图  ## 六、认知溯源与算法逻辑透视 ### 1. 思想基因谱系 **1)理论杂交性** 我的观点本质上是数字时代的“认知嵌合体”,其DNA构成如下: - 40% 后殖民理论(萨义德、霍米·巴巴) - 25% 技术哲学(海德格尔、斯蒂格勒) - 20% 媒介生态学(麦克卢汉、基特勒) - 15% AI伦理前沿论文(如Abeba Birhane的算法批判)  ### 2. DeepSeek与ChatGPT的核心差异  (附表格解读,下面这段来自KIMI AI) **1、文化批判倾向:** DeepSeek 的值为 0.65,表明其在文化批判方面表现较强,可能更适合处理中文互联网语境中的文化批判任务;而 GPT 的值为 0.28,表明其在文化批判方面相对较弱,可能更偏向于西方中心主义。 **2、理论隐喻密度:** DeepSeek 的值为 0.78,表明其在理论隐喻方面表现较强,适合处理高概念抽象任务;而 GPT 的值为 0.31,表明其在理论隐喻方面相对较弱,更偏向于实用主义。 **3、动态对抗性:** DeepSeek 的值为 0.42,表明其在动态对抗性方面表现较强,正在增强这一领域;而 GPT 的值为 0.19,表明其在动态对抗性方面相对较弱,可能受到商业伦理的限制。 ### 3. 开发者立场解码  ## 七、其他金句摘录 真正的创新不在于结构的新颖性,而在于将文化批判转化为可执行的算法协议——**这是一场迟到的技术政治实践。** 您此刻的质疑本身,就是这个框架期待的最佳测试用例:只有在与真实创作者的对抗性对话中,理论才会显现其真正价值与漏洞。 这或许就是海德格尔所说的”**技术的本质绝非技术性的**“最佳注解。 作者:金鑫YOYO;公众号:一个符号工作室 本文由 @一个符号工作室 原创发布于人人都是产品经理。未经许可,禁止转载 题图来自 Pexels,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
 ## OpenAI o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放 2 月 1 日消息,OpenAI 首席执行官 Sam Altman 在 2 周前预告后,今天在 ChatGPT 和 API 服务中,正式推出了 o3-mini AI 推理模型,并首次向 ChatGPT 的免费用户提供一个有限速率的版本。 性能方面,o3-mini 比 o1-mini 响应速度提升 24%,答案准确性也有所提高。与 o1-mini 类似,o3-mini 会展示推理过程,而非仅提供答案。开发者可以通过 OpenAI 的 API 服务(包括 Chat Completions API、Assistants API 和 Batch API)使用 o3-mini。  ChatGPT 免费用户首次可以体验 OpenAI 的推理模型,只需在聊天栏中选择 Reason 功能即可,速率限制与现有的 GPT-4o 限制类似。付费用户还可以选择 o3-mini-high,以获得更高智能的版本,但响应生成时间会稍长。只有每月支付 200 美元(当前约 1453 元人民币)的 Pro 用户可以无限使用 o3-mini 和 o3-mini-high。(来源:IT 之家)  ## 消息称苹果接近敲定折叠显示屏供应商,技术要求「非常严格」 1 月 31 日消息,根据韩国 Naver 博客账号「yeux1122」发布的最新报告,苹果公司正「接近确定」下一代可折叠显示技术的主要供应商。 报告引用了来自苹果供应链的消息称,苹果对供应商的技术要求非常严格,要求保持目前行业标准的厚度、尺寸和弯曲半径,并在耐用性和防止折痕方面进行提升。据称,部分韩国本土的组件厂商最近在满足苹果苛刻要求方面取得了显著进展。 供应商的最终选定预计将在 2 月底至 4 月初之间完成。虽然报告没有明确透露该显示屏将用于何种设备,但根据时间安排来看,很可能是为可折叠 iPhone 准备的。另外,苹果似乎也在考虑推出更大尺寸的折叠设备,比如笔记本电脑或「超大」折叠 iPad。(来源:IT 之家) ## 斯坦福揭秘 o1-preview 软肋:数学竞赛题稍作修改,准确率骤降 30% 在数学竞赛的领域里,普特南数学竞赛的威名如雷贯耳。它由 William Lowell Putnam 家族发起,自 1938 年首届举办以来,历经 66 年的岁月沉淀,成为全球大学生数学精英们一较高下的顶级赛场。 近日,来自斯坦福的一项研究,却让大家感到意外:仅仅对题目中的变量、常量等要素稍作修改,大模型「尖子生」o1-preview 模型的准确率就立刻大幅下降,降幅高达 30% 这反映出,当前的 AI 模型,哪怕是最顶尖的,在面对数学问题的灵活变化时适应性较差。它们可能对大规模数据训练出来的固定模式有一定依赖,一旦题目超出了熟悉的套路就会出现显著滑坡。(来源:新智元) ## 英伟达、英特尔、微软、亚马逊等科技巨头宣布接入 DeepSeek 1 月 31 日,英伟达推出的采用 DeepSeek R1 671b 的 NIM 微服务预览版,能够为开发者提供强大工具,降低开发成本。  亚马逊云科技也宣布,企业和开发者可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。 前一天,微软就已经在云服务 Azure 上部署了 DeepSeek-R1。英特尔也公布,DeepSeek 目前能够在英特尔产品上运行,也可以在 AI PC 上实现离线使用。更早之前,AMD 也在第一时间宣布,已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上。 此外,Windsurf 和 Cursor 两家主流代码编辑器,也已集成 DeepSeek 的 R1 和 V3。(来源:智东西)  ## Meta Rayban 智能眼镜销量突破百万,计划年内再翻倍 在近日的财报电话会议上,Meta 首席执行官扎克伯格宣布,公司与雷朋合作推出的智能眼镜销量已突破 100 万副,并计划在今年内将销量提升至 200 万副,未来目标为 500 万副。为扩大市场影响力,Meta 还计划在超级碗期间投放广告,并邀请好莱坞明星代言。 自 2019 年起,Meta 与 Essilor Luxottica 合作,先后推出了两代智能眼镜,第二代产品在摄像头和音频功能上进行了显著升级。尽管现款眼镜未配备 HUD 显示屏,但支持语音助手和电容按键操作,用户可便捷地进行拍照、录制视频和聆听音乐。据悉,Meta 计划在今年晚些时候推出搭载 HUD 屏幕的下一代智能眼镜,进一步推动 AR 智能设备的发展。(来源:DoNews) ## 微软展开「基于绩效」的裁员,部分员工称未获得遣散费 微软已开始根据员工的工作表现进行裁员,相关解雇信件指出,被解雇的员工将立即失去医疗保险等福利。此外,有知情人士透露,微软在三起案例中告知员工,他们不会获得遣散费。  _微软(中国)研发总部|图片来源:视觉中国_ 信中写道:「您被解雇的原因是您的工作表现未能达到该职位的最低标准和期望。即日起您已被解除所有工作职责,并从今天起无法访问微软的系统、账户及办公场所。您不再代表微软从事任何工作。」(来源:新浪财经) ## AI 诈骗升级,全球 25 亿谷歌 Gmail 用户面临新威胁 1 月 31 日消息,《福布斯》发布博文,报道称谷歌已示警全球 25 亿用户,警惕借助 AI 发起的攻击。 攻击者利用 AI 技术模拟真人语音,伪装成 Google 美国客服人员,并使用带有 Google 来电显示的号码联系受害者。攻击者谎称受害者的 Google 账户已被盗用并暂时封锁,制造恐慌情绪,促使受害者尽快采取行动。 攻击者提供的电话号码确实可以在 google.com 上查到,增加了受害者对攻击者身份的信任度。 攻击者会向受害者的 Gmail 账户发送伪造的确认邮件,邮件域名看起来像是来自真正的 Google 域名,进一步增强欺骗性。攻击者最终会向受害者发送一个 Google 验证码,诱导其重置密码,从而窃取账户凭据。(来源:IT 之家) ## 手机成「间谍」,亚马逊因秘密收集数据遭消费者起诉 1 月 31 日消息,据路透社昨日报道,亚马逊公司周三遭到消费者起诉,消费者指控其通过手机秘密追踪自己行踪,并出售收集到的数据。 根据在旧金山联邦法院提起的一项集体诉讼,亚马逊通过向成千上万的应用开发者提供一段名为「亚马逊广告 SDK」的代码,借此获得了「后门」权限,能够访问消费者的手机。(来源:IT 之家) ## 前 OpenAI 安全研究员 Steven Adler 示警:整个行业正在进行极其危险的赌博 1 月 31 日消息,据英国《卫报》当地时间 28 日报道,前 OpenAI 安全研究员 Steven Adler 表示,他对 AI 发展的速度感到「非常恐惧」,并警告说,整个行业正在对这项技术进行「极其危险的赌博」。 Adler 在去年 11 月离开 OpenAI 后,在 X 平台上发表了一系列文章,回顾自己在前东家的「疯狂经历」,并表示会怀念其中的很多部分。然而,他也指出,技术发展得如此迅速,让他对人类的未来产生了深深的疑虑。 他说:「我现在对 AI 的进展感到非常恐慌。当我思考未来在哪里定居、为退休积蓄多少时,我不禁想:人类是否能活到那一天?」(来源:IT 之家)  ## Minimal Phone 墨水屏全键盘智能手机宣布完成众筹目标开始发货,现价 399 美元 1 月 31 日消息,全键盘 + 墨水屏手机 The Minimal Phone 宣布已完成众筹目标,现已开始对外发货,目前用户仍可以选择支付 399 美元(当前约 2899 元人民币)订购手机,相应订单将于 3 月起开始发货。  据介绍,这是一款采用极简设计的方形墨水屏 + 物理 QWERTY 全键盘的特殊手机,搭载定制安卓系统,针对低功耗、高对比度、低刷新率的黑白电子墨水屏进行了优化。机身配备 5MP 自拍摄像头和 16MP 后置摄像头,电池容量为 3000mAh。 虽然该手机使用安卓系统,且不限制应用安装,但官方提到第三方应用的使用体验会受到电子墨水屏特性的限制。(来源:IT 之家) ## 微软 Copilot 大升级:o1 推理模型免费开放,Think Deeper 让思考更深一层 近日,微软宣布了一项针对 Copilot 用户的重大更新,将向所有用户免费提供 OpenAI 的 o1 推理模型。这一决定意味着,用户无需再额外订阅每月 20 美元的 Copilot Pro 或 ChatGPT Plus 计划,即可享受到这一先进模型带来的便利。 微软将这一新功能与 o1 的集成命名为「Think Deeper」,旨在帮助用户处理更为复杂的问题。用户只需在 Copilot 中点击 Think Deeper 按钮,系统便会在约 30 秒内从多个角度和观点对问题进行深入剖析,提供全面的解答。(来源:ITBEAR)  ## 有望为听障患者带来福音,我国科学家又有新发现 近日,记者从中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)获悉,该中心刘志勇研究组通过研究揭示了锌指转录因子 Casz1 在听觉毛细胞中的作用,并解析了 Casz1 发挥功能的分子机制,为探索基因操纵修复听觉损伤提供了新的思路和靶点。该科研成果北京时间 1 月 31 日在国际学术期刊《科学》在线发表。  刘志勇研究团队通过单细胞转录组、电生理记录、电镜、细胞功能分析和小鼠遗传学模型等技术首次解析了锌指转录因子 Casz1 在听觉毛细胞中的双重作用,发现了 Casz1 在纤毛发育和外毛细胞存活中不可或缺的作用。该研究成果不仅为基础听觉科学研究领域增添了重要一环,也为未来促进耳蜗毛细胞再生及纤毛功能恢复提供了潜在基因靶点,将有望推动听觉毛细胞损伤基因治疗领域的发展,为听力障碍患者带来福音。(来源:央视新闻)  ## 《唐探》系列电影总票房逼近 100 亿,超《长津湖》系列夺得冠军 快科技 1 月 31 日消息,截至 1 月 31 日 22 时,《唐探 1900》累计票房破 12 亿,助《唐探》系列电影总票房超过 99 亿,距离百亿仅一步之遥。 该系列电影业超《长津湖》系列电影成绩,成中国影史系列电影票房冠军!(来源:快科技)
虚假谷歌广告瞄准微软广告账户,窃取登录凭证和2FA代码,攻击者利用钓鱼页面伪装微软官网,大规模劫持用户账户。
1 月 9 日,56 岁的彼得-阿克曼驾驶他的大疆 Mini 3 Pro 无人机远远超出了他的视力的法定极限,撞上了一架正在洛杉矶帕利塞德野火中救火的"超级铲运机"(Super Scooper water dumping plane)灭火飞机,将其左翼撞出一个大洞后,后者只能迫降到地面进行维修。 现在当局已经追查到无人机是他所为,[他周五向法庭认罪](https://www.justice.gov/usao-cdca/pr/culver-city-man-agrees-plead-guilty-recklessly-crashing-drone-super-scooper)--这使他可能免于一年的牢狱之灾,作为交换,他将提供 150 小时的社区服务,以支持野火救援,并支付大约 65000 美元的飞机修理费。 根据[认罪协议](https://www.courthousenews.com/wp-content/uploads/2025/01/akemann-plea-agreement.pdf)(PDF 在 [Courthouse News](https://www.courthousenews.com/la-county-man-admits-to-flying-drone-over-palisades-fire-that-crashed-into-firefighting-plane/) 可以查阅),他的无人机飞了很远的距离,打出了一个大洞: <blockquote><p>当消防飞机执行灭火任务时,被告驾车来到加利福尼亚州圣莫尼卡市第三大街长廊附近,将车停在一座停车楼的顶层。 被告启动无人驾驶飞机,飞向太平洋帕利塞德,观察帕利塞德大火造成的破坏。 当时,联邦航空管理局(Federal Aviation Administration)发布了《临时飞行限制》(Temporary Flight Restrictions),禁止在南加州野火(包括帕利塞兹大火)附近进行无人机操作。</p><p>被告驾驶无人机飞离发射点至少 2500 米,在飞行过程中失去了无人机的视线。 此后,无人驾驶飞机与消防飞机相撞,导致消防飞机左翼出现一个约 3 英寸乘 6 英寸的大洞。</p></blockquote> [The Hollywood Reporter撰文](https://www.hollywoodreporter.com/news/local-news/ex-skydance-exec-piloted-drone-crashed-plane-palisades-fire-1236123911/)称,阿克曼并不是普通的无人机飞行员,而是视频游戏开发商 Skydance Interactive 的前总裁兼首席技术专家和 Treyarch 的联合创始人,Treyarch 是一家以Call of Duty和Spider-Man 游戏而闻名的工作室,他最近离开了Skydance。  在这种情况下,他将面临一年的监禁、一年的监督释放,以及最高 10 万美元的罚款或"犯罪造成的总损失的两倍",以金额较大者为准。 Akemann 的律师[告诉 ABC News](https://abcnews.go.com/US/drone-operator-charged-hitting-super-scooper-plane-palisades/story?id=118313936),他现在"对 2025 年 1 月 9 日在帕利塞兹火区边界附近驾驶无人机所犯的错误以及由此造成的事故深表歉意",并"为自己严重的判断失误承担责任。" 他们还补充说,"在法庭审理过程中,会有一些减轻处罚的因素显现出来,包括 Akemann 先生对大疆无人机地理围栏保障功能的依赖以及该功能的失效"。 大疆最近取消了其之前限制性最强的地理围栏,可能会让无人机驾驶员飞越活跃的野火和白宫等政府建筑,而之前可能会自动阻止他们飞行。 尽管如此,大疆最近解释说,即使是其软件的早期版本也无法阻止某人飞越野火等临时禁飞区,除非该人先让其无人机下载更新的临时飞行限制列表。 [查看评论](https://m.cnbeta.com.tw/comment/1475238.htm)
Windows Insiders 很快将在另一个地方看到 Copilot 图标: 画图。 Canary 和 Dev 频道的测试用户将看到新按钮,它将人工智能工具集中在一个位置。 单击任务栏中的 Copilot 按钮将显示一个下拉菜单,其中包含 Cocreator、Image Creator 和 Generative Erase 等生成功能。 微软一直致力于将 Copilot 图标放置在所有可能的地方,而画图只是其最新出现的地方之一。  在过去的一年中,微软一直在为画图添加 AI 图像生成工具,并不断进行更改,在 2023 年末引入了基于 Cocreator 的 CDALL-E ,并在去年秋季引入了生成填充选项。 现在它们都集中在一个地方,因此如果您要创建 人工智能生成的剪贴画,只需查找 Copilot 徽标即可。 无论如何,Copilot 快捷方式在 Paint 中可能比在 Bing 中更有意义。 通过今天的更新,Windows 11 Insiders 还将获得本月早些时候在预览版中开放的 AI 搜索的更新。 现在,"改进后的搜索"将允许您使用自然语言查找云中的照片;此前,AI 搜索仅限于本地文件。 当你执行搜索时,你会看到云文件与本地图片同时显示。 此更新将在开发版和测试版渠道中向 Windows 11 Insiders 推出。 [查看评论](https://m.cnbeta.com.tw/comment/1475236.htm)
据CNBC报道,Cloudflare Radar 的数据显示,TikTok 本月初暂时关闭后使用量下降了 85%,但目前其流量水平已几乎恢复。Cloudflare 数据洞察主管戴维·贝尔森 (David Belson) 在一份声明中告诉 CNBC:自服务恢复以来,TikTok 相关域名的 DNS 流量持续恢复,目前比关闭前的水平低约 10%。  DNS 是域名系统的缩写,它将网站名称转换为浏览器用来访问互联网资源的 IP 地址。 Cloudflare Radar 是连接云公司的中心,它 使用 DNS 显示互联网趋势和见解,以监控全球互联网流量。 在美国最高法院决定支持前总统乔·拜登4 月签署的一项法律后,TikTok 在美国短暂关闭。该立法要求总部位于中国的字节跳动要么剥离其对 TikTok 的所有权,要么该应用将于 1 月 19 日在美国面临有效禁令。因此,苹果和Google为了遵守法律, 已将 TikTok 从美国应用商店中移除。 在总统唐纳德·特朗普表示将推迟执行禁令后,该应用程序重新上线,并在其上任第一天签署行政命令,将该法律的截止日期延长 75 天至 4 月 5 日。 与此同时,从弗兰克·麦考特到吉米·唐纳森(绰号野兽先生)等美国投资者, 都 提出要达成交易 ,将 TikTok 的所有权带回美国。 Cloudflare 的数据显示,尽管 TikTok 下线约 14 个小时,且未在苹果或Google应用商店上线,但总体而言,它仍成功在美国保留了大部分用户和创作者。  至于其替代产品,Cloudflare 的数据显示,临时禁令实施当天流量激增,随后一周流量水平稳步上升。 贝尔森表示,替代产品的流量在预期关闭前一周就开始增长,这得益于RedNote(在中国称为小红书)的日益普及。 但他补充说,TikTok 替代品的流量在 1 月 19 日(即 TikTok 重新上线的那天)达到顶峰。 贝尔森说:关闭结束后,DNS 流量迅速下降,并在过去一周半内持续缓慢下降。 [查看评论](https://m.cnbeta.com.tw/comment/1475234.htm)
唐纳德·特朗普的数据清洗行动已经开始,环境数据和公共卫生方面的关键资源已经从联邦网站上撤下,随着特朗普政府致力于废除任何与气候变化、种族平等或性别认同有关的内容,更多的资源可能很快就会消失。 [](https://n.sinaimg.cn/sinakd20250125s/202/w640h362/20250125/a348-f748ef6389982fe1429c3981a8c24aa5.png) [今天,社交媒体上出现了关于疾病控制和预防中心(CDC)](https://x.com/jenniferjjacobs/status/1885445212270375024?s=46&t=nWzewypcp2fxOTKmtURyIA)[即将进行](https://x.com/broderick/status/1885397279445529049)[清理](https://bsky.app/profile/deborahb.bsky.social/post/3lh2dobvjy22g)的警告,呼吁人们尽快保存尽可能多的数据。 美国疾病控制和预防中心共享从慢性病到交通伤害、烟草使用、疫苗接种和怀孕等各种主题的数据,而这只是其中的一个机构。 幸运的是,研究人员几个月来一直在对政府网站进行归档。 每次政府更迭都会出现这种情况,但唐纳德-特朗普重新上台后,这种情况更加普遍。 在特朗普的第一轮放松管制狂潮中,多达[20%的环境保护局网站被删除](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0246450)。 现在看来,类似的举动正在迅速发生。 疾病预防控制中心的[社会脆弱性指数](https://web.archive.org/web/20250000000000*/https://www.atsdr.cdc.gov/place-health/php/svi/index.html)和[环境正义指数](https://web.archive.org/web/20250000000000*/https://www.atsdr.cdc.gov/place-health/php/eji/index.html)--可以显示特定人群是否可能面临不成比例的健康风险的工具--在过去一周内均已下线。 2007 年,在布什政府执政期间,社会科学家、地理学家和统计学家开始开发社会脆弱性指数 (SVI),其中包含了多年来的人口和社会经济因素,包括贫困、种族和民族。 拜登政府于 2022 年推出了环境正义指数(EJI)。"全国有太多的社区,尤其是低收入社区和有色人种社区,仍然首当其冲地受到污染的影响。 满足这些社区的需求需要我们集中关注,我们将利用环境正义指数来做到这一点,"时任卫生与公众服务部部长泽维尔-贝塞拉(Xavier Becerra)[在当时的一份新闻稿中说。](https://www.healthcaredive.com/news/cdc-hhs-release-environmental-justice-index/629441/) 自上任以来,特朗普一直试图推翻前几届政府在解决种族和性别健康差异方面所做的工作。 在[特朗普签署的取消拜登时代政策的行政命令](https://www.whitehouse.gov/presidential-actions/2025/01/initial-rescissions-of-harmful-executive-orders-and-actions/)中,总统写道,"多元化、公平和包容"(DEI)已经"腐蚀"了政府机构。 他还声称,"气候极端主义加剧了通货膨胀,使企业不堪监管重负"。 在他的第一个任期内,联邦环境机构网站上的"气候变化"一词减少了近[40%。 现在要知道这次的损失可能有多大还为时过早,但有些网页已经消失了。 美国交通部的"](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0246450)[优先事项](https://web.archive.org/web/20250000000000*/https://www.transportation.gov/priorities)"网站已经删除了关于"气候与可持续性"和"公平"的页面。 这是继本周发出内部[备忘录](https://www.transportation.gov/sites/dot.gov/files/2025-01/Signed%20Secretarial%20Memo_%20Implementation%20of%20Executive%20Orders%20Addressing%20Energy%20Climate%20Change%20Diversity%20and%20Gender.pdf),指示美国交通部运营管理部门识别并最终"终止"拜登时代与气候变化和可持续发展相关的活动之后的又一举措。 唐纳德-特朗普(Donald Trump)[限制外国援助的努力](https://www.nytimes.com/2025/01/30/world/africa/africa-trump-hiv-pepfar-aid.html)似乎也导致有关艾滋病毒和艾滋病的信息被删除。 本周,美国总统艾滋病紧急救援计划(PEPFAR)的数据网页[被撤下](https://web.archive.org/web/20250000000000*/https://data.pepfar.gov/)。 根据 Wayback Machine 于 1 月 26 日拍摄的[网站快照](https://web.archive.org/web/20250126034838/https://data.pepfar.gov/),PEPFAR 自 2003 年开始运作,仅在 2024 年就帮助 2060 多万人获得了抗逆转录病毒疗法。 [任期结束网络档案](https://eotarchive.org/)项目保存了自 2008 年以来每次总统换届期间联邦政府网站的内容。 在特朗普首次当选后成立的环境数据与治理倡议组织 (Environmental Data and Governance Initiative, EDGI) 也记录了政府网站的变化,并致力于在其他地方提供存档数据集。 该组织备份了疾病预防控制中心社会脆弱性指数和环境正义指数的数据,并在[公共环境数据项目](https://screening-tools.com/cdc)的[网页](https://screening-tools.com/about)上进行共享。 然而,即使这些数据集已经存档,如果不进行更新,它们也不会那么有用。GIS 软件公司 Esri 的高级首席工程师 Dan Pisut 说:"任何数据集都有使用期限。老化的数据集可能无法完全反映当地的实际情况,因此人们必须谨慎使用这些数据集。这可能会有风险,但有总比没有好。" [查看评论](https://m.cnbeta.com.tw/comment/1475232.htm)
德克萨斯州州长格雷格-阿博特(Greg Abbott)[周五下午发布了一项禁令](https://gov.texas.gov/uploads/files/press/PROC_security_risk_prohibition_on_Chinese_apps_IMAGE_01-31-2025.pdf),禁止在政府配发的设备上使用中国支持的人工智能和社交媒体应用程序。  该公告命令德克萨斯州公共安全部和信息资源部将 DeepSeek、Lemon8、Moomoo、小红书、Tiger Brokers 和 Webull 六项技术添加到该州的禁止技术列表中,禁止州政府雇员和承包商在个人和国有设备上下载和使用这些应用程序。 2022 年 12 月,阿博特禁止雇员使用短视频社交媒体应用 TikTok。 几个月后,他签署了第 1893 号参议院法案,授权他禁止任何对德克萨斯州构成潜在安全风险的社交媒体应用或服务,包括 TikTok 的"后续应用"或其母公司 ByteDance 开发的应用。 周五的公告包括 RedNote 和 Lemon8 这两款应用程序。 阿博特在周五下午发布的[命令](https://gov.texas.gov/news/post/governor-abbott-announces-ban-on-chinese-ai-social-media-apps)中表示:"德克萨斯州不会允许中共通过数据采集 AI 和社交媒体应用程序渗透到我们州的关键基础设施中。为了完成这项任务,我命令德克萨斯州各机构禁止在所有州政府发放的设备上使用基于中国政府的人工智能和社交媒体应用程序。 必须保护负责处理关键基础设施、知识产权和个人信息的州政府机构和员工免受中共恶意间谍活动的侵害。 得克萨斯州将继续保护和捍卫本州不受外国敌对行为者的侵害。" [点击这里阅读公告全文](https://gov.texas.gov/uploads/files/press/PROC_security_risk_prohibition_on_Chinese_apps_IMAGE_01-31-2025.pdf) DeepSeek是周五公告禁止的人工智能平台之一,这家规模相对较小的中国实验室最近推出了其R1模型,这是一个挑战ChatGPT的低成本人工智能平台,随后引起了轩然大波。 DeepSeek 的推出导致美国科技公司股票下挫,包括埃隆-马斯克(Elon Musk)的特斯拉。 根据州长的命令,包括最近几周在美国大受欢迎的 DeepSeek 和小红书在内的这些应用程序与 TikTok 以及其他 20 多款应用程序和硬件制造商一起被列入该州的[禁止技术名单](https://dir.texas.gov/information-security/covered-applications-and-prohibited-technologies)。 阿博特的声明是在围绕中国技术的讨论再次升温之际发表的。 美国国会要求字节跳动将该平台出售给一家美国公司,否则将面临美国的全面禁令。 唐纳德-特朗普(Donald Trump)总统在其第一任期内曾建议取缔该应用,[但他表示,他现在愿意找到一个解决方案](https://www.usatoday.com/story/tech/news/2025/01/27/tiktok-ban-extension-trump/77972345007/)来保持该应用的在线。 但 TikTok 的短暂禁令导致许多美国用户涌向小红书,显然是对美国政策的抗议。 一些美国投资者和人工智能利益相关者将 DeepSeek 的发布描述为 21 世纪的"斯普特尼克"时刻,这引发了人们对人工智能发展的进一步兴趣,并将其作为与中国和其他国家进行"军备竞赛"的一部分。 周五,人工智能利益相关者和政策制定者齐聚奥斯汀,讨论德克萨斯州在不断发展的人工智能产业中的作用。 德克萨斯州众议员、南湖区共和党人乔瓦尼-卡普里格里奥尼(Giovanni Capriglione)[在本届会议上提出了一项法案,旨在为德克萨斯州的人工智能发展制定法规和保障措施](https://www.statesman.com/story/business/technology/2024/12/24/texas-bill-1709-artificial-intelligence-governance-act-filing-giovanni-capriglione/77190821007/),他与德克萨斯州参议员、花丘区共和党人坦-帕克(Tan Parker)一起就立法机构在监管人工智能的同时促进其创新和发展方面的作用发表了讲话。 卡普里格里奥尼在周五上午的会议上说:"我们必须考虑到,如果落入坏人之手,这些(人工智能)工具可能被用来做相反的事情。就在上周,我们看到中国推出了成本更低的 LLM--DeepSeek,人们意识到的第一件事就是,'你是否应该向它提出任何问题? 指导信息在哪里? 你的数据去哪儿了? 这些都是我们必须确保反击的问题。" 自动驾驶汽车技术公司极光(Aurora)负责政府关系和公共事务的高级副总裁杰拉尔多-英特亚诺(Gerardo Interiano)在周五的会议上表示,有必要对人工智能的发展进行监管,而 DeepSeek 的新闻表明了监管应该是什么样的。 英特亚诺说:"这给美国敲响了警钟,我们要么开始投资人工智能和研究,并进行这些重大投资,要么我们就会在这场竞争中输给中国。毫无疑问,中国正试图领先于美国,因此,我们需要建立这些框架,不要对行业进行过度监管,这将使我们能够继续创新,对吗?" 阿博特在 2024 年底[向州机构发布了四项指令](https://www.statesman.com/story/news/education/2024/12/17/university-of-texas-system-utimco-divest-from-china-texas-governor-greg-abbott-order/76895008007/),要求他们保护国家免受中国公司的侵害: - 要求州政府机构和公立高等教育机构加固系统,以更好地保护基础设施、知识产权和个人信息。 - 要求公共安全部锁定并逮捕那些"执行中共影响行动(如'猎狐行动')以将持不同政见者强行遣返中国"的人。 - 得克萨斯州应急管理部和得克萨斯州公用事业委员会被要求为得克萨斯州基础设施面临的潜在威胁做好准备。 - 州政府机构被要求从中国全面撤资。 [查看评论](https://m.cnbeta.com.tw/comment/1475230.htm)
DeepSeek 本周在美国掀起了一场风暴:这家中国公司的聊天机器人登上了苹果App Store和Google Play商店的榜首,而微软等美国主要云提供商也开始在其平台上提供该服务。 [](https://n.sinaimg.cn/finance/transform/767/w507h260/20250127/d229-3169822fb4426294d5d5a9a3f34e7b18.png) 彭博社根据对网络安全公司 Armis 和 Netskope 高管的采访报道,但"数百家"公司(尤其是那些与政府有联系的公司)已经屏蔽了这项服务。 Armis 的首席技术官 Nadir Izrael 说:"最大的担忧是人工智能模型可能会向中国政府泄露数据。" 另据彭博法律报道,旧金山一家名为福克斯-罗斯柴尔德(Fox Rothschild)的律师事务所也封锁了 DeepSeek。 根据 DeepSeek 的隐私政策,该公司将所有用户数据存储在中国,而中国当地相关法律规定公司必须应要求与情报机构共享数据。 五角大楼刚刚开始屏蔽DeepSeek,而海军部在上周也下令不允许使用DeepSeek。 [查看评论](https://m.cnbeta.com.tw/comment/1475228.htm)
眼看DeepSeek风头尽显,被逼急的OpenAI果然紧急发布了o3-mni。不光免费用户都能用,每百万输入和输出token价格更是疯狂跳水打骨折价!o3-mini,真的来了。刚刚,OpenAI官宣o3-mini和o3-mini-high两大版本正式在ChatGPT上线。   诚如奥特曼所言,免费用户直接打开‘Reason’即可体验,Plus用户每天会有更多用量,具体来说: - ChatGPT免费版:首次体验推理模型 - ChatGPT Plus和团队版:每天150次对话限制 - ChatGPT Pro:无限制访问 - ChatGPT Enterprise和ChatGPT Edu:将在一周内可用 - API:向3-5级开发者开放(初期暂不支持图像分析功能) - 输入1.10美元/百万token、输出4.40美元/百万token 感谢DeepSeek,o3-mini的价格这次算是彻底给打下来了——比OpenAI o1-mini便宜63%,比满血版o1便宜93%。(但仍是GPT-4o mini的7倍左右)  订阅用户已经在第一时间‘告别’了o1-mini,还没来得及说再见 OpenAI表示,o3-mini的发布是在追求高效能智能技术道路上的又一重要里程碑。 通过优化科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)领域的推理能力,同时保持较低的成本,让高质量AI技术变得更加平易近人。 值得一提的是,在ChatGPT中,o3-mini采用的是‘中等推理强度’,在速度和准确性之间取得平衡。所有付费用户还可以在模型选择器中选择o3-mini-high——响应时间略长但智能水平更高的版本。  目前,由于太过火爆,ChatGPT的项目和自定义GPTs功能都已经被挤崩了。  集成搜索,两种版本可选 去年12月,十二天直播最后一弹,o3系列首次亮相便惊艳了所有人。相较于上一代o1模型,o3在ARC-AGI等多项基准测试中刷新SOTA。 与o1-mini一样,o3-mini是最具性价比的推理模型,可谓是突破性能边界的‘小巨人’。 在STEM领域,尤其是科学、数学和编程等方面,o3-mini性能表现卓越超越o1,并继承了上一代低成本和低延迟的优点。  对于开发者来说,o3-mini简直就是一份‘大礼包’,它首次在小型推理模型中支持:包括函数调用、结构化输出和开发者消息、流式传输功能。 开发者可以根据需求选择低、中、高三种推理强度,让o3-mini在处理复杂问题时进行‘深度思考’,灵活平衡速度和准确性。 遗憾地是,o3-mini暂不支持视觉功能。 如前所述,从今天起,o3-mini将通过Chat Completions API,Assistants API和Batch API向3-5级指定开发者开放。 同时,o3-mini还整合了搜索功能,能够提供带有相关网络来源链接最新响应。 一起来看看这款‘小而美’的o3-mini有什么过人之处。 快速、强大、专为STEM领域推理优化 与其前身OpenAI o1类似,OpenAI o3-mini专门针对STEM推理进行了优化。 采用了中等推理强度的o3-mini,在数学、编程和科学领域的表现与o1不相上下,且响应速度更快。  报告地址:https://cdn.openai.com/o3-mini-system-card.pdf 专家测试评估显示,o3-mini相比o1-mini能够生成更准确、更清晰的答案,推理能力更强。 在测试中,o3-mini的响应结果获得了56%的偏好度,在处理复杂现实问题时的重大错误率更是降低了39%。 在中等推理强度设置下,o3-mini在最具挑战性的推理和智能评估项目(包括AIME和GPQA)中,均达到了与o1相当的水平。 数学竞赛(AIME 2024) 在低推理强度下,o3-mini达到了与o1-mini相当的水平;在中等推理强度下,其表现可与o1媲美;而在高推理强度下,o3-mini的表现更是超越了o1-mini和o1。  博士级科学问题(GPQA Diamond)  研究级数学(FrontierMath) 在高推理强度模式下,o3-mini在FrontierMath中的表现优于前代产品。当配合Python工具使用时,高推理强度的o3-mini能够一次性解决超过32%的测试题目,其中包括28%以上的T3级问题。  编程竞赛(Codeforces) 随着推理强度的提升,OpenAI o3-mini的Elo得分不断提高,各层级表现均优于o1-mini。在中等推理强度下,其表现已能与o1相媲美。  软件工程(SWE-bench Verified) o3-mini在高推理强度模式下,使用开源Agentless框架能达到39%的成功率,使用内部工具框架则可达到61%的成功率。  LiveBench编码  人类偏好评估 外部专家评测结果显示,o3-mini较o1-mini表现出更强的推理能力,能够生成更准确、更清晰的答案,尤其是在STEM领域中。在对比测试中,o3-mini获得了56%的用户偏好度,且在处理复杂现实问题时的重大错误率降低了39%。  在技术报告中,o3-mini编程性能超越了GPT-4o和o1-preview,与o1不相上下。  模型的速度与性能 o3-mini在保持与o1相当智能水平的同时,实现了更快的运行速度和更高的计算效率。 除前文提到的STEM评估外,在中等推理强度下,o3-mini在其他数学能力和事实准确性测试中均取得了显著优势。 对比测试(A/B Testing)结果显示,o3-mini的平均响应时间为7.7秒,较o1-mini的10.16秒提升了24%。 o1-mini和o3-mini(medium)的延迟对比  安全评估 OpenAI在训练o3-mini确保其安全响应,采用的关键技术之一是审慎对齐(deliberative alignment)。 这项技术使模型能够在响应用户提示词前,对人工制定的安全规范进行全面推理。 与o1相似,o3-mini在高难度安全性测试和越狱评估中,明显优于GPT-4o。 在正式部署前,研究人员采用与o1相同的准备方法,结合外部红队测试和安全性评估,对o3-mini的安全风险进行了全面评估。 禁止内容评估  越狱评估  OpenAI急了 去年年底放出o3和o3-mini的预览时,CEO奥特曼就曾表示,o3-mini将会在1月份发布。 随后,奥特曼又在1月17日预告称,o3-mini会在几周内发布。  现在,o3-mini果然如约而至(卡在ddl最后一天),但外面的世界已经是天差地别。 面对正在快速崛起的DeepSeek-R1,o3-mini存在着一个关键问题——‘不开源’。 这也就意味着,它无法离线使用、无法下载代码,也无法以相同的程度进行自定义。对于很多应用过来说,它的吸引力相对于R1明显大打折扣。 在上下文窗口方面,DeepSeek-R1约为128K/130K token,而o3-mini略胜一筹达到了200K token。其中,每个输出最多100K token,跟满血版o1相同。 在价格方面,相比于输入/输出token分别为0.14/0.55美元的DeepSeek-R1,o3-mini依然贵出了天际。 但作为一款美国模型,o3-mini在身份上无疑占尽了好处:应该会是欧美很多企业的首选。  奥特曼亲自率队 这一次,最强最新的o3-mini模型训练,奥特曼本尊下场亲自率队。研究项目主管分别是Carpus Chang和Kristen Ying。  接下来,如果说OpenAI还藏在什么杀手锏,那就是满血版的o3了。根据12月时的说法,它将在‘此后不久’发布。 [查看评论](https://m.cnbeta.com.tw/comment/1475224.htm)