2025年1月15日,截止收盘,沪指跌0.43%,报收3227.12点;深成指跌1.03%,报收10060.13点;创业板指跌1.82%,报收2037.93点,两市成交额较上一交易日减少1618.71亿元,合计成交11888.3亿元。
2024 年多次大量微软账户遭到暴力破解或其他形式的登录尝试,众多用户账户里出现数量极大的登录失败日志,但目前微软并未就这个问题发布任何说明。日前网络安全公司 SpearTip 发布的报告也提到了类似攻击,但该报告提到的目标账户群主要是 Microsoft Azure Active Directory Graph API,这类攻击与我们之前提到的针对微软个人账户的暴力破解应该不同。 虽说是有区别,但攻击手法上却有很大的相似之处,攻击者使用 FastHTTP Go 库进行高速、高频次暴力破解,其特点包括使用大量并发连接、提高吞吐量、降低延迟和提高效率等。  FastHTTP 是用于 Go 编程语言的 HTTP 服务器和客户端,该库针对处理 HTTP 请求进行了优化,黑客则是利用这个库向 Azure Active Directory 端点为目标。 操作手法上黑客要么进行暴力密码破解,要么反复发送多因素身份验证请求 (MFA),也就是试图通过疲劳攻击接管目标账户,从这方面来看与 2024 年出现的针对个人账户的攻击手法有相似之处。 根据 SpearTip 的研究,恶意流量主要来自巴西并利用广泛的 ASN 提供商和 IP 地址发起攻击,其次恶意流量占比最高的分别是土耳其、阿根廷、乌兹别克斯坦、巴基斯坦和伊拉克。 让人非常惊讶的是没想到黑客的攻击成功率能达到 9.7%,这个成功率已经属于极高的水平,研究发现 41.5% 的攻击会直接失败,21% 的攻击会触发安全机制导致微软暂时锁定账户、17.7% 的攻击因为访问策略问题 (例如 IT 管理员设置禁止某些区域的 IP 登录) 被拒绝,10% 的攻击受到 MFA 的保护。 由于此次研究主要针对的是企业账户,因此研究人员还编写了 PowerShell 脚本帮助 IT 管理员检查审计日志,该脚本可以检测 FastHTTP 代理,如果发现该代理的信息即代表该企业是攻击目标。 另外 IT 管理员还可以登录 Azure 门户、Microsoft Entra ID、用户、登录日志,在这里筛选其他客户端,筛选出来的客户端里检查 UA 信息看看是否有 FastHTTP。 消息源:[SpearTip](https://www.speartip.com/fasthttp-used-in-new-bruteforce-campaign/) [查看评论](https://m.cnbeta.com.tw/comment/1471278.htm)
1月15日,知名分析师郭明錤今日发文指出,英伟达(NVDA.US)通过最新的Blackwell架构路线图重新定义了其产品阵容。其中,200系列采用双芯片设计(使用CoWoS-L制造);300系列采用双芯片(CoWoS-L)和单芯片(CoWoS-S)设计。他表示,新路线图导致传言称英伟达正在削减CoWoS-S产能,显然至少在未来一年左右的时间里,英伟达对CoWoS-S需求将大幅减少。 但从英伟达角度来看,CoWoS-S削减主要是由于产品路线图改变,而不是需求下滑。这一变化也很好地配合了台积电(TSM.US)将其CoWoS-L技术作为主流解决方案的战略计划。 [](https://static.cnbetacdn.com/article/2025/0109/11b75c3ae374375.png) 200系列:采用Dual-die(CoWoS-L制造)设计,系统产品如GB200 NVL72、HGXB 200。 300系列:采用Dual-die(CoWoS-L制造)与Single-die(CoWoS-S)设计,系统产品如GB300 NVL72(Dual-die)、HGXB 300 NVL16(Single-die)。 Nvidia将300系列的Dual-die与Single-die分别命名为Ultradual-die与Ultrasingle-die。郭明錤认为,此举纯粹是行销命名,没实质意义。根据以上新蓝图规划,较能合理解释为何最近市场传言Nvidia砍CoWoS-S产能,因为至少未来一年以上Nvidia对CoWoS-S的需求的确显著降低。 200系列世代,移除原本的B200A(Single-die,CoWoS-S制造),故不需要CoWoS-S。 自1Q25开始,Nvidia改主推200系列并降低H系列(CoWoS-S制造)供应,故逐渐不需要CoWoS-S。 采用B300系列的系统产品预计在2026年大量出货,现阶段Nvidia与CSP明显偏好GB300NVL72(CoWoS-L生产),故B300系列虽有采用Single-die/CoWoS-S的系统,但GB300 NVL72会先出货,故对CoWoS-L的需求急迫性高于CoWoS-S。 他表示,以上的产品线变化,或多或少会对Nvidia与供应链的业绩造成影响,部分供应商会受到特别大的影响故近期股价也显著修正了。但从Nvidia的角度,放缓/砍CoWoS-S扩产主要是因应产品线的变化,而非需求端造成。这样变化也符合台积电打算主推CoWoS-L为主流方案的策略规划。 [查看评论](https://m.cnbeta.com.tw/comment/1471276.htm)
据悉,美国计划出台更多法规,旨在阻止台积电和其他生产商生产的先进芯片流向中国大陆,这是拜登政府执政最后几天推出的一系列措施之一。据知情人士透露,最新举措旨在鼓励台积电、三星电子和英特尔等芯片生产商更仔细地审查客户并加强尽职调查。 [](https://static.cnbetacdn.com/article/2022/0809/c069df94a1f7896.webp) 报道称,这些规定最早可能于周三公布,将以拜登政府周一公布的AI芯片限制措施为基础。 知情人士称,根据草案,所有工艺阈值为14或16纳米及以下的芯片都将被推定为受全球单独管制措施限制,需要获得美国政府许可才能在中国大陆和其他受管制国家/地区销售。 但芯片制造商有几种方法可以克服这种假设,因为法规的目标是找出可能试图规避美国规则来生产先进芯片的中国大陆公司。 报道称,拟议法规旨在帮助芯片制造商确定哪些设计和哪些客户受到美国贸易限制。这取决于处理器的强大程度,而处理器的强大程度又取决于每个芯片上烦人晶体管数量。使用更先进的生产技术(以纳米为单位),可以添加更多晶体管。一般而言,纳米数越小的芯片越复杂。 14至16纳米的门槛通常会覆盖比现有贸易限制所管辖的先进芯片更广的范围。但根据草案规定,基于获批公司名单,以及芯片制造商的总部是否在美国、盟国或中国台湾,芯片低于该门槛的授权客户将能够证明他们的芯片设计不受美国出口管制。 据几位知情人士透露,或者如果一款芯片的晶体管数量少于300亿个,并且是由一家可信赖的公司封装的(这也会在规则中明确列出),那么它也不会被视为受限制的先进芯片。 知情人士表示,总而言之,这些参数的综合影响意味着这些规则将针对中国大陆公司设计的更复杂的处理器,即人工智能加速器。 不过,这些规定比政府官员此前向台积电暗示的更为严格。 据知情人士透露,此前,美国商务部要求台积电停止为中国客户生产7nm或以下工艺的芯片。 [查看评论](https://m.cnbeta.com.tw/comment/1471274.htm)
1月15日消息,埃隆·马斯克(Elon Musk)再次语出惊人,他宣称旗下的隧道挖掘公司The Boring Company可以用“仅为现有预估成本千分之一”的价格,建成一条连接美洲与欧洲的跨大西洋隧道,将普遍估算中高达20万亿美元的造价大幅削减。  **20万亿美元:一个遥不可及的梦想** 修建一条横跨大西洋的隧道并非新鲜话题,这一设想可以追溯至数十年前。然而,这一构想始终停留在科幻层面。其最主要的障碍在于天文数字般的成本估算。据《新闻周刊》等媒体报道,这条隧道的建设费用高达20万亿美元,大致相当于美国年度GDP。 尽管一些夺人眼球的新闻标题频频出现,但这一项目从未进入实际规划阶段。既无政府审批,亦无预算划拨,更无建筑公司参与实施。换句话说,这仍只是停留在理论上的概念。马斯克的“千倍成本降低”言论为这一设想增添了几分话题性,但短期内,他显然不会着手实施。 **从远见到现实:超级高铁的困境** 马斯克的豪言壮语不仅涉及跨大西洋隧道的构想,也延续了他推广超级高铁技术的愿景。这种基于真空密封管道的交通方式,旨在以超高速运行列车,彻底改变人们的出行方式。 2013年,马斯克通过发布白皮书将超级高铁的概念推向公众,并点燃了人们对未来交通技术的憧憬。然而,十多年过去,超级高铁的进展却远不及预期。尽管The Boring Company进行了多项测试,印度和中国等地也出现了一些试点项目,但目前尚无任何超级高铁系统实现商业化运营。 这一现状引发了许多专家对该技术可行性的质疑。他们认为,超级高铁面临的技术和经济挑战过于复杂,短期内难以实现规模化应用。事实上,The Boring Company已悄然调整战略,将重心从超级高铁转向更为基础的地下隧道建设。 **跨洲隧道并非新鲜想法** 在马斯克成为全球瞩目的焦点之前,工程师和梦想家们就曾热烈讨论过在美国与英国之间建造隧道的可能性。这一构想早在20世纪初就曾引发关注,但因其高昂的成本和极高的工程复杂性,最终被搁置。 即便到了今天,这一构想在后勤上的挑战依然难以克服。我们谈论的是一条超过3000英里(约4800公里)的隧道,要么漂浮于海洋表面,要么深埋于海床之下。相比之下,法国与英国之间的英吉利海峡隧道全长仅23英里(约37公里),耗时6年才竣工。若以相同的建设速度推进跨大西洋隧道的施工,可能需要耗费数个世纪才能完成。 马斯克宣称The Boring Company能以极低的成本建成这一隧道,这是典型的“马斯克式”言论——大胆而吸引眼球,但背后缺乏实质性依据。尽管真空列车技术的突破让高速跨大西洋旅行听起来令人憧憬,但现实是,目前关于这一项目的明确规划、资金来源或时间表都遥遥无期。此外,马斯克在超级高铁项目上的过往表现也未能让人对他的承诺充满信心。 时至今日,跨大西洋隧道仍然属于遥不可及的幻想。马斯克的言论或许能够吸引短期关注,但无法改变这一构想更接近于科幻愿景而非实际工程的事实。因此,设想中的54分钟纽约至伦敦旅程,至少在可预见的未来,依然难以成为现实。 [查看评论](https://m.cnbeta.com.tw/comment/1471268.htm)
一个由50多名医生和科学家组成的研究团队近日得出结论,肥胖并不总是一种疾病。这份报告已发表在《柳叶刀糖尿病与内分泌学》(The Lancet Diabetes and Endocrinology)上,呼吁重新定义肥胖,并制定新的诊断标准,同时建议为因超重引发健康问题的患者提供广泛的减肥治疗。 [](https://static.cnbetacdn.com/article/2023/1103/aa1422cfe0d3e57.webp) 世界上已有超过75个专业组织已经批准了这份报告,包括美国心脏协会、欧洲内科联合会和世界肥胖联合会,尽管这些建议将如何影响医疗实践还有待观察。 目前,肥胖的标准通常以体重指数(BMI)衡量,即通过体重(公斤)除以身高(米)的平方计算。在欧美,BMI超过30通常被认为是肥胖。然而,报告认为,尽管BMI是一个有用的筛查工具,但它并不等同于医学诊断。BMI无法准确追踪个体的健康状况。有些人在代谢方面是健康的,他们的生活未因体重受到明显负面影响,也可能不需要治疗。 报告的核心观点是,应将肥胖患者分为两类: 1. **临床肥胖**:患者的体重已引发健康问题或显著影响日常生活功能; 2. **临床前肥胖**:尽管患者体重超标,但通过血液检测和其他评估显示,他们在其他方面是健康的。 研究小组建议,这种分类将对医疗实践产生重要影响。对于临床肥胖患者,应优先提供药物或其他治疗手段。而对于临床前肥胖患者,尽管目前没有表现出健康问题,但仍需关注其潜在风险。治疗可能以健康咨询为主,帮助降低未来患病的可能性。同时,针对具有肥胖相关疾病家族史的患者,使用减肥药物仍可能是合理的干预措施。 [查看评论](https://m.cnbeta.com.tw/comment/1471264.htm)
商务部于2024年12月31日发布并实施了《[传统经典车通用要求](http://c.gb688.cn/bzgk/gb/showGb?type=online&hcno=0614D5922102076FF0C7E350BE1720B3)》国标。《要求》指出,为明确传统经典车通用要求,规范开展传统经典车认定要求及流程,保护汽车工业文化遗产,记录汽车工业发展历史,提升传统经典车相关产业及汽车文化发展水平,丰富汽车消费业态,制定本文件。 起草单位包括中国汽车技术研究中心、一汽集团、保时捷、法拉利、宝马、上海嘉定综合保税区发展有限公司、天津市传统经典车行业协会。  《要求》明确,传统经典车(traditional historical vehicles),需同时满足以下条件的汽车或摩托车。 **由机械驱动;距离首次制造或注册不少于30年;** 保持车辆原始状态,不包含复制和/或复刻品。车辆发动机、变速箱、底盘或车架等主要部件的技术特征没有发生实质性变化,摩托车具备原厂油箱或当时代油箱,搭载原厂排气设备或与原厂设计相同的排气设备,座椅为原装或外观上与原厂近似。 不作为日常交通工具使用。对需上道行驶的,应符合道路交通安全管理法律法规和规定;具有一定的技术价值或历史文化价值。 **具体要求方面,**包括车辆的车辆外观不应有明显的事故损坏和较大的凹凸形变;车架和底盘完整,并有对应车辆识别代号或原厂当时代车辆唯一识别号,车架和底盘不应弯曲或折断。内饰与原厂外观保持基本一致,允许在认定前改装等。   [查看评论](https://m.cnbeta.com.tw/comment/1471262.htm)
1月13日,美国拜登政府在卸任前最后一周出台了《人工智能扩散暂行最终规则》(Interim Final Rule on Artificial Intelligence Diffusion,下称“最终规则”)。美国政府声明中称,人工智能正迅速成为安全和经济实力的核心。美国必须采取果断行动,引领这一转变,确保美国技术支撑全球人工智能的使用,并确保对手无法轻易滥用先进的人工智能。 这份由美国商务部工业和安全局(BIS)公布的“最终规则”是2022年10月“先进计算芯片和半导体制造设备出口管制规则”(下称“出口管制规则”)的延续。当时,“出口管制规则”历经多次更新,主要对出口到中国等国家或地区的芯片性能进行了限制(文章详见《美国对华芯片制裁,又升级了》《英伟达最后30天窗口期被掐断,国产替代成唯一方案》)。  (图片来源:美国政府官网) 1月13日“最终规则”公布后,中国商务部发言人表示,中方注意到,拜登政府于1月13日发布了人工智能相关出口管制措施。该措施进一步加严对人工智能芯片、模型参数等出口管制,还拓展了长臂管辖,对第三方与中国开展正常贸易设置障碍、横加干涉。 “最终规则”出台前已酝酿近一周。受此影响,英伟达(NASDAQ: NVDA)、英特尔(NASDAQ: INTC)、AMD(NASDAQ: AMD)等美国知名芯片企业的股价均在下滑。美国东部时间1月9日至今,英伟达股价下滑10.3%,英特尔股价下滑7.7%,AMD股价下滑9.1%。 “最终规则”引发了英伟达、Oracle(甲骨文)等美国科技企业,以及美国半导体行业协会的强烈反对。美国产业界认为,“最终规则”在拜登政府卸任前强行通关,它在公布之前不仅没有征求美国科技企业的意见,而且无助于美国保持自身在人工智能领域的领导地位。 多位中国科技企业人士对《财经》表示,一旦通过,这将是有史以来最严格的出口管制规则。拜登政府的目的是,通过建立全球AI模型和芯片管控网络的方式,确保美国在人工智能领域的领导力。对中国科技公司来说,应该放弃美国未来可能会放松出口管制的幻想,坚持AI模型和芯片的自主研发和自主可控。 一、长臂管辖覆盖全球市场,美国盟友也要审查 “最终规则”在2022年10月出台的“出口管制规则”基础上,提出了“人工智能扩散出口管制框架”。其中主要新增了三部分内容。 其一,美国政府会对全球范围内AI模型和芯片的出口、再出口和转让进行审查。审查内容包括,目的地的敏感性,AI模型的计算能力或性能,最终用户是否符合美国政府的安全要求。 其二,美国政府会对全球的国家或地区进行分级管控,新增了每个国家和区域的AI芯片配额限制。 其三,AI芯片和模型的出口、再出口、转让必须建立分配系统,并通知美国商务部工业与安全局。 “最终规则”将接受120天公众意见征询之后生效。1月20日,美国总统拜登即将卸任,美国当选总统特朗普即将上台。这意味着,这份规则是否要最终实施,仍需特朗普政府最终批准。 美国政府在“最终规则”发布后的声明中称,它以此前的芯片管制为基础,目的在于阻止走私、堵塞其他漏洞并提高人工智能安全标准,包括六项主要内容。 其一,18个符合高安全性和信任标准且总部设在亲密盟友和合作伙伴(澳大利亚、比利时、加拿大、丹麦、芬兰、法国、德国、爱尔兰、意大利、日本、荷兰、新西兰、挪威、韩国、西班牙、瑞典、英国、台湾地区)的实体没有限制。 其二,集群能力在1700枚芯片以内的订单无须许可证,尤其是由大学、医疗机构和研究组织出于明显无害目的下达的订单。 其三,符合高安全性和信任标准且总部设在亲密盟友和合作伙伴的实体可以获得高度可信的“通用验证最终用户”(UVEU)地位,但只能将其全球AI算力的7%部署在世界各国或地区。 其四,其他满足相同安全要求且总部位于非相关国家/地区的实体可以申请“国家验证最终用户”(NVEU)身份,未来两年可以购买32万个先进GPU(图形处理器)的算力。 其五,对于亲密盟友以外的非VEU(通用验证最终用户),每个国家或地区最多可以购买5万个先进GPU。 其六,与美国政府签署出口管制、清洁能源和技术安全工作等相关协议的政府,可以将其芯片配额上限翻倍,最多可以得到10万个先进GPU。 拜登政府解释了进行AI模型及芯片的全球出口管制的三点理由。 其一,先进的AI模型出口至美国以外的任何地方,哪怕是美国盟友手中也会带来风险。因为这可能会被转移到令人担忧的最终用户手中。 其二,出口管制需要“针对那些能够被用来对美国构成严重国家安全威胁的核心技术”。因此需要适当调整潜在管制措施,以解决国家安全问题。 其三,在全球AI产业中保持技术领导力,这是美国国家安全的核心利益。先进的人工智能模型会对美国国家安全和外交政策构成独特威胁,美国国家安全和外交政策要求对它的全球传播进行监管。 一位美国科技公司人士对《财经》表示,美国政府声明中一再声称,“最终规则”降低了芯片订单的许可门槛,而且能够满足盟友或伙伴的基本需求,然而其中大量条款都与此自相矛盾,且在加重企业的审查负担。比如,出口商、再出口商和转让方必须建立一套分配系统,以便对转移并随后移出的受控物品数量进行记录。在出口、再出口、转让之前,必须通知美国商务部工业与安全局。 这份168页的“最终规则”中,仅通用验证最终用户(VEU)相关的认证和政策要求部分就有19个条款。其中对购买芯片的国家和地区及相关主体提出了大量要求。 第4条显示,未经美国商务部工业和安全局授权,VEU不得转让芯片。 第5条显示,必须提前60天通知美国商务部工业和安全局转移任何芯片的意图。 第11条显示,VEU必须持续执行监控、评估和最终用户对所有审查要求的尽职调查、出口限制、可接受使用政策和安全要求。 第19条显示,不遵守协议可能导致撤销VEU地位,拒绝芯片分配或出口许可,以及根据美国法律法规适当的其他处罚。  (图片来源:《人工智能扩散暂行最终规则》第27页) “最终规则”甚至对NVEU中国家或地区及主体每个季度的累计可配额的总体算力性能(Total Processing Performance,简称TPP)进行了明确限制。一位云计算厂商人士对《财经》表示,通过限制总体算力性能的做法进行全球市场管制,既不符合技术逻辑,也不符合市场原则。 一位美国云厂商中国市场人士认为,拜登政府此举会加剧美国科技公司的恐慌,直接导致美国公司在华开展业务时面临更大的不确定性。它们需要为极端情况做好准备。 二、美国企业强烈抗议,称拜登政府未征询意见 美国政府声称,在过去十个月,“最终规则”制定过程中与利益相关者、国会两党议员、行业代表以及外国盟友和合作伙伴进行了广泛的相关接触。 即使如此,“最终规则”仍然引发了美国科技公司的强烈反对。英伟达、Oracle、美国半导体协会声明均提到,拜登政府未与之征询意见便出台了“最终规则”。 英伟达是受“最终规则”影响最大的芯片公司。它在全球先进AI芯片市场份额超过90%,它收入来源的一半以上都来自美国以外的市场。英伟达财报显示,2024年前三季度英伟达美国以外的市场收入3543.7亿美元,在其收入大盘中占比54.7%。“最终规则”一旦出台,英伟达超过3500亿美元的出口收入都要经过严格的许可和审查。 英伟达1月13日发表声明称,拜登政府正在试图通过史无前例且误导性的规则来限制主流计算应用程序的访问,这可能会破坏全球创新和经济增长。  (图片来源:英伟达官网) 英伟达在声明强调,拜登政府在执政的最后几天,试图通过“最终规则”来破坏美国人工智能的领导地位。该法案是秘密起草的,没有经过适当的立法审查。这一全面的越权行为将对美国领先的半导体、计算机、系统甚至软件的全球设计和营销方式施加控制。拜登政府的新规则在试图操纵市场并扼杀竞争,这种做法会浪费美国来之不易的技术优势。 英伟达声明认为,这些规则披着“反华”措施的外衣,但对增强美国安全毫无作用。新规则将控制全球技术,包括主流游戏电脑和消费硬件中已经广泛使用的技术。拜登的新规则非但不能减轻任何威胁,反而会削弱美国的全球竞争力,破坏让美国保持领先的创新。尽管该规则在120天内无法执行,但它已经损害了美国利益。 美国知名云与软件公司Oracle在拜登政府的“人工智能扩散出口管制框架”发布前就在官网进行了声明。这份声明措辞激烈,称拜登政府的“最终规则”是美国失去人工智能领导地位的路线图。Oracle是美国第四大云厂商和第二大软件公司,其业务覆盖全球。Oracle在美国以外的地区采购芯片、部署数据中心会受到“最终规则”的影响。“最终规则”不符合Oracle的商业利益。  (图片来源:Oracle官网) 甲骨文声明称,“最终规则”将成为有史以来对美国科技行业最具破坏性的政策之一。它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。 甲骨文声明认为,起草“最终规则”的人忽视了这个基本事实,全球数百甚至数千个托管商业云服务的数据中心已经部署和使用了大量GPU,其数量远远少于引发国家安全问题的程度。“最终规则”有数百页,前后条款自相矛盾,复杂程度不明,而且是在新政府就职前 10 天匆忙印制的。如此引人注目的新法规在出台之前,根本进行没有磋商或意见征询。“最终规则”更多的是实现极端过度的监管,而不是保护美国及其合作伙伴和盟友的利益。 美国半导体行业协会(SIA,Semiconductor Industry Association)也对“最终规则”提出了反对意见。美国半导体协会被认为是半导体行业的代言人。它由英伟达、英特尔、AMD、三星、台积电、Arm、ASML等芯片设计、制造、供应、销售各环节的企业组成。它覆盖了全球三分之二的半导体公司,其中美国参与企业收入占美国半导体行业的99%。  (图片来源:美国半导体协会官网) 美国半导体协会1月13日声明称,我们深感失望的是,如此规模和影响的政策转变在总统过渡前几天匆忙出台,而且没有得到任何来自行业的有效意见。新规则可能会将战略市场拱手让给我们的竞争对手,从而对美国经济和半导体及人工智能领域的全球竞争力造成意想不到的持久损害。 美国半导体协会称,随时准备与华盛顿的领导人合作,规划一条保护国家安全的道路。同时让我们做美国最擅长的事情——参与全球竞争并取胜。 [查看评论](https://m.cnbeta.com.tw/comment/1471258.htm)
今天凌晨,OpenAI 正式宣布推出一项名为 Tasks 的测试版功能。无论是一次性提醒还是重复性任务,现在你只需要向 ChatGPT 说明需求和时间,它就能实现自动化处理。比方说,你可以设置每天早晨 7 点获取天气预报,或定时提醒遛狗等日常事项。 看到这,有没有觉得很熟悉?没错,类似于你手机上的 Siri,但在 ChatGPT 的加持下,Tasks 的性能显然要更强大。  OpenAI 研究工程师 Karina Nguyen 也向我们展示了几个实用案例。 你可以让 ChatGPT 每天查看股市行情,或是委托它定期在 ChatGPT Canvas 创作科幻故事,并将这些故事发送到你的邮箱里。  如果你想学英语,你可以让它每晚督促你背单词,此外,你还能让 ChatGPT 为你总结最新的 AI 新闻。面试考试党也别急,它也能根据你的设置安排化身出题官。 我试着利用这项功能提醒我定时补充水分,实际体验下来,有定时闹钟那味了。  Tasks 功能现以测试版形式向 Plus、Pro 和 Teams 用户开放,后续将覆盖 ChatGPT 所有用户。 不过,OpenAI 尚未明确该功能免费开放的具体时间。鉴于 OpenAI 过往的画饼史,估计还有一段时间才会开放。  要启用这项功能,付费用户需要在 ChatGPT 的模型选择器中选择“4o with scheduled tasks”。 所有任务均可在对话界面或网页版个人档案的 Tasks 专区进行管理,随时轻松修改或取消已设置的任务。 任务完成后,系统会通过网页端、桌面端和移动端向用户推送提醒。 每位用户可同时运行最多 10 个任务。 我们也从 OpenAI 官网上扒到一些值得注意的细节。 首先,Tasks 功能已支持 ChatGPT 网页版、iOS、Android 和 MacOS 平台,但 Windows 版本将于第一季度晚些时候推出。 无论是定时触发(一次性或重复)还是通过用户界面手动触发,ChatGPT 都会执行预设任务,且不受用户在线状态影响,直到用户将收到推送通知或邮件提醒。  对于这项新功能,用户反响不一。 除了一片吐槽声,也有不少用户推测 Tasks 可能是 OpenAI Operator 的雏形。X 用户 @kimmonismus 就认为:“信息似乎是正确的,一切都在为‘Operator’的发布做准备。”  与此同时,网友 Tibor Blaho 也发现 OpenAI 似乎正在开发代号为“Caterpillar”的功能。 它可以与 Tasks 集成,并允许 ChatGPT 搜索特定信息、分析问题、总结数据、浏览网站和访问文档——用户在任务完成时会收到通知。  给不熟悉的朋友补充一些背景知识。 根据外媒的爆料,Operator 是 OpenAI 计划于本月晚些时候推出的一款全新 AI Agent 产品,预计能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。 并且,与传统聊天机器人不同,Operator 甚至能根据用户的需求实时反馈调整其行为。 不过,此前有消息称,由于 Operator 在执行任务中用到的截图内容可能被恶意利用,导致所谓的“提示注入攻击”,存在严重的安全漏洞和风险,故而或将延迟推出。 实际上,在 2024 年开发者日上,OpenAI CEO Sam Altman 曾表示 2025 年将会是 AI Agent 的元年。 首席产品官 Kevin Weil 在 Reddit AMA 中也提到,ChatGPT 主动向用户发送消息也将成为 2025 年的重要特征。 截至发稿前,外媒 VentureBeat 也就 Tasks 和 Operator 的相关事项联系了 OpenAI。 但该公司拒绝回答这个问题,只表示 Tasks “将是使 ChatGPT 成为更有用的 AI 伴侣的重要一步”。 [查看评论](https://m.cnbeta.com.tw/comment/1471256.htm)
                     随着数字时代的来临,无论是象牙塔里的学生,还是已经步入职场的打工人,都选择以“拥抱”的姿态迎接AI技术的发展。作为AI使用的“探索者”,他们也不再满足于简单的提问和交流,而是不断深挖更多的AI强大功能——从学习到工作,再到日常娱乐,让AI全面渗透到生活的方方面面。 而年轻人熟悉的朋友——**最近热门的AI应用夸克,日前升级品牌Slogan“2亿人的AI全能助手” ,其用户规模领跑市场,00后用户占比超过一半。**经过2024这个AI爆发之年的强劲增长,夸克的用户数量实现了显著的跃升,这不仅是其自身技术实力和产品魅力的有力体现,更是广大年轻人积极拥抱AI的有力佐证。 在2024年,AI技术迎来了重要的发展节点,深度学习和大模型技术的突破,使得AI从单一任务向多形态、多任务智能跨越,展现出前所未有的能力。**夸克凭借其在AI搜索、AI写作、AI PPT等场景的深耕,为年轻人提供了一站式的AI服务,从搜索、创作、总结,到编辑、存储、分享,一体化的信息服务让大家体验到了AI带来的高效与便捷。**无论是学术研究中的前沿理论,还是职场工作中的行业动态,亦或是日常生活中琐碎的知识点,夸克都能在瞬间呈现最精准、最全面的答案,让知识的获取变得轻而易举,大大节省了年轻人的时间与精力。 夸克的用户规模增长,正是在这样的大背景下实现的。它不仅反映了年轻人对AI的高度关注和广泛应用,也展示了夸克在满足用户需求、提升用户体验方面的能力。随着AI技术的不断发展和应用场景的不断拓宽,夸克有望继续引领AI应用的发展潮流,为更多用户提供更加优质、高效的服务。 2025年,夸克希望通过不断跃升的AI能力,做年轻人学习、工作、生活中的得力伙伴,去解决他们遇到的各种问题。这也是夸克定位于AI全能助手的目标与底气所在。
<blockquote><p>在当今数字化时代,短视频已成为实体生意获客与成交的强大工具。本文将探讨同城实体生意如何利用短视频平台,通过内容创作和精准营销,实现快速触达客户、建立信任、增强熟悉度,并最终引导客户采取行动。作者将分享实用的策略和技巧,帮助实体商家在短视频时代抓住机遇,提升业绩。</p> </blockquote>  在当下流量为王的时代,短视频已经成为获客和成交的最有效工具之一。 不论是传统行业还是新兴行业,通过短视频,你可以快速让客户知道你、熟悉你、信任你,最终实现成交。 以下是短视频获客与成交的关键逻辑,帮你理清操作思路,让你的生意更轻松。 **1. 短视频能快速触达客户** 短视频的优势在于它的广泛覆盖和精准推荐。通过短视频,客户可以快速刷到你的内容,认识你的品牌和服务。 这种触达的效率,比传统的广告和线下推广方式高得多。不管是产品展示、服务流程还是品牌理念,只要用短视频展示出来,就能轻松抓住客户的眼球。 **2. 短视频建立客户信任** 成交的前提是信任,而短视频正是建立信任的最佳工具。通过真实的画面和专业的内容,你可以让客户看到你的实力和服务品质。 例如,分享客户案例、展示产品细节或分享专业知识,都能让客户对你产生信赖感。信任感越强,客户越愿意选择你的服务。 **3. 短视频让客户熟悉你** 频繁的短视频内容输出可以不断强化客户对你的印象,从而实现品牌记忆。持续的内容更新让客户从“陌生人”变成“熟悉的朋友”。 当客户产生需求时,自然会第一时间想到你。 **4. 短视频引导客户行动** 短视频不仅能让客户信任你,更可以直接促成成交。 在视频中,通过明确的行动指引(如“点击下方咨询”“加v领取福利”),你可以轻松引导客户采取下一步操作。抓住短视频的引导优势,获客和转化将更加高效。 **5. 短视频是一条完整的获客成交链路** 短视频的逻辑非常清晰: 让客户刷到你,实现初步曝光; 让客户信任你,通过内容展示专业度; 让客户选择你,通过引导实现成交。 在短视频时代,客户从陌生到信任、从信任到成交的过程被大大缩短。 总之,通过持续输出高质量内容,从吸引注意力到促成行动,你的生意可以更轻松、更高效地实现增长! 本文由人人都是产品经理作者【老陈的深度思考】,微信公众号:【老陈的深度思考】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。
据The Information报道,除非美国最高法院介入阻止禁令,TikTok计划于周日(1月19日)全面关闭其在美国的应用。**与其让已经下载的用户继续使用,TikTok选择直接关闭应用,届时所有用户切身感受到禁令的影响。**  根据计划,尝试打开TikTok应用的用户将会看到一个弹出消息,指引他们前往一个介绍禁令信息的网站。其中一位知情人士表示,TikTok还计划为用户提供下载个人数据的选项,以便他们保留自己的信息记录。 根据去年通过的一项法律,除非TikTok与其中国母公司字节跳动切断联系,否则该应用将于1月19日在美国被禁。TikTok已经以第一修正案为依据向最高法院提起上诉,并等待裁决。然而,上周五最高法院就此案的口头辩论中,法官们的提问表明,法院很可能维持该禁令。 **这项法律并未要求TikTok必须关闭应用,而是要求苹果和Google等应用商店运营商停止提供TikTok下载服务,同时要求TikTok的云服务提供商Oracle停止托管其美国用户数据。** 原本预计禁令生效后,已下载该应用的用户可以继续使用,直到苹果或Google的后续软件更新导致问题。这样一来,禁令的直接影响将仅限于阻止新用户下载应用。 **相比之下,主动关闭应用意味着TikTok的所有用户都将立刻受到影响。** TikTok的计划也解释了其律师诺埃尔·弗朗西斯科在上周五的最高法院听证会上的评论。当时他表示,如果法院未能阻止法律生效,该应用将“变黑”(即完全下线)。 根据《The Verge》报道,TikTok周二发给员工的一封邮件中提到,公司正在为多种情景做准备。对于美国的员工,公司表示:“即使在1月19日的最后期限之前问题尚未解决,你们的工作、薪酬和福利仍然有保障,我们的办公室也会继续开放。” 随着禁令日期的临近,人们对字节跳动如何应对的猜测也在增加,包括公司是否会改变立场,同意出售TikTok。 增加不确定性的是,唐纳德·特朗普将于禁令生效后的周一宣誓就任第二任总统。特朗普曾表示,他反对禁令,部分原因是他不希望看到Instagram母公司Meta平台的影响力增强。如果用户开始抱怨,他可能比现任政府更倾向于采取行动帮助恢复TikTok。 如果字节跳动出售TikTok的美国业务,禁令将被解除,这意味着新买家可以恢复该应用的正常运营。 [查看评论](https://m.cnbeta.com.tw/comment/1471254.htm)
美国洛杉矶山火仍在持续。华尔街经济学家认为,洛杉矶山火可能会造成超过数千亿美元的损失,在短期内对美国国民经济造成适度压力,但不太可能破坏美国整体的强劲增长势头。 经济学家们认为,这场大火可能会破坏美国房地产和就业市场,从而给美国通胀带来上行压力,同时也会减缓经济增长,并一定程度上抑制企业招聘需求。不过,其总体的影响程度还不足以从根本上改变美国经济增长的前景。 [](https://static.cnbetacdn.com/article/2025/0114/9845ecf6b658468.jpg) **或成美国史上代价最高气候灾难** 摩根大通经济学家阿比尔·莱因哈特(Abiel Reinhart)表示:洛杉矶山火正在成为美国历史上代价最高的气候灾难,不仅仅是这场灾难的规模,也是山火摧毁的住宅房地产的高价值。 莱因哈特指出,他认为这场山火带来的经济损失估计在2500亿美元左右,超过此前2005年卡特里娜超强飓风造成的损失。作为对比,2023年美国国内生产总值(GDP)的总规模接近30万亿美元。 不过他表示: <blockquote>“我们认为短期内对全国GDP增长、就业和通胀的影响将很小。”</blockquote> **或短期拖累美国经济增速** 高盛的经济学家对此表示赞同,并表示,过去的自然灾害为预测未来提供了线索。 他们预计,如果不考虑重建相关活动的影响,这场大火将拖累美国第一季度经济增速约0.2个百分点。 他们预计,受火灾影响,1月份美国的就业增幅可能会减少1.5万至2.5万个岗位,这对美国经济的拖累相对较小。作为对比,去年12月,美国新增了25.6万个就业岗位。 高盛的预测人士认为,这场大火也并不会推高失业保险申请人数。 摩根士丹利分析师的看法大致相同。他们预计1月的美国新增就业人数将因火灾影响减少2万至4万人。在通胀影响方面,他们指出,扣除食品和能源成本的消费者价格指数(CPI)可能会因火灾影响而提高4至9个基点。 摩根士丹利的预测人士指出:“核心商品价格似乎会受到冲击,尤其是二手车和新车…我们发现有证据表明,在类似的灾难发生后,二手车和新车的价格出现了更强劲的上涨”,而“除汽车外的核心商品似乎没有受到明显影响。” 摩根大通经济学家莱因哈特表示,“我们预计租金、建筑供应和住宅建筑劳动力将面临局部上涨压力,但全国性影响有限。” [查看评论](https://m.cnbeta.com.tw/comment/1471252.htm)
韩国调查人员在周三黎明前发起行动后,成功拘捕了被弹劾的总统尹锡悦。由于尹锡悦多次拒绝就戒严令风波所涉内乱罪接受传唤,韩国高级公职人员犯罪调查处一直寻求将其收押。调查人员1月3日进行了首次拘捕尝试,但在与尹锡悦安保团队对峙近6个小时后无功而返。 公调处证实尹锡悦已被捕,这也使得他成为韩国历史上首位被拘捕的现任总统。韩国宪法法院周二进行了尹锡悦弹劾案的首次庭审,由于他本人缺席,开庭仅四分钟后便宣布休庭。  尹锡悦在一份声明中称,他同意前往公调处接受问讯是为了避免发生任何“令人不快的流血事件”。他表示,这并不意味着他认同调查的合法性。 成功拘捕尹锡悦意味着公调处对12月初戒严令风波的调查可以迈出下一步。这场突如其来的风波引爆韩国数十年来最严重的宪政危机,令当地市场受到重创,也震惊了国际社会。 尹锡悦被捕后,韩元兑美元一度涨0.2%。韩国股市继续回吐稍早涨幅,基准Kospi指数目前涨约0.3%。 调查人员可拘留尹锡悦48小时,可能在位于首尔附近果川的办公室对他进行讯问。如果他们想在首次拘捕后继续拘留他最多20天,则需再次申请逮捕令。 “不幸的是,这个国家的法律已经崩溃,”尹锡悦表示。“向无权调查的机构签发逮捕令,这令人痛惜”。  韩国调查人员在黎明前发起了这次拘捕行动。韩联社称,行动开始几小时后,一些调查人员设法突破了尹锡悦安保团队为阻止外人进入总统官邸而设置的第三道防线。 视频显示,警方使用梯子,通过徒步小道进入位于首尔龙山区的总统官邸区内部。在零下的气温中,附近聚集有数千名抗议者。 自第一次拘捕行动失败以来,政府机构间可能发生的冲突导致紧张局势加剧。尹锡悦的总统官邸周围设置着阻拦车辆和铁丝网,他也被武装安保人员重重保护。 韩联社称,警方此次出动了约3000人执行逮捕令,约有6500名示威者聚集在外支持尹锡悦。 现年64岁的尹锡悦已经被停职,目前正等待宪法法院就是否永久解除其职务做出判决,这一过程可能将耗时数周或数月。 [查看评论](https://m.cnbeta.com.tw/comment/1471250.htm)
2025年1月15日,据路透社消息,英国一场针对苹果公司和亚马逊公司的重大诉讼被法庭驳回。该诉讼由消费者法学者克里斯汀·里法代表约3600万购买过Apple或Beats产品的英国消费者提起,指控两家科技巨头涉嫌合谋从亚马逊网站上删除苹果新产品的经销商。  据里法的律师声称,苹果和亚马逊在2018年达成了一项协议,该协议禁止了绝大多数苹果和Beats品牌产品的经销商进入亚马逊在英国的市场,从而减少了这些产品的市场竞争。这一指控若成立,案件价值将达到4.94亿英镑(约合6.02亿美元)外加利息。 然而,苹果和亚马逊均对此表示否认,认为这一诉讼毫无根据,并请求竞争上诉法庭拒绝让该案继续审理。 在经过审理后,仲裁庭作出了裁决,认为里法在第三方资助诉讼方面未能表现出“足够的独立性或稳健性”来代表原告群体,因此该案无法继续审理。 截至目前,里法的律师以及苹果和亚马逊的发言人均未对此裁决发表进一步评论。值得注意的是,竞争上诉法庭拒绝认证该案件是此类诉讼早期步骤中的不常见决定,因为通常认证门槛相对较低。 [查看评论](https://m.cnbeta.com.tw/comment/1471248.htm)
作者 | 赖文昕 编辑 | 陈彩娴 不久前,我们发布《CMU 具身智能风云榜:从传统到全面》一文,介绍了来自 CMU 的一众具身智能华人人才。 就在上个月,CMU 联合18个研究机构开源发布了一个生成式物理引擎——Genesis,引起了具身智能领域的广泛讨论与关注,在国内与海外呈现出霸榜的热度。Genesis 的核心团队为 12 位青年华人学者,其项目领导者为 CMU 机器人研究所刚毕业的博士生周衔。 凭借从底层开始重新设计和构建的通用物理引擎,Genesis 将各种物理求解器及其耦合集成到一个统一的框架中,通过在更高层次上运行的生成式智能体框架得到进一步增强,旨在为机器人技术及其他领域实现全自动数据生成。 据项目页面介绍,与先前的模拟平台相比,Genesis 具备多个关键特点: - 原生 Python,包括前端界面和后端物理引擎,全部用 Python 语法开发。底层由嵌套在 Python 内的 GPU 加速的 DSL taichi支持。 - 轻松安装,API 设计极其简单且用户友好。 - 并行模拟,速度空前:Genesis 是世界上最快的物理引擎,其模拟速度比现有的 GPU 加速机器人模拟器(Isaac Gym/Sim/Lab、Mujoco MJX 等)快一个多数量级,且并没有在模拟精度和保真度上为了优化速度做妥协。 - 一个支持各种最先进物理求解器的统一框架,可对大量材料和物理现象进行建模。 - 具有优化性能的逼真光线追踪渲染。 - 可微性:Genesis 旨在与可微模拟完全兼容。目前,我们的物质点法(MPM)求解器和工具求解器是可微的,其他求解器的可微性也将很快添加(从刚体模拟开始)。 - 物理精确且可微的触觉传感器。 - 原生支持生成式模拟,允许通过语言提示生成各种模态的数据:交互式场景、任务提议、奖励、资产、角色动作、策略、轨迹、相机运动、(物理精确的)视频等等(这个框架会内部的各模块会慢慢放出)。  项目页面:https://genesis-embodied-ai.github.io/ 从速度来看,Genesis 在单台 RTX4090 设备上的数据量可以达到实时的 430000 倍,26 秒就能训练出可迁移至现实世界的机器人运动策略;从效果来看, Genesis 能生成 4D 物理世界,如机器人操作和运动策略、开放世界铰接式物体、角色运动、3D 和完全交互式场景等等。 不过,在 Genesis 纷纷被认可其实现大模型“创世纪”的可能性之际,也有一些质疑的声音对其精确度和速度表示怀疑。本周三,Genesis 团队更新了一份详细技术报告,测评了各种场景下和主流并行仿真器的速度对比,并且开源了所有测试代码。 主导项目的周衔本科就读于新加坡南洋理工大学的机械工程系,以最高荣誉毕业后在 2017 年来到 CMU 读博,成为导师 Katerina Fragkiadaki 组里首位研究机器人学习(Robot Learning)的PhD。  2022 年 5 月,周衔在师姐的牵线下来到 MIT-IBM Watson AI Lab 实习,与淦创展开合作。也是从这时起,周衔的研究重点确认为建立统一的神经策略和数据引擎。 从“天马行空”地尝试复杂的流体操作任务开始,周衔逐渐与更多志同道合的华人学者相识,就此开启了 Genesis 的故事。 对于 Genesis 正在面临的讨论,周衔十分自信且坦诚,“我们肯定会长期维护,要把它做成一个具身智能和物理AI最好用的仿真和数据平台,同时通过借助开源社区的力量把这个底层的平台维护好。” 以下是 AI 科技评论与周衔的对话。 **从仿真器到数据引擎** **AI科技评论:22年您到 MIT-IBM Watson AI Lab 实习,Genesis 的 idea 是怎么诞生的? ** **周衔:**以前机器人做偏向于刚体的操作任务,22 年到 MIT 时我想做与流体相关的复杂操作任务,如咖啡拉花、与烟雾交互。但这些任务在现实中采集数据困难,因机器人置于水中易损坏,环境也杂乱,用强化学习或优化轨迹时,有水等液体的环境重置不易,所以自然就想到从仿真环境入手。 这也是我首次接触仿真。此前仿真器多是计算机图形学的学者在研究,当时想用仿真器,却发现没有特别合适的,像英伟达的 Flex 及基于它的 SoftGym,虽有基本的水和衣服模拟,但无法实现不同性质流体的交互,存在诸多问题。此外,我们希望仿真器可用,能借助其梯度信息搜寻策略。 正巧淦创老师组里之前有相关工作,还与发表“太极”编译器的胡渊鸣合作过,于是我们设计了许多与各类流体交互的任务,自己写了一个流体仿真的环境和测评基准“FluidLab”。 当时我结识了宋舒然老师的学生许臻佳和在 MIT 的王尊玄(Johnson),然后我们大家一起合作做了几个在不同领域但底层框架类似的项目,比如 Johnson 做软体机器人模拟,许振佳做切水果、切牛排等任务,然后我们分别为这些项目实现了底层的物理仿真,不过当时更多聚焦于软体、流体以及软体机器人本身,且都是项目特定的,无法让研究社区的使用者很容易的就安装体验。 我们觉得一个统一的物理仿真平台会对整个机器人领域有帮助,23 年初便决定将这些成果整合起来,打造一个对有软体仿真需求的人而言好用、易配置环境并训练策略的框架——这就是 Genesis 的前身,我们致力于打造一个大一统的仿真平台,重点在软体方面。后来我们觉得刚体很重要,但当时这个超出了我们的知识范围,于是就又找了马里兰大学的 PhD 乔怿凌,他做过一系列可微仿真的工作,加入后负责帮助我们实现整套刚体的仿真框架。 **AI科技评论:那 Genesis 是如何从一个仿真器演进为数据引擎的? ** **周衔:**起初,我们本只想做一个仿真器。但到了 2022 年末,ChatGPT 问世且效果出色。 在此之前,即便我们能做出比英伟达 Omniverse 更好的仿真环境,在仿真环境里收集数据仍需耗费大量人力。 具体来说,在现实中收集机器人的视觉校准数据,即给定任务描述后,机器人依据所见规划电机动作与周围环境交互来完成任务,一般采用人力采集的范式,不管是用 VR、AR 设备还是其他操控装置,本质上数据量与人力呈线性关系,要采集上百亿条数据极为困难。 在仿真环境中也不轻松,虽像人狗跑跳的演示是用强化学习在仿真中训练出来的,但在训练策略前,确定机器人学习的任务、学习环境、环境布置、物体交互方式以及奖励函数等环节都依赖人力。所以即便有了仿真环境,若要真正实现数据收集的规模化扩展,依旧艰难。 GPT 出现后,推理能力质的飞跃使其足以担当推理引擎。在机器人领域,很多人试图直接让 GPT 输出动作指令,但我们意识到此路不通。尽管 GPT 有推理能力和常识,可它缺乏对物理动力学、动作等模态信息的理解。比如让它关笔记本,它虽知道语言层面的操作步骤,却不懂实际手部动作的反馈、力度控制等物理细节。 经过反复讨论,我们在23年上半年有了新的思路:利用 GPT 等语言或视觉模型的正确方式,是提取其擅长的部分,比如确定机器人有意义的任务(如拿外卖、擦桌子等),以及每个任务适合的训练环境(如拿外卖对应客厅的布局、物体设置等),还有任务完成与否的判定标准,通过编写代码的方式生成奖励函数。 半年后,谷歌的“Language to Rewards for Robotic Skill Synthesis”和英伟达的“Eureka”接连发布,其思路与我们一致,即借助在代码里设置奖励函数的手段,构建起大语言模型在语言范畴对世界的认知以及在物理领域同世界的交互联系,待语义层面的静态信息完整生成后,就可以把它们交给强化学习,使其在物理引擎中对策略展开训练。 **AI科技评论:团队很快就确认 Genesis 是一条行得通的路。** **周衔:**没错,想通这个 pipeline 那晚的我们特别激动,因为突然意识到可以打通整个流程,从提出任务到获取解决任务的行动数据,理论上完全无需人力,能靠算力自动化生成机器人数据。这也是从大语言和视觉模型中提取其掌握范围内的信息,再通过物理仿真让机器人试错、迭代,最终掌握演示方法。 23 年初到年中,我们试验中发现这个全新框架虽各环节尚不成熟,但切实可行,从现有技术到最终实现,每个环节都有清晰的提升路径,不存在有一个环节在技术上还存在巨大鸿沟的情况,只需将各环节从四五十分提升到七八十分,就能打通流程获取数据。从数据驱动来看,若要使机器人策略模型达到 GPT、Sora 的水平,也需要海量数据,那么这条路便是更具扩展性的方法。 **Genesis 的核心:易、快、准、开** **AI科技评论:Genesis 最大的亮点是什么?它和其他仿真引擎相比,有何异同?** **周衔:**我认为有三大亮点,分别是易用性、速度与功能。 易用性方面,虽不和技术强相关,但是我个人最喜欢的部分。尽管还有很多满足各种需求的 API 还没有完全暴露给用户,但已完成的部分 API 设计简洁,学习和理解成本非常低,我还精心设计了整套可视化方式,从机器人状态呈现到颜色、缩进、emoji 运用等都花费很多没有意义但是我很enjoy的时间,希望可以优化特别是刚进入具身智能和机器人领域研究者的用户体验。 速度上,英伟达用 GPU 加速让仿真的速度大幅提高,而我们在此基础上又将速度提升一个数量级。不过,目前我们还需研究如何更好利用此速度优势,开发新的强化学习训练方案。 功能上,多数成熟仿真环境只能做刚体仿真,像 Omniverse 对软体和流体的仿真物理不准。我们在统一框架里集成各类物理求解器,如 MPM 等,支持多种物理性质物体求解,也实现了不同求解器间交互,虽处于早期但会持续迭代,且前端用户界面好用,后端用太极和 Python,语法透明,便于开发者贡献和维护。 **AI科技评论:感觉您对开源很有热情。** **周衔:**这和我一个强烈的个人动机相关。以往仿真环境多由计算机图形学领域的人开发,该领域人才厉害但壁垒高,也很少开源工作,虽现在逐渐开源但祖传C++ 代码依旧难懂,其成果应用也比较难。 在机器人和具身智能领域,对仿真能力有依赖,但以往计算机图形学研究者不懂机器人研究需求,机器人研究者不懂仿真物理原理,并且双方都受英伟达闭源的 CUDA 生态制约。比如在仿真环境中制定策略部署到真机上,发现差异想回仿真环境调参却因不了解原理而无法操作,导致两个领域虽相互依赖却存在巨大割裂。 所以我认为当下亟需让计算机图形学领域的优秀人才和算法重焕光彩,让其为机器人领域所用。具身智能领域能够充分发挥计算机图形学从渲染到仿真的技术和人才价值。因此,我有很强的动力去打造一个完全透明、底层全开源、易于访问、理解和贡献的平台,无论是机器人领域人才还是其他相关人员都能轻松参与,这便是我愿意为此事投入大量时间的原因。 **AI科技评论:可微分性的实现难度大、也容易和优化策略产生冲突,现有的大多数物理引擎都不支持,为什么 Genisis 会采取这个路径呢?** **周衔:**这里其实有个误区,大家以为我们的目标是做可微仿真,实则不然,这只是我们提供的一个会帮助这个领域发展的重要feature。 最初在做流体等精细操作任务时,我们意识到,单纯依靠纯强化学习通过大量采样轨迹来寻找最优路径,而若有梯度信息,就能引导策略朝着正确方向发展,这在当时极大地加速了训练过程。不过,利用可微仿真和梯度信息来加速强化学习的策略搜索,在学界至今仍处于研究阶段,尚未达成共识。 目前的框架不成熟也不好用,属于小众探索领域。此前的工具如 Google 的物理模拟引擎 Brax,学习曲线很高,功能也不完善物,而之前我们做的 FluidLab 这些工作,因为和底层的 taichi 绑定比较深,对于外部用户来说想要获取梯度也存在困难。 所以,为了加速这一领域的研究,我们认为有必要打造一个如同 Pytorch 般好用的工具,方便获取梯度并与策略网络连接。这并非我们主要的优化方向,而是我们额外提供的工具和功能,旨在推动可微仿真研究的加速发展,以便让我们了解其对学习策略的提升作用。 **“为爱发电”** **AI科技评论:Genesis 历时两年,您觉得其中最大的困难是什么?又是如何克服的呢?** **周衔:**Genesis 如此庞大的系统,涉及诸多方面的开发,而个人的专业知识无法覆盖全面。一方面,我们要寻觅各领域的专业人士,比如做生成式模块时,得拓展人脉,拉更多合作者加入。就像我自己,两年前对仿真一窍不通,也是在这个过程中学习的。 我深感推进这样的大项目在学界极为困难,因为我们采用的是自下而上的合作方式。淦创老师虽为项目顾问,却并非传统意义上的导师,大家是平等的合作者,他帮忙联系一些人参与进来。 一般的学术合作,导师手握经费,学生为其工作,但这个项目由我来主导推进统筹规划,但却无法给予任何人经费上的激励,全靠大家“为爱发电”。这就导致合作形式松散,每个人都有各自的学业得完成,时常忙得不可开交。 我其实有点完美主义,常常想花很多的功夫想把事情打磨到极致,然而在这种模式下,当其他合作者不认同我提出的需求时,因为我们这种自下而上的合作方式,我很难以像PhD老板那样要求他们。比如另一位核心贡献者、马里兰大学博士乔怿凌负责刚体仿真框架的实现,最初的版本因为我们想统一各种材料的表示和全局的碰撞检测和求解,速度很慢,当时我希望可以在速度上至少可以达到 Isaac 和 MJX 的水平,但当时的团队认为可能很难实现。 于是我当时唯一的选择是自己把整套框架拿过来逐行拆解优化,尝试对每个 GPU Kernel 内的数据结构和循环层级进行优化。当时我连睡觉都想着如何给它提速,经过多轮不懈努力后,最终我们成功实现比 Issac Gym 快了很多。类似情况还有很多,当合作者缺乏达成目标的动力时,我有时需要自己接手重新优化和设计,并证明一个更好的状态是可行的。我们之间的信任就是在这样的过程中建立起来。 无论如何,我们还是坚持下来并完成了项目。若有一个高效的七八人工程师团队,或许七八个月就能完成,而我们作为缺乏工程经验的博士生,很多东西都是边摸索边做,把自己当工程师使,在探索中学习如何设计、搭建和整合各个模块。 **AI科技评论:自学成为工程师是一种什么体验?** **周衔:**我觉得最有趣的是,过去大家常用的仿真环境代码极为复杂,作为初学者,会被其复杂程度吓到,还会揣测其背后是否真有不得不如此复杂的缘由,只是自己尚未理解。 但我个人倾向于精心打磨用户体验,期望每个功能都能通过一行代码调用,简单易用。而随着自己的钻研,我意识到大多代码能大幅简化。如今我简化后的成果,收到很多用户反馈,都说非常好用,对新手很友好。 这让我有了另一个感悟:很多时候,我们以为一些事情复杂背后定有隐情,但当自己亲自上手去做,就会发现完全可以将其做得更好。 **AI科技评论:当时您有想过 Genesis 会耗时这么久吗?** **周衔:**2023年初我开始做 Genesis 时以为大半年就能写完,到2023年底时,感觉已经写得差不多了。但后来发现距离成熟框架还差很远,于是不断迭代、修改。 要是最初有人跟我说这得做两年,我可能都不会开始。我们有几套成熟软件框架,能直接在上面改,但大家都在抱怨现在的物理引擎难用,却没人去解决这个问题,我们就想着自己来试试。 从23年一月开始,最初我们只是想写个仿真框架,到了三月有了新想法,可以真正实现自动化,不仅有底层物理引擎,还能通过它自动生成数据,是能原生生成数据的引擎。这意味着这个工作上升到了一个新维度,特别令人兴奋,所以我们就一直做下去了。 **回应质疑** **AI科技评论:Genesis发布之后热度颇高,在收获赞扬的同时也有些对测试速度、精确度等方面的challenge,您怎么看待这些质疑的声音?** **周衔:**网传的一份质疑我们速度的报告赚足了很多眼球,一开始我们担心确实是我们的疏漏导致早期的测试结果与实际不符,所以最初的两天压力非常大,于是这几天一直在做各种测试,测试的结果是 Genesis 确实在速度上有很大的优势。 那份质疑里有很多存在的问题,有些我们觉得不是作者的主观意图,比如没有用相同的机器人模型,同时因为我们内部一个碰撞检测的环节对于方块的支撑函数实现中有个bug,导致那份测试报告的某个场景在打开自碰撞之后掉速严重,这个我们已经修复了。其他地方我们发现有很多是事实性的错误和有误导性的设置,比如因为不知名原因改掉了官方使用的求解器选择,对于一些基本概念的错误理解等等,这些我们在和作者的沟通过程中对面也承认了,并且承诺会更改这些错误。 另外有关对 Genesis 精确度方面的质疑,认为我们的物理引擎不如 PhysX,需要更多计算资源才能达到其精确度,但事实却相反。学界公认 Mujoco 的物理引擎和英伟达的 PhysX 相比是更加符合解析解的 formulation,后者是比较接近 PBD(基于位置的动力学)的相对简化的物理模型。我们构造约束系统时遵循了 Mujoco 的约束,然后额外实现了 GPU 加速的碰撞检测,在控制变量的情况下行为能和 Mujoco 完全保持一致的,像方块掉落旋转再回转,行为和时间点都能精准匹配。 另外可能需要注意的是,抓取的稳定性有时候和物理的准确性并不完全对应,因为在现实世界中很多时候的抓取也会存在不稳定性,我们现在的这个模块可以完全匹配Mujoco的求解结果。而我们下一个大版本的更新会支持 GPU 加速的 ABD(Affine Body Dynamics,仿射体动力学)和 IPC(Incremental Potential Contact,增量式潜在接触),可以更加精确的建模现实世界的接触模型,这也是其他主流刚体仿真器不支持的。 **AI科技评论:目前的机器人操作领域,大家的共识集中在真机而非仿真,为什么您会选择非共识?您怎么看待仿真与真机数据呢?** **周衔:**我并非认为只有仿真才能行得通而真机不行,我们更多的是觉得,所有有价值的路线都值得探索,而且需要推动到极致。 仿真陷入瓶颈,一方面是生态不透明,无法在其基础上迭代和贡献;另一方面,当下众多优秀模型如 GPT 等的发展,离不开算力提升。 但完全依赖真机采集数据无法利用这一点,难以指数级扩展数据规模,人力成本又高。而仿真有很大优势,虽真机在缩小与真实世界的差距以及处理复杂物理现象上有优势,但仿真能提供大量数据,让机器人建立与物理世界交互的基本认知,即便不精准,也可通过真机的精准数据提升其局限性。 我认为两者应结合,仿真占比绝大多数,因为其可通过算力无限扩展,虽质量有欠缺,但能提供广泛数据。 真机存在的问题是,如人形机器人通过强化学习行走等炫酷演示,只是数据驱动的结果,并非真机有本质科学突破,只是大家意识到数据重要性而暴力采集真机数据,这就像“吸鸦片”,一旦真机数据带来的 demo 效果达到饱和,便难以为继。 总之,我认为仿真和真机两条路都要走,真机也有价值,做仿真不是认定只有它行,而是其存在很多遗留的问题需要解决,所以我们希望可以把这条路继续向前推进。 **AI科技评论:那接下来 Genesis 还会有更新吗?后续会有更多对 manipulation 的支持吗?** **周衔:**我们肯定会持续更新,目标是将其打造成对机器人最友好的平台,让大家共同维护好这个开源社区。之后会组建一个成熟的工程师团队长期运维,今年年初开始做整体的路线规划及团队搭建。 关于 manipulation 方面,之前有一些声音称 Genesis 更支持移动(locomotion),操作精度有仿真精度的问题,但实际上并非如此,我们不存在不支持操作的情况。而对于机器人领域有意义的功能、特性以及需要修复的漏洞等,我们都会以高效方式及时添加和解决。我们做这个平台的初心就是可以有一个完全透明,所有人都可以贡献,而且功能强大的框架,作为一个平台把计算机图形学,物理仿真,渲染,以及具身智能的学者可以团结起来,一起来创造物理 AI。 关于具身智能领域的更多精彩故事,欢迎添加雷峰网作者微信 anna042023 交流。雷峰网
2025年1月15日,据路透社消息,受去年秋季严重罢工及多重因素影响,波音公司2024年的新飞机交付量降至新冠疫情爆发以来的最低水平。波音公司当地时间周二公布的数据显示,去年全年共交付了348架商用飞机,较前一年的528架有显著下降。同时,新订单量也大幅缩减,不到一年前记录的一半。  生产质量问题、更严格的监管审查、供应链延迟以及为期七周的罢工,共同减缓了这家美国飞机制造商的装配线速度。罢工于11月5日结束后,波音公司对恢复生产采取了谨慎态度。据媒体报道,其737生产线已于12月初重启。12月,波音公司交付了30架飞机,包括17架737 MAX和9架787,月度交付总数高于11月和10月。 在整个2024年,波音公司交付了260架737 MAX、51架787、18架767和14架777。然而,飞机制造商的大部分收入来自交付飞机,这一交付量的下降无疑对波音的财务状况构成了压力。波音新任首席执行官凯利·奥特伯格曾在10月份告诉投资者,他预计该公司今年将继续面临资金压力。 在订单方面,波音公司的年度订单总数从2023年的1456份暴跌至2024年的569份,取消和转换后的净订单也从1314份锐减至377份。根据会计准则调整后,波音去年的净订单量为317份。 12月份,波音公司共获得142架订单,其中包括飞迪拜航空的30架787订单和土耳其飞马航空的100架737 MAX订单。值得注意的是,土耳其飞马航空是空客的长期客户。迪拜航空的订单最初于2023年11月公布,但直到上个月才最终确定。 此外,波音公司还在去年12月取消了印度捷特航空公司的135份订单,这是在印度最高法院下令清算该航空公司后做出的决定。截至年底,波音公司尚未完成的订单为6245份,而根据会计准则进行调整后的官方积压订单为5595份。 与此同时,波音的欧洲竞争对手空客在2024年表现强劲,共交付了766架飞机,并在取消和改装后获得了826份净订单。这是波音连续第六年在交付量和订单量上落后于空客。 [查看评论](https://m.cnbeta.com.tw/comment/1471246.htm)
美国货架上的食品包装正面,可能很快就会贴上令顾客购买欲望锐减的“警告标签”。根据美国食品药品监督管理局(FDA)周二提出的一项新规定,食品制造商必须在包装正面贴上新的营养成分表,标明有关盐、添加糖和饱和脂肪的关键营养信息。  这项规定是即将卸任的拜登政府为改善美国人饮食习惯所做努力的一部分。拜登政府认为,随着与饮食有关的健康问题(如二型糖尿病和心血管疾病)的增加,这一更为显眼的标签能有助于消费者做出更为健康的选择。 与国际上常见的做法一样,FDA此前已经要求大多数包装食品在包装上罗列出营养成分表——但通常都在背面或侧面。 而新的营养成分表将被要求直接贴在包装的正面。拟议的标签为醒目的黑白两色,还将包括产品中盐、添加糖和饱和脂肪这三种物质的含量,按每日建议最高含量的百分比计算,并标明产品的盐、添加糖和饱和脂肪含量是高、中还是低。  FDA警告称,过量摄入这些物质会导致慢性疾病。 FDA负责人类食品的副局长Jim Jones表示,“食品应该是健康的载体,而不是慢性疾病的诱因。我们有可能会看到生产商根据包装前营养标签的要求重新配置产品,使其更健康。” FDA表示,该机构将在5月16日之前接受公众对其提案的评论。如果该规则在此之后最终敲定,食品制造商将被要求在规则生效的三到四年后在大多数包装食品上添加新的营养成分表。 **食品行业反对** 显然,此项拟议中的举措可能会与食品公司发生冲突。 食品行业团体认为,几乎没有证据表明包装正面的营养成分表会改变消费者的行为,现有的营养成分表已经为消费者提供了足够的信息。 代表大型食品制造商的美国消费者品牌协会(Consumer Brands Association)表示,这项规定没有反映最新的研究成果。该组织称,研究表明,最有效的标签包括鼓励摄入的卡路里和营养素,以及限制摄入的营养素。 该协会负责产品政策的高级副总裁Sarah Gallo称,“美国食品和药物管理局对包装正面营养成分表的拟议规则,似乎是建立在不透明的方法和无视行业意见与合作的基础之上的。” 食品行业团体已经警告FDA,他们可能会提起诉讼,挑战这一强制性的要求。他们指出,此类营养成分表的强制要求可能会威胁到第一修正案的权利——因为公司可能会认为这是一种强制言论,而且只有国会才有权要求使用这种标签。 食品行业的游说者还指出,一些食品公司担心新的强制性标签会不公平地妖魔化他们的产品。他们表示,虽然过度摄入糖可能并不健康,但在这里或那里吃一点糖并不会对健康造成重大威胁。 目前还不清楚即将上任的特朗普政府将如何看待这项规定。小罗伯特·肯尼迪(Robert F. Kennedy Jr.)是特朗普敲定的下任卫生部长提名人,他也是加工食品的批评者,并直言不讳地认为美国食品公司对美国人患病负有部分责任。 消费者权益组织和公共卫生组织则对这一规定表示欢迎,甚至还有一些组织表示,他们希望特朗普政府能考虑采用与其他国家类似的标签,标注上更为尖锐的警告。 值得一提的是,不少研究此前确实发现,包装正面的营养成分表往往会引导人们识别和选择更健康的食品。智利、墨西哥和其他国家现在都要求在食品和饮料容器上贴上标签,而法国、英国和澳大利亚等其他国家则实行自愿计划。 一些食品公司已自愿在食品包装正面张贴营养成分表,标明饱和脂肪和钠含量等信息。这些标签还强调了热量和公司希望宣传的营养成分,如纤维素或钙。 [查看评论](https://m.cnbeta.com.tw/comment/1471244.htm)
**摩根大通分析师估计,如果获得美国证券交易委员会的批准,一批持有替代加密货币的交易所交易基金(ETF)可能会吸引高达140亿美元的资金流入。**这家总部位于纽约的银行的分析师预测,拟议中的Solana ETF将在6到12个月内吸引30亿至60亿美元的资金,而XRP基金将在同一时间段内吸引40亿至80亿美元的资金。  为了得出这一预测,摩根大通研究了现有现货加密货币ETF的所谓采用率。在分析时,比特币基金持有约1080亿美元的资产,约占该代币市值的6%。这些基金恰好在一年前进入市场。以太币ETF自六个月前推出以来已筹集了120亿美元,渗透率为该代币市值的3%。 尽管摩根大通预计,全球最大的数字资产比特币将继续成为投资者青睐的加密货币,但分析师表示,Solana和XRP也可能引起极大兴趣,尽管人们对其兴趣程度存在疑问。 摩根大通分析师肯尼斯·沃辛顿(Kenneth Worthington)在一份报告中写道:“这里的关键问题仍然是投资者对额外产品的需求的不确定性,以及新的加密ETP的推出是否重要。” 值得一提的是,去年,美国证券交易委员会收到了几份基金申请,这些基金追踪各种类型的加密货币,例如第三大数字代币XRP、全球第六大代币Solana和规模小得多的代币莱特币。大量申请表明,整个行业都在努力向大众开放这一资产类别。 如今,加密货币已成为唐纳德·特朗普11月大选胜利的关键主题之一。这位候任总统曾是比特币怀疑论者,后来成为比特币的倡导者,他承诺扭转乔·拜登总统领导下的监管打击,从而激励了数字资产界。 到目前为止,他的行动符合该行业的利益,尤其是任命行业支持者保罗·阿特金斯取代加密货币对手加里·根斯勒担任美国证券交易委员会主席,并设立一个专门负责人工智能和加密货币的新职位。 摩根大通承认,由于政府变动,比特币和以太币以外的ETF的进展可能会很慢,尤其是考虑到监管不明确。不过,分析师“预计其他ETP申请将在2025年提交,并可能获得批准。” [查看评论](https://m.cnbeta.com.tw/comment/1471242.htm)
日本汽车进口协会1月9日公布了2024年国内纯电动汽车销量。中国比亚迪同比增长54%,达到2223辆,首次超过了丰田(2038辆)。这是比亚迪在日本市场的销量首次超越本土品牌,标志着中国品牌在日本市场取得了重要突破,实现了新能源时代的弯道超车。 日本是传统汽车品牌的强国,日本汽车品牌在全球市场具有强大的影响力。日本汽车消费均以本土品牌为主,过去,很多品牌想进入日本市场,都难以取得突破。比亚迪能够在这个竞争激烈的市场中超越丰田,实属不易。  图1:比亚迪EV销量超越丰田 比亚迪2022年7月进入日本市场,是首个进入该市场的中国新能源汽车品牌。首款车型为BYD ATTO 3,售价440万日元(约合22.8万元),随后,引入海豚、海豹等车型。拉动销量增长的是轿车“海豹”,标准版售价528万日元(约合24.1万元)。“海豚”限量版定为299万日元(约合13.9万元)起,这一适中的价位,高性价比赢得了市场和消费者的认可。目前比亚迪已在东京、大阪、横滨、名古屋、福冈等城市开设门店,预计到2025年年底门店数量将达到100家。 在“日本年度风云车”评选中,比亚迪海豹凭借卓越表现,荣膺2024-2025日本年度风云车“十大最佳车型”奖。这是日本历史最悠久、最具权威性的汽车奖项之一,也是中国汽车品牌首次获此荣誉,具有里程碑式的意义。  图2:日本年度风云车-海豹荣膺“十大最佳车型”大奖 [查看评论](https://m.cnbeta.com.tw/comment/1471238.htm)
<blockquote><p>我们都知道产品运营不分家,职场上产品和运营是两个亲密的战友。即便如此,总有一方的任务会更重一些。这篇文章,我们来看看作者从带孩子思考到两个职位的差异,希望能给大家带来一些启发。</p> </blockquote>  自家孩子已经好几岁了,目前看来长得还不错,感谢家人的付出。 在参与带孩子的过程中,让我不禁联想到互联网一个老话题:对于一款互联网产品的成功,产品和运营哪个岗位更重要? 孩子的出生,就像互联网产品团队孵化一款0-1的产品一样。唯一不同的是,孩子的诞生不需要市场调研、需求分析,一旦爹妈对了眼,接下来就是爱情的结晶。 产品就像是自己的孩子,产品像爹,父爱如山,一动不动,倾听孩子成长的声音,在背后默默支持;运营像妈,陪伴产品整个成长过程,活动推广,三头六臂。爹妈团结一心,各自发挥自身才能,就能把产品做好。 此前,互联网行业流传着一句话:产品运营不分家。意思是在负责同一款产品的生命周期过程中,产品和运营发挥的作用和价值是相辅相成的,没有办法明显区分开,一款产品的成功到底是谁的功劳。 产品经理在一款产品的生命周期中,负责前期市场调研、用户洞察、需求分析,为产品的诞生寻找一块安全的蓝海泽地,当产品不辞辛苦地协调研发团队将产品开发出来上市后,接下来就是运营介入进行市场预热、推广。产品上市后,产品经理和运营人员一起,继续为产品的规划迭代、营销宣传、拉新变现努力。 运营会给产品经理提供好的产品反馈和建议,为产品增添具备竞争力的功能。这就好像妈妈们在宝妈群里看到了某些新奇的玩具、科学的教育方式,然后回来反馈给爸爸们,由爸爸们负责陪玩。 偶尔,产品经理也会像爸爸们一样,在女性同事中了解到某些不错的育儿方法,回来反馈给妈妈运营,可以带孩子去干啥,比如童模比赛、素质教育培养等等。运营活动时,产品爸爸们也会熬夜等上线。 孩子从出生到死亡的整个产品生命周期要大概要经历以下阶段: - 开发期:妈妈备孕生育,孩子出生后大概从1岁迭代到3岁; - 引入期:3岁开始接触早教、幼儿园,开始学习知识技能,一直到受教育阶段结束;期间爸妈也许有了新的第二曲线,生了二胎; - 成长期:学校毕业后,步入社会继续不断成长;第二曲线也不断成长,家庭也有了产品矩阵; - 成熟期:社会工作多年后,有了一定的阅历和能力,也经历了家庭组合、生儿育女,形成了家庭产品矩阵; - 衰退期:随着年龄变大,面临退休直至死亡。 ## 一、产品如何开发? 产品的定位、战略规划、运营策略等,可以直接影响产品的走向。但很多时候往往容易忽略产品的开发方式,一系列正确的、适合自身条件的开发方式可以帮助产品更好地迭代。 自建研发团队,属于孩子父母亲自带娃,没有条件就创造条件,全职爸妈亲自下场,好处是可以随时关注孩子需求,并且满足需求。孩子也大概率会在父母的引导和期望中成长,成长为父母希望的样子;缺点是有可能会因为家庭现金流不稳定,导致孩子在某个阶段只能享受更多的精神陪伴,而非物质支持,从而导致规划很丰满,现实很骨感。 劳务派遣,类似于大多数双职工家庭,孩子爸妈上班让家里老人帮忙带娃,爸爸妈妈则主要负责挣钱和周末陪伴,从成本考虑,这是性价比最高的方式,爸爸妈妈上班维持家庭现金流,上班期间把孩子交给老人,既可监督也比较可靠。 外包驻场,则是将带孩子的任务交给外来协助人员,比如请保姆,通常是因为爸妈要上班,家里老人又不方便,只能雇佣保姆等。条件好的请一些高质量保姆或者家教,甚至可以提供比自己家庭原本更多的资源给到孩子,同时也能受到爸爸妈妈的监督;缺点是我们大多数情况下无法完全信任外来人员,在人员管理方面需要多费心。 ## 二、产品如何定位? 想要把产品做好,定位很关键。面向什么样的受众,用户群体规模有多大,后续能否变现等等,都是最开始就需要有思考的。 那么自己的孩子应该如何定位呢? 孩子将来是走传统教育方面,读好大学找好的工作,还是从小发掘兴趣特长,将来从事艺术行业等等,可以从爸爸妈妈自身家庭教育背景、兴趣以及成长经历来评估。 学渣父母家庭通常无法给子女提供好的学习思路和方法,自然孩子也大概率在传统考学方面不会有显著的成就。但如果自己有其他方面的天分,不妨观察下自己的孩子是否有相关的基因和天赋,结合自己的家庭条件,运用好长板策略。 现实生活中很多奥运冠军、演艺明星、个体老板等等,虽然在读书学习上不是最好的,也没有扎实的计算机、建筑工程、会计等专业知识,也不懂历史文化、数理算法,但不妨他们很早就能发现自己的特长,并加以钻研练习,从而也能成为自己领域的佼佼者。 学霸父母家庭通常具备良好的学习环境和自我管理能力,也有成功的学习经验,可以给孩子提供好的学习思路和建议。但是因为很多学霸父母对孩子有期望,甚至期望过高,导致控制欲太强,从而影响孩子的心理健康发展,最后事与愿违。 ## 三、产品如何运营? 这个问题或许可以理解为另一个本质问题,什么样的孩子会有好的发展?成长确实没有一套标准的模板,但是能发展好的孩子都会具备一些好的特质,比如善于理解和表达,情绪管理能力好,有责任心、有好的财商、身体健康。 很惭愧,我自己目前为止也只也没能做到全部,所以之后我会有意识的引导我的孩子,来培养一些好的特质,不管将来社会环境如何改变,这些通用的能力也能帮助他获得成功。 具体到落地,在有条件的前提下,多让孩子参加课外活动,去尝试新鲜事物,发掘孩子的兴趣;学校期间多参加社交活动,培养孩子的协调能力和情商;尽量给孩子准备大的生活空间,方便孩子可以邀请同学、伙伴来家里做客,锻炼组织能力。打造良好的读书环境,哪怕自己不习惯读书,也可以做一个小书柜,买一些经典书籍摆进去,总比什么都不放会好。 一款产品健康的成长,都是通过团队各个职责人员共同努力,不断打磨优化起来的。养育孩子也同样需要父母家庭的细心关注、投入精力培养。 ## 四、最后的话 产品和运营在产品生命周期的各个阶段,都在发挥自己的能力,帮助产品快速成长。前者帮助产品明确发展方向,后者推动产品走得更远,无所谓谁更重要。就像爸爸妈妈在孩子的成长过程中,相互理解和扶持,并将这种美好的状态影响给孩子,孩子自然就能在家庭的关爱中变得越来越好。反之,一旦某一方缺席,就必然会造成发育不良的表现。 **专栏作家** 王曙,微信公众号:产品科代表,人人都是产品经理专栏作家。平平无奇产品人,分享成长中的产品思维、职业经验。 本文原创发布于人人都是产品经理,未经许可,禁止转载。 题图来自 Pixabay,基于CC0协议。 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
作者 | 赖文昕 编辑 | 陈彩娴 与位于宇宙中心硅谷湾区的伯克利、斯坦福不同,被视为锈带区复兴唯一希望的卡内基梅隆大学(以下简称“CMU”)坐落在上世纪的工业重镇匹兹堡。 计算机科学学院的机器人研究所(以下简称“RI”)成立于1979年,是世界上第一个致力于机器人研究的大学级研究所。 这座机器人摇篮在 45 年间诞生了无数耀眼成就,但在如今技术更迭到由 AI 方向领衔、以仿真与强化学习算法方为“技术先进”之际,以传统机器人学见长的 CMU 能否跟上具身智能的热潮? 答案毋庸置疑:有人加入了最前沿热门的企业,或在OpenAI研究机器人基础模型,或到特斯拉参与人形机器人Optimus 的研发;有人选择了创业,宾通智能、星猿哲、木牛、雅可比,涵盖工厂、物流、商超场景;有人走进了高校,在北大、中大、USCD 等大学继续具身智能的研究。 回到纽维尔·西蒙楼,一切才刚刚开始。 **坚守「传统」Robotics** 人形机器人控制算法的演进分为三个阶段:一是经典模型控制,如 LIPM+ZMP,以 ASIMO 为代表;二是高级模型控制,即如 MPC+WBC 的动态模型和最优控制算法,以 Atalas 为代表;三是仿真和强化学习的结合。前两者均基于模型(Model-Based),第三代则转为基于学习(Learning-Based)。 一般而言,“技术先进”指技术出现得更晚、更年轻。在这个概念上,由 CS、AI 人才主导的第三代算法可以说最为先进,基于模型的方法也逐渐被称为“传统机器人学”。但同时也有很多人认为,在现实的应用中,世界上只有一种先进的技术,那就是行得通的技术。 2017年正值学习萌芽之际,机器人顶会ICRA中约40%的论文都与之相关,对于是否转向,侯一凡与导师Matthew T. Mason有过一番对话: Mason问他是否考虑转向,侯一凡深思好久后回答,目前对机器人学习(Robot Learning)兴趣不大,自己关注的重点在解决操作,而非用学习解决操作——他不在乎方法或流派,只关注效果,哪种方法对解决问题最有效,就会尝试——当时学习的成本及效果上限都远不及基于模型。 回到2015年,侯一凡从清华自动化系毕业,来到CMU成为了刚卸任RI所长、机器人操作(Manipulation)先驱Matthew T. Mason的学生。 二人的互选缘于12年进组的周佳骥:计划读博的侯一凡看到师兄周佳骥在知乎回答了不少CMU与机器人的问题,便主动私信探讨课题,就此结为好友。侯一凡觉得周佳骥做的研究很有意思,来到CMU后在周的介绍下和Mason见面也相谈甚欢,就进组开工了。 曾为清华火神队队长的侯一凡,2014年曾带队参加RoboCup,拿到了人形组AdultSize第三名,擅长运动控制和步态规划。在CMU深入探索机器人系统后,他逐渐领悟到,要让机器人变得实用,最大的瓶颈在于手部的操作能力,而非腿部的移动,便改变了研究重点。  侯一凡 操作和移动在理论知识上有许多共通之处,尤其是在运动规划和轨迹优化方面,因此侯一凡起初打算将移动的思路应用于操作上。 在第一个手内操作(In-hand Manipulation)的项目中,他试图将模型做得尽可能精确,花了半年时间研究摩擦力模型,以深入理解操作中的摩擦力。 然而,两者在实际应用上差异显著。对人类来说简单的动作,想要精确建模却异常困难。严格来说,摩擦力并没有完美的模型,许多操作的模型也是如此。过分追求模型的精确性,往往导致模型过于复杂,限制了分析和控制规划方法的应用,反而效果不佳。 渐渐地,侯一凡形成了对操作的清晰思路:若需建模,应选择简单模型,并以此设计出鲁棒的控制和规划方法。模型简单则可利用强大的方法获得鲁棒的解决方案,再利用这些解决方案的鲁棒性去应对实际环境中的不确定性和复杂性,而非试图将所有复杂性和不确定性精确描述出来——这种偏向工程的思维,实际上非常有效。 受Mason的影响,侯一凡对操作的取舍也很明确。灵巧手多年来未广泛应用并非因为技术难以实现,而是因为难以找到成本效益高的应用方法。传统上,机器人主要用于工业,一旦确定了具体应用,通常能找到比灵巧手更适用的系统。 因此在研究手内操作时,侯一凡决定简化手指的自由度,采用基本的两指结构,微调硬件以便于在各种姿态下进行操作。他广泛使用了“外部灵巧度”概念,即机器人通过与环境互动来弥补手部自由度的不足,如二指夹爪也能通过与地面的接触来竖立一本书。 接着,侯一凡转向了更具通用性的3D物品重定向问题,专注于规划。但很快,他发现控制才是瓶颈——即使提供了精确的轨迹,当时的算法也很难执行动作,尤其是在多接触点操作中。 操作通过接触传递力,每个接触都有其模式(Contact Mode),如粘着、滑动或脱离。即使是粘着接触,也分为点到面、边到面或边到边等多种类型,这些离散状态与运动的连续性形成鲜明对比。 在操作中,接触模式的任何变化都可能导致环境约束和物体动力学的突变。如果控制器不能迅速适应这些变化,操作就会失败。尽管一些机器人具有柔性控制,但往往只保证一般安全性,缺乏精细操作任务对机器人柔性的具体要求,难以在多接触任务中有效应对不确定性。 简而言之,如果能稳健地执行接触模式,就能显著提高操控控制的稳定性。 因此,侯一凡的博士研究分为三个步骤:首先,提出了量化接触模式鲁棒性的方法,通过精确计算接触点位置和姿态来评估系统在不同控制下的稳定性;其次,基于这种鲁棒性评估,优化柔性控制策略以增强操作的抗干扰性;最后,在量化鲁棒性并优化底层控制后,将控制度量纳入高级机器人规划中,寻找一条从始至终都极为鲁棒的轨迹。 侯一凡发表的论文让机器人能够规划并稳定执行一系列接触模式变化复杂的动作,而非简单的抓取pick and place,这些动作能够在模型并不准确的情况下做到稳定多次重复,而以往这些动作即使完成一次都很困难。同行也传来了积极反馈,称这套方法不仅算法简单,而且效果显著。 彼时,在CMU同样选择传统robotics的还有刚完成RoboMaster 2018总决赛的前大疆技术总监杨硕。 早在2016年底,一直想读博但工作繁忙的杨硕就申请过不需提交托福和GRE成绩的伯克利,并在次年初收到秋季入学的录取通知。因想先完成好手头的事,杨硕又推迟到2018年再入学。 2017年,杨硕在大疆深入研究了深度神经网络和强化学习,既为了探索新领域的知识,也为了筹备2018年的RoboMaster AI挑战赛。 在研究深度强化学习(DRL)时,杨硕常感到一种难以名状的挫败:算法难以稳定收敛,结果波动大,对参数极为敏感,稍有调整就可能导致截然不同的输出,且调整缺乏理论支持。 尤其让杨硕不适的是,DRL忽视了机器人学的核心——能量转换和系统建模。在机器人领域,电能和磁能转化为动能、力的传递产生运动,是一个复杂但可预测的系统。然而,在DRL中,这些原理被边缘化,调整参数或神经网络结构时,依据的竟并非牛顿运动定律。  杨硕 3月,杨硕受邀到CMU RI介绍大疆的无人机技术和RoboMaster,然后又去伯克利参加了给博士生组织的校园开放日。 两地的探访经历让杨硕意识到,自己在工业界的经验和编程技能,更适合以产学合作和大型项目执行能力强著称的CMU。而且,匹兹堡作为美国传统工业重镇,总让杨硕想起自己的家乡太原——两者都曾因煤炭和钢铁而繁荣,也都在国家发展新阶段中面临挑战。 种种因素影响下,杨硕在2018年来到了CMU,成为了Howie Choset的学生,研究主线是足式机器人的长距离定位,应用在四足和人形机器人上。 读博的头两年里,杨硕机器人做得很好,却一直未能发论文:他先是在六足机器人Daisy上面做状态估计,优化了卡尔曼滤波器以更准确地估算机器人在空间中的行进距离;接着做了个两自由度的猴子机器人,并利用iLQR算法快速验证了不同构型机器人的性能,辅助进行了机器人参数的选择。 “花了两年时间让六足机器人上楼梯,但做出楼梯上得好的机器人不是一个科学问题,解释清楚为什么能上楼梯才是。”杨硕意识到,自己是重新解决了一遍已被人解决过的问题,再用较强的工程能力提升机器人性能,呈现的结果虽好,却没有解决某个新的科学问题。 茅塞顿开后,杨硕的第一篇论文推进的很顺利,和过去重工程的工作不同,这是个非常数学且具理论性的工作,从有了想法到完成,只用了短短两三个月。 2020年8月,杨硕复现了几种带约束的LQR算法,意识到这类问题是领域内的挑战,并萌生了将约束LQR与SLAM中的图优化技术相结合的创新想法。他和SLAM图优化先驱 Frank Dellaert 及其学生合作,用因子图求解有约束的最优控制问题,并成功发表在ICRA 2021上。 2021年初,杨硕邀请RI新来的年轻教授Zachary Manchester做他的另一位导师。Zach最初从事航天研究,其博导曾任NASA首席科学家,后来Zach将航天和卫星控制中的数学和优化理论应用于机器人问题,取得了显著成效。 在Zach的指导下,杨硕深入掌握了航天及机器人领域几十年基于模型的控制方法,还花了半年系统性地学习了机器人轨迹规划的各种知识,特别加深了对非线性优化、LQR和DDP的理解。至此,他把足式机器人的建模、状态估计、底层控制、轨迹规划每个环节都摸了一遍。 “所谓的传统方法并不等同于过时,二者是平行的,只是侧重点不同,并无先进与否之分。”同样是从大疆到CMU的邱迪聪告诉雷峰网,“CS的人更倾向于基于学习的方法,认为它能解决所有问题,但实际上并非如此。” 回到2013年,在中山大学软件工程系读大三的邱迪聪就开始探索强化学习,并认为这是机器人技术中不可或缺的一环。 作为非传统机器人领域出身且十分推崇强化学习的一员,邱迪聪却觉得,自己真正深入研究机器人始于CMU。2017年,他来到CMU读研,由“大白之父”Christopher Atkeson和场地机器人之父、自动驾驶先驱William(Red)Whittaker指导,研究多步优化决策和人形机器人的双臂灵巧操作。 在实践中,邱迪聪发现RL存在时代的局限性,并不能立即广泛应用,应将强化学习与优化或基于模型的方法结合起来,以适应更复杂的决策和技能学习, “毕竟目前纯基于学习方法的机器人还没实现任何落地,而无论黑猫白猫,能抓到老鼠的就是好猫。”  邱迪聪 **进军 Learning** 在学术研究是否转向数据驱动的学习方法的十字路口,CMU机器人研究所(RI)中也有学者选择了不同的道路。 2017年夏,林星宇从北京大学信息科学系毕业,进入 CMU 读博士学位。本科阶段,他主要研究三维视觉。然而,在实时观看AlphaGo战胜李世石的比赛后,他深受启发:基于搜索的机器学习算法不仅能够创造自己的策略,还可能推动通用人工智能(AGI)的实现。 林星宇意识到,这种算法的潜力不应仅限于棋赛或游戏,而应应用于更实用的领域——机器人。 此时,机器人学与强化学习的交叉领域尚处于起步阶段。伯克利人工智能实验室(BAIR)刚成立,全球从事此方向的研究者尖指可敲。恰逢此时,CMU机器人研究所进入了一位新加入的助理教授——刚从伯克利Pieter Abbeel组完成博士后的David Held。 林星宇被David的研究吸引,主动联系了进一步面谈。两人在第一次见面时一拍即合,就样本效率、从图像中学习奖励函数等关键问题展开了深入讨论。几天后,林星宇正式加入研究团队,成为了David的大弟子。 初入实验室时,林星宇开发了一种新算法,通过增加探索奖励,使强化学习智能体能够快速适应新环境,无需人工干预。 2017年圣诞前夜,在空荡荡的校园里,他独自进行实验。当实验首次取得成功时,他激动得从凳子上跳了起来。这部分科研成果的发表之路却比较坎坷,几次被会议拒稿后才发表在ICRA上。 在这个过程中,林星宇感到了些许挫折,但逐渐意识到了在机器人领域,有影响力的工作最终需要体现在学习新的机器人技能上。  林星宇 到2020年博士三年时,林星宇开始研究机器人对柔性物体的操作。 机器人操作领域对学习算法的态度仍存在疑虑:传统方法在处理复杂任务时表现出艰艳,研究者不理解为何要转向数据驱动的强化学习算法。 面对这种疑问,林星宇决定创建一个针对柔性物体的Benchmark,这也是该领域的首个此类基准测试。 “柔性物体的研究使机器人学更加完整。传统机器人学假设操作对象是刚性物体,并在此基础上做出了对物体状态估计和动态估计的各种假设。柔性物体的操作挑战几乎打破了所有这种假设,是构建通用机器人的必经之路。” 林星宇解释他聚焦柔性物体的原因,“假如这能解决,就相当于解决了最难的方向,能以相同的算法或系统解决其他机器人任务,把成果迁移过去。 通过多种算法试验,林星宇发现一种简单的搜索算法——Cross-Entropy效果卓越。该算法基于试错优化动作,其关键假设是:如果有仿真器能够预测动作结果,就可以通过简单的优化方式选择最佳动作,无需依赖对复杂动力学的强化学习。这一发现使他认识到,学习世界模型或动力学是机器人学中最基础也是最困难的任务。 此后,他将研究重点转向数据驱动的方法,通过将柔性物体视为粒子集合,借助图神经网络模拟粒子间的相互作用和动态,为机器人完成复杂任务(如平整痕褶衣物)提供了可能性。 林星宇的博士研究逐渐聚焦于构建柔性物体的世界模型。 他认识到,领域内真正缺乏的是具有挑战性的任务,而非传统方法也能解决的简单问题。通过建立Benchmark,他进一步意识到数据驱动的核心在于预测和动力学建模,一旦掌握了动力学建模,优化就相对简单,可以通过搜索不断提升模型的能力。 “从这个角度,机器人领域走在了自然语言前面,因为语言模型是从预训练ma慢慢走向测试时计算(Test Time Computing),而机器人作为一个决策任务,从一开始就必须要做搜索。”林星宇认为,在处理复杂任务和实时决策方面,机器人可能比语言模型更早地面临和着手了类似的挑战。 除了林星宇的博导David Held外,CMU RI中的两位印度教授、Skild AI创始人Abhinav Gupta和Deepak Pathak在AI+Robotics领域也十分活跃,但后者比较年轻,2020年9月才入职,所带的博士生们都尚未毕业。 资深的Abhinav Gupta涉猎领域广泛,多做视觉,也涉及机器人学与语言,是现UCSD助理教授王小龙的博导。 2014年,王小龙从中山大学来到CMU读博,延续硕士时师从林倞的研究,继续做计算机视觉,利用视觉数据的冗余性进行深度学习的无监督学习和视频识别。 读博期间,王小龙曾在FAIR实习,由何恺明和Ross Girshick指导,在CVPR 2018发表了了非局部神经网络(Non-local Network)的工作,通过其创新的全局上下文聚合和自注意力机制,在视频分类、语义分割、目标检测等多个领域内提升了模型的性能,并且由于其计算效率高和易于集成的特点备受关注,至今引用量已近1.2万。 2018年,随着导师Abhinav创立了Facebook的匹兹堡实验室与机器人组,王小龙也开始接触机器人导航、操作等相关研究,并在ICLR 2019发表了自己的首个RL+Robotics的工作。 这是关于将语义先验知识融入语义导航任务的研究。人类能利用多年来建立的语义或先验知识来高效搜索和导航,比如找杯子时会搜索咖啡机附近的橱柜,找水果时则会查看冰箱。为了让机器人具备相似的导航能力,王小龙通过融合语义先验知识到深度强化学习框架中,利用图卷积网络提升智能体在新场景中导航至目标物体的性能和泛化能力。 2019年9月,博士毕业的王小龙在BAIR做了一年博士后,受Alexei Efros和Trevor Darrell指导,期间也和彼时在OpenAI的吴翼一起指导过多智能体强化学习的论文。 次年7月,王小龙加入UCSD视觉计算中心任教,带领实验室研究视觉与机器人技术,后者侧重于研究机器人手部操作、腿部移动的学习和低层控制(Low-level Control)。  王小龙 除了王小龙外,在CMU从视觉切入具身智能的研究者还有梁小丹与仉尚航。 梁小丹2013年起在中山大学读博,是林倞的首位博士生,和王小龙是同门。 博士期间,梁小丹主要研究人物解析,提出的库在当时是人物解析领域最大的,连续五年举办的workshop和比赛也吸引了众多参与者,许多人像分割、解析和编辑的研究也都基于其方法和数据。在分割算法后,因导师对复杂推理特别感兴趣,梁小丹就转向推理相关的研究。 视觉研究更侧重于解决具体问题,如架构和图像模型的构建及因果关系的分析,她在申请博士后时希望体验不同技术方向,特意选择了与之前导师关联甚少的邢波(Eric Xing),想在CMU的机器学习系(MLD)开阔视野,探索底层和基础问题。 邢波也希望有些偏视觉的工作,梁小丹便在2016年7月来到CMU,成为当时组里唯一一个视觉方向的博士后,延续图像分割的工作。 在CMU,梁小丹主要做机器人视觉语言导航。从软到硬的转变十分丝滑,让机器人到达某位置最关键的是视觉导航,而视觉导航再往下就是对场景的分割理解、物体检测问题,就是自己的老本行。 “很多分割算法都被用在搜索或编辑中,但跟机器人交互其实是非常自然的过渡,所以就是从 2D 走到 3D 世界和机器人交互。” 在梁小丹看来,具身智能并非从天而降,“30年前SLAM也可以理解为具身智能,而现在的具身智能考虑落地应用,普遍认为抓取很难,SLAM等导航算法非常成熟,其实是上一代的技术已被应用,现在开始想下一代的应用场景,探索下一代的技术。”  梁小丹 2018年底,在婉拒OpenAI、CMU与腾讯AI Lab等多个offer后,梁小丹回到母校中山大学任教。回国后,梁小丹也开始接触真机,并与智能工程学院里的同僚们合作交流,特别是擅长硬件与控制的同事。 目前,梁小丹正带领团队做具身大模型,希望把多模态大模型加上3D感知能力,做具身智能领域的GPT-4o。 此外,为了改善之前仿真环境缺乏真实感和细节的问题,梁小丹团队还发布了仿真平台InfiniteWorld,能通过简单拍照将现实场景如咖啡厅等精确复制到虚拟环境中,实现物品的交互功能,以促进机器人在复杂环境中的泛化能力。 “以前的仿真平台场景不太真实,也缺少纹理,因为在真机上训练测试性能不佳,很少能被机器人厂商使用,所以首先得把虚拟环境的真实感提升上去。” 仉尚航也是在2013年开始读博,她从北京大学读完研到CMU,收到了博导José Moura教授(美国工程院院士、美国发明院院士、IEEE/AAAS Fellow、前IEEE主席)给的难题:对整个纽约市各路口监控视频中的车辆进行检测计数与流量分析。 面对缺乏具体数据集和思路的挑战,仉尚航自己定义研究问题,开启了领域自适应(Domain Adaptation)的研究。此时正值深度学习初兴之际,经过调研后,她提出了基于深度学习的解决方案。刚开始时,José不太信任此方法,在她汇报时经常一句接一句地提出质疑,让她不停在白板上推公式。 因导师坚持采用非深度学习方法低秩回归(Low Rank Regression),仉尚航便采取了一个工作量倍增但“两全其美”的解决方案:对同一个问题和同样的数据,同时设计深度学习和非深度学习两种方法进行研究,一年后均取得成功并发表在CVPR上。经历了该工作从问题定义到数据收集与标注,从传统机器学习方法到深度学习方法的完整过程,仉尚航的科研能力得到了很大提升。 此后,José就对她特别信任和赞赏,无论她提出什么想法,总会频频点头认可、大力称赞,在此鼓励下,她愈发敢于探索新方法、尝试新研究,后来做科研也越来越顺利,产出也越来越多,沿着模型泛化、领域自适应、有限样本学习的方向继续推进。 此时正是自动驾驶的火热时期,仉尚航也通过高通创新竞赛将研究场景从车辆检测计数过渡到自动驾驶,并使用深度学习方法研究自动驾驶的泛化视觉感知,关注领域自适应和有限样本学习的难题。 因其一直对机器人方向很感兴趣,来CMU的最大动力也是因为其RI久负盛名,读博期间,她经常跑到RI与在Matthew T. Mason组做博士后的北大师兄万伟伟(现大阪大学副教授)和在John Dolan组读博的董驰宇、许闻达探讨,也发表了一篇关于机器人操作的工作。  仉尚航 2018年博士毕业后,仉尚航来到了“梦寐以求”的湾区,在Eric Xing的创企Petuum做了一年科研后,更加坚定了做教职的决心,就来到伯克利的 Berkeley AI Research Lab(BAIR)做了两年博士后,在Trevor Darrell和Kurt Keutzer的指导下进行开放世界泛化学习的研究,包括领域自适应、零样本学习等,主要应用场景是自动驾驶。 Trevor是BAIR的Director,同时和Kurt一起带领Berkeley Deep Drive,在伯克利期间,仉尚航参与了DARPA、BDD等多个项目并和多位教授展开合作,此经历成为她日后担任教职的重要基石。 一直以来都有教职梦的仉尚航,经历了湾区的工作和伯克利的博士后研究后,更加坚定了回国任教的决心。而且她惊喜地发现教课、做报告和登台主持有异曲同工之妙,能满足自己曾经有过的媒体梦(她很喜欢主持,曾在CMU多次担任过华人春晚主持人)。 博士导师José十分支持她的决定,其妻子Manuela Veloso是CMU RI教授与RoboCup创始人之一,IEEE/AAAS/ACM/AAAI Fellow,曾任CMU Machine Learning Department Head,也很关注她的研究,专门参加她在CMU的博士答辩,对其很欣赏,夫妻二人在给她的教职推荐时赞扬“尚航能去世界上任何一所TOP10大学”。 现在想起José、Kurt和Trevor三位老师的指导和鼓励,以及Manuela的支持,仉尚航还很感动,正是这些优秀的学者给她树立了榜样,让她坚定了踏实科研、勇于探索、教书育人的决心。 2022年初,仉尚航回到北京大学任教,加入了硕士曾就读的计算机学院视频与视觉技术国家工程研究中心,办公室就在当年读研的工位旁,让她更有“勿忘初心,方得始终”的归属感。加入北大后,她开始专注于具身智能领域的研究,将之前在自动驾驶、泛化学习、多模态大模型方向积累的经验转化到具身智能研究中,在此方向迅速成长。 今年夏天,仉尚航还成为北京智源人工智能研究院的智源学者,带领具身多模态大模型研究中心专注于面向具身智能的多模态大模型与大数据构建,目前正在研究4D世界模型。她于近期发布了大规模多构型智能机器人数据集RoboMind,是世界上集中采集的最大规模数据集,捕捉机器人面对复杂环境、长程任务时的各种交互和经验,从而促进能够掌握不同操作策略的通用模型的训练。RoboMIND包含5万5千条机器人轨迹数据,涉及279项不同的任务,涵盖了高达61种不同的物体,覆盖了家居、厨房、工厂、办公、零售等大部分生活服务场景,将打造具身智能领域的ImageNet时刻。 **系统见长** 2014年秋,走进地下负一层没有窗户的生物机器人实验室,龚超慧得知了自己的蛇形机器人工作登上《Science》杂志的好消息。 四年前,2010年,龚超慧从哈工大毕业来到CMU RI读博。下属计算机学院的 RI 做机器人较偏算法化,在机器人算法三要素感知规划决策的闭环系统颇有建树。 在各实验室轮转上课时,龚超慧意识到,机器人自动化远比自己的机械式理解更广泛,除了预设程序与硬件外,不仅包括通过传感器进行感知和数据采集,还涉及到基于数据的智能化控制和复杂规划。 对规划着迷的龚超慧决定加入此领域顶尖学者Howie Choset的小组。Howie除了在RI任教外,也是生物医学工程、电气与计算机工程的教授,研究蛇形机器人、工业机器人与医疗机器人。 第一次正式见面时,龚超慧在Howie的办公室磕磕绊绊地分享了自己对规划的一些基础研究和文献调研工作,感受到他的热情后,Howie建议龚超慧尝试参与组内课题。在蛇形机器人平台上进行软件开发并迅速取得研究成果后,龚超慧顺利开启了PhD阶段,成为了Howie的首位华人学生。  龚超慧 进组后,龚超慧有两个并行项目:一是研究蛇形机器人的运动,如控制转弯、行进方向;二是定位和建图的 SLAM 项目, 基于拓扑学的数学理论,研究如何通过机器人之间的信息交互,包括不断设计新的行进方向,快速地把未知环境的拓扑结构描述出来。 龚超慧从本科就开始“手搓”机器人,跟周谷越(清华AIR副教授、前大疆CV总监)同为哈工大机器人队的主力成员。此前龚超慧的做事方式偏工程化,喜欢去实现机器人的某个功能,Howie却告诉他,如果要成为一个PhD,必须对能认知、改变世界的方法论上形成新的观点和突破,否则只是位工程师。 因此,龚超慧的研究核心放在了高维度数学空间的规划问题,即如何找到最优解。 假设机器人有无穷个关节,那面对无穷个自由度,该如何控制变量才能让它形成有效运动的最低能量,且运动速度最快? 这其实是一个非常抽象的数学问题,所以在做研究时,龚超慧接近数学方法论,专注于在高维空间中寻找高效的低维子流形(Submanifold)。通过降低机器人的维度,在更低维的空间中快速进行计算,并利用这一理论框架,研究生物和机器人的运动,从高维统计数据中提取低维特征和模式。 导师Howie对学术有着近乎变态的苛刻,对于任何一个公式的推导,每个上下角标是否准确,每项异常数据如何解读归因,都要求严谨准确。在他的指导下,龚超慧陆续在机器人顶会ICRA、IROS以及《科学》杂志和美国科学院刊上发表论文。 到博士后期时,龚超慧开始对广义机器人的规划与任务分配软件感兴趣,认为AI 和 Robotics 技术会在制造业里有广泛应用的机会,“工业 4.0让物理实体设备具有结合数据技术使其更智能化的机会,而设备智能化后也是一种机器人。” 因此,龚超慧在2016年初继续留校做博士后,除了收尾PhD时的工作外,也开始把研究重点往智能制造的方向转变。 在每周五下午的午餐会上,RI各组学生都会聚在一起喝咖啡闲聊,龚超慧结识了小两届的周佳骥,二人常讨论机器人的商业化问题。 周佳骥本科毕业于东南大学吴健雄学院,2012年来到CMU读研,次年在RI开启其博士阶段,师从Matthew T. Mason与视觉教授Drew Bagnell,研究抓取操作与视觉感知规划。 2016年,周佳骥发表的平面滑动运动模型工作获得了当年ICRA全会最佳论文,成为了ICRA创办30年来第三位以第一作者身份获奖的华人。  周佳骥与Matthew T. Mason 在两位学术成果颇为优秀的年轻人中,更早产生创业念头的是龚超慧。每次讨论机器人时,周佳骥更关注深入的学术问题,龚超慧则更关注应用场景。 彼时富士康到美国找研究团队合作,VP戴佳鹏资助了龚超慧团队,龚超慧就开始研究如何让生产更柔性和智能,包括生产设备网络化、智能化后的集群管理,以及AGV等设备有移动能力后的调度来连接生产环节。 在同富士康交流的过程中,龚超慧发现,制造业中传统的管理方法、技术都有大量的信息不对称,在数据的全面性、运算的智能化、计算能力都有瓶颈,生产线上大量设备也没有自适应能力,导致生产效率不足。 看到产业机会后,此前认为自己肯定会走学术路线的龚超慧向Howie提出了自己的创业计划。Howie非常惊讶,没想到龚超慧会在学术做得不错、有教职机会的情况下,还想要创业。 龚超慧向Howie解释,学术研究存在的目的是解决实践中遇到的问题,把它抽象出来突破,但既然部分机器人和AI 结合的技术已经到了可以工程应用和产业化的阶段,更大的机会和空间应该在产业界而非学术界中。 龚超慧的想法得到了Howie的认可,再加上当时组里的硕士生任中强(现上海交大AP),师徒三人于2017年1月在匹兹堡一起成立了宾通智能(Bito Intelligence)。 很快,周佳骥也决定创业。他与在麻省理工大学(MIT)读博的俞冠廷相识,后者师从操作与机制实验室负责人Alberto Rodriguez,曾作为技术架构总负责人带领MIT-Princeton联队在2015-2017连续三年参加亚马逊拣选挑战赛,均获全球前三,并且获得2017年装载任务冠军。 通过亚马逊挑战赛,他们意识到视觉拣选领域已接近可商用化的程度,便于2018年4月在波士顿一起创办了星猿哲(XYZ Robotics),为物流及工业自动化提供更好更快的机器人解决方案,周佳骥的导师Drew Bagnell也参与了种子轮的投资。 不难发现,两位CMU学子对产业机会极其敏锐,果断抓住了机器人的第一波创业机会。伯克利的Pieter Abbeel与三位华人学生成立的Covariant,也是在同一时期诞生,并同样以物流场景起步。(伯克利故事详见https://mp.weixin.qq.com/s/iqiKeMgGIsCuvoNtyi-yaw) 说起各高校的机器人人才,业内普遍认为,若想让机器人达成商业目标、落地,CMU是首选,若关注具体算法,则选伯克利和斯坦福。 据罗瑞琨介绍,CMU 学子多对机器人工程落地的全链条有系统性认知,从课程体系起,就要求学生除了必修数学和本专业外,感知、规划、运动各方向都上够学分,了解机器人整个系统。而且工程师和科学家协作制度完善,教授也分研究型和工程型两类;RI 虽属计算机学院,但却很重视跨学科交叉,吸收了很多机械工程、电气工程等专业的学生一起科研做项目,而非以单一的计算机专业为主。 2012年,罗瑞琨毕业于清华的机械工程自动化系,来到CMU读研。起初他打算申博研究纳米机器人,后因联系的教授在欧洲,面试安排不定,担心错过截止日期的他就先接受了硕士项目的录取。 因对人机交互感兴趣,罗瑞琨加入了做多智能体与高层次规划的Katia Sycara小组,研究人体动作学习和预测,通过结合动作识别和活动学习,优化学习的准确性,并预测下一步行为。此方向当时非常热门,其应用前景包括使机器人能预测人类行为,从而决定自己的行动,例如帮助做家务和做饭。  罗瑞琨 Katia不会干预学生的研究兴趣,但对论文写作尤为细致,带着罗瑞琨从头到尾改完了他的第一篇论文。项目资金结束后,罗瑞琨又做了点 SLAM 及多智能体的工作,便在14年顺利毕业了。 在伍斯特理工与密歇根大学读博期间,罗瑞琨专注于人机协作的实际应用,如工厂中的共同作业、问题检查和装配协助。他曾与苹果供应链专家探讨,发现机器人执行效率低,不如全自动化或人工作业,许多需求在实际应用中不切实际,是伪需求。 权衡过各类机会后,罗瑞琨以CTO的身份在2021年加入创企木牛机器人。他认为,过往积累的机器人交互的多领域知识、实践经验与对系统的了解,在大厂难以充分发挥优势,聚焦工业场景落地的木牛更适合自己,加入后带队开发了一套从伺服驱动控制到上层感知决策的底层框架。 **新与旧共舞** 今年10月,特斯拉「We,Robot」发布会上,人形机器人TeslaBot(前Optimus)列队出场,化身“酒保”走入人群调酒、猜拳、合照、蹦迪,现场俨然成为了一场赛博大派对。 发布会后,杨硕站在TeslaBot旁,和它合照了一张。 就在去年3月,即将博士毕业的杨硕看到Optimus项目在扩张,便在领英上与团队取得了联系。很快,HR发来了面试邀请,在两轮现场手写C++代码和推公式的面试后,杨硕拿到了offer。 可以说,读博时精进的工程能力,让杨硕具备独自完成推公式、仿真、做硬件、上真机实验、处理数据全流程的能力,特别是对C++解决机器人控制和估计的钻研,使他成为了最匹配的候选人。 特斯拉让杨硕尽快入职,导师Zach了解情况后非常开明地同意了,让杨硕努努力再整理投出一篇论文即可毕业。 7月,杨硕正式加入,参与机器人控制核心算法模块的开发。 今年初,团队发现第二代Optimus机器人的一项关键指标需远超行业标准才能稳定运行。一次双周会议上,Elon Musk对项目进展表示不满。会后,杨硕主动提出在十天内开发一个新的算法模块,两千行代码加上后情况迅速有改善,便在下次会议上向马斯克现场演示。 在特斯拉的一年半里,杨硕慢慢转移到用深度学习、AI 的方法做机器人,过往对传统机器人学的理解让转变十分丝滑。 “做机器人得不断推翻自己之前形成的固有思维,之前无人机做久了我选择去研究新东西,博士期间做传统的方法,来到特斯拉又推翻,用比较主流的AI技术。”杨硕告诉雷峰网,“ 对基于模型的方法有深刻理解后,对无模型的AI方法,通过数据让神经网络自己发掘模型,是更有帮助的。” 除了杨硕,侯一凡对新方法的态度也发生了转变。 2021年博士毕业时,侯一凡认为科研问题已解决,自己完整的操作方案需要在实际场景中验证效果,便加入了有着世界上最大的操作场景的亚马逊机器人部门,研究物流场景中的储存任务,负责自动化存储过程中的柔性控制和运动规划设计。 在亚马逊的三年间,侯一凡意识到自己提出的解决方案效果不错,但受限于建模的需求,在应对不断出现的新场景(长尾效应)或者难以预先建模的家庭服务类场景时往往需要巨量的工程投入来解决。因此,如何在模型质量高度不确定时提高操作的成功率和效率,成为一个全新的挑战。 一直关注着学术进展的侯一凡发现,机器人学习已进入激动人心的阶段,尽管目前成果距离解决实际问题还有很大差距,但已完成了从0到1的转变,让非机器人背景的人也能快速做出demo。 不过,侯一凡认为,在接下来的5年或更长时间内,学习方法仍无法替代某些问题的最佳解决方案,特别是在机器人需要快速、高成功率地应对高度不确定场景时,因为这些问题用模型来处理更容易获得可预测,解释和调节的结果。 他意识到,后续想让demo变得通用和鲁棒既需要机器学习的泛化能力,也需要对机器人问题的理解和分析——机器人学习与传统机器人学的结合有巨大的机会,而探索这些机会的最佳场所是学校,而非工业界。 侯一凡读博时,因参加亚马逊挑战赛的MIT-普林斯顿队中有导师Mattew的学生Alberto Rodrigue,双方交流密切,就此认识了队里的宋舒然。 加上近些年自己最喜欢研究都来自其团队,考虑重返学术界时,侯一凡便联系了宋舒然,两人讨论非常投机,侯一凡就在今年3月来到斯坦福做博士后,依旧沿着解决操作的主线。 “以前认为解决操作的方法和学习关联不大,所以做模型和优化,随着对问题的了解和不同方法的演化,现在觉得是基于模型与learning的结合。” 同样支持两者结合的邱迪聪,在2018年硕士毕业后,先进入了更成熟的自动驾驶领域。 他同时接到了英伟达与MIT创企ISee的offer,在面对他“公司要做什么”的提问时,双方给出了不同的答案:英伟达想构建一个能在特定场景下工作的自动驾驶系统;ISee则致力于开发具有人性化思考的AI,目标不仅是自动驾驶。 ISee的愿景更符合邱迪聪的规划,在他看来,自动驾驶是当时最接近智能化机器人的实例,其他技术要么不够先进,要么虽能落地但缺乏革命性。 三年后,邱迪聪又先后加入了如祺出行与PIX Moving,负责搭建自动驾驶团队,探索商业化落地。到了23年4月,在意识到开放推理能力开始有解决方案后,邱迪聪与CMU LTI(语言技术研究室)的师兄梁俊卫合作,共同创立了雅可比机器人,采取轮式方案,重点在操作以及机器人对开放世界和开放物品的理解。 雅可比以商超为切入点,下一步是餐饮服务、办公场景,最终进入到养老以及家庭场景。“这样每个场景积累的知识和经验能直接应用于新场景,比如机器人在商超场景中学会识别锅碗瓢盆等物品,当转移到餐饮场景时,如清理餐桌,就已具备基础能力,几乎无需额外专用化投入,甚至能实现零样本迁移。” 至于一开始就笃定learning路线的林星宇,则在2022年从CMU毕业。答辩前,David Held专门开了个告别组会,让林星宇给学弟学妹们分享建议,还把二人的邮件往来与合照放在一起,配文“this is how we started”。 林星宇来到伯克利在Pieter Abbeel的组里做博士后,从博士期间注重解决不同任务,如柔性物体的一个个建模,转变为做更通用的基础模型,研究如何利用基础模型让任务更通用,以及构建一个属于机器人学的基础模型。 在伯克利,林星宇和高阳的学生汶川合作,利用互联网人类视频训练机器人大模型,发表了RSS 2024的满分论文。 林星宇发现,许多视频预测模型专注于纹理的真实感,却忽略了物理真实性,就提出了学习微粒轨迹模型的想法,用于预测空间中每个点随时间变化的轨迹。例如,当拿起并倾倒一杯水时,杯中水的微粒会沿着不同的路径移动。最重要的是,这一模型能够直接从视频数据中学习。 今年8月,OpenAI风传已久的机器人组终于重启,林星宇成为了创始成员之一。 OpenAI成立初期,机器人技术就是其主攻方向之一,联创Wojciech Zaremba领导的团队最初试图打造一个通用机器人,并在2019年发表了一篇工作,分享了他们如何训练神经网络使用单只机械手复原魔方。但在2020年10月,因缺乏训练数据,机器人组解散。 加入OpenAI重整旗鼓的机器人组,林星宇经过了不短的思考:首先,OpenAI有研究机器人的经验,重启说明时机已经成熟;再者,产业界研究能比学术界更易于拓展。 更重要的是,很多机器人学的问题在于boot strapping(自举,指机器人或AI系统通过自我学习和自我改进来提高其性能和能力),缺乏数据导致系统性能不佳,无法产出产品,数据积累陷入停滞,形成恶性循环——视觉语言模型能有效缓解这一问题,而OpenAI拥有最顶尖的视觉语言模型。 来到OpenAI,林星宇将继续探索机器人基础模型,“我一开始是想训练一个模型做好可变形物体的任务,但逐渐发现真正需要的是海量数据,需要不同数据间有各种积极的迁移转化,最终希望有一个模型来理解物理、空间来完成各种任务。” **结语** 站在是否转向的十字路口,没有all in机器人学习的CMU似乎慢了一步。 与从纯仿真出发、始于图像或游戏的模式不同,工业合作伙伴众多的CMU携带着工程师基因,对解决实际问题习以为常,做项目的重要意义之一就是将技术真正应用于某个具体场景中。 可以说,如果将机器人学的研究工作分为0-1(概念创新)、1-99(技术发展)和99-100(产品成熟)三个阶段,CMU更擅长1到99%的推进,甚至能够制造出接近实用的高完成度机器人。 除了擅长实际工程落地外,CMU的强项还在于对基础问题以及整个系统的深入理解。凭借对传统方法的深厚积累,CMU人才们能够轻松而顺畅地过渡到基于学习的方法。 杨硕、林星宇、王小龙、仉尚航、梁小丹、龚超慧、周佳骥、罗瑞琨、侯一凡、邱迪聪......成长于基于模型方法的CMU一派,用“传统机器人学”搭起坚实地基,以学习为梯,让机器人迈向了下一个阶梯。 在具身智能产学结合紧密的趋势下,补上学习拼图后的CMU派系,逐渐从传统走近了全面。 此刻的他们,正搭建着下一块台阶。 关于具身智能领域的更多精彩群像故事,欢迎添加雷峰网作者微信 anna042023 交流。雷峰网
<blockquote><p>从用户互动的真实感受,到评论区在内容创作中的独特作用,再到小红书的流量分配机制,本文将揭示小红书如何通过评论区激发用户的参与度,成为新闻和非虚构写作的“富矿”。</p> </blockquote>  我也想谈一谈小红书。 上周池老师提到了他眼中的小红书流量分配机制的神奇,这已经被很多的案例证明过。比如有女生在垃圾堆找到了一位学者的遗物。比如有远在马来西亚的亲属在两天之内就找到了。比如一个叫小奈的女生,自己小小的世界被很多人发现了,然后被半佛老师发现了,从而她经历了成为网红之后要经历的一切。 其实在此之前,作为一个小红书重度用户,我已经注意到了这方面,但并没有写出来,结果其他人写完觉得有些晚了。但目前讲小红书的文章,好像也还漏了一点什么,所以下面就是我的一些观察。 我们都知道媒体很喜欢在社交网络上找采访对象。列出所有的主要平台,比如说微博、豆瓣、知乎、虎扑、NGA、贴吧、小红书,乃至抖音、快手和B站——你会发现记者们可喜欢小红书了,比别处都喜欢。  这是两个原因综合的结果:小红书用户更容易发现愿意接受采访的人;即使不与真人采访,一个小红书的帖子通常看起来更像是真实的。换句话说,帖子中的内容似乎藏着一些可以相互验证的信息,而不是全然虚假的、无从查证的,或者营销号搬运的。 社长认为,为什么会有这种感觉,最大的原因应该在于小红书发帖和评论等“创作”的低门槛。而评论比发帖门槛还要更低,这些用户们随手发出的真实感慨,让营销号帖子都能化腐朽为神奇,堪称是小红书的灵魂。 ## 一、为啥不是知乎呢? 事实上,小红书上大量的帖子正文是营销号从知乎复制过来的,它们将知乎帖子截图,把原作者的名字去掉,换上自己的ID。但在知乎的原帖评论区,和转发到小红书之后的评论区,呈现出截然不同的景象,尤其是在涉及婚姻家庭、育儿和男女关系的帖子中。 ——知乎被称为“男乎”的强烈倾向性,影响了很多帖子的观感,也使得迎合社区氛围的胡编乱造大行其道。除了很多真知灼见的作者会讨厌平台调性而退出之外,知乎的内容格式也有缺陷。一个几千字帖子完全可以概括一件完整的事情,还可以编辑原帖带后续,这天然适合讲一个故事。 而小红书真正的求助帖一般都是点进账号,还能发现几条帖子讲连续剧。这种情况下,多个帖子以及回复评论区的动作就更可以相互验证,如果是编的,就更容易露馅。小红书也不乏新账号就这一条帖子的情况,但你会知道这可信度低。 知乎在ChatGPT刚兴起的时候,一度获得了大量的关注,因为当时它是互联网中最优质且相对开放的语料来源之一。然而,当时也存在对大模型-语料间关系的不同看法。一种认为,基底模型通过优质语料训练出来,决定了输出质量;一种认为,模型本身并不需要太聪明,而是通过RAG(结合搜索结果的输出)提供更好的答案。 到2024年底,结果变得清晰。RAG且利用专有数据源的方式占了上风。小红书作为语料来源,还不如自己搭建一个AI站内搜索,这也正是点点App的由来。 通过试用,我认为点点App并没有做什么复杂的工作,只是采用自然语言更好地呈现了小红书原本站内搜索和推荐算法的高精准度。如果你是小红书的重度用户,使用点点App的效果可能不如自己主动搜索和被动推荐来的好,因为个人调教出来的信息流可能会更符合自己的需求。但作为一个让不常使用小红书的人了解平台价值的入口,点点App还是不错的。 ## 二、四种帖子 小红书上还有一种类型的营销号,截取其他同平台用户的帖子截图,并附上自己的评论。其实,很多火爆的小红书帖子,原作者在内容火起来之后会删除原帖。当然,也有一些营销号会在小红书上,自己用小号截取没有头尾不带头像的帖子图片,马上就删除。你去搜原帖肯定没有,因为它传播的主战场其实是微博。 ——那这种没头没尾的营销号帖子,不是跟你上面说到“一个小红书的帖子通常看起来更像是真实的”相矛盾吗?别急,下面就是简易的鉴定方法。 社长在小红书中看到会点进去的帖子有几种类型。第一种是点赞和收藏数量较少,但评论数却非常多的帖子。这类帖子即便最终爆火,点赞和收藏的数量也远不及评论数。比如,一条帖子可能有几十个点赞、十几个收藏,但评论数可能达到二三百条。火了以后也是等比例上升:几百个赞、几十个收藏、上万条评论。(写的时候随手找了一篇,不太典型)  如果你仔细查看这些评论比点赞多的帖子,经常会发现有几个人在某个串里面吵架。另一种情况,某条评论获得的点赞数比原帖还多好多。在这种情况下,评论区和原帖共同参与了内容的创作,如果没有画龙点睛的评论,就不可能让原帖“至此,已成艺术”。 第二种类型是赞藏评指标均衡地高,毕竟小红书也有明星入驻。第三种,点赞收藏数量高但是评论稀疏的,就看着假了不少,里面通常是卖课卖产品的,原po会给每一个评论的人回复“私”或者“滴滴”。 还有第四种——纯新人冷启动内容,啥指标都没有,主要通过我点击后的下一步行为,来决定是否继续推送这个帖子。如果我在评论区留了首评,这就可能激发其他人也评论,往往会进一步提升帖子曝光度。 ## 三、对新人的宠溺 池老师和其他人也关注到,小红书特别倾向于给新用户推送流量。最典型的是,如果新用户的第一篇帖子是一个实用工具帖,或者容易引战,那么该用户可能一辈子都没看过的几十万流量就到手了,看到小红点实时增加的那种感觉是令人震惊和上瘾的。 而且就像上面说的,有些帖子的点赞和收藏不多,但评论区非常活跃,点进去一看都是活人而不是bot。小红书在降低发布门槛的同时,给新人提供了货真价实的流量数字和评论区的真人作为回报。社长的第一条小红书帖子的数据就给自己留下了难以磨灭的印象。  等把你钓起来以后就另说了。社长以前跟人聊的时候想到,想要在小红书上做账号运营的难度很大,主要是因为它是按照单篇帖子来推送流量,而不是依据粉丝数。 以社长自己的号来看,作为纯粹记录个人生活感悟的号,没有固定主题,就会发现一个超高流量帖子之后不一定就会带来留存。  在小红书,微信等联系方式在帖子不可露出,在私信中也不能顺利传递,加个联系方式像对暗号一样。有很多人尝试在常见的疾病或减肥、保健帖子的评论区唱双簧,假装一问一答,透露出产品的名字和购买方式,也是比较徒劳的。但是,小红书还是为私域运营开了一个口子——你可以在小红书里新建群组,进小红书群的人能传递的东西就更多一些。 在小红书上,如果你想查疾病,应该本着的原则是:关注反面案例,而不是正面宣传;关注病人及其家属的自述,而不是来自医院、医生或第三人的介绍。 类似的搜索技巧在小红书其他领域的帖子也适用。总体而言,不管你再怎么不喜欢避雷语气,避雷帖仍然是小红书上最有价值的内容。特别是因为不是以店铺为单位组织和维护好差评,小红书的差评是“无法预防”的,只能事后试图扑灭。 ## 四、评论区藏着的“另一个我” 说小红书是女性主义的大本营,或者五环内人均多少万收入,显然是对当前小红书内容生态的误解。事实上,小红书是当下最接近0几年贴吧生态的社交网络,甚至比贴吧自己都像贴吧。 你可能以为小红书评论区最有共鸣的还是男女对立,原生家庭,姐姐好飒;但至少社长看过的真情实感,还出现在衡水学校压迫,外卖吃出东西,最佳拍照角度,避雷餐厅,给孩子挑哪种尿不湿,医院急诊室交叉感染,抗癌,找情头,菜谱下面交作业的……等等地方。对了,还有投诉“避雷华为电脑上的压缩软件要收费”的,因为她可能下错了。 但是跟贴吧以关键字整合信息不同,小红书是算法整合。而且,小红书个人资料页不汇总ta在评论区的交互。只有一个momo头像,你真的极难知道ta都在哪里发过言,所以更多了一丝萍水相逢,你不可能让人看你资料页,就知道你有多少面相。    社长使用小红书最大的乐趣,实际上是在热门帖子的评论区高强度冲浪,但只有我顶着特定id的时候才会暴露。 即使一条笔记都不发的momo也可能在评论区充分发泄着表达欲望。如果我是个momo,那我在评论区干的事情可能永远没人知道。 光看上面那位momo老师的个人资料页,你能想到她在亲子关系帖子下面的人间清醒吗? 就像新人发帖有回报一样,真人如果选择回复别人的消息,从收获的点赞和评论区跟帖的小红点增长来看,也是相当“有瘾”的。所以在热门帖子下面一些评论的回复可能相当及时,因为很多看到的人都有旺盛的表达欲。 ## 五、公域朋友圈 小红书非常强调对内容的原汁原味呈现。它倡导直接发布,重点在于不加编辑地记录下当下的情境。短视频在抖音可能意味着需要进剪映编辑,但在小红书,短视频也就是时间长一点的live photo。 现在在抖音上发布未经剪辑、布景混乱和抖动的视频,可能无人问津,只能作为自己朋友圈的备份。但在小红书上,你随手发布的内容,就可能变成“公域朋友圈”。 社长多次观察到一个帖子在自己的微信好友或群聊人员中,都得到了推送,尽管基本可以排除它所谓“窃听”“盗取微信好友关系”这种嫌疑。  我认为小红书的推荐机制,其实是比较简单粗暴的,但由于用户不断主动贡献自己的互动,包括密集发帖和跟帖,这种简单的推荐方式反而非常有效。 具体来说,当你主动搜索某个词时,这个行为的优先级是最高的。或者,如果你在信息流中看到一个帖子,点击进入翻了翻又退出,再次点击搜索框时,系统会首先联想并展示与你刚刚浏览的帖子相关的关键词。接着,你会在信息流中看到更多同主题相关的帖子。哪怕是分词错误,系统也会硬着头皮推荐给你。  因此,当你搜索了某个疾病后,接下来的半天到一天时间里,恐怕你的时间线里会充斥着各种相关内容,比如癌症筛查、晚期治疗、临终关怀等。(当然点不感兴趣还是有用的) 另外,基于人们对热门话题的参与度,一些帖子还会在时间线上反复推送。即便你第一次没点击进去,过一段时间之后,它仍然可能会回到你的时间线上。 曾有一个关于莫言给小孩送签名书的帖子,算法好几次推送给我,即使我每次看见都没点开,但可能每次都额外停留了一秒钟。虽然我也不太清楚为什么,但幸亏我后来还是点进去看了,因为评论区提示我真正的看点:图里面的莫言老师穿的是睡裤。  ## 六、结论 去年是我集中使用小红书,将它作为日常杀时间工具的一年。小红书是一个相对真实的空间,因为它降低了发布门槛,并对发布行为给予了更高的激励,“一推一拉”极致拉抬用户互动。 使用得越频繁,你就越能发现规律,能分辨哪些人是在真实地传递信息。这些人通常出现在发言门槛较低的地方,比如帖子的评论区,比帖子本身更容易发现真情实感。所以,即使是营销号帖子,评论区仍然是非常有价值的。 评论区是小红书的灵魂。 在高强度冲浪的过程中,之前积累的媒介素养,事实核查的能力也可以起作用,帮助读者更准确地辨别信息的真伪。对于有此经验的人来说,不怕消息鱼龙混杂,怕的是有话憋着不说。如果在知乎看到的都是迎合站点氛围的高谈阔论,和“我有一个xx”的爽文结局,对平台的信任度自然会降低。 这就是为什么小红书是现在写非虚构的记者和编辑最喜欢的地方。相信只要小红书仍然保持这种平台运营模式,不断激发草根参与,降低发布信息的门槛,它就能继续反映社会的真实,成为新闻行业的“富矿”。 本文由人人都是产品经理作者【航通社】,微信公众号:【航通社】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。