所有文章

Caesium – 开源,批量图片压缩工具[Win/macOS/Linux/网页版]

Caesium 是一款适用于 Windows、macOS、Linux 系统的批量图片压缩工具,支持支持 JPG、PNG、WebP 和 TIFF 格式。@Appinn 在之前讨论《反向操作:如何把图片体

2025-04-27 04:06:49 · 0次阅读
 
 
前所未有的丰富虫虫!放置游戏《虫虫生态箱》发售定档5月22日

![](https://image.gcores.com/e5165637abd8033dc10f901d3f52458c-1600-900.jpg?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 由失眠社开发,GCORES PUBLISHING发行的放置造景养虫独立游戏《虫虫生态箱》,正式定档5月22日在Steam平台发售。游戏定价24.8元,首发9折,折后22.32元。 《虫虫生态箱》是一款以昆虫养殖为主题的放置游戏。大家可能玩过各式各样主题的放置游戏,养鱼、养花、种田等等,而《虫虫生态箱》是一款非单一昆虫品类的放置游戏。除了昆虫养殖,《虫虫生态箱》还加入了造景DIY等多维度玩法,将会为你打开一扇休闲游戏的全新大门! <内嵌内容,请前往机核查看> #### 敬请期待!正式版游戏内容 ![](https://image.gcores.com/3a174ce354e3fdf32bfa4753837c7145-2560-1440.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) ![](https://image.gcores.com/72270f77c93dcbd3897c0123bf909196-2560-1440.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) - 300种基于现实原型的虫虫,涵盖发光和发声虫虫。繁殖获取稀有品种,许多惊喜等着你通过繁殖去发现; - 300种造景物,700+种变化状态,通过离线放置逐渐获取; - 78种水、土和壁纸,带来百变的生态箱景致; - 5个时段,4种天气变化,箱内也是一处别样的生态小天地; ![](https://image.gcores.com/6a43d5c48b0027b0b2bd358bd73f6c08-2560-1440.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) - 桌面(壁纸)模式和无边框窗口化,随时赏玩; - 番茄钟功能,周期性专注闹钟,陪伴你的工作和摸鱼时光; ![](https://image.gcores.com/b6cee79e201a865ed587f03ff1464a48-2560-1440.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) - 3种投喂机器人和其他小功能小彩蛋,长时间放置不无聊。 <内嵌内容,请前往机核查看> #### 虫虫不分善恶!快加入愿望单吧! ![](https://image.gcores.com/f88574dd6b8ab070c4798750150ca811-2560-1440.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) 虫虫真的很可爱!希望这款游戏能让大家感受到养虫的乐趣。 既能长知识,又能舒缓身心。在桌面安置一个小小自然,看狗尾草慢慢繁茂,青苔爬满石头,点缀其中的是可爱虫虫和阵阵虫鸣,为繁忙的工作和学习带来一缕放松与惬意。 欢迎关注《虫虫生态箱》制作组官方社媒账号,获取更多游戏新鲜资讯: - 官方QQ交流1群:[980970910](https://qm.qq.com/q/hcXrRlcaH0)(养虫党请进) - 官方QQ交流2群:[723551380](https://qm.qq.com/q/mBdGaObHt6)(恐虫党、赛博养虫党请进) - 小红书:[虫虫生态箱](https://www.xiaohongshu.com/user/profile/64bf872e000000001403a8a6) - billbill:[虫虫生态箱](https://space.bilibili.com/3546726122129520) <内嵌内容,请前往机核查看>

2025-04-27 04:00:00 · 0次阅读
 
 
XRP库xrpl.js 遭黑客攻击,导致钱包被盗

近期,Ripple推荐加密货币NPM JavaScript库名为“xrpl.js”,被入侵窃取Ripple钱包种子和私钥,并将其转移到攻击者控制的服务器上,允许威胁者窃取存储在钱包中的所有资金。 恶意代码被添加到xrpl NPM包的2.14.2、4.2.1、4.2.2、4.2.3和4.2.4版本中,并于下午时间4:46到5:49之间发布到NPM注册表中。这些被破坏的版本已经被删除,现在有一个干净的4.2.5版本,所有用户都应该立即升级到这个版本。 xrpl.js库由Ripple币账本基金会(XRPLF)维护,是Ripple币通过JavaScript与Ripple币区块链交互的推荐库。它支持钱包操作、XRP转账和其他分类账功能。由于它是与XRP区块链交互的推荐库,它已经被广泛采用,在过去的一周内下载量超过14万次。 NPM库通过可疑方法进行了修改,名为CheckValitysofdeed将附加到折衷版本中的“ <pre>/src/index.ts</pre> ”文件的末尾进行了修改。此功能接受字符串作为参数,然后通过http Post请求转发给https:// 0x9c [。] xyz/xcm,威胁者可以在其中收集它。该代码试图通过使用“ AD-REFFERAL”用户代理使其看起来像网络流量监视系统的广告请求,从而试图变得隐秘。 ![xrpl-compromise.webp.png](https://img.4hou.com/uploads/ueditor/php/upload/image/20250423/1745402755127401.png) 恶意代码插入到xrpl.js NPM库中 根据开发安全公司Aikido的说法,checkValidityOfSeed()函数在各种函数中被调用,用于窃取XRP钱包的种子、私钥和助记符。 ![calling-checkvalidityofseed-function.webp.png](https://img.4hou.com/uploads/ueditor/php/upload/image/20250423/1745402756912654.png) 通过checkValidityOfSeed函数窃取数据 威胁者可以利用这些信息在自己的设备上导入被盗的XRP钱包,以提取其中的任何资金。 目前已经确定,受感染的版本是在不同时间上传的,总共有452次下载。虽然总下载量并不大,但这个库可能被用来管理和连接更多的XRP钱包。 恶意代码似乎是由与Ripple组织相关的开发人员帐户添加的,可能是通过受损的凭证添加的。恶意提交没有出现在公共GitHub存储库中,这表明攻击可能发生在NPM发布过程中。 如果用户使用其中一个版本,请立即停止并旋转与受影响系统的任何私钥或秘密。XRP Ledger支持钥匙旋转:https://xrpl.org/docs/tutorials/how-tos/how-tos/manage-manage-acccount-account-settings/assign-a-a-a-regular-regular-key-pair-,如果任何帐户的主密钥可能被妥协,则应将其禁用:https://xrpl.org/docs/tutorials/how-tos/manage-manage-account-settings/disable-master-key-pair。” 开发人员称,XRP账本代码库或GitHub存储库没有受到影响。“澄清一下:这个漏洞存在于xrpl.js中,这是一个用于与XRP账本交互的JavaScript库。它不会影响XRP账本代码库或Github存储库本身。使用xrpl.js的项目应该立即升级到v4.2.5,”XRP账本基金会在X上发布。 开发商还证实,Xaman钱包、XRPScan、First Ledger和Gen3 Games项目没有受到供应链攻击的影响。这种供应链攻击类似于之前以太坊和索拉纳npm用于窃取钱包种子和私钥的攻击。

2025-04-27 04:00:00 · 0次阅读
 
 
阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。作为阿里巴巴AI旗舰应用,夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。 ![](https://static.leiphone.com/uploads/new/images/20250427/680da8daece80.png?imageView2/2/w/740)  视觉交互创新,智能分析万物 在工作、学习、生活各类场景中,面对复杂物体、表格和图形时,用户往往难以准确描述真实需求。全新的夸克AI相机能深入理解用户意图,更好地实现视觉搜索、多轮问答、图像处理与创作。 基于AI超级框背后的视觉理解和推理模型能力,“拍照问夸克”能在手机和电脑上进行图片搜索、问答、思考、编辑以及创作。全新的多模态产品入口和交互体验,让AI相机成为AI时代用户表达问题和获取信息的重要方式。 “拍照问夸克”能精准识别图片中的人物、物体和诸多细节,能深入理解用户需求并联想相关问题。比如,拍照搜索文物时自动关联历史背景,上传商品图片时一键跳转淘宝同款链接。无论是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料还是故障代码,夸克都能做到秒级识别,经过多轮问答和深度思考后,给出同类产品中的最佳回答。  深入理解意图,完成复杂任务 过去,用户需要切换多个AI工具才能完成围绕“图片”的复杂任务。现在,夸克进一步提升“超级Agent”在视觉搜索的产品体验和使用场景,满足用户对现实物理世界的解读、处理和创作。 “拍照问夸克”将搜索、扫描、修图、翻译、创作等能力聚合为统一入口。针对较为复杂的图像,用户可一次上传10张图片进行深度推理并完成各类复杂任务。目前,夸克具备超百个专业Agent和原子能力,包括搜索、健康、学习、旅游、商品、创作等,持续通过模型能力升级来优化Agent组合策略,满足用户对图像信息的个性化需求。 ![](https://static.leiphone.com/uploads/new/images/20250427/680da8db17749.png?imageView2/2/w/740)   旅行中,“拍照问夸克”化身“专业导游”,边逛边拍获取文物讲解、景点攻略;工作中,它能辅助分析数据图表、优化代码逻辑,生成工作总结文档;在健康领域,上传体检报告,它给出指标异常分析以及康复方案建议。娱乐场景中,它支持棋牌指导、截图找剧、情头配对等趣味功能,并能一键完成高清化、去水印、原文溯源等。此外,“拍照问夸克”还支持多种语言提问和翻译解读。  今年3月,夸克发布“AI超级框”并不断迭代用户体验。随着“拍照问夸克”上线,“AI超级框”在多模态交互上极大拓展了应用场景。AI数据分析机构Xsignal最新数据显示,用户活跃率方面,夸克排名行业第一,次日留存率同样稳居榜首。分析师认为,夸克通过升级“AI超级框”,从学习到工作、生活全场景覆盖,多模态功能融合和智能交互创新,精准直击用户需求。  夸克搜索负责人张帆表示:“我们希望通过提升AI超级框的多模态能力,打造用户与现实物理世界之间的全新交互方式和产品体验。AI时代,夸克将继续围绕信息的获取、消费、编辑、传输、管理、决策和创作,由AI超级框承载更多的需求、更好的交互、更大的能力。”

2025-04-27 03:49:00 · 0次阅读
 
 
全球第一盏“核聚变灯”,有望5年内在中国点亮

小堆与可控核聚变的协同发展,有望成为人类能源革命的“双引擎”。

2025-04-27 03:46:31 · 0次阅读
 
 
巨亏超12亿,负债达145亿,南都电源紧急冲刺港股“补血”

2024年归母净利润亏损12亿元至15.6亿元。

2025-04-27 03:26:27 · 0次阅读
 
 
当FPGA遇上开源,要变天了

未来,开源FPGA将成为硬件创新的核心引擎。

2025-04-27 03:26:22 · 0次阅读
 
 
【生态环境周观察】光伏龙头晶澳科技暴亏46亿;宁德时代发布新一代钠电池;特朗普煤炭复兴政策或加剧产业工人尘肺病问题

政策层面,十部门联合印发《关于推动交通运输与能源融合发展的指导意见》;我国与沙特签署《核能发展安全与安保合作谅解备忘录》;特朗普煤炭复兴政策持续引发争议;事件层面,晶澳科技2024年净亏损46.56亿元;宁德时代发布新一代钠电池;我国民企核聚变研究取得重要突破;我国风光装机历史性超过火电。

2025-04-27 03:21:30 · 0次阅读
 
 
Midea Sets Timeline for Humanoid Robot Rollout: Factory Integration in May, Retail Launch Mid-Year

Midea&#39;s humanoid robots are set to enter the commercialization phase, with factory deployments slated for May and retail integration planned for the second half of the year.

2025-04-27 03:18:05 · 0次阅读
 
 
“拆二代”5套房近4000万元灰飞烟灭,当心“杠杆重锤”砸向更多人

破解困局的关键,在于重拾“俭” 的哲学。

2025-04-27 03:08:24 · 0次阅读
 
 
中国还会诞生3-10个“泡泡玛特”

“今年的行业关键词是品牌化”

2025-04-27 03:08:21 · 0次阅读
 
 
康缘药业两笔关联交易后,关联方更名,大股东退出

如此“合规”可休矣!

2025-04-27 03:08:19 · 0次阅读
 
 
ABS市占率第一难解成长焦虑,商用车电子龙头瑞立科密募资扩产遭拷问

商用车主动安全系统龙头企业“带病闯关”。

2025-04-27 03:08:16 · 0次阅读
 
 
百元级笔记本火了 但建议别买

前段时间,小雷的朋友向我提了一个问题:“如果我想买一台单纯上网和office的笔记本电脑,最便宜的要多少钱?”。说实话,这个问题确实不好回答,毕竟真要说便宜,如今全新的笔记本电脑几百一千的都有,但是你问我能不能用,那就真的要打上个问号了。 为了帮朋友找到这个问题的答案,小雷也是打开京东一番搜索,只能说不搜还好,一搜就上头。**本以为全新的笔记本电脑一千多已经是极限,却没想到还看到不少卖几百块的,再次让我见识到了中国PC产业链的逆天。** ![](https://static.cnbetacdn.com/article/2025/0427/ed70a2fce370423.jpg) 图源:雷科技 随着进一步探索,我也发现这些几百上千元的笔记本电脑其实受众并不少,甚至还诞生了不少主打超廉价PC市场的品牌,这些品牌的产品售价可以用一句话来形容:大牌的最低起售价,几乎就是他们的最高售价。 下面就让雷科技来帮大家盘一盘,这些超廉价的笔记本电脑,真的能满足最基础的需求吗? **笔记本电脑只要几百元,** **到底便宜在哪?** 俗话说得好:一分钱一分货,这句话在消费电子领域更是近乎通用的定律,所以就别想着几百上千的笔记本电脑,在体验上能够与大牌两三千的拉平了,即使外观看起来差不多,在你看不到的地方,减配都是无法避免的。 就拿处理器来说,百元和千元级的笔记本电脑,使用的基本是英特尔的N系列,虽然换了名字,**本质上还是英特尔的赛扬和奔腾产品线,主要针对性能要求不强的使用场景,比如大型广告牌、NAS等。** 而且,N系列也分新旧两代,其中较老的那一代基本上就是赛扬和奔腾产品线取消前的最后一代产品的马甲,比如某款百元笔记本电脑采用的N5805,实际上属于赛扬系列,参数为2核4线程,默频2.0GHz,睿频2.7GHz,缓存仅有4MB。 ![](https://static.cnbetacdn.com/article/2025/0427/d34218445470c7b.jpg) 图源:雷科技 就性能来说,其实还不如很多手机处理器,唯一的优势就是便宜,虽然官方宣传其可以满足日常办公和轻度娱乐需求,但是在实际使用时表现却一言难尽,特别是搭配Windows 11这样的新一代操作系统时,性能表现更是受限。 虽然不少人觉得只有游戏等应用对性能有要求,实则不然,浏览器、系统动画以及一些应用都有着不小的性能要求。**以大家常用的chrome浏览器为例,同时打开十个左右的网站,就会占用约2GB的内存,如果其中包括在线视频网站,那么内存占用还会更高。** 如果你买到手的笔记本电脑,处理器和内存的配置都不行,那么“上个网都卡”或许就不是一句玩笑话了。 不过,正规品牌一般都会把处理器型号列出来,所以想规避掉一些低性能处理器并不难。而一些浑水摸鱼的杂牌厂商,就会使用容易混淆的话术来描述处理器,比如“11代处理器”等宣传语,乍看之下会让人误以为是11代酷睿,实则指的是Jasper Lake平台赛扬和奔腾处理器。 ![](https://static.cnbetacdn.com/article/2025/0427/60feea47be98c97.jpg) 图源:雷科技 **简单来说,如果你发现产品介绍页面里,商家对处理器的描述以各种形容词为主,甚至写出xx代处理器却不提准确型号,那么就要格外警惕了,商家可能在误导你以为这是一款高性能电脑。** 除了处理器,屏幕也是减配的重灾区,根据小雷的观察,多数千元级别的笔记本电脑屏幕均为低色域+低亮度的残废屏。虽然说不上完全不能用,但是体验真的很一般,如果厂商的屏幕调教技术不过关,或者本身采购的就是残次品,那么看个视频红色偏成橙色也不是什么奇怪的事情。 而且低亮度的屏幕在户外使用体验极差,基本上断绝了你移动办公的可能,部分屏幕甚至会在强烈一点的灯光下就出现过暗等问题,会让眼睛更快进入视觉疲劳状态,如果长时间使用且没有适当休息,很容易造成视力下降等问题。 整体而言,超廉价笔记本电脑最大的问题就是性能和屏幕体验不佳,其他诸如电池容量小续航低、全塑料外壳等问题都是次要的了。另外也要提醒一下大家,这些笔记本电脑的Windows系统基本是试用版,需要自己想办法或者联系客服进行激活。 **“便宜不是货”,****超廉价笔记本能买吗?** 前面我们说了,这类笔记本电脑普遍存在性能低、续航短等问题,即使这些处理器本身的功耗不高,为了节省成本而配置的小容量电池也无法支撑长时间的离电使用。 以上还只是你能看到、感知到的缩水配置,在大家看不到的地方,内存、硬盘、供电模块都可能减配或使用不合规的硬件,由此带来的质量隐患才是最大的问题。 所以小雷并不推荐大家这类超廉价笔记本电脑,即使它们真的很便宜,甚至你真要问“能不能用”的话,我的答案也是“能用”,毕竟能开机、能上网,对于某些人已经足够了。 但是问题的关键就在于它能用多久?在贴吧、B站你很容易就能搜到不少维权、避坑这类笔记本电脑的内容,其中提到的问题包括但不限于:**突然关机无法再启动、某天开机后突然变得很卡并且无法恢复、开机运行一段时间后会自动关机。** ![](https://static.cnbetacdn.com/article/2025/0427/287d58778619ccc.jpg) 图源:雷科技 虽然并非每台电脑都会遇到这些问题,但是从网友的反馈来看,小问题不断、大问题不少的概率还挺高的。而且普遍存在售后慢、敷衍等问题,即使是京东自营平台购买的产品,同样要经历漫长的“返厂——检查——维修”流程,短则一周长则两三周,除非这台电脑对你来说是可有可无的存在,否则如此漫长的售后时间都会直接影响你的学习和工作。 **事实上,主流品牌的电脑不仅仅是贵在配置和质量上,其中有不少的品牌溢价其实是给售后服务买单的。** 以联想为例,数千家售后网点遍及全国各地,在部分地区直接覆盖到乡镇,而且仅去年就新增了500家服务中心。再比如说惠普,也在全国1200个市县也设有超过1800家服务网点。 主流品牌遍布全国的售后网点,确保用户即使生活在乡镇区域,也可以在附近的城市找到售后网点,然后现场解决你的问题。即便问题比较严重或缺少配件而无法当日解决,整个维修周期也不会超过三天(主要是国内的快递速度确实不讲道理,配件配送一般一两天就到了)。 如果你不想冒险或者赌一下自己的运气,那么还是建议在有完善售后体系的主流品牌里选购电脑。倘若你还是想赌一把,那么不妨继续往下看。 **雷科技实测:****做工还行,性能让人失望** 口说无凭,为了进一步了解这些“入门级”笔记本电脑的实际体验,小雷斥“巨资”从京东购入了一台价格不到千元的产品,并上手实际体验了一番。 ![](https://static.cnbetacdn.com/article/2025/0427/e7f9e5cd4e2f5ea.jpg) 图源:雷科技 老实说,这台电脑的质感有点出乎我的预料,虽然是全塑料的机身,外壳却颇为扎实。甚至用力敲打键盘时都没有明显的空腔声,键盘面也不会脆弱到一压就往内凹,显示屏的边框厚度也控制得很好,和我以前用过的一些两三千价位的笔记本电脑并没有太大区别。 以一款百元笔记本电脑来说,除了重量有点出乎意料外,整体表现都还算不错。不过就和我猜测的一样,屏幕的色彩和亮度表现都很差,算是近年来用过的笔记本里倒数的存在。 不过也只是色彩表现差而已,倒是没有明显的偏色,一通体验下来,最大的问题还是CPU性能严重不足。**这么说吧,仅仅是打开任务管理器就能够让CPU占用率从15%左右暴涨到35%左右,再打开个浏览器看B站视频,占用率直接涨到90%以上。** ![](https://static.cnbetacdn.com/article/2025/0427/da91d0c97c75eec.jpg) 图源:雷科技 简而言之,这真的就是一台“上网本”,性能只够应付在线视频、word等简单的需求,但凡是个数据多一点的Excel表格,这台电脑分分钟都能卡死给你看,一些特效较多的PPT估计体验也不会好到哪去。 可以说这个表现并不出乎我的预料,毕竟从参数来看,N5805的性能堪堪够满足中高端路由器的需求,就连NAS都不太看得上。这个厂商拿来给Windows PC用,能流畅跑一些简单的任务就已经不错了,而且内存也只有8G,不过在占满内存之前估计CPU会先爆炸。 如果说其他的超廉价笔记本电脑都有这样的做工,那么只要选个处理器性能好一些还是可以用的。比如2023年推出的N100,单论参数已经非常超过不少老版本的酷睿处理器,在实测中性能也足以应付多数日常应用和office软件。 不过我搜了一下,搭载N100的笔记本电脑价格普遍都不低,算上国补价格在1500-2000之间,已经非常接近某些主流品牌的入门级产品价格。**比如Redmi Book 14焕新版,国补后只要两千六出头,配置是i5-12450H+16GB+512GB,甚至还有金属机身,或者荣耀的MagicBook X16战斗版,配置差不多,价格还要比小米更便宜些。** ![](https://static.cnbetacdn.com/article/2025/0427/f825615c2e29c78.jpg) 图源:雷科技 说实话,这种情况就很尴尬了,1000元左右的笔记本电脑性能完全不够用,加钱到1500元的话倒是勉强够了,但是只要再往上提一点,就已经可以买到主流品牌的入门型号了。 所以,如果你想买一台办公本,而且不考虑二手电脑,那么我还是建议攒攒钱,把预算提高到2000-2500元,足够你买一部性能和做工都达到及格线的产品,只要不磕碰用个三四年毫无问题。 真的不要图便宜而去买那些几百上千的笔记本电脑了。 [查看评论](https://m.cnbeta.com.tw/comment/1495680.htm)

2025-04-27 03:05:12 · 0次阅读
 
 
B端财务领域的“账套”分析与总结

<blockquote><p>在B端财务领域,“账套”是一个核心且基础的概念,它不仅是财务数据管理的重要工具,更是企业财务健康和合规运营的关键。本文将深入探讨“账套”的定义、结构、核心作用以及在实际业务中的应用场景。</p> </blockquote> ![](https://image.woshipm.com/2023/04/14/fa5cbae0-da8e-11ed-b35a-00163e0b5ff3.jpg) 在财务领域,“账套”是一个核心概念,通常指企业或组织为记录和管理财务数据而建立的**一套完整、独立的会计核算体系**。它相当于财务数据的“容器”,用于系统化存储和归类所有经济业务活动产生的凭证、账簿、报表等信息。 ![](https://image.woshipm.com/2025/04/26/1eb86342-2292-11f0-9b1e-00163e09d72f.jpg) ## 一、如何理解账套? ### 1.独立核算单位 每个账套对应一个独立的核算主体(如一家公司、一个部门、一个项目),确保财务数据隔离。例如: – 集团企业为每个子公司设立单独账套; – 同一公司内不同业务线(如零售、电商)使用不同账套。 ### 2. 结构化数据框架 账套包含预设的规则和参数,如: – **会计科目表**:资产、负债、权益、收入、费用等科目体系; – **核算维度**:部门、项目、客户等辅助核算项; – **货币与汇率**:本位币设置、外币核算规则; – **会计期间**:月度/季度/年度的划分,启用日期。 ### 3. 操作流程载体 所有财务操作(填制凭证→过账→结账→生成报表)均在账套内完成,数据逻辑严密关联。 ## 二、账套的核心作用 ### 1. 数据隔离 不同账套数据完全独立,避免混淆(例如母公司与子公司账务分开)。 ### 2. 灵活管理 企业可通过多账套实现: – 多会计准则并行(如中国GAAP与国际IFRS); – 多币种核算; – 历史数据对比(如新旧年度账套分立)。 ### 3. 效率与合规 标准化账套模板可快速复制,减少重复设置;同时满足审计和税务监管要求。 ## 三、实际应用场景示例 **– 场景1:跨国公司** 中国总部、美国分公司、欧洲办事处分别设立账套,按当地货币和税法独立核算,最终合并报表。 **– 场景2:多项目管控** 建筑公司为每个工程项目单独建账套,跟踪成本、收入及利润。 **– 场景3:测试与生产环境** 在财务软件中,企业可能保留“测试账套”用于演练,与正式账套区分。 ## 四、账套 vs 账簿 vs 科目 – 账套是顶层框架,包含所有财务数据; – 账簿是账套中的具体记录载体(如总账、明细账); – 科目是账簿中分类核算的最小单元(如“银行存款-中国银行”)。 ## 总结 账套的本质是“**财务数据的逻辑集合体**”,通过结构化设计和独立配置,为企业提供清晰、可追溯的财务信息管理基础。理解账套,需结合其独立性、结构化规则及实际业务需求进行分析。 本文由 @给我磨墨 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

2025-04-27 03:03:36 · 0次阅读
 
 
深度复盘:TOP级房企渠道业务风控及效能升级

<blockquote><p>本文提供房企渠道业务数字化转型的完整方法论,通过该项目案例验证&#34;技术驱动管理变革&#34;的落地路径,揭示从系统重构到组织升级的演进逻辑。适合数字化转型负责人或房企IT、营销负责人收藏阅读</p> </blockquote> ![](https://image.woshipm.com/2023/04/17/44f0cbce-dcf5-11ed-8851-00163e0b5ff3.png) ## 一、为什么做? **——行业的痛点:当地产从野蛮生长时期发展到现在,已经过了黄金时期,在无法通过快速去化获得现金流的背景下,通过精细化管理的手段实现“降本提效”摆在选项前。** 当房地产行业告别野蛮生长时代,”精细化管理”成为TOP级房企的核心命题。 该项目为某新一线城市区域TOP房企,其渠道业务长期受困于三大顽疾: 1.飞单行为导致佣金流失,每年因舞弊导致营销费用花费上百万; 2.项目同时使用多系统管理业务形成数据孤岛导致管理盲区; 3.结佣周期冗长影响,渠道团队士气; 更严峻的是,市面上竞品系统仅能提供基础功能堆砌,缺乏业务全链路穿透能力,风控规则如同”纸糊的篱笆”。 为了解决这一系列问题,我们团队认为应该将系统进行整合,同时将渠道业务+系统进行重构,在这场重构战役中,我们面对的不仅是系统的替换升级,更是对房地产渠道业务底层逻辑的再认知。 当时其他几套系统存在100万+历史数据需要迁移,当需求摆在面前时,我们清醒地意识到:这不是简单的数据搬运,而是业务流、资金流、数据流的三位一体重构。 ## 二、怎么做? **——核心是通过重构渠道业务流程,规范渠道业务流程,利用工具将整套业务串联起来,因此对战略目标进行拆解。** ### 1. 现状诊断:对业务全景扫描 采用”驻场式”深度调研法,我作为项目负责人与一线业务人员同上班、同时接待客户,真实还原交易场景。通过《渠道业务诊断报告》揭示关键发现: - 飞单高发区集中在”客户报备-带看-签约”三节点; - 数据孤岛导致同一组客户信息需人工搬移至其他系统; - 结佣流程涉及多个风险环节(如带看水印照可人工PS、数据搬运过程中可换号码、或换人更名); ### 2. 业务场景重构:场景化风控矩阵设计 基于项目渠道业务现场,创新提出”20场景SOP手册”,将复杂业务流程解构为标准化操作单元。以”带客上访”场景为例: - 满足三维度匹配原则(手机号+人证照片+带看人同框照) - 从客户报备→到访→成交全场景都有系统监管,实现留痕率100% **风控体系:** ![](https://image.woshipm.com/2025/04/26/ee94a192-2289-11f0-b1a0-00163e09d72f.png)   ### 3. 历史数据:百万级数据迁移攻坚 面对SAP和另一家友商系统两大异构数据源,我们采用”双保险”迁移策略: (因SAP负责系统管理房源、收款等信息,故采用接口打通。另一家轻量级友商系统采用替换方案) **人为刁难:**友商听到要被替换第一时间表示不会提供历史数据,这过程一度让项目陷入停滞…… 后来通过与房企多方打听了解到友商还有一笔尾款未付。这时候让我们看到了希望,经过与房企主 C沟通,由他作为沟通桥梁,同时明确想要拿到尾款必须配合系统数据迁移,至此人的问题全部搞 定。 - 技术层:利用数据接口打通智能数据清洗引擎,自动识别并修复脏数据,每日和SAP同步交易&amp;客户数据。 - 最终完成100万+数据无损迁移,核心字段匹配准确率99.98% ### 4. 培训交付:知识转移体系 针对渠道总监、销售经理、内勤/文员三类核心角色,设计差异化培训体系: - 高管层:面向管理层1V1培训+人手一页《风控数据看板一页纸指南》 - 执行层:面向执行层编制《结佣20场景SOP手册》(含流程图解+FAQ) - 考核机制:通过模拟实战演练(如虚构飞单场景测试风控预警)实现100%考核通过率,关键用户可独立完成系统操作。 ## 三、最终成果 系统上线后8个月,业务端感知到显著变化: - **效率革命**:结佣周期压缩40%(60天→30天),交易回款当月即可拿佣。 - **风控升级**:8个月识别15起舞弊行为,直接挽回佣金损失约50W。 - **战略延伸**:系统沉淀的渠道效能数据(如带客转化率排名、佣金成本占比)直接支撑营销预算决策;促进年增收约四十万元来源于渠道资源优化配置(淘汰低效渠道商4家,头部渠道商产出提升18%) ## 四、方法论:可复制的风控升级路径 本项目验证了”技术驱动管理变革”的可行性,形成三大可复用经验: - **业务中台化思维**:避免单纯功能堆砌,需建立“流程引擎+风控规则+数据分析”三位一体的业务中台,这样才可以做到业务上的成功。 - **灰度风控策略**:历史数据迁移需保留旧系统并行运行3个月,通过业务结果反向校验数据准确性,另外还要避免一刀切导致系统&amp;新业务模式导致的一线执行问题。 ## 五、跨行业改造指南:如何将该项目经验迁移至其他行业 **核心迁移逻辑**:将”业务流程数字化重构→风控规则引擎嵌入→历史数据资产化→组织能力沉淀”四层架构,转化为行业共性解决方案。 ![](https://image.woshipm.com/2025/04/26/0b1eea0c-228a-11f0-9b1e-00163e09d72f.png) **场景推导:** 金融行业——信贷审批风控升级 **行业痛点**:小微贷款审批周期长、欺诈案件频发 **改造方案**: - 业务流程重构:建立自动化审批流 - 风控规则迁移:自动识别空壳公司嵌套贷款 ## 六、互动讨论 1.当行业传统利益格局与数字化改造产生冲突时,如何设计共赢的过渡方案? 2.在将用户需求洞察转化为产品功能时,如何避免“解决方案超出产品能力边界”? 3.传统企业进行数字化改造时,技术团队与业务部门常陷入“鸡同鸭讲”困境。最有效的跨部门协作机制应该如何进行? 最后 当行业进入”管理红利”时代,数字化风控不再是成本中心,而是战略级生产力工具。这场渠道业务变革启示我们:真正的技术赋能,应该让管理动作变得”举重若轻”。 (注:本文关键数据已脱敏处理,关键业务逻辑经抽象化改编) 本文由 @靓男大师兄 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

2025-04-27 03:01:59 · 0次阅读
 
 
Multinationals Ramp Up Investment in China's Auto Supply Chain, Diversify Beyond Nvidia

As Chinese new energy vehicle manufacturers sold 70% of the world&#39;s EVs in 2024, the global automotive chip supply chain is becoming increasingly globalized.

2025-04-27 02:58:04 · 0次阅读
 
 
剧场版《孤独摇滚(上)》上映2天国内票房突破1000万!

![](https://image.gcores.com/4b300c31b8cce8251283a4a92ae942a2-1920-1080.jpg?x-oss-process=image/resize,limit_1,m_fill,w_626,h_292/quality,q_90) 剧场版《孤独摇滚(上)》官方宣布,上映两天,国内累积票房现已突破1000万! ![](https://image.gcores.com/33a97622c9a35b47918ca78f8142d654-1920-1080.jpg?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10) 此前, 中国电影发行放映协会新片档期显示 《孤独摇滚(下)》将于5月10日上映。 ![](https://image.gcores.com/c7b3744187ace7380a1caaa326a40653-1002-844.png?x-oss-process=image/resize,limit_1,m_lfit,w_700,h_2000/quality,q_90/watermark,image_d2F0ZXJtYXJrLnBuZw,g_se,x_10,y_10)

2025-04-27 02:55:30 · 0次阅读
 
 
主流 AI 生成 3D 技术流派辨析:Text-to-3D, Image-to-3D 与 NeRF 应用概览 (AI+3D 产品经理笔记 S2E02)

<blockquote><p>AI生成3D技术正在迅速改变我们创造和体验三维内容的方式。从文本到图像,再到复杂的三维模型,AI技术的多样性为产品设计、游戏开发、虚拟现实等多个领域带来了前所未有的机遇。</p> </blockquote> ![](https://image.woshipm.com/2025/04/26/12c4adc4-22b1-11f0-82f5-00163e09d72f.png) ## 引言:从“指令”到“立体”的技术光谱 在上一篇笔记(S2E01)中,我们共同探讨了 AI 生成 3D 技术之所以在当前节点迎来爆发的深层驱动力,分析了它旨在解决的行业核心痛点,并对现阶段的技术挑战与局限建立了初步的理性认知。我们认识到,AI+3D 并非单一的技术魔法,而是一个包含多种路径、处于不同发展阶段的技术集合。这种多样性源于问题的复杂性以及可用数据和计算资源的限制,迫使研究者探索不同的策略来弥合抽象指令(如文本)或低维数据(如图像)与高维、结构化的 3D 输出之间的鸿沟。 ![](https://image.woshipm.com/2025/04/26/21cc7e64-22b1-11f0-b1a0-00163e09d72f.png) 那么,当我们谈论“AI 生成 3D”时,具体指的是哪些主流的技术方法或流派呢?它们各自的工作逻辑是怎样的?需要什么样的输入?能产生什么样的输出?又分别适用于哪些应用场景?理解这些不同技术流派的特点、优势与局限,是产品经理进行技术选型、定义产品功能、评估可行性的基础。未能区分这些技术的光谱,可能导致产品定位失误、用户预期错配或技术路线选择不当。 ![](https://image.woshipm.com/2025/04/26/27b94b68-22b1-11f0-9c05-00163e09d72f.png) 本篇笔记(S2E02)将聚焦于梳理和辨析当前备受关注的几种主流 AI 生成 3D 技术流派,主要包括: - **Text-to-3D (文本到三维)**: 如何让 AI 根据一段文字描述“凭空”创造出 3D 模型? - **Image-to-3D (图像到三维)**: 如何从单张或多张二维图像中恢复或生成对应的 3D 结构? - **NeRF (神经辐射场)**: 作为一种强大的场景表示和渲染技术,它在 3D 重建和生成中扮演着怎样的角色? - **(可能涉及) Sketch-to-3D (草图到三维) 及其他**: 其他值得关注的交互式生成方式。 我们将尝试从产品经理的视角,深入浅出地解析这些技术流派的基本原理、输入输出特性、典型的应用场景以及初步的优劣势对比。目标是帮助大家建立一个关于 AI 生成 3D 技术“光谱”的清晰认知地图,认识到它们并非相互排斥,而是常常相互借鉴、融合,共同推动着领域的发展。为后续更深入的技术探讨和产品思考打下坚实基础。 ## 一、 Text-to-3D:用语言“召唤”三维实体 Text-to-3D 无疑是近年来 AI+3D 领域最引人入胜、也最具“魔法感”的方向之一。它的核心目标是让用户能够仅仅通过输入一段自然语言文本描述(例如,“一个坐在扶手椅上看书的宇航员”,“一个带有锈迹和划痕的蒸汽朋克风格的机械臂”),就能让 AI 自动生成对应的三维模型。这极大地降低了 3D 内容创作的门槛,使得没有任何 3D 建模经验的用户也能将想象中的物体或场景快速具象化。这种潜力对于游戏开发、虚拟现实、影视制作等需要大量 3D 内容的行业具有革命性意义。 实现高质量的 Text-to-3D 并非易事,它需要模型同时具备强大的自然语言理解能力、丰富的世界知识以及生成复杂三维几何结构的能力。由于直接建立文本与高质量 3D 模型之间映射关系的大规模配对数据集极为稀缺,研究者们探索了多种间接的技术路径。 ### 1️⃣ 核心技术路径与演进 ![](https://image.woshipm.com/2025/04/26/3097a70c-22b1-11f0-82f5-00163e09d72f.png) 实现高质量的 Text-to-3D 并非易事,它需要模型同时具备强大的自然语言理解能力、丰富的世界知识以及生成复杂三维几何结构的能力。目前主流的技术路径大致可以分为几类: ### a. 基于 CLIP + 优化/生成器 的早期探索 **核心思路**: - **① 借鉴 Text-to-Image**: 利用 CLIP 强大的跨模态(文本-图像)对齐能力作为“语义引导”。 - **② 定义 3D 表示**: 如 NeRF、SDF 或直接操作 Mesh 顶点。 - **③ 渲染与评估**: 从不同虚拟视角渲染 3D 表示得到 2D 图像,用 CLIP 计算渲染图与输入文本的相似度得分。 - **④ 优化**: 以最大化 CLIP 相似度为目标,通过反向传播优化 3D 表示参数或驱动 3D 生成器网络。 **代表性工作**: - **Dream Fields**: 直接优化 NeRF 参数。 - **CLIP-Forge**: 两阶段方法,先训练 3D 形状自编码器,再训练以 CLIP 图像特征为条件的归一化流生成形状嵌入,推理时用 CLIP 文本特征驱动生成。 **优缺点**: - **优点**: 巧妙利用预训练 CLIP,绕开缺乏文本-3D 配对数据的难题;CLIP-Forge 生成速度相对较快。 - **缺点**: 优化过程缓慢,易陷局部最优;缺乏固有 3D 理解,几何质量和三维一致性差,易出现“Janus 问题”(前后都有脸等矛盾特征)。 ### b. 基于 2D 扩散模型的“蒸馏” (Score Distillation Sampling – SDS) **核心思想**: 利用强大的预训练 2D 文本到图像扩散模型(如 Imagen, Stable Diffusion)作为“教师”,将其二维生成能力“蒸馏”到三维表示(常用 NeRF 或 SDF)的学习中。 **工作流程**: - **① 初始化 3D 表示**。 - **② 随机视角渲染**: 得到 2D 图像。 - **③ 2D 扩散模型评分**: 将渲染图和文本 Prompt 输入 2D 扩散模型,利用其去噪网络估计一个“分数”或“梯度”,指示如何修改 2D 图像使其更符合文本。 - **④ 3D 表示更新**: 利用 SDS 算法,根据 2D 分数计算更新 3D 表示参数的梯度,使其在任意视角渲染下都更符合文本。 - **⑤ 迭代优化**: 大量迭代直至 3D 表示收敛。 **代表性工作**: - **DreamFusion (Google)**: 开创性工作。 - **Magic3D (Nvidia)**: 两阶段优化(低分粗糙+高分精细),提高质量、分辨率和速度。 - **ProlificDreamer**: 提出 VSD,旨在解决 SDS 的过饱和、过平滑、低多样性问题。 **优缺点**: - **优点**: 生成细节更丰富、三维一致性更好(Janus 问题缓解)、语义更准确。 - **缺点**: 训练(优化)过程仍非常耗时(小时级);对 Prompt 敏感,需“提示工程”技巧。 ### c. 直接在 3D 表示上进行扩散 **核心思想**: 尝试直接在三维数据表示(点云、体素、参数化 Mesh/SDF)上应用扩散模型,避免 SDS 的优化循环。 **代表性工作**: - **Point-E (OpenAI)**: 三步流程(文本到图像 -&gt; 图像到低分点云扩散 -&gt; 低分到高分点云扩散),速度较快(1-2 分钟)。 - **Shap-E (OpenAI)**: 直接在隐式函数参数空间(可解码为纹理网格或 NeRF)进行扩散,生成速度相对较快,但公开模型细节有限。 - **挑战与优势**: - **挑战**: 3D 数据维度高、结构复杂,高质量、大规模、带标注的 3D 训练数据稀缺,训练强大的 3D 扩散模型难度大。 - **潜在优势**: 推理速度可能更快。 - **现状**: 目前在生成质量和细节上普遍不如基于 SDS 的方法。 ### d. 结合检索与生成 - **核心思想**: 给定文本描述,先在大型 3D 模型库中检索语义相似的模型,然后将其作为生成过程的起点、参考或组成部分,再利用生成模型进行修改、组合或添加细节。 - **优势**: 有助于利用现有高质量资产的结构和细节,提高生成结果质量和结构合理性。 - **依赖**: 效果高度依赖所用 3D 数据库的规模、质量和多样性。 ### 2️⃣ 输入、输出与典型应用场景 ![](https://image.woshipm.com/2025/04/26/3e1e6b68-22b1-11f0-b1a0-00163e09d72f.png) **输入**: - **核心**: 自然语言文本描述 (Text Prompt)。Prompt 质量(清晰度、细节、具体性)影响巨大。 - **辅助**: 可能支持否定提示、风格关键词、图文混合提示、迭代式文本指导。 **输出 (通常需后处理)**: - **① 隐式表示 (Implicit Representation)**: NeRF 或 SDF,需后续提取为 Mesh (如用 Marching Cubes)。 - **② 点云 (Point Cloud)**: 如 Point-E 输出,需表面重建得到 Mesh。 - **③ 体素网格 (Voxel Grid)**: 分辨率有限,外观块状,需平滑处理并转为 Mesh。 - **④ 显式网格 (Explicit Mesh)**: 如 Magic3D 或 GET3D 输出,但通常拓扑不规则、面片质量差,需拓扑优化 (Retopology)、UV 修复等。 - **· 颜色信息**: 通常生成顶点色或低分辨率纹理贴图。 **典型应用场景**: - **① 快速概念设计与原型制作**: 为设计师、艺术家、开发者提供快速可视化工具,用于早期评审、头脑风暴、沟通、迭代。 - **② 个性化内容生成**: 在元宇宙、虚拟社交、游戏中,让用户通过文本创建独特虚拟化身、服装、道具、家园装饰。 - **③ 教育与创意启发**: 激发想象力、辅助学习 3D 概念、降低创作门槛。 - **④ 填充虚拟世界背景**: 快速生成大量非关键性背景道具或环境元素(需注意质量一致性)。 - **⑤ 辅助营销内容创作**: 快速生成用于广告、社交媒体的简单 3D 视觉元素。 ### 3️⃣ 优势与局限性 (产品视角) ![](https://image.woshipm.com/2025/04/26/45afcdd6-22b1-11f0-82f5-00163e09d72f.png) **优势**: - **① 极低的创作门槛**: 无需专业技能,自然语言即可创作,扩展创作者群体。 - **② 极高的创作效率 (概念阶段)**: 分钟/小时级获得初步结果,相比传统手工(天/周级)效率提升巨大。 - **③ 激发创意与想象力**: 语言灵活性和模型随机性支持尝试各种想法,探索传统工具难实现组合。 **局限性**: - **① 生成质量不稳定且普遍不高**: 几何细节、纹理清晰度、拓扑规整性等普遍达不到专业要求,需大量后期修复。 - **② 可控性差**: 难通过 Prompt 精确控制尺寸、比例、位置、特定细节。“开盲盒”感强,难稳定复现或精确迭代。 - **③ 三维一致性问题**: 即使 SDS 有所改善,仍可能出现视角间结构矛盾(Janus 问题)。 - **④ 计算资源消耗大/生成速度慢**: 尤其 SDS 方法,需较长计算时间(GPU 小时级),难实时交互。直接生成方法更快但质量通常更低。 - **⑤ 输出格式与下游可用性**: 输出模型需复杂后处理(网格提取、拓扑优化、UV 重建、材质调整、绑定等)才能整合到专业工作流。 **产品视角总结**: 当前核心价值在于加速概念探索和降低创作门槛,而非取代传统建模。产品定位应侧重灵感激发、快速原型、个性化娱乐等,需管理用户对质量和可控性的预期。 ### 4️⃣ 代表性技术/模型/工具与讨论 ![](https://image.woshipm.com/2025/04/26/4d950840-22b1-11f0-b1a0-00163e09d72f.png) **① CLIP-Guided Optimization:** **Dream Fields:** Zero-Shot Text-Guided Object Generation with Dream Fields ![](https://image.woshipm.com/2025/04/26/52eef6e8-22b1-11f0-b1a0-00163e09d72f.png) (来源:https://arxiv.org/abs/2112.01455) **CLIP-Forge:** Towards Zero-Shot Text-to-Shape Generation ![](https://image.woshipm.com/2025/04/26/58e0b17c-22b1-11f0-b1a0-00163e09d72f.png) (来源:https://arxiv.org/abs/2110.02624) **② Score Distillation Sampling (SDS) &amp; Variants:** **DreamFusion (Google):** Text-to-3D using 2D Diffusion ![](https://image.woshipm.com/2025/04/24/2f3be306-205d-11f0-82f5-00163e09d72f.gif) (来源: https://dreamfusion3d.github.io/) **Magic3D (Nvidia):** High-Resolution Text-to-3D Content Creation ![](https://image.woshipm.com/2025/04/26/69f64332-22b1-11f0-b1a0-00163e09d72f.png) (来源:https://deepimagination.cc/Magic3D/) **ProlificDreamer:** High-Fidelity and Diverse Text-to-3D Generation with Variational Score Distillation ![](https://image.woshipm.com/2025/04/26/79f24e52-22b1-11f0-b1a0-00163e09d72f.png) (来源:https://arxiv.org/abs/2305.16213) **③ Direct 3D Diffusion:** **Point-E (OpenAI):** A system for generating 3D point clouds from complex prompts ![](https://image.woshipm.com/2025/04/26/85cdbbee-22b1-11f0-9b1e-00163e09d72f.png) (来源:[https://openai.com/index/point-e/](https://openai.com/index/point-e/)) **Shap-E (OpenAI):** Generating Conditional 3D Implicit Functions ![](https://image.woshipm.com/2025/04/26/8c61a95c-22b1-11f0-82f5-00163e09d72f.png) (来源:[GitHub](https://github.com/openai/shap-e), https://arxiv.org/abs/2305.02463) **④ Representative Tools/Platforms:** **Luma Genie:** Luma AI’s Text-to-3D Tool ![](https://image.woshipm.com/2025/04/24/93161ce2-205e-11f0-b1a0-00163e09d72f.gif) (来源:https://lumalabs.ai/genie?view=create) **Masterpiece X:** AI-Powered 3D Model Generation ![](https://image.woshipm.com/2025/04/26/9890e0da-22b1-11f0-82f5-00163e09d72f.png) (来源:https://www.masterpiecex.com/) **Meshy AI:** The #1 AI 3D Model Generator ![](https://image.woshipm.com/2025/04/26/9ddefab8-22b1-11f0-82f5-00163e09d72f.png) (来源:https://www.meshy.ai/discover) **⑤ Quality &amp; Challenge Discussion:** **Janus Problem and View Inconsistency Analysis:** Debiasing Score Distillation for Text-to-3D Generation ![](https://image.woshipm.com/2025/04/26/a2c203c2-22b1-11f0-b2c8-00163e09d72f.png) (来源:[https://openreview.net/forum?id=jgIrJeHHlz](https://openreview.net/forum?id=jgIrJeHHlz)) A Quick Look at Text-to-3D Methods (来源:[https://www.pkowalski.com/?p=2415](https://www.pkowalski.com/?p=2415)) ## 二、 Image-to-3D:从二维图像“还原”三维世界 Image-to-3D 技术的目标是从输入的单张或多张二维图像中恢复、重建或生成对应的三维模型。相比于 Text-to-3D 的“无中生有”,Image-to-3D 更侧重于利用图像中包含的丰富视觉信息——例如物体的轮廓、表面的纹理、光照产生的明暗、以及物体间的遮挡关系等线索——来推断其三维结构。根据输入图像的数量(单张 vs 多张)和类型(照片 vs 绘画),以及技术目标(精确重建 vs 合理生成)的不同,Image-to-3D 可以细分为多个子方向。 ### 1️⃣ 主要技术分支与方法 ![](https://image.woshipm.com/2025/04/26/a7e9049a-22b1-11f0-b1a0-00163e09d72f.png) ### a. 单视图 3D 重建/生成 (Single-view 3D Reconstruction/Generation) **目标**: 仅从一张输入的 2D 图像(照片、绘画、草图)生成 3D 模型。 **挑战**: - **固有歧义性 (Ill-posed Problem)**: 2D 投影丢失深度信息,单图可对应无限 3D 形状。 - **依赖先验**: 模型需依赖强大的先验知识(常见形状、光照、透视)来“猜测”或“脑补”缺失信息(尤其是背面)。 **技术路径**: - **① 基于深度学习的直接预测**: 训练 DNN (CNN, Transformer 等) 直接从图像预测 3D 表示(体素、点云、网格参数、隐式场)。需大量“图像-3D 模型”配对数据监督训练。 - 代表: Pix2Vox (预测体素), Mesh R-CNN (预测粗糙体素再优化为网格)。 - 局限: 性能受训练数据多样性和质量限制。 - **② 结合生成模型与先验**: 利用生成模型 (GAN, Diffusion) 学习 3D 形状先验,再根据输入图像条件生成或优化。 - **③ 利用 2D 扩散模型先验 (如 Zero-1-to-3)**: 近期热门且效果显著提升。 **核心思想: **利用强大预训练的、能生成新视角的 2D 图像扩散模型(如微调版 Stable Diffusion)作为先验。 **流程: **给定单张输入图,模型“想象”并生成该物体在不同新视角下的高质量图像。然后用这些 AI 生成的多视图图像,通过成熟的多视图重建技术 (NeRF, MVS) 恢复 3D 模型。 **代表: **Zero-1-to-3, SyncDreamer, Magic123。 **优势: **将困难的单视图问题转化为信息更充分的多视图问题,显著提升质量和一致性。 **特点: **结果依赖模型“想象力”和先验知识;对未显示部分需合理推断;几何精度通常不高,但视觉上可能合理完整。 ### b. 多视图 3D 重建 (Multi-view Stereo – MVS) **目标**: 从多张已知(或可估计)相机位姿的、不同角度拍摄的图像中,重建精确的三维几何结构。 **技术路径**: - **① 传统方法**: 基于几何原理(特征点匹配 SIFT、三角测量、深度图估计融合)。 - **代表工具: **COLMAP, Meshroom (AliceVision)。 - **局限: **处理无纹理、高反光/透明、薄结构困难。 - **② 基于深度学习的方法**: 用 DNN 提升 MVS 各环节(预测深度图、特征匹配)或端到端学习 3D 表示。 - **③ NeRF/Gaussian Splatting 作为 MVS 新范式**: **NeRF**: 优化 MLP 拟合所有视图光线,隐式学习精细几何和复杂外观(光照、反射、半透明),生成逼真新视图。Mesh 提取是研究热点。 **Gaussian Splatting**: NeRF 的显式、高效替代,用大量带参数的 3D 高斯椭球表示场景,训练更快,可实时渲染。 代表研究: BoostMVSNeRFs, MVS-GS (应用于大规模 MVS)。 **特点**: 输入信息丰富,几何精度和完整性通常远高于单视图方法;目标是忠实还原真实世界结构。 ### c. 特定类别物体重建 (Category-specific Reconstruction) **目标**: 重建特定类别物体(人脸、人体、车辆、家具等)。 利用类别共有的形状先验,即使输入信息有限(单图或稀疏视图)也能得到结构合理、细节丰富的模型。 **方法**: - **常用参数化模型 (Parametric Models)**: - **人脸**: 3D Morphable Models (3DMM),基于大量扫描数据构建参数空间(控制身份、表情),优化参数匹配输入图像特征。 - **人体**: SMPL (Skinned Multi-Person Linear Model) 及其扩展(如 SMPL-X),通过参数控制体型 (Shape) 和姿态 (Pose),从图像/视频估计参数重建 3D 人体。 **优势**: 利用类别先验降低重建难度和数据要求,生成符合类别典型结构的、语义合理的模型。 ### 2️⃣ 输入、输出与典型应用场景 ![](https://image.woshipm.com/2025/04/26/b2863df0-22b1-11f0-b1a0-00163e09d72f.png) **输入**: - **单视图**: 一张 2D 图像(照片、绘画、设计图等)。 - **多视图**: 多张不同角度图像,通常需相机内外参数(或能估计)。 - **视频**: 时间连续的多视图图像序列,通常需估计相机轨迹。 **输出**: - **① 显式网格 (Mesh)**: 最通用格式。MVS/NeRF 提取的 Mesh 几何较精确、拓扑较好。单视图生成的 Mesh 拓扑/精度可能较差,需后处理。 - **② 点云 (Point Cloud)**: 某些 MVS/扫描流程的中间输出,需表面重建得 Mesh。 - **③ 隐式表示 (NeRF, SDF)**: NeRF/SDF 方法的直接输出,需提取得 Mesh。 - **④ 体素网格 (Voxel Grid)**: 较少作为最终输出。 - **· 纹理信息**: 通常能恢复/生成 PBR 材质贴图或顶点色。 **典型应用场景**: - **① 3D 扫描与数字化**: 手机 App (Polycam, KIRI) 或专业设备拍摄,生成模型用于文物保护、存档、展示、逆向工程、BIM 等 (主要 MVS &amp; NeRF/GS)。 - **② VR/AR 内容创建**: 扫描现实物体/场景导入 VR/AR 环境,增强沉浸感 (主要 MVS &amp; NeRF/GS)。 - **③ 电子商务商品建模**: 从商品图生成 3D 模型用于在线 3D/AR 展示、虚拟试穿/戴 (单/多视图方法)。 - **④ 游戏与影视资产创建**: 从概念图、照片、扫描数据创建 3D 资产 (各种方法)。 - **⑤ 虚拟人/化身生成**: 从照片生成个性化 3D 人脸/人体模型 (单视图 &amp; 特定类别重建)。 - **⑥ 辅助设计**: 从草图、参考图、实物照片生成初步 3D 模型,加速迭代 (主要单视图生成)。 ### 3️⃣ 优势与局限性 (产品视角) ![](https://image.woshipm.com/2025/04/26/b8aec166-22b1-11f0-aa67-00163e09d72f.png) **优势**: - **① 利用现有视觉信息**: 比 Text-to-3D 更贴近现实物体或参考图,利用图像线索。 - **② 多视图方法精度高**: 利用多视角几何约束,重建精度高、结果可靠。 - **③ 应用场景广泛**: 从手机扫描到专业资产创建,满足不同需求。 **局限性**: - **① 单视图的固有歧义性**: 结果依赖先验和“猜测”,几何精度/可靠性有限,易出错。 - **② 对输入图像质量和视角的要求**: 多视图方法需高质量、光照均匀、纹理丰富、视角分布合理的图像,相机位姿需准确。 - **③ 处理复杂材质和结构的挑战**: 透明、高反光、无纹理、精细结构(头发、薄纱)仍是难点(KIRI Engine 等尝试解决)。 - **④ 输出质量与可用性问题**: 生成模型(尤其单视图)也可能存在拓扑混乱、UV 不佳、材质不理想等问题,需后处理。 - **⑤ 计算成本**: 高质量多视图重建(尤其 NeRF 训练/渲染)需较高计算资源和时间(Instant-NGP, GS 等已加速)。 ### 4️⃣ 代表性技术/模型/工具与讨论 ![](https://image.woshipm.com/2025/04/26/bd880288-22b1-11f0-82f5-00163e09d72f.png) **① 单视图重建/生成 (Single-View Reconstruction/Generation):** **基于 2D 扩散先验 (2D Diffusion Priors):** **Zero-1-to-3:** Zero-shot One Image to 3D Object ![](https://image.woshipm.com/2025/04/26/c3151a06-22b1-11f0-b1a0-00163e09d72f.png) (来源: https://zero123.cs.columbia.edu , [GitHub](https://github.com/cvlab-columbia/zero123)) **SyncDreamer:** Generating Multiview-consistent Images from a Single-view Image ![](https://image.woshipm.com/2025/04/26/d4a355a8-22b1-11f0-82f5-00163e09d72f.gif) (来源:https://liuyuan-pal.github.io/SyncDreamer/) **Magic123:** One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors ![](https://image.woshipm.com/2025/04/26/e44ede0a-22b1-11f0-b1a0-00163e09d72f.png) (来源:https://openreview.net/pdf?id=0jHkUDyEO9) **早期直接预测 (Early Direct Prediction):** **Pix2Vox:** Context-aware 3D Reconstruction from Single and Multi-view Images (来源:https://arxiv.org/abs/1901.11153) **Mesh R-CNN:** Mesh R-CNN (来源:https://arxiv.org/abs/1906.02739) **② 多视图重建 (Multi-View Stereo – MVS):** **传统方法代表 (Traditional Representatives):** **COLMAP:** Structure-from-Motion and Multi-View Stereo Pipeline ![](https://image.woshipm.com/2025/04/26/eaccd8ea-22b1-11f0-82f5-00163e09d72f.png) (来源:https://colmap.github.io/ , [GitHub](https://github.com/colmap/colmap)) **Meshroom:** Open-Source 3D Reconstruction Software (来源:https://alicevision.org/#meshroom) **NeRF/Gaussian Splatting 应用 (NeRF/GS Applications):** **NeRF for MVS:** BoostMVSNeRFs: Boosting MVS-based NeRFs to Generalizable View Synthesis in Large-scale Scenes ![](https://image.woshipm.com/2025/04/26/f80910f0-22b1-11f0-82f5-00163e09d72f.png) (来源:https://arxiv.org/abs/2407.15848) **Gaussian Splatting for MVS:** MVS-GS: High-Quality 3D Gaussian Splatting Mapping via Online Multi-View Stereo (来源:https://arxiv.org/abs/2412.19130) GaussianPro: 3D Gaussian Splatting with Progressive Propagation (来源:https://arxiv.org/abs/2402.14650) **③ 代表性工具/应用 (Representative Tools/Apps):** **Luma AI:** AI for Realistic 3D (来源:https://lumalabs.ai/ ) **Polycam:** 3D Capture for Everyone ![](https://image.woshipm.com/2025/04/26/01919962-22b2-11f0-b2c8-00163e09d72f.png) (来源:https://poly.cam/) **KIRI Engine:** 3D Scanner App for iPhone, Android, and Web (来源:https://www.kiriengine.app/) **CSM (Common Sense Machines):** AI for 3D Asset Creation (来源:https://www.csm.ai/ , https://3d.csm.ai/) **④ 特定类别重建 (Category-Specific Reconstruction):** **3DMM (Faces) Review:** 3D Face Reconstruction Based on A Single Image: A Review (来源:https://www.researchgate.net/publication/379324383_3D_Face_Reconstruction_Based_on_A_Single_Image_A_Review) **SMPL (Bodies) Paper:** SMPL: A Skinned Multi-Person Linear Model ![](https://image.woshipm.com/2025/04/26/0aa72620-22b2-11f0-b1a0-00163e09d72f.png) (来源:https://files.is.tue.mpg.de/black/papers/SMPL2015.pdf) ## 三、 NeRF (神经辐射场):超越几何,表示与渲染场景的新范式 虽然我们在前面讨论 Image-to-3D 时已经多次提及 NeRF,但它本身足够重要和独特,值得单独作为一个技术方向来理解。NeRF(Neural Radiance Fields)的核心贡献并不仅仅在于 3D 重建本身,更在于它提出了一种全新的、基于神经网络的、连续的三维场景表示方法,并能通过可微分的体积渲染技术生成极其逼真的新视图图像。它代表了从传统的离散几何表示(如网格、点云)向基于学习的隐式函数表示的重大转变。 ### 1️⃣ 核心思想:用 MLP “记住”光线 ![](https://image.woshipm.com/2025/04/26/10fe3ed2-22b2-11f0-b1a0-00163e09d72f.png) **① 隐式表示**: NeRF 用一个 MLP 神经网络隐式表示整个三维场景,而非离散几何。 **② MLP 输入**: 5 维向量 = 空间点坐标 (x,y,z) + 观察方向 (θ,ϕ) 或 (dx,dy,dz)。 **③ MLP 输出**: 该点在该方向下的物理量: - **体积密度 (Volume Density, σ)**: 表示点的不透明度或光线吸收/散射概率。 - **颜色 (Color, c)**: 点在该方向呈现的颜色 (RGB),通常与视角相关 (View-dependent),以模拟高光、反射等。 **④ 场景编码**: 整个场景的几何与外观被编码在 MLP 的权重参数中,网络“记住”了每点对不同方向光线的响应。 ### 2️⃣ 渲染过程:可微分体积渲染 ![](https://image.woshipm.com/2025/04/26/16684886-22b2-11f0-9b1e-00163e09d72f.png) - **① 模拟光线传播**: 从虚拟相机为每个像素发射光线穿过 MLP 定义的体积场。 - **② 采样**: 沿光线在近/远端边界间采样一系列 3D 点。 - **③ 查询 MLP**: 将采样点坐标和光线方向输入 MLP,得到密度 σ 和颜色 c。 - **④ 体积渲染方程**: 根据光路上所有采样点的密度和颜色,计算光线最终形成的像素颜色,考虑光线被遮挡的累积效应。 - **⑤ 关键特性:可微分**: 整个渲染流程(MLP 查询 -&gt; 体积渲染)完全可微分。 - **⑥ 意义**: 可计算渲染图像与真实图像损失对 MLP 权重的梯度,从而通过反向传播和梯度下降优化网络。 ### 3️⃣ 训练过程:从多视图图像学习 ![](https://image.woshipm.com/2025/04/26/1d441572-22b2-11f0-9b1e-00163e09d72f.png) **① 输入**: 一组已知精确相机参数(内外参)的多视图图像。 **② 目标**: 训练 MLP,使其对任意给定视角渲染的图像尽可能与真实图像一致。 **③ 方法**: 随机梯度下降 (或 Adam)。 - **迭代过程**: 随机采样像素光线 -&gt; 沿光线采样 3D 点 -&gt; MLP 查询密度颜色 -&gt; 体积渲染得预测颜色 -&gt; 计算预测与真实颜色的损失 (L2 loss) -&gt; 反向传播计算梯度 -&gt; 优化器更新 MLP 权重。 - **重复**: 大量迭代直至收敛。 **④ 技巧**: - **位置编码 (Positional Encoding)**: 帮助 MLP 学习高频细节。 - **层级体积采样 (Hierarchical Volume Sampling)**: 先粗采样再精采样,提高效率和质量。 ### 4️⃣ NeRF 在 AI+3D 中的角色与应用 ![](https://image.woshipm.com/2025/04/26/26c3f8ce-22b2-11f0-b1a0-00163e09d72f.png) **① 高质量三维重建 (Implicit MVS)**: SOTA 方法之一,擅长处理复杂光照、精细几何、反射、透明等,生成逼真结果。 **② 新视图合成 (Novel View Synthesis, NVS)**: 核心应用,从任意新视角渲染逼真、连贯的图像,用于 VR/AR、特效预览、虚拟旅游、自由视角视频等。 **③ 作为 Text-to-3D / Image-to-3D 的中间表示**: 因其连续、可微特性,适合基于优化 (如 SDS) 的生成方法,许多生成方法输出 NeRF 或类似表示,需后续提取 Mesh。 **④ 场景编辑与操纵**: 后续研究探索对 NeRF 进行编辑。 - 代表: NeRF-Editing (通过代理几何变形), NeRFshop (cage-based 变形), Instruct-NeRF2NeRF (文本指令+2D 编辑模型指导), ED-NeRF (LDM 潜空间编辑)。 - 意义: 使 NeRF 不仅能“看”,还能被“修改”。 **⑤ 动态场景表示**: 扩展 NeRF 处理时变场景。 - 代表: D-NeRF (时间作输入+变形场), Nerfies (每帧变形潜码+连续变形场)。 - 目标: 重建和渲染含非刚性运动的动态场景。 ### 5️⃣ 优势与局限性 (产品视角) ![](https://image.woshipm.com/2025/04/26/2dd038c6-22b2-11f0-82f5-00163e09d72f.png) **优势**: - **① 无与伦比的渲染质量**: 照片级真实感,视角连贯,细节还原好。 - **② 处理复杂光学现象**: 对高光、反射、透明等表现力好。 - **③ 连续表示**: 避免离散表示的拓扑问题和分辨率限制,理论上可表示任意细节。 - **④ 紧凑表示**: MLP 网络权重通常比密集体素或高精度点云小。 **局限性**: - **① 训练速度慢**: 标准 NeRF 耗时(小时/天级),虽有加速技术 (Instant-NGP, GS 等) 将其缩短至分钟/秒级,但复杂场景或极致质量仍可能慢。 - **② 渲染速度**: 实时 (&gt;30 FPS) 高质量渲染仍有挑战,需较多计算资源。GS 等显式方法在这方面突破显著。 - **③ 编辑性仍受限**: 相比传统 Mesh 编辑,对隐式 NeRF 进行同等级别编辑仍困难,现有方法在通用性、精度、易用性上有差距。 - **④ 难以直接用于物理模拟等**: 不直接提供显式表面,难用于碰撞检测、物理模拟、3D 打印等,需先提取 Mesh(可能引入误差)。 - **⑤ 泛化能力与场景范围**: 标准 NeRF 针对单场景优化,难泛化。处理大/无界场景需特殊设计 (Mip-NeRF 360)。 ### 6️⃣ 代表性技术/模型/工具与讨论 ![](https://image.woshipm.com/2025/04/26/3703a2ca-22b2-11f0-b1a0-00163e09d72f.png) **① 核心论文 (Core Paper):** **NeRF:** Representing Scenes as Neural Radiance Fields for View Synthesis (Mildenhall et al., ECCV 2020) ![](https://image.woshipm.com/2025/04/26/3ea3809a-22b2-11f0-b1a0-00163e09d72f.gif) (来源:[http://www.matthewtancik.com/nerf](http://www.matthewtancik.com/nerf)) **② 重要改进工作 (Key Improvements):** **加速训练/渲染 (Acceleration):** **Instant-NGP:** Instant Neural Graphics Primitives with a Multiresolution Hash Encoding (Müller et al., SIGGRAPH 2022) ![](https://image.woshipm.com/2025/04/26/4c0e9ae4-22b2-11f0-b1a0-00163e09d72f.gif) (来源:https://arxiv.org/abs/2201.05989 , https://nvlabs.github.io/instant-ngp/ ) **Gaussian Splatting:** 3D Gaussian Splatting for Real-Time Radiance Field Rendering (Kerbl et al., SIGGRAPH 2023) (来源:https://www.researchgate.net/publication/372989904_3D_Gaussian_Splatting_for_Real-Time_Radiance_Field_Rendering , [GitHub](https://github.com/graphdeco-inria/gaussian-splatting)) **编辑性 (Editability):** **NeRF-Editing:** Geometry Editing of Neural Radiance Fields ![](https://image.woshipm.com/2025/04/26/5de2a1e8-22b2-11f0-b1a0-00163e09d72f.gif) (来源:https://github.com/IGLICT/NeRF-Editing , arXiv:2205.04978) **Instruct-NeRF2NeRF:** Editing 3D Scenes with Instructions (来源: https://instruct-nerf2nerf.github.io/ ,arXiv:2303.12789) **动态场景 (Dynamic Scenes):** **D-NeRF:** Neural Radiance Fields for Dynamic Scenes ![](https://image.woshipm.com/2025/04/26/640f6d12-22b2-11f0-82f5-00163e09d72f.png) (来源: https://www.albertpumarola.com/research/D-NeRF/index.html ,arXiv:2011.13961, [GitHub](https://github.com/albertpumarola/D-NeRF)) **Nerfies:** Deformable Neural Radiance Fields (来源: https://nerfies.github.io/ ,arXiv:2011.12948, [GitHub](https://github.com/google/nerfies)) **③ 应用平台/工具 (Application Platforms/Tools):** **Nvidia Instant-NGP:** Open-Source Implementation ![](https://image.woshipm.com/2025/04/26/6a2e965a-22b2-11f0-b1a0-00163e09d72f.png) (来源:https://github.com/NVlabs/instant-ngp ) ## 四、 其他值得关注的技术方向与趋势 除了上述三大主流方向(Text-to-3D, Image-to-3D, NeRF),AI 生成 3D 领域还有一些其他值得关注的技术路径和发展趋势,它们可能代表了未来的重要方向或补充了现有技术的不足。 ### 1️⃣ Sketch-to-3D (草图到三维) ![](https://image.woshipm.com/2025/04/26/6f8fd5b4-22b2-11f0-82f5-00163e09d72f.png) **目标**: 用户通过绘制 2D 草图(轮廓、结构线、颜色提示)引导 AI 生成 3D 模型。 **优势**: - **输入直观**: 对擅长绘画或习惯草图表达的用户更直观,更能表达空间形态。 - **交互性强**: 可通过修改草图迭代调整 3D 结果,实现更精细控制。 - **挑战**: - **理解意图**: AI 需理解草图几何意图和风格,并合理“膨胀”到 3D。 - **处理歧义**: 如何处理手绘线条歧义(边缘/轮廓/细节?)、从稀疏线条推断完整形状是难点。 **应用**: 概念设计、教育、创意娱乐(快速动画角色)。 - **代表**: Sketch2Model (从单草图生成视点感知模型), Google Monster Mash (绘制 2D 部件“充气”成可动 3D 模型)。 ### 2️⃣ 3D-aware Generative Models (感知三维的生成模型) ![](https://image.woshipm.com/2025/04/26/895a9e20-22b2-11f0-b1a0-00163e09d72f.png) **目标**: 让生成模型 (GANs, Diffusion) 在生成 2D 图像时就具备“三维意识”,生成的 2D 图隐含合理且一致的 3D 结构。 **方法**: - **架构设计**: 在生成器中间层引入 3D 表示 (NeRF, 体素, 带纹理 Mesh),再通过可微渲染生成 2D 图。 - **损失函数**: 设计损失鼓励生成结果在不同视角保持 3D 一致性。 **意义**: - 生成的 2D 图像因内在 3D 一致性,更易用于后续 3D 重建/编辑。 - 可从生成图像直接提取对应的 3D 模型和纹理,保证视图一致性。 **代表性工作**: - **EG3D (Nvidia)**: 混合三平面表示+StyleGAN2,生成高分辨率、多视图一致图像和高质量 3D 几何。 - **GET3D (Nvidia)**: 直接生成显式、带纹理的 3D 网格,输出可直接用于渲染引擎。 - **StyleSDF**: 结合 SDF (3D 表示) 和 StyleGAN2 (2D 生成器),旨在同时实现高分辨率图像和精细 3D 形状。 ### 3️⃣ 多模态融合与交互式生成 ![](https://image.woshipm.com/2025/04/26/9340f5e2-22b2-11f0-b2c8-00163e09d72f.png) **趋势**: 结合多种输入模态(文本、图像、草图、语音、手势等),提供更丰富、自然、精确的控制。生成过程更交互式,用户与 AI 持续对话、指导、共创,实时调整。 **驱动力**: - **解决单一模态局限**: 文本难描几何,草图难表材质。 - **提升可控性**: 弥补当前生成模型可控性差的问题。 - **市场趋势**: AI 领域向多模态发展;内容创作中 AI 从自动化工具变协作伙伴,交互性更重要。 ### 4️⃣ 代表性技术/模型/工具与讨论 ![](https://image.woshipm.com/2025/04/26/985848be-22b2-11f0-b2c8-00163e09d72f.png) **① Sketch-to-3D:** **Sketch2Model:** View-Aware 3D Modeling from Single Free-Hand Sketches (arXiv:2105.06663) ![](https://image.woshipm.com/2025/04/26/9d4cc2c8-22b2-11f0-82f5-00163e09d72f.png) (来源:[https://openaccess.thecvf.com/content/CVPR2021/papers/Zhang_Sketch2Model_View-Aware_3D_Modeling_From_Single_Free-Hand_Sketches_CVPR_2021_paper.pdf](https://openaccess.thecvf.com/content/CVPR2021/papers/Zhang_Sketch2Model_View-Aware_3D_Modeling_From_Single_Free-Hand_Sketches_CVPR_2021_paper.pdf)) **Google Monster Mash:** Sketch-Based Modeling and Animation Tool (来源:https://monstermash.zone/# Demo, [GitHub](https://github.com/google/monster-mash), [https://research.google/blog/monster-mash-a-sketch-based-tool-for-casual-3d-modeling-and-animation/](https://research.google/blog/monster-mash-a-sketch-based-tool-for-casual-3d-modeling-and-animation/)) **② 3D-aware Generative Models:** **EG3D:** Efficient Geometry-aware 3D Generative Adversarial Networks ![](https://image.woshipm.com/2025/04/26/a72bcd70-22b2-11f0-82f5-00163e09d72f.gif) (来源: https://nvlabs.github.io/eg3d/ arXiv:2112.07945, [GitHub](https://github.com/NVlabs/eg3d)) **GET3D:** A Generative Model of High Quality 3D Textured Shapes Learned from Images (来源:https://research.nvidia.com/labs/toronto-ai/GET3D/ , [https://proceedings.neurips.cc/paper_files/paper/2022/file/cebbd24f1e50bcb63d015611fe0fe767-Paper-Conference.pdf](https://proceedings.neurips.cc/paper_files/paper/2022/file/cebbd24f1e50bcb63d015611fe0fe767-Paper-Conference.pdf), [GitHub](https://github.com/nv-tlabs/GET3D)) **StyleSDF:** High-Resolution 3D-Consistent Image and Geometry Generation (来源: https://stylesdf.github.io/ ,arXiv:2112.11427, [GitHub](https://github.com/royorel/StyleSDF)) **③ 多模态/交互式生成趋势 (Multimodal/Interactive Trends):** **Multimodal AI Market Analysis:** Multimodal AI Market Size &amp; Share Report, 2030 ![](https://image.woshipm.com/2025/04/26/b68a7ec4-22b2-11f0-b1a0-00163e09d72f.png) (来源:[https://www.grandviewresearch.com/industry-analysis/multimodal-artificial-intelligence-ai-market-report](https://www.grandviewresearch.com/industry-analysis/multimodal-artificial-intelligence-ai-market-report)) Multimodal AI: Everything You Need to Know (来源:[https://www.superannotate.com/blog/multimodal-ai](https://www.superannotate.com/blog/multimodal-ai)) ## 结语:理解光谱,拥抱多元 ![](https://image.woshipm.com/2025/04/26/bb001f86-22b2-11f0-9b1e-00163e09d72f.png) 通过本篇笔记的梳理,我们对当前 AI 生成 3D 的主流技术流派——Text-to-3D 的“语言召唤”、Image-to-3D 的“视觉还原”、NeRF 的“光场记忆”以及其他如 Sketch-to-3D 的交互探索——有了更清晰的认识。我们看到,每种技术路径都有其独特的优势、局限和最适宜的应用场景,它们共同构成了 AI+3D 技术的“光谱”。 **Text-to-3D** 以其极低的创作门槛和近乎无限的创意可能性,在快速概念设计和大规模个性化内容生成方面展现出巨大潜力。然而,现阶段其输出质量的稳定性和精度,以及对生成结果的精细控制能力,仍然是亟待突破的瓶颈。 **Image-to-3D** 则更侧重于从现有的视觉信息中恢复三维结构。其中,基于多视图输入的方法(特别是结合 NeRF 或 Gaussian Splatting)在重建精度和视觉真实感上表现突出,是推动 3D 扫描和现实世界数字化的重要力量;而单视图方法则在利用强大的 AI 先验知识进行“脑补”式生成方面不断取得进步,尤其是在 Zero-1-to-3 等利用 2D 扩散先验的技术出现后。 **NeRF** 作为一种革命性的场景表示与渲染技术,不仅极大地推动了高保真三维重建的发展,也因其可微性而成为了许多 AI 生成方法(如 SDS)的底层表示支撑。其在新视图合成和处理复杂光学现象方面的优势无与伦比,但训练与渲染效率、以及直接编辑性仍然是其广泛应用面临的挑战,尽管 Instant-NGP、Gaussian Splatting 和 NeRF 编辑等研究正在积极应对。 ![](https://image.woshipm.com/2025/04/26/bfbf8980-22b2-11f0-b1a0-00163e09d72f.png) 作为 AI+3D 领域的产品经理或从业者,深刻理解这个技术“光谱”至关重要。这意味着我们需要: - **避免“一刀切”思维**: 根据产品目标、用户需求、场景及对质量/速度/成本/可控性要求,审慎选择技术路径或组合。 - **科学管理预期**: 清晰认识技术成熟度、能力边界和局限,传递准确预期,避免过度承诺。 - **关注融合与演进**: 不同流派在相互借鉴融合,持续关注前沿研究和技术趋势。 - **聚焦最终“可用性”**: 严格评估生成结果质量(几何、拓扑、UV、材质)和性能,考虑后处理工作量,判断产品价值。 在接下来的笔记中,我们将开始更深入地钻研这些技术背后的核心机制和挑战,例如 NeRF 的具体工作原理、面临的挑战及加速方法(S2E04 预告),Diffusion Model 如何作为强大的先验驱动 3D 内容生成(S2E05 预告),以及如何建立一套科学的评估体系来衡量 AI 生成 3D 模型的“可用性”(S2E08 预告)。理解了这些基础技术流派及其特点,我们将能更好地把握 AI+3D 领域未来的发展脉络和涌现的产品机遇。 ### 附录:主流 AI 生成 3D 技术流派对比概览 ![](https://image.woshipm.com/2025/04/26/c5f4e520-22b2-11f0-b1a0-00163e09d72f.png) 本文由人人都是产品经理作者【Mu先生Ai世界】,微信公众号:【Mu先生Ai世界】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图由作者提供

2025-04-27 02:53:10 · 0次阅读
 
 
元器件电商平台流量运营–来源与渠道

<blockquote><p>在电子元器件电商领域,流量运营是企业生存和发展的关键。如何有效获取和转化流量,是每个电商平台运营者必须面对的问题。本文将深入探讨元器件电商平台的流量来源与渠道,供大家参考。</p> </blockquote> ![](https://image.woshipm.com/2023/04/13/37033ad4-d9de-11ed-8d63-00163e0b5ff3.jpg) 流量运营内容太多,分作几次来写 ## 一、流量来源 ### 搜索引擎 其实流量来源很广泛,主要的还是我们常常接触的一些渠道,比如引擎搜索,垂直平台,媒体/自媒体等。 搜索引擎主要是百度,这个在前面也介绍过了,是目前最大最直接流量来源之一,付费推广竞争比较大,是大家都争相竞逐的地方,也因此会出现明显的恶性竞争的场面。而且就SEM与SEO两个阵营来看,显然作为搜索引擎更希望客户通过SEM这种付费的方式来争取流量。所以在排名的顺序上也自然更偏向于付费推广结果考前,这个无可厚非。 早些年收录还还做的时候,有些做SEO的人可以自己经营一批网站,把百度权重最高了卖出去可以赚不少的钱。所以近年来SEO收录的口子开得越来越小,很多人都已经放弃了SEO自然推广,这也使得原本做SEO的人员找不到相关的工作,纷纷转行了。 当然这不是在说百度的不是,这只是别人企业策略变更优化的结果,况且如果一直维持告诉收录自然词的话对服务器的要求也会越来越高,成本也会很高,这不符合一个企业的利益。 反倒是近几年Bing为了抓取更多用户的心,开了比较大的口子,网站优化得好的话,自然流量还是有比较明显的增长的,只是现在它还远没有达到百度的那个流量。 有人说做SEO已经没有什么意义了,见效太慢还不如SEM来得快。但是你想过没有电子元器件自营商城的型号数量是非常庞大的,你不可能所有的词都高价投放广告吧。热门词那么激烈的竞争你的企业有那么多预算支持吗,而且就算你的预算充足,你的品牌影响力不足的话转化率必然不高,从投入产出比来看绝对是不划算的。 我个人认为SEO还是要做,不只针对一个平台做,还要把其他平台的一起争取了。在企业还没有占据头部位置的时候,可能你想投入更多的钱砸在SEM上,你都不一定花的出去。SEM抢重点词,SEO的推广也不要停下来,多关注一下Bing或者谷歌这样的平台,不要把鸡蛋都压在一个篮子里面。 ### 垂直平台 垂直平台目前看来靠前的两家非IC交易网和华强网莫属了,从最近几年来看又似乎IC交易网的流量似乎更大一些,这个可以从站长工具上面去查一下自然流量,数字还是比较清晰的。 这些付费做型号推广平台的客户意图就十分明显,他们就是冲着交易去的,因此这些客户非常精准,在这里就更加纯粹一些。只要你舍得花钱咨询会话数应该还是不会少的,当然这个跟企业名声也有些关系。 当然这些垂直平台上的型号排名也都是要付费的,有自己的排名规则,这里不做详细的介绍,但是有一点想说的是,作为一个垂直平台你是想要客户相互恶性竞争多花钱,还是在增加服务上让客户花更多的钱,这个最后的结果也是不太一样的,客户的眼睛也是雪亮的,都能清晰的感受得到,也都会在心里衡量清楚,决定在哪个平台投入更多的资金。 特别想提一下正能量,虽然目前并没有成为大哥二哥,但是可以看到最近它还是有许多动作的,开设客户店铺/搞论坛/展会直播/开放香港仓等等,其实这都可以看得出他们想要做得更好,希望更多客户愿意到他们那进行交易的期望。这也在一定程度上反应出现在这个市场有多难了,大家都在竭尽全力想要活得更好。 ### 媒体 这里说媒体特别的想把传统媒体和新媒体分开来,本质上其实并没有什么差别,都是广告进行投放的媒介。 新媒体 新媒体是相对于传统媒体而言的,在新媒体没有出来之前,传统电视、报纸、期刊、户外广告牌等都是十分重要且有效的广告形式。我们所熟知的“收礼只收脑白金”、“牙好,胃口就好”这些都是电视广告的经典,只是如今遭受到了时代产物的冲击。 如今随着网络的发展,5G已经覆盖了我们很多地区,短视频平台正在占据着我们绝大多数人的休闲时间,这也使得短视频这个炙手可热的产物成为了新的广告中心。如今几乎是所有品牌都在积极拥抱这些平台,大把大把的资金涌入其中,想要占据你我的时间。而对于普通老板姓想要投放广告也是不再遥远的事,我们可以花几十块钱就能给自己的视频投上一次广告,这在以前几乎是不可能的事。 不只是如此,短视频的爆火也让许许多多人才能的人有了更多施展空间,也造就出了许多“平民富豪”,也许我们也都曾经怀揣着能暴富的心来挤入短视频的世界,这也许也是短视频的魔力所在。 所以短视频应该也是我们电商的必争之地,只是对于To B的企业来说并没有To C的那么友好,特别对于各个细分行业而言,这个短视频平台简直是又爱又恨。爱是因为它那么大的流量,很是因为它那么的广泛,个人属性太强了,精准客户难找,更难的是还要抓住他们的心。 所以呀,这个时代的产物,我们应该积极拥抱但是也要去衡量它是否真的能够给其他带来价值。短视频也好、直播也罢,我们终究还是要对结果负责,我们收获的观看人数、粉丝数量这些到底有多少含金量,究竟是自我感觉良好还是自欺欺人,我们最好能用数据来说话。 回归到我们之前讲的一个观点:运营结果有时候是很难有单一数据能够去衡量的。所以综合各种因素衡量投入短视频的时间、金钱,看看它对于我们电子元器件行业到底是不是真的合适企业。 公众号也是如此,看起来似乎每个企业都在整自己的一个公众号,因为这个投入的资金并不多,甚至内容都可以不用自己去原创,从其他地方搬来稍微修改一下就能发出去捕获一批粉丝。特别是做咨询类的账号,搬运成了常规操作,简单又高效。 不过与短视频一样,这其中又有多少是能够转化成企业客户的,对于我们To B的企业来说认真去衡量和评估。 不管如何,一个时代发展的产物终究是应运而生的,对于大众而言,我们应该去积极主动的拥抱。对于To B的企业我觉得还是要谨慎考虑,可以先迈出一步试试,不要急着快速投入大批的人力和财力。 传统媒体 是不是感觉传统媒体已经没落了?可能这是我们玩电商的都有的感觉。就拿电视广告来说好了,可能大家觉得现在看电视的人都少了,至于为什么少了除了开机麻烦,看视频还要各种会员外,还有一个重要原因就是像抖音、快手、西瓜视频这些视频平台的崛起,抢占了很多客户的时间。 但是这并不妨碍电视依旧是许多家庭非常普遍都配备了的设备,虽然在电视上投广告的受众有所减少,我还是觉得这依旧是一个不错的渠道。 只是对于我们这一行来说投电视广告的话,观众太过分散,或者说是命中客户的概率太小了,如果公司没有十分雄厚的资金,还是不做这个选择为好。 同样,杂志、报纸这类纸质期刊也受到了很大的冲击,观众数量也大大减少了。但是依旧有一些专注于行业的杂志,依托于其本身教为庞大的客户群体,依然受到了大家的欢迎。这种细分领域精准营销依旧是一种比较不错的选择。 再说说一些建筑广告吧,现如今的城市里建筑物的外墙上撞上了LED大屏的已经不算少见,地铁站的大屏更是常见,我们就说说这些广告是不是值得我们去投入。 事实上安装LED大屏的地方基本上都是经过挑选的人流密集处,所以在人流上是肯定靠谱的,只是我们也要对选择的地方进行考核。就比如深圳北站吧,经常看见一些手机品牌的广告,一般是在曝光他们最新的手机,过往的人主要抬头就能看见,不管是对这款手机的曝光还是对公司的宣传都是不错的选择。 再回到我们这个行业,To B的市场就未必了,虽然曝光量大但命中率就极低,如果要选择地铁广告的我,可能我们行业更适合在华强北的地铁站进行投放,毕竟这里是电子人最为汇集的地方,许许多多的贸易公司都集中在这里。另外华强北街上的那些建筑大屏也是不错的选择,当然这里的价格也是不便宜的,而且有时候还需要排期,这也反面正面了这里大屏广告的成效应该也是不错的。 总结一下,没有不好的广告媒体,有的只是匹配与否的问题,更重要的是广告的创意和呈现效果是否优良,内容是否能把握住客户的心,调动客户的情绪,更更重要的是企业的本身的家底是否足够丰厚。 ## 二、流量渠道 ### PC端 我们电子元器件行业的流量最主要的还是来自于PC,这是To B所决定的,采购人员或者其他采购相关的人员每日的工作还是比较忙的,PC端处理事情的效率要高得多,所以我们的精力应该还是要重点放在PC端。 为了大部分客户能够更方便,我们还是更愿意把PC端的网站搞得更好一些,无论是页面独特风格,还是客户体验,下单支付等等都会把精力更多的放在上面,这是我们获取客户好感的主战场,是怎么都不可能放弃的地方。可能说获取好感有点不太合适,对于客户而言他只会感觉得到谁家的购买体验没那么好,那些做得好的也是应该的而已。所以我们做的各种优化都是为了让自己不在那个不太友好的行列。 而PC端有一个很重要的东西,那就是域名,我们网站的域名应该简短一点,而且最好跟企业的名称相互关联起来。比如我知道szlcsc.com、ic.net.cn代表什么,因为这个跟他们的中名称很相似,这可以剩下一笔推广费用。仅从这一点来看我们的商城域名还是要尽量简单一些,跟品牌中文名称对应起来,不要搞得太花里胡哨了。 我们作为商城,我觉得我们最好还是要让客户进来的第一眼就要能快速找到自己想要的商品。那么多客户想要的商品必然都不一样,那就让搜索框尽可能方便的展示出来,在每一个页面都能快速搜索,我们也可以看得到大多数友商也是如此的,不值得重点描述了。 同样我们在商城的首页,还是要让客户能一眼看到我们的商品,让他对我们的印象是这是一个商城,而不是其他别的。我们可以尽量减少上面其他宣传版面的高度,在第一屏就把一些型号展示出来,加深客户的印象。 所以你可以看得到现在的友商商城大多是一个模样的,这也不是说因为要模仿别人,而是一种有利于客户购物体验的很好的方式。所以有时候千篇一律未必就显得那么贬义,可能是某些优秀特征的总结。 ### 移动端 不过我们也可以看到,由于C端电商的带动,许多人都已经形成了使用手机购物的习惯,近些年来我们电子元器件行业内移动端的流量增长也很快,各大品牌都在快速推进小程序/APP,以获取更多的流量。 客观来看客户数是不变的,只是客户的习惯在发生变化,也可能只是在某一段时间内必须使用移动端,真正的客户数量并没有增加。但是商业竞争就是那么激烈,这一点变化都可能是别人跟进了而你没有,你就会失去一些机会。所以在投入不是很大的时候,我还是觉得有必要也做一个小程序或者APP,没办法现在获客那么难,别人都做你没做就是吃亏。 但是主次我们还是要分清楚,移动端对于To B的企业来说终究还不是主力,在移动端上的成交额还远远达不到PC端的水平,所以精力上还是要有区分。可以把他当做一个不错的流量入口而不是重要销售额的来源。 本文由 @青山郭员外 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

2025-04-27 02:50:34 · 0次阅读
 
 
不懂数据分析的运营,做不好IP运营精细化

<blockquote><p>在当今竞争激烈的IP运营领域,数据分析已成为运营者不可或缺的工具。它不仅能帮助运营者深入了解用户需求,还能优化内容策略、提升用户体验,并实现精准的商业变现。本文将深入探讨数据分析在IP运营中的具体应用,</p> </blockquote> ![](https://image.woshipm.com/2023/04/14/a1a3f674-da9e-11ed-95a1-00163e0b5ff3.png) 在IP运营中,数据分析不仅是辅助决策的工具,更是驱动IP成长的核心力量。 通过科学的数据分析,IP操盘手可以深入了解用户需求、优化内容策略、提升用户体验,并实现精准的商业变现。 今天秃头老王分享下,数据分析在IP运营中的具体应用,帮助你更好地理解如何用数据驱动IP的成功。 ## 1.用户画像与精准定位 在IP运营的初期,明确目标受众是至关重要的。数据分析可以帮助你构建用户画像,了解用户的年龄、性别、地域、兴趣爱好、消费习惯等关键信息。 反正我作为IP运营操盘手,通常会从以下维度去搜集用户信息。 **数据来源**:通过社交媒体平台的后台数据、问卷调查、用户行为分析等渠道收集用户信息。 **分析维度**: - **人口统计学特征**:年龄、性别、地域分布等。 - **兴趣爱好**:用户关注的领域、参与的话题、点赞和分享的内容。 - **消费行为**:购买习惯、付费意愿、消费频次等。 ## 2.内容策略优化 **内容是IP的核心竞争力,数据分析可以帮助你了解哪些内容更受欢迎,哪些内容需要改进,从而优化内容策略。** **内容表现分析**: - **阅读量/播放量**:衡量内容的曝光度。 - **点赞、评论、分享**:评估用户对内容的互动热情。 - **完播率/阅读完成率**:判断内容的吸引力和用户留存情况。 **热门话题挖掘**: - **趋势分析**:通过平台的热门话题、搜索关键词等数据,发现用户关注的热点。 - **内容相关性**:分析用户对不同类型内容的偏好,调整内容主题和形式。 我之前做的知识付费IP,通过分析用户互动数据发现,用户对“职场技能提升”类课程的完播率和付费转化率远高于其他课程。 于是,我让IP加大了这一领域的课程开发力度,同时减少了一些低效内容的产出,结果整体收入提升了30%。 ## 3.用户增长与留存分析 用户增长和留存是IP运营的关键指标。数据分析可以帮助你找到用户增长的瓶颈,优化用户留存策略。 至于怎么做用户增长和留存分析?以下角度仅供参考。 **用户增长分析**: - **渠道效果评估**:分析不同推广渠道(如社交媒体、广告、合作伙伴)带来的用户数量和质量。 - **裂变增长策略**:通过用户推荐、分享等行为分析,优化裂变增长机制。 **用户留存分析**: - **留存率计算**:分析用户在不同时间段内的留存情况(如7日留存、30日留存)。 - **流失用户分析**:找出用户流失的原因,如内容质量、用户体验、竞品干扰等。 ## 4.用户反馈与内容改进 用户反馈是优化内容和提升用户体验的重要依据。数据分析可以帮助你快速收集和分析用户反馈,及时调整运营策略。 比如通过评论区和私信,分析用户评论和私信中的情感倾向和关键词。 或者定期开展问卷调查,收集用户对内容、功能、服务的满意度和改进建议。 ## 5.商业变现分析 IP的商业变现是账号运营的最终目,常规的商业变现模式,无非就是广告、打赏、带货和知识付费。 可以通过计算用户在LTV(用户生命周期)内的价值,去评估一个付费用户的成本,也就是CPL获客成本。 ### 结语:数据驱动,让IP运营更精准、更高效 数据分析在IP运营中的应用贯穿始终,从用户画像到内容优化,从用户增长到商业变现,数据都是不可或缺的决策依据。 如果你希望在IP运营中取得成功,那么学会用数据说话,用数据驱动运营,将是你的必修课。 本文由 @秃头老王聊运营 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自 Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

2025-04-27 02:48:38 · 0次阅读
 
 
美团AI功能的项目解析

<blockquote><p>美团作为中国领先的本地生活服务平台,近年来在AI领域的布局和实践备受关注。本文将深入剖析美团App的AI功能项目,从其核心产品定位、目标用户群体、AI功能的识别与价值,到项目生命周期的各个阶段(立项、需求分析、设计开发、测试上线),以及上线后的分析与未来方向,进行全面解读。</p> </blockquote> ![](https://image.woshipm.com/2023/09/26/150398ca-5c65-11ee-b266-00163e142b65.jpg) 美团App产品分析:基于AI功能的项目实施解析 ![](https://image.woshipm.com/2025/04/25/02ee3f78-21bc-11f0-b1a0-00163e09d72f.png) ## 1 理解美团的产品格局 ### 1.1 核心产品定位与价值主张 美团的根本使命在于“帮大家吃得更好,生活更好”,其核心目标是利用科技连接消费者与广泛的本地服务及商品 。最初,美团以餐饮外卖为核心业务,但随着市场发展和用户需求的演变,它已成长为一个综合性的本地生活服务平台,业务范围涵盖餐饮、住宿、旅游、休闲娱乐以及零售等多个领域 。用户可以通过美团App便捷地预订餐厅、点外卖、购买电影票、预订酒店和景点门票,以及享受跑腿、打车、单车等服务. 这种多元化的服务布局使得美团能够满足用户在本地生活中的各种需求。 ![](https://image.woshipm.com/2025/04/25/203ab9e4-21bc-11f0-b1a0-00163e09d72f.png) 美团的商业模式建立在一个高效的“三边网络”之上,该网络紧密连接着用户、商家和骑手,通过高频次的交易活动形成了强大的网络效应 。这种模式的优势在于,用户越多,商家就越有动力加入平台;商家越多,用户就能获得更丰富的选择;而高频的交易又进一步提升了物流配送效率,从而增强了整个平台的吸引力。 美团的核心价值主张体现在其提供的便捷性、多样性、具有竞争力的价格(通过团购和促销活动),以及高效的配送服务。尤其值得一提的是,美团通过其“美团闪购”品牌,强调“30分钟万物到家”的极致购物体验 。美团闪购被定位为“24小时陪伴消费者的新一代购物平台”,旨在满足全国10亿消费者的日常购物需求,为用户创造“闪购一下,30分钟好货到手”的便捷体验 。这一战略性的扩张表明,美团正积极布局即时零售市场,希望在餐饮外卖之外,进一步扩大其在零售领域的市场份额。 由此可见,美团的核心定位是成为用户满足所有本地生活需求的首选App,其关键在于强调速度和便利性,尤其是在快速增长的即时零售市场。美团闪购的推出并将其定位为全天候服务,预示着美团的目标不仅仅是提供交易服务,而是更深度地融入用户的日常生活,成为用户不可或缺的生活助手。 ### 1.2 目标用户群体及其需求 美团的目标用户群体非常广泛,涵盖了各种有本地生活服务需求的消费者。从追求时尚和便利的年轻群体和情侣,到需要高效服务的忙碌上班族,都是美团的重要用户 。例如,情侣可以通过美团找到美食、电影、酒店和旅游等约会相关的服务;“懒宅”一族则可以便捷地通过外卖订购美食、水果、鲜花、下午茶以及超市百货;朋友聚会可以通过美团预订按摩足疗、KTV和桌游电玩等活动 。此外,对于有家庭需求的消费者,美团闪购和旗下的小象超市(小象超市)也提供快速的生鲜食品和日用品配送服务 。 为了更精细化地服务不同用户群体,美团还构建了用户分层模型,将用户划分为“Base Mass(潜在曝光人群)”、“Expose Discovery(有效曝光人群)”、“Thrill Interest(有效互动人群)”、“Tempt Newcomer(首次下单人群)”、“Enhance Old Customer(复购人群)”以及“Rely Loyalty(高频复购人群)”六个阶段 。这种精细化的用户分群方法有助于美团更精准地进行营销和提供个性化的服务。 根据公开数据,美团在2024年拥有超过7.7亿的年度交易用户和1450万的年度活跃商家 。如此庞大的用户和商家规模,不仅体现了美团在本地生活服务市场的领先地位,也为其AI驱动的个性化和推荐功能提供了丰富的数据基础。庞大的用户基数意味着美团能够收集到海量的用户行为和偏好数据,这为训练出更精准、更有效的AI模型提供了坚实的基础,从而能够更好地满足不同用户的多样化需求。 ### 1.3 核心功能与服务概览 美团App提供了一系列核心功能和服务,旨在满足用户在本地生活中的各种需求 。这包括餐饮外卖(美团外卖)、即时零售(美团闪购)、到店餐饮与优惠、酒店预订、旅游出行、打车、单车共享、电影票务等 。用户可以在线预订餐厅座位,享受外卖订餐的便利,查找酒店和旅游信息,购买火车票和机票,以及使用美团打车和单车服务 。 除了服务消费者,美团还为商家提供了多种服务和工具,例如在线店铺管理工具(美团开店宝)、数字化营销解决方案以及餐厅管理系统 。美团开店宝为商家提供线上开店、营销获客、数据分析和经营资讯等功能,帮助他们更好地管理线上业务和触达用户 。美团还为餐饮商家研发了“秒提”等新产品,帮助他们拓展堂食半径. 美团在物流配送方面进行了大量的投资,构建了覆盖全国的高效配送网络,确保为用户和商家提供及时可靠的服务 。其智能决策平台能够在数秒内完成大规模订单的分配,将合适的订单匹配给合适的骑手,从而保障用户、骑手和商家等多方体验. 此外,美团App还具备用户评价和评分系统,用户可以对消费体验进行评价,为其他用户提供参考,同时也帮助商家了解用户反馈并改进服务. 美团的核心竞争力不仅在于其全面的服务覆盖,还在于其持续利用技术提升用户和商家的体验,这正是其“零售+科技”战略的体现。通过不断地数字化和优化本地商业的各个环节,美团致力于为用户提供更便捷、更高效的生活服务体验,同时也助力本地商家实现数字化转型和业务增长。 ## 2. 全面解析美团的新AI功能 ### 2.1 AI功能的识别 美团近期在其美团外卖App的“神抢手”板块中推出了一项新的AI功能 。这项AI功能由DeepSeek AI提供技术支持,主要包括“缘分测试”(Destiny Test)和AI智能提炼商品卖点等功能 。用户在使用美团外卖“神抢手”下单时,点进商品券详情页后,可以使用AI进行“缘分测试”,并获取商品卖点和健康指引等信息 。 ![](https://image.woshipm.com/2025/04/25/0382ab2e-21bf-11f0-b1a0-00163e09d72f.png) 此外,美团一直在测试其他AI驱动的功能,例如面向C端用户的AI助手“问小袋”(Wen Xiaodai),该助手类似于电商平台的AI导购功能,可以根据用户的搜索关键词或关键语句,自动匹配符合用户消费意图的外卖商品,并提供用餐建议 。 值得注意的是,美团拥有更宏大的AI战略,该战略分为三个层面:在工作中应用AI(AI at work)、在产品中应用AI(AI in products),以及构建美团内部的大语言模型“龙猫”(Longcat)。此次在“神抢手”中集成的AI功能,以及正在测试的“问小袋”,都属于“AI in products”层面。 由此可见,美团最新的AI功能主要体现在与DeepSeek AI合作的“神抢手”板块,旨在通过趣味互动和信息提炼帮助用户更快更好地发现和选择商品。同时,对“问小袋”的测试表明,美团也在积极探索利用AI提供更智能化的个性化推荐服务。而其全面的AI战略则预示着美团将在更广泛的业务场景中深入应用AI技术。 ![](https://image.woshipm.com/2025/04/25/5b4ac896-21bf-11f0-b1a0-00163e09d72f.png) ### 2.2 用户痛点分析 “神抢手”AI功能的推出,旨在解决用户在浏览大量促销信息时可能面临的信息过载和选择困难的问题 。在众多的优惠券和商品中,用户往往需要花费大量时间去筛选和比较,才能找到自己真正需要或感兴趣的。AI智能提炼商品卖点功能可以帮助用户快速了解商品的独特优势和特点,从而节省用户的决策时间。而“缘分测试”则通过一种更具互动性和趣味性的方式,帮助用户发现可能感兴趣的商品,降低用户在面对众多选择时的犹豫感。 正在测试的“问小袋”AI助手,则着眼于解决用户在不知道具体想吃什么或者难以从众多餐饮选项中做出选择的痛点 。通过理解用户的自然语言搜索或提出的需求,例如“送女友礼物”或者“附近的烤鱼”,AI助手可以智能地推荐符合用户意图的外卖商品,并进行分类展示,帮助用户快速找到心仪的美食。 更广泛地来看,美团通过在App中集成AI,旨在提升整体用户体验。这包括提供更相关的搜索结果,更精准的个性化推荐,以及通过AI驱动的客服聊天机器人提供更高效的客户服务 。这些AI能力的整合,都指向了解决用户在使用本地生活服务平台时可能遇到的信息不对称、选择困难以及服务效率等问题。通过更智能化的方式连接用户和商家,美团希望打造一个更流畅、更便捷、更个性化的使用体验。 ### 2.3 潜在价值主张及对用户体验的影响 美团新推出的AI功能具有显著的潜在价值,能够极大地提升用户体验。通过AI智能提炼商品卖点和提供个性化推荐,用户可以更快更直观地发现自己感兴趣的商品和服务,从而节省了浏览和筛选的时间 。这使得整个购物和决策过程更加高效和便捷。 “缘分测试”的引入,为用户提供了一种新颖有趣的互动方式,增加了用户与“神抢手”板块的互动意愿 。这种寓教于乐的方式不仅能够吸引用户的注意力,还可能激发用户探索更多潜在感兴趣的商品。 AI驱动的客户服务,例如潜在的智能客服代理,可以提供更快速、更高效的支持,从而提升用户在遇到问题或疑问时的满意度 。智能客服能够处理大量常见问题,并快速将复杂问题转交给人工客服,从而优化整体服务流程。 通过提供更精准的个性化体验,AI功能有望提高用户的参与度和转化率 。当用户更容易找到自己需要和喜欢的东西时,他们更有可能进行消费,并对平台产生更高的忠诚度。例如,商家使用美团的AI工具可以更精准地推荐营销策略,从而吸引更多顾客 。 总而言之,美团AI功能的价值主张在于通过提升便捷性、个性化程度和互动性,为用户带来更优质的使用体验。这将有助于提高用户满意度,增强用户粘性,并最终促进美团平台交易量的增长。美团对AI的投入,与其致力于提供卓越用户体验的战略目标高度一致,这对于其在竞争激烈的本地生活服务市场保持领先地位至关重要。 ![](https://image.woshipm.com/2025/04/25/994c23e2-21bf-11f0-b1a0-00163e09d72f.png) ## 3. AI功能项目生命周期:从立项到上线 ### 3.1 立项 **3.1.1 推测项目立项的背景和原因** 美团AI功能的立项很可能源于多方面因素的综合作用。首先,随着美团用户规模的持续增长,平台积累了海量的用户行为数据和偏好信息。对这些数据的深入分析,可以发现用户在产品发现和决策过程中存在的痛点,例如信息过载和个性化需求未被充分满足 。通过分析用户在“神抢手”等促销板块的浏览和购买行为,美团可能意识到用户需要更智能化的工具来辅助决策。 其次,人工智能技术的飞速发展,尤其是在大型语言模型和推荐系统领域的突破,为实现更智能化的用户体验提供了技术可行性 。DeepSeek AI等高性能AI模型的出现,以及美团自身对“龙猫”大语言模型的投入 ,使得在App中集成复杂的AI功能成为可能。 此外,本地生活服务市场的竞争日益激烈,抖音等新的竞争者不断涌现 。为了保持市场领先地位,美团需要不断创新,通过提供更先进、更具吸引力的功能来差异化其平台。AI作为一种前沿技术,能够显著提升用户体验,是应对竞争的重要手段。 最后,AI功能的开发也与美团“零售+科技”的战略高度契合 。该战略强调利用技术手段改造传统零售体验,提升平台运营效率。投资和应用AI技术,正是这一战略的具体体现。例如,美团的AI选址工具已经基于海量数据为商家提供开店指导. 综上所述,美团AI功能的立项很可能是基于对用户需求的深刻理解、对先进AI技术的积极拥抱、对激烈市场竞争的主动应对,以及对自身“零售+科技”战略的坚定执行。 **3.1.2 与美团战略目标及“零售+科技”重点的契合** 美团将“零售+科技”作为其核心战略,强调通过技术创新来驱动零售业务的升级和效率的提升 。AI作为一项关键的技术领域,自然成为美团战略布局的重点。美团对AI能力的投资,例如构建“龙猫”大语言模型 ,充分体现了其对AI技术在各行业颠覆性力量的认可和重视。 此次在“神抢手”中集成AI功能,以及测试“问小袋”等AI助手,正是美团将其战略重点转化为实际产品的具体行动 。这些AI功能的推出,旨在通过技术手段优化用户的购物体验,提高用户在平台上的搜索和交易效率 。这与美团利用科技提升零售业务的核心目标高度一致。 因此,AI功能项目的立项是美团“零售+科技”战略的直接体现,展示了公司致力于通过前沿技术提升用户价值和巩固市场地位的决心。 ### 3.2 需求分析 **3.2.1 可能考虑的关键因素** 在美团AI功能的需求分析阶段,产品团队可能会重点考虑以下几个关键因素: - **用户场景:** 深入理解用户在何种场景下需要AI的帮助至关重要。例如,在浏览“神抢手”时,用户可能希望快速了解优惠商品的亮点,或者通过更有趣的方式发现潜在的购物选择 。而对于“问小袋”,用户可能希望根据模糊的需求或偏好获得个性化的餐饮推荐 。需求分析需要覆盖这些不同的用户场景,并明确AI在每个场景中需要解决的具体问题。 - **功能边界:** 清晰地界定AI功能的能力范围和限制是至关重要的。例如,“神抢手”的AI摘要需要提炼哪些关键信息?“缘分测试”应该包含多少轮互动?“问小袋”能够处理哪些类型的用户查询?明确功能边界有助于团队集中精力开发核心功能,并避免后期出现范围蔓延。 - **技术可行性:** 评估实现这些AI功能所需的技术是否成熟和可行是需求分析的关键环节。例如,DeepSeek AI的模型在商品信息摘要和趣味互动方面是否能达到预期效果?美团自身的“龙猫”模型或其他推荐模型是否能够提供准确和个性化的餐饮建议?还需要考虑模型部署的成本和性能是否满足要求 。 - **商业价值:** 分析AI功能可能带来的商业价值是决定项目优先级的重要因素。例如,AI功能是否能够提高“神抢手”的点击率和转化率?“问小袋”是否能够提升用户的订单量和满意度?这些商业价值需要被量化评估,以判断项目的投入产出比 。 通过综合考虑以上关键因素,美团的产品团队可以更清晰地定义AI功能的需求,为后续的设计和开发阶段奠定坚实的基础。 ### 3.3 设计与开发 **3.3.1 设计与开发阶段可能采取的关键步骤** 美团在设计和开发AI功能时,很可能遵循了一系列关键步骤: 整个设计和开发过程很可能需要产品经理、AI研究员、软件工程师和UI/UX设计师之间的紧密协作,以确保AI功能既能满足用户需求,又能在技术上可行,并与美团App的整体设计风格保持一致。 - **模型选择与集成:** 对于“神抢手”,选择并集成DeepSeek AI提供的模型是核心步骤 。这涉及到理解DeepSeek模型的API和功能,并将其与美团App的现有系统进行整合。对于“问小袋”,团队可能需要选择或开发合适的推荐模型 。 - **用户界面与用户体验设计:** 设计直观且吸引用户的界面对于AI功能的成功至关重要。这包括确定AI功能的入口位置、交互流程以及AI生成内容的展示方式 。例如,“神抢手”的AI摘要可能需要清晰地展示在商品信息旁边,“缘分测试”则需要设计有趣的互动界面。 - **后端开发与API集成:** 为了支持AI模型和用户端的交互,需要进行相应的后端开发和API集成 。这包括处理用户请求、调用AI模型、接收和处理AI模型的返回结果,并确保整个过程的稳定性和高效性。 - **数据准备与模型训练(针对“龙猫”):** 如果美团的“龙猫”模型被用于某些AI功能(例如客服或内部工具),那么数据准备、模型训练和评估将是重要的步骤 。这需要收集大量的相关数据,训练模型以达到所需的性能,并进行评估和调优。 **3.3.2 可能遇到的挑战及应对方式** 在AI功能的设计和开发过程中,美团可能会遇到以下挑战: - **确保AI输出的准确性和相关性:** 如何保证AI生成的商品摘要和推荐是准确、相关且对用户有帮助的?这可能需要对AI模型进行严格的测试和调优,并结合人工审核和用户反馈机制来不断提升AI的质量 。 - **维持性能和可扩展性:** AI计算通常需要大量的计算资源,如何确保AI功能在数百万用户同时使用时仍能保持良好的性能和响应速度?这可能需要优化AI模型的部署方式,采用高效的API设计,并利用云计算基础设施来支持高并发访问 。美团对DeepSeek R1模型进行INT8量化以提升推理吞吐的努力 就是一个例证。 - **数据隐私与安全:** 在使用用户数据进行AI个性化推荐时,如何确保用户数据的隐私和安全?这需要严格遵守相关的数据隐私法规,并采取必要的技术措施来保护用户数据不被泄露或滥用 。 - **与现有App的无缝集成:** 如何将新的AI功能平滑地融入到现有的美团App中,而不会给用户带来困扰或降低用户体验?这需要仔细规划功能的位置和交互方式,进行充分的用户测试,并可能采取灰度发布的方式逐步推广 。 面对这些挑战,美团很可能采取了多管齐下的方法,包括与专业的AI公司合作(如DeepSeek),投入资源进行自身AI能力的研发(如“龙猫”),进行严格的测试和质量控制,并密切关注用户反馈,以便及时发现和解决问题。 ### 3.4 测试与上线 **3.4.1 测试阶段的假设** 在AI功能上线之前,美团很可能进行了多轮测试: - **内部测试(Alpha测试):** 由美团内部员工对AI功能进行全面测试,以发现和修复早期的Bug和可用性问题。 - **小范围公开测试(Beta测试):** 邀请一小部分真实用户参与测试,收集他们对功能性能、用户体验和整体价值的反馈 。美团之前推出“省钱版”时就采用了灰度测试的方法 。 - **A/B测试:** 可能针对AI功能的不同版本或不同的展示方式进行A/B测试,以优化用户参与度和功能效果 。 - **性能测试:** 对AI功能在高并发场景下的性能进行评估,确保其能够稳定运行并快速响应用户请求。 **3.4.2 上线策略** 美团的上线策略可能包括: - **灰度发布:**先将AI功能向小部分用户开放,观察用户反馈和系统运行情况,如果没有重大问题再逐步扩大发布范围 。 - **App内推广:**在美团App内部通过横幅广告、弹窗通知或专门的功能入口来宣传新的AI功能,引导用户使用 。 - **公开宣布:**通过新闻稿、官方博客或社交媒体等渠道向公众宣布新AI功能的上线及其带来的益处 。 - **整合到营销活动中:**将AI功能的上线与更广泛的营销活动相结合,以提高用户认知度和使用意愿。 ## 4. 上线后分析与未来方向 ### 4.1 潜在的迭代方向和优化空间 AI功能上线后,美团可能会持续进行迭代和优化,可能的方向包括: - **持续监测用户反馈和数据:**通过分析用户对AI功能的反馈、使用数据以及性能指标,识别需要改进和优化的方面 。 - **提升AI推荐的准确性和个性化程度:**基于用户的互动和反馈,进一步训练和优化AI模型,使其在“神抢手”和“问小袋”等功能中提供更准确、更个性化的推荐 。 - **将AI能力扩展到App的其他领域:**鉴于初期AI功能的成功,美团可能会探索将AI集成到App的其他部分,例如搜索、客户服务,甚至个性化的旅游和酒店推荐 。 - **探索新的AI原生产品:**美团的AI战略包括开发全新的AI原生产品 。基于已有的AI功能部署经验,美团可能会进一步探索和推出更多基于AI的创新产品。 ### 4.2 AI功能对美团App整体产品生态可能产生的影响 AI功能的成功实施和持续优化,预计将对美团App的整体产品生态产生积极的影响: - **提高用户参与度:**通过提供更个性化和高效的体验,AI功能有望提高用户与美团App的互动频率和时长 。 - **提升转化率:**更精准的AI推荐和商品信息摘要可能会提高用户在“神抢手”等板块的购买转化率 。 - **增强用户忠诚度:**更优质、更便捷的用户体验能够提升用户满意度,从而增强用户对美团平台的忠诚度 。 - **强化竞争优势:**成功集成先进的AI能力将进一步提升美团在本地生活服务市场的竞争力,使其在与竞争对手的较量中占据更有利的地位 。 - **形成数据飞轮效应:**用户参与度和交易量的提升将产生更多的数据,这些数据可以用于进一步优化AI模型,从而形成一个正向反馈循环,不断提升用户体验和平台价值 。 ![](https://image.woshipm.com/2025/04/25/e1e96e84-21bf-11f0-b1a0-00163e09d72f.png) ## 5. 结论 美团作为中国领先的本地生活服务平台,始终将技术创新置于战略核心地位,尤其是在“零售+科技”的战略指引下,积极探索和应用人工智能技术。此次在“神抢手”板块成功集成DeepSeek AI技术,推出“缘分测试”和AI智能提炼商品卖点等功能,以及此前测试的“问小袋”AI助手,都充分展现了美团在AI领域的积极布局和落地能力。 这些AI功能的推出,旨在解决用户在信息过载和选择困难等方面的痛点,通过更智能、更个性化、更具互动性的方式提升用户体验。从项目立项的背景来看,美团的AI战略与用户需求、技术趋势以及激烈的市场竞争环境紧密相关。在需求分析、设计开发、测试上线等各个阶段,美团都可能面临着确保AI输出质量、维持系统性能、保障数据安全以及实现无缝集成等挑战。 然而,通过持续监测用户反馈和数据,不断优化AI模型,并将AI能力扩展到App的更多领域,美团有望进一步提升用户参与度、转化率和忠诚度,从而在竞争激烈的本地生活服务市场中保持领先地位。其积极主动的AI战略,以及对“龙猫”等内部大语言模型的投入,预示着美团将在未来持续发力AI领域,为用户和商家创造更大的价值。 ![](https://image.woshipm.com/2025/04/25/2b28e314-21bf-11f0-b1a0-00163e09d72f.png) 本文由 @Gavin**杰 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自Unsplash,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

2025-04-27 02:45:33 · 0次阅读
 
 
硅谷"神仙工作"消亡:福利砍半、加班成瘾、工资冻薪

不久之前,在科技行业工作还意味着职业稳定、福利丰厚,以及可以享受一种“全情融入职场”的企业文化氛围,这在其他行业极为罕见。而如今,在科技行业工作看起来与普通工作没什么两样——不仅是因为公司厨房里不再供应草饲牛肉干,还因为员工们正面临持续不断的裁员恐惧、更长的工作时间,以及越来越多的职责,而薪资却原地踏步。 ![](https://n.sinaimg.cn/tech/transform/238/w630h408/20201225/5991-kftfpiw0639386.jpg) Meta Platforms最近基于绩效评估裁员了5%,并新增了差旅限制。亚马逊开始监控员工电脑的使用情况。谷歌在部分团队中选择不再补招离职员工留下的岗位。 对于这个长期享受行业红利、曾引领职场文化变革的群体而言,这无疑是一场鲜明的逆转。他们曾带动了诸如办公室乒乓球桌、外出团建、羽衣甘蓝薯片、甚至穿连帽衫上班等文化元素,成为企业管理的风向标。 几年前,科技行业人才争夺激烈到近乎荒诞的程度,个别案例中甚至有人被雇用却几乎无事可做。而现在,不少员工不得不承担起多位被裁同事的工作量。有些人虽然被返聘,但新岗位却不再享有加薪或股票奖励等待遇。过去跳槽几乎是涨薪的捷径;现在,仅仅是提出薪资要求,便可能导致工作机会被收回。 这一转变已在科技行业中悄然酝酿多年。长期以来,对技术人才的需求始终超过供给,新冠疫情期间更是达到巅峰。Meta和Salesforce等科技巨头承认,疫情期间他们雇佣了过多员工。随后的行业调整从2022年起引发了大规模裁员潮。 曾在Meta工作九年、如今为科技大厂员工提供财务咨询的安德烈·纳达尔(Andre Nader)说:““如今在这些公司上班,很难再让人觉得工作的可持续性。而在2022年之前,人们真的会觉得自己的职位不可撼动。” 硅谷公司提供的薪资依然具有吸引力,但不少资深员工表示,他们已难以认同自己供职的企业。管理层愈发关注业绩表现,以满足华尔街的期望。尽管科技巨头收入依然强劲,但它们正在将大量资源投入到昂贵的人工智能基础设施建设中,企业现金流因此承压。随着行业走向成熟,一种“埋头做事、少说话”的文化正在成为新常态。 公司管理理念的变化也无需讳言。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在接受播客采访时表示,他希望企业文化能重新找回“阳刚之气”,认为此前这种特质已经被削弱。谷歌联合创始人谢尔盖·布林(Sergey Brin)则在今年2月对员工表示,每周工作60小时是保持效率的最理想状态。 在亚马逊云服务部门AWS,一位产品经理表示,尽管他所在的团队客户数量大幅增加,公司却不允许他补充人手。他还指出,由于公司将人工智能项目优先于日常运营任务,从其他部门获得支持变得愈发困难。2024年,他不得不亲自写代码——这是他十年来从未再做过的工作——因为原本负责相关任务的技术团队已无人可用。 亚马逊发言人回应称,公司根据业务需求和优先级进行招聘决策,包括是否补招空缺岗位。 Meta一位曾被裁员的招聘人员去年被重新聘回原岗位,但有个前提:她现在被归类为“短期员工”,合同虽然可续签,但不享有绩效加薪、晋升或股票奖励资格。她表示,自己如今承担的工作量,过去是由数人共同完成的。 公司将这种超负荷承担额外职责的状态称为“敏捷性(agility)” 凯特·史密斯(Kate Smith)在金融和房地产领域工作过后,随后以合同工身份在谷歌供职两年。她表示,在此期间,她的工作量显著增加,但资源却明显减少。“这些工作正变得和普通岗位毫无二致,”她说。 史密斯将工作负荷的增加视作拓宽经验的机会,但她发现,谷歌的老员工似乎不这么看,“人们都在怀念过去的黄金时代”。 人力资源分析师、咨询公司创始人乔什·伯辛(Josh Bersin)表示,特朗普政府的政策方向与埃隆·马斯克(Elon Musk)的成本削减策略,进一步助推了“用更少的人完成更多工作”的企业思维。 伯辛称:“每一家我接触的公司都在谈生产力问题,或许我们确实人手过多了。现在公司在思考的,如何提高人均营收,而不仅是总营收?” 随着企业推进组织扁平化改革,管理层级不断减少,团队也在越来越多的整合。 曾在亚马逊工作七年、现为科技大厂员工提供高管辅导的大卫·马克利(David Markley)说:“我听说有些人要直接管理多达30名下属,这并不是因为公司缺钱,而是由于人工智能的崛起以及‘组织结构扁平化更高效’的说法流行起来。” 裁员如今已非罕事,而是企业常规运营的一部分。某些公司即使创下营收新高,仍会继续裁员。根据追踪裁员信息并通过众筹整理失业者名单的网站Layoffs.fyi统计,2025年迄今,已有100多家科技公司进行了裁员,受影响员工总数已超过5万人。 **无处可去** 虽然亚马逊向来不像其他大型科技公司那样“娇惯”员工,但过去员工普遍感到被公司信任,并享有高度自主权。而如今,一些员工发现,公司已开始更密切地监控他们。 莉兹·吉伦(Liz Guillen)本月上旬刚从亚马逊AWS的技术文档专员职位离职。她表示,曾在电脑上看到弹窗提示:“您的屏幕正在被查看。”另一位AWS员工则在其工作电脑上发现了可以记录键盘输入、监控网页浏览及截屏的监控软件。 亚马逊发言人回应称,公司使用这些程序是为了保护敏感和专有信息,而非监控员工。 曾几何时,“随时随地办公”是科技公司吸引人才的利器。如今,亚马逊要求大多数白领员工每周到岗五天,而其他科技巨头则多为三天。谷歌近期通知部分原本被指定为远程办公的员工:必须每周返岗三天,否则可选择接受离职补偿。 谷歌发言人称,要求居住地临近办公点的远程员工返岗,旨在提升协作效率。 不少科技从业者在寻求跳槽时发现,自己的谈判新筹的空间已大幅缩小。一位专注于用户安全的从业者透露,她经过八轮面试拿到一家科技巨头的口头录用通知,提出加薪12%的要求,结果对方表示不再推进录用流程,称对薪资谈判过程不满意。 尽管科技行业的薪资在整体上仍高于其他行业,但目前行业内部已出现明显分化:人工智能领域,尤其拥有博士学位的人才,薪酬水涨船高;而缺乏人工智能背景的从业者则发现,跳槽不仅不再有溢价,反而待遇可能不如从前。 薪酬管理软件公司Pequity的创始人凯特琳·诺普(Kaitlyn Knopp)指出,许多企业如今更倾向于以短期奖金或无保障激励的方式发放薪酬。她解释称:“可以逐年剥离这些奖金,这样公司更容易灵活调整薪酬支出。” **福利不再** 大约15年前,谷歌高管曾在节日前的全员大会上,向员工抛撒一捆捆1000美元现钞;Meta员工曾长期享受免费的洗衣服务,甚至不惧组织罢工抗议以抗议公司决策;Netflix则给予员工高度信任,可自由决定差旅、休假和育儿假的安排。 如今,谷歌抛钱的盛况早已不复存在。曾以“自下而上”的文化闻名、员工可在周五全员会议上向高管自由提问的谷歌,如今的内部活动流程则高度预设。 Netflix也开始收紧福利政策:员工现在被限制订购带有公司标志的纪念品数量,曾被誉为全美最慷慨之一的育儿假政策也部分收回。如今,员工若休育儿假超过六个月,通常会被视为不利于职业发展的选择。 Meta几年前便取消了免费洗衣服务。目前,员工每年最多只能差旅四次,除非获得特殊批准;团队纪念品预算遭削减,连帽衫和夹克等“公司装备”发放也减少。最近,更有员工反映,公司零食的质量和供应量双双下降:草饲牛肉干消失了,原本钟爱的能量饮料也被撤下。 一位刚刚离职的Meta员工表示:“与工作保障相比,零食和福利或许看似无关紧要,但当它们被一项项削减时,确实会打击士气。” 据知情员工透露,几个月前,扎克伯格曾对员工表示,参与公司问答环节“不再是合理的时间分配”。 谷歌方面也在收紧开支。一位员工表示,曾用于组织团建活动(如品酒、卡丁车)的“娱乐预算”被削减;免费咖啡厅营业时间缩短,现场技术支持减少,员工换发新笔记本电脑的频率也受到限制。 谷歌发言人解释称,这些调整是根据混合办公模式所作出的财务优化,并强调公司仍然提供“业内领先的福利待遇”。 此外,谷歌今年2月还宣布,将不再坚持“招聘代表性不足群体”的多元化目标。 尼古拉斯·惠特克(Nicholas Whitaker)曾在谷歌人力运营团队工作十年,2023年被裁。他回忆道,过去谷歌曾公开倡导多元、公平与包容(DEI)理念。如今,他为大型科技公司员工提供职业咨询。他表示,有些谷歌员工正在等待买断机会(即自愿离职补偿协议),称公司文化的剧变是一种“道德伤害”。 惠特克说:“我见证了整个转变过程。公司曾经公开宣扬的原则,如今已变得面目全非。” [查看评论](https://m.cnbeta.com.tw/comment/1495676.htm)

2025-04-27 02:35:50 · 0次阅读
 
 
刘强东送外卖 母亲现身京东食堂给员工煮饺子

刘强东亲自送外卖,老母亲也没闲着。据国内媒体报道,近日,**刘强东母亲被拍到在京东食堂帮忙,给员工煮饺子,网友大赞淳朴。**此前,她还在京东智慧城建设期间参与工地监工,甚至与工人一起拖管子、打混凝土。 [![](https://static.cnbetacdn.com/article/2025/0427/22013d508d7dae9.jpg)](//img1.mydrivers.com/img/20250427/2ce5037959dd4c22a42e0f0546a481a6.jpg) [![](https://static.cnbetacdn.com/article/2025/0427/8a95df01d6b644a.jpg)](//img1.mydrivers.com/img/20250427/f439601805ba4e5b862ccbcb5eb9a1a6.jpg) [![](https://static.cnbetacdn.com/article/2025/0427/aaee726eb64ce00.jpg)](//img1.mydrivers.com/img/20250427/57b38b45d60849ebbe0356de6c5b6bbe.jpg) [![](https://static.cnbetacdn.com/article/2025/0427/15d76db1243bf85.jpg)](//img1.mydrivers.com/img/20250427/92165e9c43b144e98282781f8c1cb348.jpg) 针对“作秀”的质疑,有网友现身澄清:**“还真不是作秀,我六七年前在北京京东工作的时候,宿迁京东来的好几个同事都说过,经常看东哥母亲在食堂里帮忙,对客服对快递员不管什么职工都没有架子**”。 公开资料显示,刘强东的母亲叫王绍侠,早年与丈夫刘志成一起在外行船为生。 [![](https://static.cnbetacdn.com/article/2025/0427/b510f2e106bda7e.jpg)](//img1.mydrivers.com/img/20250427/51967dc70d5b45c4977283552b0b36ae.jpg) 2025年1月10日,王绍侠现身宿迁老家,跟邻里唠家常,笑着展示儿媳妇章泽天买的新衣服,并亲自下厨给工作人员做家乡小吃表示感谢。 当时,刘强东母亲身穿一件黑色大衣,笑着向众人展示,称:“**这是我儿媳妇买的。”众人也纷纷夸赞“好看”。** 刘强东1974年出生于江苏省宿迁市宿豫区来龙镇光明村,曾在来龙镇光明村上小学、在来龙镇上初中、在宿迁市上高中。 **在大学时代之前,刘强东的生活和成长一直没有离开过农村。** 考上大学时,全村人凑了500元和76个鸡蛋送给他,这份恩情刘强东一直未忘。 [![](https://static.cnbetacdn.com/article/2025/0427/3c60d67a16eaf73.png)](//img1.mydrivers.com/img/20250427/9179408f82074b3997521286fffd2407.png) [查看评论](https://m.cnbeta.com.tw/comment/1495674.htm)

2025-04-27 02:35:36 · 0次阅读
 
 
联合国报告称数字化转型导致劳动条件恶化并破坏社会结构

联合国经济和社会事务部发布的一份新报告,即《[2025 年世界社会报告》](https://desapublications.un.org/publications/world-social-report-2025-new-policy-consensus-accelerate-social-progress),阐述了数字化转型对劳动条件和社会结构造成的破坏。报告称,即使在高收入国家,数字化转型也带来了更多的就业不确定性和更多的零工,这些零工在就业中得不到任何保障或权利,而这些保障和权利在许多发达国家是普通员工所享有的。他们失去了带薪病假、最低工资以及产假或陪产假——这导致人们为了维持生计而精疲力竭。 [![](https://static.cnbetacdn.com/thumb/article/2020/0418/26368e7dcbb872d.jpg)](https://static.cnbetacdn.com/thumb/article/2020/0418/26368e7dcbb872d.jpg) 联合国对此评论[说](https://news.un.org/en/story/2025/04/1162561): <blockquote><p>即使在高收入国家,不断上升的就业不确定性、零工和数字化转型也加剧了这一趋势。这些工作或许提供了灵活性,但往往以安全和权利为代价——将劳动者沦为商品化劳动力市场中单纯的服务提供者。</p></blockquote> 数字化转型带来的损害远不止于此。越来越多的人陷入焦虑,工作也岌岌可危,而科技界的超级富豪们却未能阻止他们旗下社交网络上虚假信息和虚假信息的泛滥。他们赚得盆满钵满,却又破坏着世界各地的社会结构。 联合国表示,[在WhatsApp等平台上传播的](https://www.dw.com/en/how-do-indians-navigate-whatsapp-misinformation/a-72301322)虚假信息和虚假信息正在破坏[人们对机构](https://edition.cnn.com/2025/04/06/health/measles-texas-second-child-dies/index.html)甚至个人的信任。由于社交网络使用的算法,人们被引入虚拟的、孤立的回音室,在那里他们只能看到自己认同的新闻和观点,这有可能将人们转变为极端分子。联合国表示,这些回音室正在奖励更极端的内容和参与度,使其获得更高的曝光度。 在对机构的信任方面,报告发现公众对政府的信任度处于低位,而出生于21世纪的科技一代的不信任感则更加强烈。联合国警告称,这引发了人们对公民脱离(例如不参与投票)和政治不稳定(例如美国国会骚乱、战争等)的担忧。 就人与人之间的信任而言,联合国报告发现,信任度也在下降。在有数据的国家中,只有不到30%的人认为大多数人值得信任。报告指出,这削弱了社会凝聚力,并使集体行动更加复杂化。 为了应对这些社会弊病,联合国建议各国政府通过投资教育、医疗、住房和健全的社会保障体系来促进公平。联合国还呼吁建立更具包容性和问责性的制度,并减少权力和财富向社会顶层的集中。 [查看评论](https://m.cnbeta.com.tw/comment/1495668.htm)

2025-04-27 02:35:23 · 0次阅读
 
 
AMD线程撕裂者9000系列离发布不远 技嘉主板新BIOS已添加支持

尽管AMD尚未明确AMD线程撕裂者9000系列的发布时间,但有迹象表明,该系列发布似乎已经近在咫尺。**技嘉为其TRX50主板发布了新的F10A BIOS版本,明确提到支持AMD SHP下一代CPU,SHP即“Shimada Peak”,也就是基于Zen 5架构的新一代线程撕裂者处理器的代号。** [![](https://static.cnbetacdn.com/article/2025/0427/95ef449cc0f76cd.png)](//img1.mydrivers.com/img/20250427/010c57ba-4ff0-43f8-9cad-8e9b47f8a123.png) 值得注意的是,此次F10A BIOS更新在三天前就已发布,这可能意味着技嘉提前发布了该固件,以便让评测人员能够及时更新BIOS进行相关测试。 **最新的SKU列表确认了AMD线程撕裂者9000系列五种型号,核心数从12到64不等,此外,AMD还将推出一款96核版本,与上一代系列的核心数量相匹配。** AMD线程撕裂者9000系列预计还将支持PCIe 5.0,并且可能会配备3D缓存,预计会采用与“Storm Peak”相同的SP6插槽。 ![](https://static.cnbetacdn.com/article/2025/0427/03a0ba4a81c35e9.png) [查看评论](https://m.cnbeta.com.tw/comment/1495666.htm)

2025-04-27 02:35:12 · 0次阅读
 
 
沐邦高科,最近一个月又有哪些骚操作?

最近一个多月,沐邦的每一则公告,背后几乎都有一个故事。

2025-04-27 02:32:13 · 0次阅读
 
 
微软 Copilot大更新,系统级AI野心,用户却不满,狂喷CEO!

<blockquote><p>微软近期对Copilot进行了重大更新,试图将其打造成系统级的AI助手,整合Windows系统和微软全家桶产品,打造一个强大的多模态工作空间。然而,这一波更新却引发了用户的集体吐槽,甚至有人在社交媒体上狂喷微软CEO纳德拉。本文将为你详细剖析微软Copilot此次更新的具体内容,解读用户不满的原因,以及微软在AI领域的战略野心和面临的挑战。</p> </blockquote> ![](https://image.woshipm.com/2023/04/13/0aefb984-d9ef-11ed-a8b0-00163e0b5ff3.jpg) 作为OpenAI的最大投资方和外部股东,微软的所有AI产品并没有近水楼台先得月,尤其最近承载其野心的Copilot大更新,引起了用户的集体吐槽。 ![](https://image.woshipm.com/wp-files/2025/04/A7Rs5HpQ5lsxNFj7LYrs.png) 这次春季更新,微软带来了365 Copilot Wave-2 ,系统级的AI助手重大升级版,任何Windows 系统自带。本来凭借得天独厚的资源,应该秒天秒地秒众多AI产品,但是这波时隔一年的更新,微软CEO纳德拉亲自在X上发布,用户却并不买账,批评的潮水淹没了评论区。 ![](https://image.woshipm.com/wp-files/2025/04/kgpjVBJs3UJ0tpUr8kck.png) 鲸哥总结更新看,新 365 Copilot打造了系统级AI 的雏形,融合了本地和在线资源,打通了微软公司内外的产品,整合了很多工作流程,有一定的革新意义。 但用户想要的是传统产品升级,而不是新的AI功能,另外Copilot和Windows系统本身、微软产品全家桶打通得不够,都是大家吐槽的地方。 具体更新哪些功能更新,鲸哥总结大概集中在这四方面,也会一并解读下这些点为何会被吐槽。 第一是Copilot改变展现思路,不做大客户端,而是在win 11中无处不在,更小巧便捷。 举例来说,此前Copilot是在电脑底部任务栏和Edge浏览器侧边栏强推,打开后一个霸占屏幕的应用端窗口形态。 目前正在测试桌面一个弹出小横幅窗口,可以用快捷键唤醒(新版电脑Copilot,老版Windows 键 + C);或者右键菜单中的 AI 选项,随时能调用Chat,彻底融入系统中。 它还引入了记忆和个性化功能,通过添加更多个人背景来提高 Copilot 的响应质量。通过聊天、工作简介和自定义指令,以后Chat更自由了。 去年,微软还推出了3秒截一次屏幕的Recall,大家现在也担忧它的记忆和个性化,可千万别涉及隐私。 第二是增强Agent和工作流能力,打造“多模态工作空间”。 微软也在为Copilot增加AI Agent能力,和最近的大火的扣子空间、Manus等产品一样,能多步骤推理从网络和企业中获得的数据,并汇总和分析信息,最后根据用户给出的主题,创建具有洞察力的报告。 这次 Microsoft 还引入了第三方开发的Agent。下图中可以看到脑图工具Miro,团队项目管理工具Jira。 ![](https://image.woshipm.com/wp-files/2025/04/vacERGhkmIxTFuTJp3Ug.png) 另外打通 了Web + Work + Pages,做了一个Notebooks产品。用户可以用 AI 进行创意构思,重要的是与他人协作。这些不同地方的异构数据,比如Pages、文档、网站文章或者团队会议记录——Copilot会识别这些内容重新整合,转换成你想要的内容模态,比如直接转成音频博客,感觉像是一个“多模态工作空间”。 ![](https://image.woshipm.com/wp-files/2025/04/Km8v5lG5oTVLkUXP8FoP.jpeg) 但有用户评价,office套件上的Copilot很蠢,能不能先解决这个问题。 ![](https://image.woshipm.com/wp-files/2025/04/yD7MznK78DW3Hfu9sxtr.png) 我感觉微软现在还是犹豫,去年9月份推出的Pages在线文档,主打协作。office升级后也越来越在线化和AI化,但office本身是传统软件框架,引入AI注定很慢很复杂。 两条路线分散了精力,也没想好具体应该两边如何发展。那就先做Notebooks,新的东西好做一点。 第三个是强化搜索资源,本机、企业软件以及网络数据整合。 微软这次新增了跨应用的全面搜索功能,Copilot 中的新**智能搜索**不仅可以访问 Microsoft 环境(例如 Word、Excel 或 Outlook)内的数据,还可以访问**第三方工具**(例如 Slack、Google Drive、Confluence、Jira 或 ServiceNow)中的数据。 ![](https://image.woshipm.com/wp-files/2025/04/0WOUMke6SXd0DOhCPKvS.png) 一个简单的案例,通过 Windows 搜索查找保存在云端的照片,终于实现了。应该能够通过 OneDrive 查找云端照片。不过,前提是微软能够修复 OneDrive 同步的一些问题。 ![](https://image.woshipm.com/wp-files/2025/04/aW8BDv9niC9AMK8x3QVi.jpeg) 第四个是打造创造能力板块,直接在PPT中使用GPT-4o。 新的**Copilot Create**部分是 Microsoft Designer 工具的演变,允许您直接在生产力环境中生成视觉和多媒体内容。借助**OpenAI 的 GPT-4o**模型,可以在 PowerPoint 演示文稿创建图像、视频、调查,甚至动漫风格的插图。 ![](https://image.woshipm.com/wp-files/2025/04/cXEEt7IQzc86w02tLOUb.png) 不离开 Microsoft 套件,直接插入AI生成的视觉内容,比如吉卜力风格的照片。 而一些网友则吐槽,别增加那些多模态能力,Copilot生成图片就很难看,还想把PPT转成视频,让AI做点基础性工作,比如对齐幻灯片、修复字体等,这些事情很费时间。 ![](https://image.woshipm.com/wp-files/2025/04/49I5DRa6nsDqmVINEOvb.png) 为这个老哥点赞,上次用Canva调整海报,一键对齐功能真的很好用,PPT还没有这个AI能力,确实是“不务正业”。 微软的AI野心不止于此,还想依靠更强的AI能力以及上下文记忆,把工作(365Copilot)和消费(Copilot)场景融合。 甚至微软的Copilot Vision(适用于 Windows)、Copilot Shopping等功能,也在等待发布。这些功能感觉就脱离Copilot生产效率的范畴了,进军私人生活助理的领域了。 微软2024年在一份声明中表示:“这需要一个模糊本地计算和云计算界限的操作系统。明年必将是非凡的一年。”。现在看来这个目标正在实现了。 不过,从微软公司战略升级的角度看,给CEO纳德拉打高分,但是从用户的AI体验看 ,却并没有合格。 正如这位恨铁不成钢的老哥,狂喷微软内部人是不是很久没用其他家的 AI产品了,“你知道你们落后多远了吗?” ![](https://image.woshipm.com/wp-files/2025/04/bGR96hVXJ4Ss9UJEmvVO.png) 目前来看,这个将在5月初上线的新版Copilot,旧问题解决的不多,新功能届时看效果了。 但鲸哥想说的是,相比Windows的系统级AI Copilot已经迭代了很多,苹果Mac的“Apple Intelligence”现在还是句空话呢。(预告:鲸哥近期正测一个能让Mac提升10倍AI能力的产品) 无论微软还是苹果,至今没带来一个亮眼生成式AI功能,没有产生破圈的AI产品,要知道这俩都是3万亿美元市值的巨无霸,有些AI产品还不如OpenAI这些创业公司。 掌控系统生态的巨头们,真是一个个难言奋进。 作者:鲸哥 本文由人人都是产品经理作者【鲸选AI】,微信公众号:【鲸选AI】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。 题图来自Unsplash,基于 CC0 协议。

2025-04-27 02:06:52 · 0次阅读
 
 
中国一季度进口车销量大跌39% 保时捷近腰斩

崔东树日前发布了中国1-3月份进口汽车市场的分析文章。崔东树指出,中国进口车进口量从2017年的124万辆持续以年均8%左右下行,到2023年仅有80万辆。2024年汽车进口70万辆,同比下降12%。**2025年1-3月进口汽车9.5万辆,同比下降39%,这是近期少见的1-3月巨大下滑。** 随着国产车的崛起和国际品牌本土化加速,近几年汽车进口持续低迷,进口车持续3年负增长,如果熨平波动,则是连续7年的负增长。 从品牌来看,**目前进口车主要靠豪华车的需求支撑,非豪华进口车剧烈萎缩。** 2025年的雷克萨斯的进口零售下滑1%,表现不错。宝马、奥迪、路虎的表现总体较强。 **而保时捷的近期表现偏弱,今年1、2、3月份进口量为3672、1874、2928辆,同比已接近腰斩。** ![](https://static.cnbetacdn.com/article/2025/0427/9f0d60e328f3fff.png) 超豪华品牌中,法拉利的走势很强、宾利和劳斯莱斯表现较坚挺,虽然连续下滑,但仍在相对高位销量。玛莎的走势总体低迷,超豪华总体走弱。 ![](https://static.cnbetacdn.com/article/2025/0427/522876d64364817.png) 此外,值得关注的是,考虑到关税和政策影响,中国进口美国和的数量近期波动也较大。 中国自美国进口汽车近几年快速下滑,从2017年的28万辆的进口规模,到2024年下降到10.9万辆,下滑幅度较大。2025年1~3月份,进口美国车辆达到8870辆,同比下降66%的水平,而且3月份仍在持续下滑。 ![](https://static.cnbetacdn.com/article/2025/0427/ae77f6613995742.jpg) [查看评论](https://m.cnbeta.com.tw/comment/1495664.htm)

2025-04-27 02:06:13 · 0次阅读
 
 
不学Sora?这家国产AI搞了个“无限续杯”的视频模型

这回说个不一样的视频模型:sand.ai的Magi-1。具体有啥不一样?我们先翻了翻sand.ai的资料,发现他们团队还真是有点来头。创始人曹越和联创张拯早在2021年的万引神文Swin Transformer就有合作,都曾就职于科技界的黄埔军校 - 微软亚洲研究院。曹越还是光年之外的创始人之一。 ![](https://static.cnbetacdn.com/article/2025/0427/fec5e89d9d19988.webp) 在强强联手的buff加持下,sand.ai创立才一年多就有了自己的第一个视频生成模型 Magi-1。 据说Magi-1是现在市面上唯一一款能进行无限时长视频续写的模型,还能精细化控制到每一秒生成的内容。 要知道现在视频生成模型的极限普遍就几十秒,像可灵那样一分钟以上的都很少见。要生成更长的视频,那是另外的...另外的价钱也不行,这是底层模型的技术问题。 而Magi-1支持无限时长续写,还可以每次同时生成最多16个1s到10s的视频。 ![](https://static.cnbetacdn.com/article/2025/0427/f34795ab43ad3c8.webp) 不光技术有创新,sand.ai还表示,他们已经在4月21日开源了模型,并同步上线产品 demo。 连业界大佬都发文力挺sand.ai,李开复发帖,这是继 DeepSeek之后又一个开源的世界级模型。 ![](https://static.cnbetacdn.com/article/2025/0427/8cbfe74ad058895.webp) 美团创始人王慧文也为sand.ai这波开源发声:“只有科技的不断前行,能挽救人类掉入零和游戏的深坑。” ![](https://static.cnbetacdn.com/article/2025/0427/7d473abb8785dcf.webp) 我们去翻了几个官方的案例,好像确实有点东西啊。 看看这飞快的运动速度! ![](https://static.cnbetacdn.com/article/2025/0427/4015c6bfa36bf58.gif) 再看看这丝滑的镜头转换! ![](https://static.cnbetacdn.com/article/2025/0427/9c8d56d9684f7ea.gif) 这可让世超有点期待了。 不过得先冷静一下。测试下来,感觉想法是很有潜力的,有优势和特色,但是生成的效果还有待提升。 我们先找了个梦中情车的正面特写慢镜头,准备续写接下来世超驾驶Lamborghini秋名山车神再世的画面。 测试的过程中,我们发现Magi-1对于运动速度和镜头的控制确实很优秀。兰博基尼在路上疾驰的效果做出来了,镜头也很有电影感,一直聚焦在跑车上。 还有一个很明显的优点,就是Magi-1对于视频主要物体的保护非常到位。不会在多次续写之后,跑车变身大黄蜂的情况。 它对物理环境的理解也是正确的,车辆一直保持在地面上,没有出现低空飞行之类的骚操作。 ![](https://static.cnbetacdn.com/article/2025/0427/647f4c15e5343fb.gif) 不过...Magi-1好像有点健忘。比如前三段生成的视频都知道车后是一面墙,结果第四段直接一个倒车摆尾漂移丝滑上路了。 而且场景理解自从上路就越来越抽象了。除了克苏鲁风绿化带,提示词让它在红灯前刹车,本意遵纪守法,它直接来个交通肇事。 虽然确实是在红灯前刹车,没毛病 ![](https://static.cnbetacdn.com/article/2025/0427/6c7b6faba9c2305.gif) 但我们接下来的测试发现,效果不好也不能全怪模型,还可能是提示词出了问题。 打开Magi-1的提示词增强,它可以把简单的提示词扩展成更详细、容易让模型理解的指令。但在实际使用的时候,它出现了添油加醋,假传圣旨的现象。 比如这里,我们只想让小鸡玩具跳起来,提示词增强自己给自己上了个难度,还要让小鸡扇动翅膀。 ![](https://static.cnbetacdn.com/article/2025/0427/fbc2ca4a9f79ad8.webp) 但如果我们把提示词复制一遍,只删掉扇翅膀的要求,关掉提示词增强,生成的视频效果立刻好起来了。 左图有扇翅膀提示词,右图去掉扇翅膀提示词 ![](https://static.cnbetacdn.com/article/2025/0427/08476b12cec129a.gif) 接下来,我们再对之前的跳跃提示词直接进行修改,变成让镜头逐渐左移。 效果看起来也不错,环境没有崩,小鸡也没有崩,镜头的确移动了。 ![](https://static.cnbetacdn.com/article/2025/0427/7c6f8954e44c4f4.gif) 所以这里有个小小的功能改进建议嗷: 在进入视频生成环节之前,最好让大家伙儿看看增强的提示词对不对,给一个修改提示词的机会。 毕竟生成一次还是要等挺久的,要是最后才发现中间提示词被魔改了,有点搞心态。 这也侧面反映了,Magi-1对于提示词是非常敏感而且要求很高的。想用好它,最好知道什么样的提示词才能让它出好活。 看完测试,你可能觉得,这模型有点拉呀,现在生成效果比这个好的多的是,为啥把它拿出来说? 因为它和我们熟悉的 Sora 等非自回归DiT模型(Diffusion Transformer) 的技术路线完全不一样,是一个自回归生成模型AR(Autoregressive model)。 作为一次创新尝试,它有自己独特的优势和潜力。 AR 模型就像一条环环相扣的锁链,每一次生成视频的新一帧,都在前一帧的基础上。这样生成的视频相邻帧之间就会有强相关性。 而 DiT 模型更像是放在一起伪装成锁链的一堆铁环。它为了效率会同时生成很多帧,但没有办法兼顾到帧与帧之间的关联。 ![](https://static.cnbetacdn.com/article/2025/0427/519e5decd67e50f.webp) 为什么sand.ai要尝试一条新路,选择和主流视频生成都不一样的 AR 模型呢? 我们对sand.ai团队进行了简单的采访,很荣幸得到了对 Magi-1 更专业、长远的解答。 sand.ai表示,他们早在Sora发布前就洞察到了AR模型在视频生成方面的潜力。坚持AR,是因为它在大语言模型上已经被证实是可扩展的(scalable) ,而scalable在很大程度上决定了这个技术在未来的上限。 理论上,AR 模型和语言模型的技术路线更接近,有机会让语言和视频统一建模,使文字和视频之间的关系就像现在文生图一样紧密,效果有可能实现一次跃迁。 另一方面,视频随着时间的推移往往还有物理和逻辑的相关性。比如篮球如果被篮筐拦住,它就不会再掉落了。 下图是用Magi-1生成的 ![](https://static.cnbetacdn.com/article/2025/0427/69d46e2484b27f1.gif) DiT每帧独立生成的方式可能会切断这种关联,没准会让篮球直接魂穿篮筐。而AR会更好地理解视频内容,不仅内容合理,还会在运动幅度、速度上表现得更好。 虽然技术路线目前看还没有完全成熟,但sand.ai相信AR会是未来。随着技术的不断迭代,也许就会找到最合理的 AR 模型视频生成的方式。 于是按照他们的说法,在对技术全面而理性地分析后,sand.ai在AR视频生成上下了注。 其实,在视频生成领域卷到飞起的今天,sand.ai看似迟到了,但在上限更高的AR视频生成上他们却是先发而至。 最重要的是,sand.ai这波开源,属实格局拉满。 科技行业的每一次重大开源,都会带来一场百花齐放。期待sand.ai未来的更多产品,以及更多团队在Magi-1基础上的创新成果。 [查看评论](https://m.cnbeta.com.tw/comment/1495658.htm)

2025-04-27 02:06:00 · 0次阅读
 
 
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795796797798799800801802803804805806807808809810811812813814815816817818819820821822823824825826827828829830831832833834835836837838839840841842843844845846847848849850851852853854855856857858