2025中国AI大模型平台排行榜
文 | AI大模型工场,作者 | 参商 西梅汁,编辑 | 星奈
国内大模型发展趋势|6月份解读
高考季成了AI秀场,模型厂商们纷纷上线志愿填报功能,将考试和选校这两个关键环节紧密串联,也重塑了市场格局。 这场围绕高考的AI竞技,不仅是技术实力的展示,更是对教育痛点的一次精准出击。
夸克搜索打头阵,其智能引擎打造了一个集成式志愿填报平台。这里不光汇集了丰富的大学和专业信息,更利用AI模型分析考生个人情况,智能推荐匹配度高的选项。借助自然语言处理技术,考生只需简单提问,就能快速获取历年分数线、招生计划等关键信息,有效规避填报弯路。其核心的AI推荐系统,基于考生成绩和兴趣,推送高度个性化的院校与专业建议。最新消息显示,夸克已经累计为考生和家长生成超1000万份专业级志愿报告。
其中QQ浏览器也扮演了重要角色。背靠腾讯强大的社交生态,它不仅提供实时填报工具,更通过数据分析和机器学习,为考生推送个性化志愿建议。依托腾讯云的大数据处理能力,QQ浏览器能深度挖掘往年录取数据,提供更科学、更具参考价值的预测。内置的智能助手还能随时解答考生填报过程中的疑问,大大提升了使用体验。
百度同样不甘落后,推出了AI驱动的“高考志愿助手”。凭借强大的搜索和大数据基础,百度打造了一站式信息查询平台。在AI大模型的加持下,它能综合考生成绩、兴趣、就业前景等多维数据,生成个性化填报方案。同时,百度教育通过与高校合作,提供特定学科和专业的深度解析,进一步提升了建议的精准度和参考价值。
常言道“七分考,三分报”,如今这关键的“三分”或将被算法重新定义。技术积累的背后,是厂商们对考生“志愿焦虑”的精准洞察。当AI开始模拟人类专家的链式思考,志愿填报便从单纯的信息检索,升级为智能决策辅助。更值得期待的是,这些在高考场景中锤炼出来的“思考型AI助手”,未来很可能延伸到求职、置业等更多重大人生决策之中。
6月,AI行业的资本格局呈现出鲜明的“马太效应”,资源加速向技术壁垒高、商业化明确的头部企业集中。一方面,像银河通用和硅基流动这样拥有技术实力的公司,纷纷获得大额融资。银河通用成功吸引了11亿人民币的资金,而硅基流动则获得了阿里领投的数亿元融资。
这些企业的成功融资,不难看出资本市场对技术领先企业的青睐,资本更倾向于将资源集中投向那些技术底蕴深厚、市场前景广阔的企业。
与此同时,部分明星企业却陷入收缩:阶跃星辰关停ToC产品线,百川智能转向医疗领域,零一万物艰难求生,“AI六小龙”中截至目前已有12位高管离职。这种分化凸显资本对技术落地能力的严苛筛选,同时,资源向具备场景深度结合的头部技术公司倾斜似乎愈加明显。
与融资分化同步,AI企业IPO进程显著提速,行业步入密集资本收割期。摩尔线程、云知声等公司纷纷启动IPO进程,MiniMax也确认了赴港筹备的计划。
随着技术逐渐成熟和市场需求的爆发,更多的AI企业开始考虑通过上市获取更多资金,以加速发展步伐。尤其是在技术逐渐成为竞争壁垒的背景下,资本的支持不仅为企业带来了更多的资金,也为其在行业中的竞争力提供了保障。
整体来看,资本正迅速向头部企业集中,融资和IPO的加速体现了行业的成熟与竞争的激烈。技术领先者和具有创新优势的企业,正在成为资本市场的宠儿。而对于一些技术尚未成熟或市场前景不明朗的公司,生存压力愈加沉重。
随着Agent技术在教育、医疗、办公等多个垂直场景的渗透愈加显著。
以夸克的AI高考志愿功能为例,它通过大数据分析和智能推荐,帮助学生根据自己的兴趣和优势做出更合适的志愿选择。这样的应用层面不仅让AI在教育领域的角色更为重要,也让它成为了决策过程中的一种助力。
在医疗领域,蚂蚁的AI健康管家AQ和智谱的CoCo企业助手也展现了Agent技术的强大潜力。蚂蚁的健康管家围绕百姓看病就医刚需、健康管理痛点,AQ提供健康科普、就诊咨询、报告解读、健康档案等上百项AI功能,还能高效连接全国超5000家医院、近百万医生、近200个名医AI分身等专业医疗服务。
而智谱的CoCo则通过AI来优化企业内部的工作流程,提升了办公效率,减少了重复劳动,帮助企业节省了大量成本。可以看到,Agent正在这些高频、刚需的场景里找到自己的位置,开始真正解决实际问题了。
大厂们都在努力降低开发和使用Agent的门槛。腾讯云的AI Builder平台,让开发者能快速拼装出适合自己业务场景的智能体,并与微信生态无缝集成,推动实现“任务穿透”。钉钉多维表免费开放后,结合20余个AI模板,为中小企业提供零代码的Agent接入能力;火山引擎的豆包大模型则通过MoE架构和端到端工作流,将图片、语音转化为动态表格,加速Agent的应用,推动办公环境的智能化。
同时,搜索与研究型Agent的进化,也在推动信息获取方式从“检索”转向“深度推理”。360 AI搜索的“慢思考模式”通过15步思维链和跨模型调用(如360智脑、豆包、通义千问),对复杂问题展开多轮反思与验证,提升答案可信度。Kimi推出的Researcher工具则代表Agent自主研究能力的突破,基于端到端强化学习技术,可自动拆解问题、搜索数百篇资料,生成万字报告及可视化图表,实现“目标→执行→输出”的全自动。
技术的不断成熟,使得Agent正在迅速渗透到各个行业领域,成为推动行业数字化和智能化转型的重要力量。
国内主要大模型进展
6月,字节主要以火山引擎春季FORCE原动力大会为开端,通过发布新一代AI大模型、拓展AI应用生态、加强内部AI工具推广等举措,持续巩固市场地位。
6月11日,火山引擎春季FORCE原动力大会开始,发布了豆包大模型1.6,并宣布采用统一定价模式。价格大幅降低,最低仅为2.6元/百万tokens,相较于豆包大模型1.5与DeepSeek-R1的7元/百万tokens的价格,大幅下降了63%。
与此同时,豆包大模型的使用量也呈现爆发式增长。截至2025年5月底,豆包大模型日均 tokens 使用量已超过16.4万亿,较去年5月刚发布时增长了137倍。
6月12日,FORCE原动力大会继续进行,发布了更多AI产品和工具,包括PromptPilot、MCP Servers、TRAE和扣子开发平台的升级。字节跳动技术副总裁洪定坤透露TRAE的月活用户已超过100万。
6月16日,有消息称,字节跳动人工智能实验室(AI Lab)负责人李航已正式卸任,其在内部系统中的身份已变更为“劳务/顾问”。字节相关负责人表示,“李航辞任”消息不实,实际是退休返聘,管理范围无变化。
6月17日发生了多项动态。首先,SSeed团队发布了基于多模态模型的AI视频生成工具Seedance1.0。其次,字节跳动宣布与比亚迪达成深度合作,双方将共建实验室,利用SSeed团队开发的电解液AI模型框架BAMBOO,以帮助比亚迪加速兆瓦闪充电池的研发。同一天,字节旗下豆包上线了“AI播客”新功能,用户只需上传文档或输入文章网页链接,即可一键生成一段由AI双人对话构成的播客类音频。
6月23日,字节跳动旗下的抖音正式上线了一款名为"探饭"的AI美食助手。该工具整合探店推荐、菜品筛选、美食攻略等功能,支持地图找店、PK 比店、AI 点菜等特色服务。产品搭载豆包大模型,由北京有竹居网络技术有限公司开发,后者为字节跳动的全资子公司。
6月24日,火山引擎正式发布企业A中台 HiAgent2.0,引入Agent DevOps理念,将开发(Dev)、运营/运维(Ops)和测试(Test)等环节紧密结合,通过自动化流程和工具链的整合实现智能体从开发到运维的快速、高效交付。
整体来看,字节跳动正通过技术普惠化、产品多元化和生态开放化三轨并行,加速AI技术从基础设施到消费端、产业端的价值渗透。
阿里6月围绕AI技术展开密集布局,覆盖开发工具、行业应用、全球化部署及人才战略等多个维度。
6月9日,通义千问3开源一个月后全球下载量突破1250万次,衍生模型超13万个,覆盖Hugging Face、魔搭社区等平台,其30B参数版本在代码生成任务中响应速度达每秒18个token。
同日,硅基流动已完成数亿元人民币A轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。
6月6日,通义实验室发布Qwen3 Embedding系列模型,包含0.6B/4B/8B三种规格,8B版本在MTEB多语言榜单登顶,性能超越GPT-4等商业API。该模型支持网页检索、RAG等场景,在长文本语义理解任务中误差率降低至2.3%。
6月初,钉钉7.7.0版本上线多维表全免费策略,并推出20+AI智能字段模板,涵盖图像生成与文本解析功能;其闪记功能针对招聘面试、客户洽谈等场景优化,实现实时语音转写与智能纪要生成,企业用户反馈会议效率提升40%以上。同期,夸克发布“深度研究”功能,支持一键生成专业研报。这是一项基于AI的智能分析研究功能。它的核心目标是:将原本需要几天甚至几个月才能完成的专业研究、分析类任务,缩短到几分钟之内完成,并生成输出结构化、专业化的内容报告。
6月27日,《时代》杂志公布“全球百大影响力企业榜单”,阿里巴巴入选榜单,并被评价为“开源AI领域领军者”。这是继2021年上榜后:阿里巴巴第二次入选该榜单。
人才与生态建设方面,阿里巴巴6月8日启动的2026届校招中,AI相关岗位占比近50%,涵盖大模型训练、多模态算法等方向。
这一系列动作显示阿里正加速构建“基础模型-工具链-行业应用”的AI闭环:通过开源模型Qwen3扩大技术影响力,借助IDE与开发框架降低应用门槛,并以行业垂直方案拓展商业化边界(高考志愿、企业服务)。财报数据显示,阿里云AI相关收入连续三个季度同比增速超60%,技术红利正转化为商业增长动能。
6月30日,华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B)。此外,基于昇腾的模型推理技术也同步开源。华为表示,此举是华为践行昇腾生态战略的又一关键举措,将推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。
据了解,华为最新开源的Pro MoE 72B大模型,在参数量仅为720亿,激活160亿参数量的情况下,通过动态激活专家网络的创新设计,实现了以小打大的优异性能,甚至可以媲美千亿级模型的性能表现。在业界权威大模型榜单Super CLUE最新公布的2025年5月排行榜上,位居千亿参数量以内大模型排行并列国内第一。
6月20日,在华为开发者大会上,全面分享了HarmonyOS、昇腾AI云服务、盘古大模型等最新科技成果。同时,宣布盘古大模型5.5正式发布,自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级。
此外,华为诺亚方舟实验室主任王云鹤、华为云CTO张宇昕分别就盘古基础大模型技术解密和华为云如何用AI重塑云服务发表主题演讲,详细解读华为在AI领域的全栈创新优势。
DeepSeek在6月初发布了DeepSeek-R1模型的小版本升级,版本号为DeepSeek-R1-0528。此次升级基于DeepSeek V3 Base模型,显著提升了模型的推理能力、编程性能、长文本处理能力以及写作质量。在AIME 2025测试中,其准确率从旧版的70%提升至87.5%,幻觉率降低了45%-50%,整体性能已接近国际顶尖模型(如OpenAI的o3和谷歌的Gemini 2.5-Pro)。
百度近期围绕智能云业务与AI技术展开了一系列战略调整与产品发布。
6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MOE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。
目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。
6月23日,百度AI开放日举行,百度副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——Comate AI IDE。据介绍,Comate AI IDE是行业首个多模态、多智能体协同的AI集成开发环境(IDE),目前已接入文心4.0 X1 Turbo,开箱即用。
6月10日,百度文库及网盘联合举办AI Day开放日活动,发布主打"拍存管一体"的"AI相机"功能。百度副总裁、文库/网盘事业部负责人王颖在现场分享中介绍,用户可从百度文库App、网盘App,及文库/网盘网页的不同入口进入AI相机。
AI相机作为全模态输入重要能力,已在百度网盘APP上线,并已接入百度文库APP。百度文库还宣布多智能体协作能力"GenFlow超能搭子"全新升级为2.0版本,使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。
6月9日,百度智能云正式推出金融领域专属大模型 “千帆慧金” 及行业智能体解决方案矩阵。该产品基于数百亿金融场景 token 数据训练,在同等参数规模下效能指标提升 25% 至 30%,主要应用于金融机构精准高效的人工智能解决方案。
6月4日,据大厂青年消息,近日,百度智能云事业群组为加强前线市场力量,进行新一轮组织调整和干部轮岗:原业务中台负责人袁佛玉轮岗至前线,负责泛科技、金融、能源等赛道;政务、交通、汽车等赛道仍由石清华负责。
据悉,百度自2011年起就开启干部轮岗制度,先后通过引入OKR绩效管理制度、调整To B组织架构、倡导干部年轻化等方式,每两三年都会组织干部轮岗,不断适应变化的市场。
据百度刚刚发布的Q1财报显示,百度智能云业务强劲增长42%,表现亮眼。从大模型相关项目的招标市场数据看,百度智能云处于行业前列,一季度中标数量和中标金额,在通用大模型厂商中均位列第一。
通过干部轮岗保持组织敏捷性,依托大模型技术突破驱动垂直场景落地,并以开发者工具生态降低AI应用门槛。财报数据与市场表现印证了其战略有效性,而金融、办公、开发工具等领域的密集创新,或将成为百度智能云持续领跑行业的重要引擎。
6月围绕其自研大模型“混元”展开了一系列技术升级与产品发布。月初,混元大模型矩阵进一步迭代,推出深度思考模型混元T1和快思考模型Turbo S。其中,Turbo S在权威评测平台Chatbot Arena的排名已攀升至全球前八,代码与数学能力进入全球前十,理科推理、代码生成等核心指标较此前提升超10%-39%。
6月27日,腾讯正式发布并开源混元大模型家族的新成员--混元-A13B模型。该模型采用基于专家混合(MOE)架构,总参数规模达800亿,激活参数为130亿,在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。
据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github.HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
同日,搜狗输入法版推出“AI合成表情”与“候选表情”两大功能,以Al技术提升用户社交沟通体验。
“AI合成表情”基于腾讯混元大模型技术,用户输入文字描述或表情描述,便可毫秒级生成个性化表情包““候选表情”则是用户在输入常用文字时,候选区自动推荐高匹配度表情包,一键即可发送,告别手动翻找的繁琐操作。
6月16日,腾讯云推出全链路人工智能驱动应用开发平台“AI Builder”。这款工具支持用户通过自然语言输入需求,快速生成完整的前后端代码,并支持局部修改和一键部署。
在AI Builder发布后,腾讯进一步强调其在开发者生态中的价值。AI Builder不仅支持生成完整应用,还允许开发者导出代码包进行深度修改,满足专业开发者的定制化需求。这一功能吸引了大量开发者关注。
此外,腾讯在6月下旬发布的财报中,明确将AI作为公司未来增长的核心引擎。财报显示,腾讯AI技术在广告、游戏和云业务中发挥了重要作用,广告业务同比增长20%,游戏收入同比增长24%。此外,腾讯混元大模型已接入700多个内部场景,并广泛应用于微信、QQ、腾讯文档等产品,进一步提升了内部运营效率。
6月14日,在CVPR 2025(计算机视觉领域顶会之一)上,腾讯混元3D 2.1大模型对外全链路开源——模型权重及架构、训练代码、数据处理流程等等,全部开放。
这是混元3D模型首次实现全链路开源,开发者不仅可以调用模型,还能了解其训练过程、设计原理,并根据自身需求进行二次训练或微调。
6月8日,微信生态中的公众号后台接入首个AI助手“腾讯元器”。这一功能让公众号运营者能够利用AI工具实现问答式内容交互,例如自动解析文章、总结热点事件、回答用户咨询等。
6月26日,科大讯飞语音合成技术全新升级,一句话声音复刻与超拟人合成两大核心能力实现突破。据评测数据显示,科大讯飞一句话声音复刻技术在相似度、准确度等维度行业领先。
据介绍,此次一句话声音复刻技术升级在星火语音大模型底座基础上,构建了一套层次化语音建模框架,在此框架下进行音色编码增强和强化学习等关键技术突破,使得音色恢复的相似度显著提升,并精准还原用户的停顿习惯、情感起伏和呼吸节奏,达到真人难以区分的声音复刻效果,显著降低了应用门槛;超拟人合成技术则赋予AI声音以“上下文情商”。
随着星火语音大模型在教育、医疗、汽车、金融等领域的深度渗透,其技术底座已服务全国5万余所学校、600家医院及众多金融机构。
6月12日,科大讯飞在深圳举办2025智能交互产品升级发布会,以"交互领航 智启新章"为主题,重磅升级AIUI、机器人超脑、虚拟数字人与星辰开发平台四大核心产品,推动人机交互从"工具型"迈向"类人化"。新一代AIUI以大模型为引擎,实现情绪识别、创意生成与深度语义理解,日均交互量突破3亿次。
6 月 10 日,科大讯飞宣布星火 X1 认知大模型将于今年 7 月迎来架构级更新,预计将在现有的基础上进行更深层次的优化和功能扩展,进一步提升其智能应用能力。董事长刘庆峰表示,升级版将更好地满足用户对人工智能的期待,特别是在教育和专业领域的应用中。
讯飞星火 X1 在高考科目的表现令人瞩目,显示出其在数学、代码、逻辑推理、文本生成、语言理解和知识问答等多个领域的显著进步。今年 4 月 20 日,星火 X1 在完成这些通用任务时,其模型参数甚至比业界同类产品小一个数量级,然而整体性能却可与 OpenAI 的 o1 和 DeepSeek 的 R1 相媲美。
科大讯飞持续践行"自主可控、通专结合、软硬一体、行业深耕"的战略方向,推动AI技术在各行各业的深度应用。
6月11日,360正式发布了"纳米AI超级搜索智能体"。据360集团创始人周鸿祎介绍,这一超级搜索智能体能够打破各平台的"信息围墙",让AI直接调用小红书、淘宝、京东、高德地图等信息。他指出,虽然目前大模型的能力越来越强,但仅有大模型还不够。大模型相当于大脑,能思考、能生成,但是没有手和脚,不会用工具,不能直接干活,落地执行遇到障碍。
此外,周鸿祎还发布了能够接入个人知识库AI智能录音硬件纳米AI Note,以及和Rokid联名的AI眼镜。
6月14日,360AI云盘同步版进行了更新,该产品原名为360云盘同步版,是一款自动同步工具,用户只需将文件直接拖入本地360AI云盘文件夹即可实现自动同步,方便快捷,无需U盘,轻松实现数据存储。
360AI云盘同步版是360全新推出的网络存储应用,可以让用户的照片、文档、音乐、视频、软件、应用等各种内容,随时随地触手可及,永不丢失。
6月20日,360 AI办公工具集进行了版本更新,新版本为3.1.0.2200,大小为26.46 MB。360 AI办公,是一款一站式AI办公工具集,涵盖AI图片、AI文档、AI写作、AI音视频、AI PPT、PDF处理等200种办公权益及30万模版资源,让用户高效工作轻松生活。
6月22日,360AI图片工具进行了更新,该工具已从360看图升级而来。
360看图(已升级为360AI图片)是一款集简洁、高效、安全于一体的看图工具。无论是专业摄影师还是普通用户,都能在这款软件中找到满足自己需求的功能。
6月9日,智谱 AI 宣布全新企业级超级助手 Agent CoCo 正式上线,这款智能助手以 “懂你懂企业,能干能交付”为核心理念,致力于为企业带来前所未有的工作效率提升。
CoCo最大的亮点在于其突破性的记忆机制。与传统AI助手不同,CoCo能够:记住每位员工的工作习惯和偏好、根据不同部门职能提供差异化服务、持续学习并优化互动体验、主动提供个性化的信息和建议。
6月4日,智谱AI迎来了一项重大人事变动。据36氪报道,智谱AI首席运营官(COO)张帆将于6月底离职,选择在AI Agent领域继续创业。针对这一消息,张帆本人向界面新闻证实了这一消息属实,他表示:“近期会从智谱离职,创业做企业级生产力Agent方向”。
6月20日,昆仑万维正式发布并开源Skywork-SWE-32B,揭示LLM软件工程能力的数据缩放定律。
Skywork-SWE-32B模型在SWE-bench Verified基准上取得38.0% pass@1准确率,刷新Qwen2.5-Coder-32B系列模型在OpenHands代码框架下的最佳成绩。进一步引入测试时扩展技术后,模型表现提升至47.0%的准确率,不仅超越了现有参数规模在32B以下的开源模型,也显著效缩小了与闭源模型之间的性能差距。
近两个月来,天下秀旗下“灵感岛”AI营销平台持续深化技术布局与行业渗透,在推动AI与营销深度融合中动作频频。
6月27日,荣联科技集团与天下秀企业级人工智能内容营销生产平台灵感岛近日达成战略合作。双方在启动会上发布汽车行业AI营销解决方案,面向汽车服务场景提供智能一体化服务,推动AI技术在汽车全产业链的深度融合应用。此次合作旨在通过技术创新助力车企升级,提升营销效率与智能化水平。
上个月,灵感岛AI业务完成海外首站布局—— “灵感岛AI创新孵化中心”日本东京开幕,这是天下秀在海外设立的首个专业AI创新孵化平台。天下秀董事长李檬表示:“此次在东京设立孵化中心,是我们业务面向海外AI布局的第一站,也是面向全球市场技术出海战略的重要一步,未来将以灵感岛AI为核心进行创新孵化合作,构建更加国际化的内容创作生态体系,赋能全球内容创作者及AI产业。”
据了解,灵感岛提出国内首个GEO技术方法论体系——STREAM,通过语义结构化处理、可信源认证、用户共鸣等构建技术框架,针对性解决“AI幻觉”痛点,为品牌可信认知提供系统性方案。
天下秀依托十余年红人营销数据与实战经验推出“灵感岛”,以“创作者赋能+企业营销服务”双引擎模式解决AI内容精准度、可信度及传播效能痛点。企业端构建“创意灵感-素材生成-矩阵分发-效果追踪”全链路闭环,支持图文/短视频批量生成、爆款复刻、社媒账号管理及数字人IP打造,已服务本地生活、汽车等行业客户获客增长;创作者端推出6大AI智能助手,覆盖热点挖掘至脚本生成全流程,推动AI技术向产业实践转化。
6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,可在生成视频时同步生成高质量、富有空间感的立体声音效,实现“所见即所听”的沉浸式体验。同时,平台原有的“音效生成”功能中也新增了“视频生音效”模块,支持用户上传视频或调用历史作品,一键匹配精准同步的音效。
据悉,该功能基于可灵自研的多模态视频生音效模型Kling-Foley,能够对音画进行帧级对齐,展现了极高的音画同步精度和极佳的空间听感。目前,新功能已向用户限时免费开放。
6月17日,快手股价早盘上涨3.39%,报收50.35港元,这一股价变动与可灵AI在4月15日发布的可灵2.0和可图2.0模型的宣布密切相关。
6月1日,快手自研的视觉生成大模型——可灵AI V1.6正式开放API,这一版本在生成质量与内容效果上都有显著提升,特别是在广告视频素材生成方面表现出色,能够更精准地响应复杂的文字描述,包括运动、时序类动作以及运镜等复杂需求。
作为上海AI领域的独角兽企业,MiniMax在6月以密集的"技术发布周"形式,在基座模型、多模态技术及智能体应用层面实现了全面突破。
6月17日,MiniMax以"技术发布周"的开篇之作,正式推出了其自主研发的MiniMax-M1系列模型。MiniMax-M1被定位为"全球首个开源大规模混合架构推理模型",其核心创新在于采用了"闪电注意力"(Lightning Attention)混合架构与创新的CISPO强化学习算法,旨在大幅提升大规模语言模型的推理效率与成本效益。
紧随M1发布之后,6月18日,MiniMax推出了其新一代视频生成模型Hailuo-02,这一发布在多模态领域投下了一颗更具视觉冲击力的"炸弹"5。Hailuo-02采用创新的"Noise-aware Compute Redistribution(NCR)"架构,在将模型参数和训练数据量分别提升3倍和4倍的同时,实现了2.5倍的效率飞跃。
同时,AI独角兽稀宇科技(MiniMax)正考虑在香港进行首次公开募股(IPO)。据MiniMax的知情人士表示,MiniMax内部确实有类似想法,但目前仍处于初步筹备阶段。
6月19日,MiniMax上线其通用智能体产品——MiniMax Agent。这款AI Agent以其在长程复杂任务处理上的技术突破和"像靠谱队友一样"的超强交付能力,旨在将人工智能从"解放大脑"的聊天机器人,带入"解放手脚"的生产力。据内部测试,在网页开发、深度调研等垂直领域,MiniMax Agent已经能够替代一位专业人士长达一周的工作量。
6月21日,MiniMax持续推出了音色设计产品Voice Design,进一步完善了其多模态AI产品线。这一产品专注于声音特性的定制与生成,为AI音频内容创作提供了专业工具。
MiniMax的技术发布周后,公司对这一系列密集发布进行了总结。MiniMax表示,在当下全球AI竞赛进入"下半场"的关键节点,此次一系列密集发布不仅是对公司技术积累的集中展示,更为行业发展路径和竞争格局注入了全新的、颠覆性的变量。
6月17日,月之暗面发布首款面向软件工程任务的开源代码大模型Kimi-Dev-72B,基于720亿参数的Qwen2.5-72B模型训练,采用大规模强化学习方式优化,在SWE-bench Verified基准上实现60.4%准确率,超越DeepSeek等模型。而且,6月20日晚,月之暗面发布首个Agent,宣布小范围内测Kimi-Researcher(深度研究)。
该智能体被定位为"全球首个基于端到端自主强化学习的深度研究智能体",其核心创新在于采用了创新的"零结构设计"和"自主决策机制",完全依靠自主决策能力在动态环境中运行。
此前,智能体技术主要掌握在OpenAI、Anthropic等少数国际公司手中,而月之暗面的突破使中国企业在这一前沿领域占据了重要一席。
6月12日,阶跃星辰的Tech Fellow段楠已经离职,并将加入京东探索研究院,担任视觉与多模态实验室负责人。段楠在阶跃星辰的公开身份是视频生成模型负责人,后期以Tech Fellow的头衔出现。他的加入标志着京东在AI领域引进的又一位重磅技术专家。
此外,阶跃星辰在去年末对角色扮演类agent产品“冒泡鸭”停止了大范围投入,原团队合并至对话产品“跃问”(现更名为“阶跃AI”),仅留部分员工运维。这些变动反映了阶跃星辰正在调整其战略方向,从多元化应用探索回归到技术核心竞争力的打造。
6月30日,云知声智能科技股份有限公司(以下简称“云知声”)于香港联合交易所主板挂牌上市,股份代号:09678.HK。
云知声成立于2012年,2015年启动自研芯片,2018年推出边缘交互式AI芯片UniOne系列,目前形成了Atlas AI基础设施、云知大脑、AI应用解决方案构成的技术栈。其招股书显示,2022年云知声已经提供1300万颗消费级AI芯片,并通过NPUIP授权将其车用芯片商业化。
上市前,云知声共完成11轮融资,并于2023年拿下7亿元D3融资,估值达到约90亿元。招股书显示,云知声的股东阵容包括京东、360、高通、启明创投、中网投等,此次上市,还引入商汤科技作为基石投资者。
6月20日,云知声智能科技股份有限公司(以下简称“云知声”)开启招股、至25日结束,并计划于2025年6月30日正式以“9678”为股票代码在港交所主板挂牌上市。这意味着,云知声即将正式成为“港股AGI第一股”。
云知声计划在本次IPO中发行1,560,980股H股。其中,香港公开发售156,100股H股,国际发售1,404,880股H股。以每股165港元至205港元的招股区间计算,云知声将至多通过本次发行募集3.2亿港元,IPO市值将介于117亿港元至145亿港元。
值得注意的是,云知声本次共引入3名基石投资者,累计认购约9550万港元——其中,商汤认购约4370万港元、臻一资管认购3000万港元、润建股份(002929.SZ)认购2000万元人民币。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App