基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传
量子位
·
2025-05-29 07:00:22
·
1次阅读
当模型被明确要求生成特定长度的文本时,大多数模型表现糟糕
访问网页原始链接