基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传

量子位

  ·  

2025-05-29 07:00:22

  ·  

1次阅读

当模型被明确要求生成特定长度的文本时,大多数模型表现糟糕