整个4月份开始,大模型版本更新感觉就没有停过
不知道最后谁能胜出呢

我觉得当各个模型的能力都达到某一个水平线之后,用户的注意力就会从挑选“最好最聪明的模型”转移到 harness engineering:设置 spec 和约束,不仅让模型高效的工作,还要尽可能少的出错。

Gemini很久没有上新了

我觉得还得要稳定,一个24小时可以稳定运行中上模型,要比一个时不时超时的顶尖模型好很多,毕竟现在模型都很厉害了,要让他们解决的工作也是一些机械重复的基础工作

到了 GLM-5.1 的水平,比较影响编程体验的就不是模型能力了,而是价格和速度

尤其是速度,有一天梯子不好用,想着是个小问题,用 trae 应急用一下,排队 2000 多位,瞬间无语