两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
在大型项目上,J***aScript 是个烂语言吗?
俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
你理想中的完美户型长什么样?
为什么程序员独爱用Mac进行编程?
为什么现在键盘轴体不用颜色命名了,全是些莫名其妙的名字,看不懂到底是什么?
独立开发***能盈利吗?感觉好累...
postgresql能取代mongodb吗?
如何看待土耳其“可汗”第五代战斗机完成首飞?
长期使用的大佬来说说,MacOS 真的比 Windows 稳定吗?
请问27寸4K显示器哪个好呀?
学编程要不要买电脑?
特厨隋坡探店成都快餐店,给出80分以上的高分,为什么评分远高于大饭店?
中国与敌国发生战争,哪些国家会帮中国?
如何评价 Next.js?
《西西里美丽传说》女主角,在当时打扮这么高调,不觉得带给自己很多不便吗?如何理解她的心态?
谷歌云服务宕机导致 OpenAI、Shopify 等服务中断,此次宕机的具体技术原因是什么?