两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
如何看待国内开源项目的不可持续性?
mac安装homebrew失败怎么办?
独立开发***能盈利吗?感觉好累...
为什么成功人士的精力都非常旺盛?
为什么感觉德国在中国的名声比英法美日好一点?
长期使用的大佬来说说,MacOS 真的比 Windows 稳定吗?
图数据库有哪些有点特点,如何选择图数据库?
女婿不喜欢去丈母娘家的原因是什么?
女生被踢裆也会很疼吗?
显示器选32还是27,2k还是4k?
当初中俄为什么不摧毁朝鲜的核设施,让朝鲜拥有了自己的核武器?
对方酒驾,我们提出私了要了3.5W,会被认为敲诈勒索吗?
你们的腰突是怎么突然好的?
为什么新流行的开源编辑器都在用Rust开发?
只用321原则备份家用Nas 数据而不组建raid阵列的人,不怕哪天备份全部同时损坏导致无法恢复吗?
不结婚,不生孩子,老了怎么办?