两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
你和你老婆是怎么认识的?
在职场中,分屏显示器有什么选购技巧?
postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢?
国产手机APP为什么越来越臃肿?
俗话说“女人三十如狼四十如虎”,到底是不是真的??
你最真实(很少吐露)的择偶标准是什么?
Python+rust会是一个强大的组合吗?
微软edge浏览器为什么逐渐被其他的浏览器代替?
服务器能否拒绝非浏览器发起的HTTP请求?
伊朗到底有没有击落以色列的F35?
有邻居的追求者出价三万,让我连续半个月每天找个女朋友晚上弄点动静,我该答应吗?
go 有哪些成熟点的后台管理框架?
字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平?
Office和WPS哪个好用些?
公立医生帮联系民营救护车,800 公里收费 2.8 万元,收费合理吗?救护车收费标准是什么?
鸿蒙是换皮安卓吗?