两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
{dede:pagebreak/}
如何评价网易新单机游戏作品《归唐》的首发 PV ?
为什么***骂 Ubuntu,但是 Ubuntu 一直是所有 Linux 发行版中知名度、热度最高的?
Nginx 能做什么好玩的事情?
印度是真的烂还是咱们在信息茧房里面?
为什么现在年轻人越来越讨厌相亲?
为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要?
Node.js是谁发明的?
评价一下Proxmox VE与ESXi的优劣?
洲际导弹能打到任何地方,为什么还需要轰炸机?
有一个***约你出去,你会去吗?
黑龙江地区人口下降为何比俄罗斯远东远东联邦还快?
vscode 是盈利的吗?微软为什么要持续投入开发***?
Electron是否有作为游戏引擎的潜力?
腰陆陆续续疼了一年多了,这个是腰突吗?
如何看待多地开展查摆年轻干部玩心重、贪图享乐、说话随意、社会交往复杂、生活不检点等问题的行动?
如何评价MiniMax开源首个视觉RL统一框架V-Triune,实现推理感知一肩挑,其技术上有何优势?