当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
{dede:pagebreak/}
MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响?
以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
前端能否限制用户截图?
大海捞针还捞着了是一种什么样的体验?
央企的信创,是否有必要把 spring 替换成国产的 solon ?
瞒着家人在高位买了黄金怎么办?
四岁的女孩儿跳舞怕压腿,家长该坚持吗?
如何评价Cursor?
为什么国内程序员不喜欢写单元测试?
国密加密算法有多安全呢?
为什么欧美影视喜欢露点?
不用CDN就没事,用阿里云CDN就被攻击刷流量,阿里云表示证明不了就要用户买单,如何看到这种行为?
为什么部分人对《大明王朝 1566》中芸娘嗤之以鼻?
Apple 为什么不封杀 Flutter 呢?
女生真正的完美身材是什么样子?
如何看待b站出现有关小米的大量反向标题,号称“薅千亿补贴”的现象?