IT之家 1 月 27 日消息,《华盛顿邮报》科技专栏作家 Geoffrey A. Fowler 测试 OpenAI 最新上线的 ChatGPT Health 功能,导入其十年积累的 Apple Watch 数据(含 2900 万步记录和 600 万次心跳测量),结果被错误判定心脏健康为“不及格”(F)。
Fowler 感到恐慌并立即联系了医生。医生在详细检查后,断然否定了 AI 的诊断,指出 Fowler 的心脏病发作风险极低,甚至无需进行额外的有氧适能测试来证伪 AI 的结论。
深入分析显示,ChatGPT 的误判主要源于误读数据性质。Fowler 指出,AI 将 Apple Watch 记录的 VO2 max(最大摄氧量)视为绝对精准的医疗数据,并据此给出了负面评价。实际上,苹果官方明确说明该数据仅为“估算值”,主要用于追踪趋势而非临床诊断。
此外,Fowler 更换新款 Apple Watch 后,因传感器升级导致的静息心率基准变化,也被 AI 错误地解读为生理机能的实质性改变,完全忽略了硬件迭代这一关键变量。
除了误读数据,ChatGPT Health 反馈结果还存在不稳定情况,当 Fowler 重复询问同一健康问题时,AI 的评分竟在“F”到“B”之间剧烈摇摆。IT之家附上相关截图如下:
更严重的是,该系统表现出明显的“健忘症”和逻辑断层,在对话中多次遗忘用户的性别、年龄等基础信息,甚至在拥有近期血液检测报告的情况下,分析时却选择性忽略这些关键的临床证据。返回搜狐,查看更多
{dede:pagebreak/}
入门rust是读rust语言圣经好还是读微软的教程好?
go 有哪些成熟点的后台管理框架?
什么是Android逆向?如何学习安卓逆向?
如何看待贾玲、沙溢、贾冰、杨天真、范湉湉均瘦身成功?为什么明星想瘦就瘦普通人却很难?
男的真的会把所有衣服从上到下都扔洗衣机吗?
雷军为什么不愿意用性价比打法进军NAS?
如何判断鱼缸中的硝化系统是否已经成功建立?
有没有哪个明星刚出道长得很残,但很快就变美了的(排除整容)?
如何看待大学里面怀孕的女生?
如何激活 PyCharm 专业版?
如今的Intel为什么连AMD都打不过?
为什么有的女生喜欢穿紧身牛仔裤?
如何评价《机动战士高达GQuuuuuuX》第十二集?
当初中俄为什么不摧毁朝鲜的核设施,让朝鲜拥有了自己的核武器?
苹果 macOS Tahoe 26 新 Finder 图标引争议,其争议点主要集中在哪些方面?
为什么hdmi2.1带宽优于dp1.4,还是会推荐dp?