2024年12月25日,AIbase基地报道 —— 一项由哈佛医学院与斯坦福大学联合进行的最新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗病例方面,可能优于人类医生。研究显示,o1-preview 在多个医疗测试中表现出色,其诊断准确率远超人类医生,尤其在复杂病例的推理和决策方面。o1-preview 超越医生:诊断准确率显著提高这项研究的重点是 o1-previe...
OpenAI的一名员工近日公开指责埃隆·马斯克旗下的xAI公司发布的最新AI模型Grok 3在基准测试中的结果存在误导性。此指责引发了两家公司的激烈争论。xAI在其官方博客中发布了一张图表,显示Grok 3的两个版本——Grok 3 Reasoning Beta和Grok 3 mini Reasoning——在AIME 2025(2025年高难度数学考试)上的表现超越了OpenAI的最强可用模型o...