得分_3D标签 - 大屏时代

OpenAI o1-preview 在复杂医疗病例诊断中超越医生，研究显示其优越性

2024年12月25日，AIbase基地报道 —— 一项由哈佛医学院与斯坦福大学联合进行的最新研究表明，OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗病例方面，可能优于人类医生。研究显示，o1-preview 在多个医疗测试中表现出色，其诊断准确率远超人类医生，尤其在复杂病例的推理和决策方面。o1-preview 超越医生：诊断准确率显著提高这项研究的重点是 o1-previe...

OpenAI员工批评xAI Grok 3基准测试误导性：测试结果引发激烈争议

OpenAI的一名员工近日公开指责埃隆·马斯克旗下的xAI公司发布的最新AI模型Grok 3在基准测试中的结果存在误导性。此指责引发了两家公司的激烈争论。xAI在其官方博客中发布了一张图表，显示Grok 3的两个版本——Grok 3 Reasoning Beta和Grok 3 mini Reasoning——在AIME 2025（2025年高难度数学考试）上的表现超越了OpenAI的最强可用模型o...

首页 1 尾页