首页 > 3D标签Reasoning 相关文章
OpenAI员工批评xAI Grok 3基准测试误导性:测试结果引发激烈争议

OpenAI员工批评xAI Grok 3基准测试误导性:测试结果引发激烈争议

OpenAI的一名员工近日公开指责埃隆·马斯克旗下的xAI公司发布的最新AI模型Grok 3在基准测试中的结果存在误导性。此指责引发了两家公司的激烈争论。xAI在其官方博客中发布了一张图表,显示Grok 3的两个版本——Grok 3 Reasoning Beta和Grok 3 mini Reasoning——在AIME 2025(2025年高难度数学考试)上的表现超越了OpenAI的最强可用模型o...