OpenAI员工公开指责Grok3的基准测试结果具有误导性

时间：2025年02月23日 11:11

比特之家 2月23日消息，据金十报道，近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

本分分类： 快讯

马斯克：Grok语音模式、记忆功能等多项改进即将推出

数据：34,862 ETH从未知钱包转移到Bybit，价值超9500万美元

币种	价格	涨跌幅
BTC 比特币	$109527	0.34%
ETH 以太坊	$4000.92	0.43%
USDT 泰达币	$1	-0%
XRP 瑞波币	$2.78	0.2%
BNB 币安币	$966.97	-0.1%
SOL Solana	$201.27	0.31%
USDC USDC	$0.999653	-0%
STETH Lido Staked Ether	$3998.69	0.42%
DOGE 狗狗币	$0.226679	-1.04%
TRX 波场	$0.336339	0.07%
ADA 艾达币	$0.768905	-1.16%
WSTETH Wrapped stETH	$4857.38	0.38%
USDE Ethena USDe	$1	0.02%
LINK Chainlink	$20.59	-1.43%
WBETH Wrapped Beacon ETH	$4339.94	-3.66%

OpenAI员工公开指责Grok3的基准测试结果具有误导性

币安APP

OKX欧易app