【財新網(wǎng)】全球大模型仍在競速跑。當(dāng)?shù)貢r間7月9日晚,馬斯克旗下AI公司xAI發(fā)布最新一代大模型Grok 4和Grok 4 Heavy,其中Grok 4為單智能體版,消費者可花30美元/月訂閱體驗;Grok 4 Heavy為多智能體版,訂閱費用高達300美元/月。
馬斯克以“人類最后的測試”(Humanity’s Last Exam)為標準,發(fā)現(xiàn)在不使用工具的情況下,Grok 4的分值為25.4%,高于谷歌最先進的Gemini 2.5 Pro(21.6%),也高于OpenAI的o3大模型(21%)。如果讓大模型調(diào)用工具,Grok 4的分值達34.6%,Grok 4 Heavy的分值達44.4%?!叭祟愖詈蟮臏y試”難度很高,包括了2500個極其困難的學(xué)術(shù)問題,涉及一百多個學(xué)科。



















京公網(wǎng)安備 11010502034662號 