埃隆·馬斯克的人工智能初創公司xAI推出了其聊天機器人Grok-2的最新版本。它宣布,新的人工智能助手的測試模式將面向付費X用戶(以前是推特)。
xAI于8月13日向公眾發布了Grok-2。它宣傳其最新的人工智能模型是4月份發布的Grok 1.5版本的改進版本。新模型有兩個大型語言模型(LLM)版本:Grok-2和功能較弱的Grok-2 mini。
最新版本是xAI聊天機器人自2023年11月發布Grok-1以來的第三次迭代。該公司將此次發布描述為對其前身的重大改進。
獨立評論對Grok-2、ChatGPT-4o和Gemini 1.5 pro的比較結果喜憂參半。該比較由Chatbot Arena完成,這是一個評估大型模型系統組織(LMSYS Org)創建的LLM的平臺
Grok 2對競爭對手的排名(來源:xAI)根據LMSYS組織的說法,Grok-2在某些方面與GPT-4o相匹配,在編碼、數學和硬提示方面表現出色。然而,它在所有人工智能功能中排名第三,低于GPT-4o和Gemini 1.5。
沃頓商學院教授Ethan Mollick也承認Grok-2的能力,但他指出,沒有任何人工智能模型能超越OpenAI的GPT-4。他說:
“現在有五種GPT-4級型號:GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1和現在的Grok 2。所有實驗室都表示,還有繼續大幅改進的空間,但我們還沒有看到任何模型真正超越GPT-4......”
新的聊天機器人目前僅供X Premium和Premium+用戶使用。然而,這家初創公司計劃在8月底之前向開發人員提供其應用程序編程接口(API)。
Grok-2版本的一個顯著改進是生成圖像的能力。與Midjouney和DALL-E等其他AI圖像生成器相比,它對生成的圖像的限制更少。用戶已經用它來創建政治主題的圖像。
生成圖像的能力有助于Grok-2與其他聊天機器人進行比較,因為幾乎所有頂級模型,如OpenAI的ChatGPT、Google Gemini和Meta的Llama,都可以創建圖像。馬斯克甚至轉發了Grok根據提示生成喬治·華盛頓肖像的截圖。