Bitget App
Торгуйте разумнее
Купить криптоРынкиТорговляФьючерсыКопитрейдингBotsEarn
Сотрудники OpenAI публично обвиняют результаты тестов производительности последней модели ИИ от xAI, Grok3, в введении в заблуждение

Сотрудники OpenAI публично обвиняют результаты тестов производительности последней модели ИИ от xAI, Grok3, в введении в заблуждение

Посмотреть оригинал
Bitget2025/02/23 03:37

Недавно сотрудник OpenAI публично обвинил компанию xAI Илона Маска в публикации вводящих в заблуждение результатов тестов для последней модели ИИ, Grok3. В ответ Игорь Бабушкин, соучредитель xAI, настаивал на том, что никаких нарушений не было.

График xAI показывает, что две версии Grok3 - Grok3 Reasoning Beta и Grok3 mini Reasoning - превзошли по производительности текущую самую сильную доступную модель OpenAI o3-mini-high на AIME 2025. Однако сотрудник OpenAI быстро указал на платформе X, что график xAI не включал оценку o3-mini-high при условии "cons@64" в AIME 2025.

На платформе X Бабушкин утверждал, что OpenAI также выпускала в прошлом аналогичные вводящие в заблуждение графики тестов. Несмотря на то, что эти графики использовались для сравнения производительности их собственных моделей.

0

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.
APR до 12%. Аирдропы новых токенов.
Внести!