Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. С молотка снова пытались продать имущество Виктора Бабарико — чем закончился аукцион
  2. Создатель «Ждановичей» прошел клиническую смерть, наезды государства и тюрьму, но рынок все еще живет. Рассказываем его историю
  3. Горнолыжный комплекс «Логойск» закрывается
  4. Что за ЧП произошло в Гродненском районе? «Зеркало» узнало подробности — есть пострадавший
  5. Четыре области подняли цены на проезд в общественном транспорте
  6. Лукашенко поручил выпустить литовские фуры из Беларуси
  7. Российские автопоставщики нашли лазейку, которая помогает сильно сэкономить на покупке авто из ЕС. Схема работает через Беларусь
  8. «Прям над домом кружил и улетел». В разных концах страны беларусы слышали «жужжащий звук»
  9. В Украине задержали беларусского добровольца — бывшего калиновца
  10. Узнали, что за девушка присутствует на переговорах Коула и Лукашенко
  11. «Так утвердили». Для абитуриентов-2026 во всех медвузах страны отменили платное обучение на врачей
  12. Власти определили три района для ядерного могильника. В одном люди такого соседства не хотят
  13. В Минске расширят и продлят несколько улиц
  14. Доллар быстро дорожает: как долго он продержится выше трех рублей? Прогноз курса валют


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.