Google презентует обновленный Gemini 3 Deep Think, который обходит конкурентов и открывает новые горизонты в науке и фармацевтике

Google анонсировала обновление режима рассуждений под названием Gemini 3 Deep Think. Этот инструмент предназначен для решения комплексных задач в науке и инженерии.

В ходе тестирования модель показала более высокие результаты, чем GPT-5.2 от OpenAI и Claude Opus 4.6 от Anthropic, успешно справившись с заданиями из ARC-AGI-2, включающими визуальные головоломки, а также с оценкой мультимодальных возможностей в MMMU-Pro, Elo 3455 и «Последним экзаменом человечества».

В блоге компании отмечается: «Обновление Gemini 3 Deep Think было реализовано в сотрудничестве с учеными и исследователями для решения комплексных научных задач, которые часто не имеют четких границ или единственного правильного ответа, а также предполагают неполные данные».

Gemini 3 Deep Think демонстрирует выдающиеся результаты в математике и программировании, а также «отлично» работает в естественных науках, таких как химия и физика. Модель способна решать задачи на уровне золотых медалистов международных олимпиад.

В тесте CMT-Benchmark она продемонстрировала 50,5%, что подтверждает ее глубокие знания в теоретической физике.

Согласно заявлению Google, «помимо впечатляющих показателей, Deep Think также ориентирован на практическое применение: он помогает исследователям в интерпретации сложных данных и поддерживает инженеров в моделировании физических систем через код».

Новый Deep Think доступен для подписчиков Google AI Ultra в приложении Gemini и через API для избранных разработчиков.

Подразделение Google DeepMind представило ИИ-агента по имени Aletheia, который установил рекорд в бенчмарке IMO-ProofBench Advanced, решив 91,9% задач. Этот тест считается одним из самых сложных в области математики.

Нейросеть основана на Gemini Deep Think и оснащена модулем верификации, который выявляет ошибки в начальных версиях решений и инициирует процесс их улучшения.

Главное преимущество Aletheia заключается в способности признавать невозможность решения задачи, что значительно экономит время исследователей.

Aletheia использует Google Search для работы с сложными научными материалами, уменьшая вероятность использования ложных ссылок и вычислительных ошибок.

Среди достижений этой модели можно выделить:

В DeepMind подчеркивают, что успех Aletheia подтверждает релевантность законов масштабирования: в доказательной математике качество действительно улучшается благодаря эффективному использованию агентов.

Дочерняя компания DeepMind — Isomorphic Labs представила движок IsoDDE для разработки новых лекарственных препаратов. В сложных испытаниях эта новинка превзошла AlphaFold 3 по точности предсказаний вдвое.

AlphaFold 3 стал значительным достижением, будучи способным предсказывать трехмерные структуры белков и их взаимодействия с молекулами. IsoDDE же предлагает совершенно новый уровень возможностей:

«IsoDDE предоставляет масштабируемую платформу для ИИ-дизайна лекарств, обеспечивая необходимую для работы с новыми биологическими системами точность предсказаний на беспрецедентном уровне», — заявляют в блоге компании.

Напомним, что в июле 2022 года алгоритм AlphaFold предсказал структуры более 200 миллионов белков, что почти соответствует всем известным науке соединениям, найденным в растениях, бактериях и животных.