Два студента уволились с работы на Илона Маска и создали ИИ, который превзошел модели OpenAI и Anthropic

Два года назад Илон Маск предложил двум 22-летним студентам контракт на миллион долларов, чтобы привлечь их в свою компанию xAI. Уильям Чен и Гуань Ван, друзья еще со школьной скамьи в Мичигане, сделали то, что большинство назвало бы безумием: они отказались от денег самого богатого человека в мире.

► Подписывайтесь на Telegram-канал Минфина: главные финансовые новости

Вместо того чтобы работать на технологического гиганта, они решили пойти своим путем и создать искусственный интеллект, работающий по принципу человеческого мозга. И теперь их стартап Sapient Intelligence показывает результаты, превосходящие модели OpenAI и Anthropic в тестах на абстрактное мышление. Об этом пишет Фортуна.

OpenChat: первый успех и письмо Маска

Все началось в лаборатории мозга Университета Цинхуа в Пекине. Чен и Ван создали OpenChat — небольшую языковую модель, обученную не на гигантских наборах данных из Интернета, а на небольшом, тщательно отобранном наборе диалогов высокого качества. Ключевой особенностью стало использование обучения с подкреплением (RL), при котором система учится на собственных ошибках, как живое существо.

Их проект «взорвался» в научных кругах, доказав, что качество данных важнее их количества. Именно тогда им поступило предложение от Маска, который искал таланты для xAI.

«Мы решили, что у больших языковых моделей есть свои ограничения. Нам нужна была новая архитектура, которая преодолеет структурные ограничения крупномасштабного машинного обучения», — объяснил Чен причину отказа.

HRM: Прорыв в 3 часа ночи

Ребята считали, что путь к настоящему искусственному интеллекту (AGI) лежит не через увеличение размеров моделей, а через изменение их архитектуры. Так родилась модель HRM (модель иерархического рассуждения).

Прорыв произошел в июне 2024 года. В 3 часа ночи Чен и Ван увидели результаты испытаний своего экспериментального прототипа. Крохотная модель с 27 миллионами параметров (это микроскопический размер по сравнению с GPT-4) обошла гигантов индустрии в логических задачах:

Решение сложных судоку (Судоку-Экстрим).

Нашел оптимальные пути в лабиринтах 30х30.

Показал впечатляющие результаты в бенчмарке ARC-AGI.

Как это работает: Думать, а не гадать

В отличие от преобразователей (архитектура GPT), которые просто предсказывают следующее слово на основе статистики, HRM имитирует работу человеческого мозга. Он имеет двухуровневую структуру, сочетающую «медленное» глубокое мышление с «быстрыми» рефлекторными реакциями.

«Это не догадка. Это образ мышления», — говорит Чен.

По его словам, их модель гораздо реже «галлюцинирует» (выдумывает факты) и уже показывает самые современные результаты в прогнозировании погоды, торговле и медицине.

Будущее разумного

Сейчас основатели готовятся открыть офис в США и привлечь новое финансирование. Их главный тезис остается радикальным: AGI (общий интеллект, подобный человеческому) нельзя создать, просто добавив больше вычислительной мощности к старым моделям. Будущее основано на эффективных, «мозгоподобных» архитектурах.

Почему это важно?

История Чена и Ванга развенчивает миф о том, что для создания революционного искусственного интеллекта требуются миллиарды долларов и центры обработки данных размером с целый город. Она доказывает, что в эпоху гигантов (Google, OpenAI, Microsoft) еще есть место «гаражным» инновациям, если они основаны на гениальной идее, а не на грубой вычислительной мощности.