ChatGPT и Клод? Настоящая революция искусственного интеллекта происходит в другом месте

ChatGPT и Клод? Настоящая революция искусственного интеллекта происходит в другом месте

  • Крупные компании, такие как Nvidia, Alibaba и Tencent, уже инвестируют в эту технологию.
  • Реальные данные становятся ключевым ресурсом для систем обучения
  • Модели мира дают ИИ понимание физического мира, которого нет у чат-ботов
  • Китай может стать ведущим фактором в развитии физического ИИ

В то время как всеобщее внимание сосредоточено на мощных чат-ботах, таких как ЧатGPT и Клод, легко не заметить развитие другой области искусственного интеллекта: так называемых «моделей мира».

Эти системы могут понимать трехмерное пространство и физику, обеспечивая основу для всего: от роботов до умных очков и автономных автомобилей — и предлагают возможности, которых не хватает сегодняшним чат-ботам.

За последние две недели Nvidia Corp., Alibaba Group и Tencent Holdings Ltd. представили свои собственные модели мира, предполагая, что новая группа игроков может возглавить следующую революцию в области искусственного интеллекта.

Передовые компании следуют разным бизнес-стратегиям: HY-World 2.0 от Tencent имеет открытый исходный код, а модель Нвидиа предназначен только для исследователей — и Китай показывает, что он значительно меньше отстает, чем был, по основным языковым моделям.

Что такое модели мира?

Такие боты, как ChatGPT, могут создавать впечатление, что они понимают, как устроен физический мир, но на самом деле они являются опытными имитаторами, не имеющими реальной связи с материальным опытом или с идеей постоянства объекта — пониманием, которое люди развивают в младенчестве и что объект существует, даже если его нельзя увидеть.

Языковая модель может описать комнату элегантным языком, но если ее спросить, пролезет ли диван в дверь или где остановится мяч после отскока от стены, она полагается на текстовые модели, полученные в ходе тренировок, а не на реальное понимание физических сил, и может дать неправильный ответ. Модели мира призваны восполнить именно этот дефицит.

Реальные данные как новое топливо для искусственного интеллекта

Эти усилия постепенно набирают обороты благодаря ряду подходов и бизнес-моделей, использующих реальные данные, включая одну популярную игру десятилетней давности.

Покемон Гомобильное приложение, которое побудило миллионы людей направлять свои телефоны на местные кладбища и улицы, чтобы «охотиться на покемонов», накопило глобальную базу картографических данных, которой оно делится с такими компаниями, как Coco Robotics, чьи роботы-доставщики доставляют продукты в несколько городов США и Европы.

Создатель игры, компания Niantic Spatial, разрабатывает так называемую Большую геопространственную модель (LGM), конечными пользователями которой на практике будут роботы.

DoorDash, в свою очередь, платит своим курьерам за съемку таких действий, как складывание белья или мытье посуды, для сбора данных, которые они могут продать робототехническим компаниям для обучения систем.

Instacart же совместно с Nvidia разработала тележку для покупок, оснащенную датчиками и камерами, и цель — не обучение роботов, а сбор данных для рекламы и управления запасами.

По мнению некоторых ученых, такой подход к искусственному интеллекту является следующим ключевым шагом на пути к тому, чтобы дать машинам что-то, приближающееся к человеческому интеллекту, — цель, к которой OpenAI, Anthropic PBC и Alphabet Inc. через Google стремились в течение многих лет (Google DeepMind, которая разрабатывает чат-бот Geminiтакже инвестировала в глобальные модели со своим Genie 3.)

Представьте, например, что ChatGPT не только понимает язык, но и может водить машину или наливать чашку кофе. Результат будет напоминать андроида, как в фильме Айзека Азимова «Я, робот», или, более абстрактно, видеоигру, которая развивается вместе с пользователем, или систему промышленной автоматизации, например, для газовых турбин.

Среди компаний, излагающих это видение, — World Labs, стартап Стэнфордского университета, основанный Фей-Фей Ли, которую часто называют «крестной матерью искусственного интеллекта» за ее вклад в системы распознавания образов. В феврале компания объявила, что привлекла $1 млрд на раннем раунде финансирования.

Бизнес-модели все еще формируются

Базирующаяся в Сан-Франциско компания World Labs использует свою модель Marble для создания виртуальных миров и планирует искать клиентов в сфере игр, виртуальной реальности и обучения роботов.

Несмотря на инвестиции со стороны НвидиаAdvanced Micro Devices и Autodesk, путь к прибыли остается неясным. «Уолл-стрит, особенно инвесторы на поздней стадии, все еще ждут, пока технология достигнет зрелости и найдет реальное применение», — сказал Ли в интервью. Тем не менее, она сохраняет уверенность: «Я убеждена, что это так же важно, как и лингвистический интеллект».

Ли также делает ставку на синтетические данные как на ключевой элемент разработки моделей мира, поскольку, в отличие от языка, богатые трехмерные данные не так широко доступны в Интернете.

Другими словами, следующая волна ИИ может обучаться в первую очередь на контенте, созданном самим ИИ, а не только на реальных видеороликах — что само по себе является потенциальной бизнес-моделью.

В сегодняшнюю эпоху языковых моделей, вероятно, будет доминировать небольшая группа хорошо финансируемых лабораторий США с закрытыми, патентоспособными системами.

Однако глобальные модели формируются по-другому — с более широким спектром подходов, регионов и более открытыми моделями лицензирования, без четкого консенсуса о том, как эта технология будет монетизироваться.

Китай и будущее физического искусственного интеллекта

Китай может сыграть более важную роль в этой области. Согласно анализу Barclays, сильные позиции компании в сфере аппаратного обеспечения и производства помогли ей поставить от 85 до 90 процентов гуманоидных роботов в мире в прошлом году.

Если глобальные модели Китая станут стандартом обучения роботов, компании, которые будут формировать физическое ИИ в следующем десятилетии, возможно, не те, которые мы видим сегодня в новостях, и они могут быть далеки от Кремниевой долины.

Парми Олсон — технологический обозреватель Bloomberg. Бывший репортер Wall Street Journal и Forbes, она является автором книги «Совершенство: искусственный интеллект, ChatGPT и гонка за изменение мира».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *