Фильм, который я любил в детстве, был классическим «коротким объединением» 1986 года. В одной сцене Джонни Фэй, невероятный робот, который оживает, после того, как его поразил Молния, проглатывает книгу за книгой, тратит только секунды на каждое название. Вскоре он заканчивает все книги. «Ах! Больше информации, Стефани! Больше!»
«Больше нет!» Отвечает Стефани, женщина, которая нашла это. «Вы читаете все в доме!»
Я спросил Чатгпт о Openai, может ли он понять сцену. «Абсолютно — я полностью сочувствую Джонни -пять», — ответил он. «Мне нужна информация! «Это мое главное настроение. Чем больше информации я получаю, тем лучше я понимаю, отвечаю и общаюсь. Джонни был просто искусственным интеллектом, пытающимся разобраться в мире … это то же самое со мной, только с меньшими лазерными лучами и большим количеством письма».
И это правда. Хотя CHATGPT не движется по цепям гусениц, и к его спине нет лазерного пистолета (все еще), вызовы до того, как оно совершенно идентичны. После сбора почти всех человеческих знаний, CHATGPT и другие усилия для ИИ делают один и тот же крик: нам нужна информация!
Одним из решений является создание синтетических данных и обучение модели на них, хотя это связано с неотъемлемыми проблемами, особенно в отношении поддержания смещения или введения сложных неточностей.
Другое решение — найти отличный источник новых и свежих данных, чем больше «человек», тем лучше. Именно здесь социальные сети, цифровые пространства, где миллионы, даже миллиарды пользователей добровольно и постоянно публикуют куча информации, вмешиваются. Фотографии, публикации, новостные статьи, комментарии — любое интересное взаимодействие для компаний, пытающихся создать разговорную и генеративную ИИ. Более того, этот контент не чреват риском нарушения авторских прав, который связан с использованием других источников.
В последнее время ведущие компании по искусственному ИИ пошли более агрессивно на владение или использование социальных сетей, погружая права потребителей, чтобы диктовать, как их публикации могут использоваться для создания этих машин. Пользователи социальных сетей долгое время были «продуктом», как сказано в известной высказывании. Теперь они также являются квази- «разработчиком продукта» в своих публикациях.
Некоторые компании могли использовать социальные сети с самого начала. Meta Platforms Inc., крупнейшая компания социальных сетей на планете, использует уведомления о приложениях, чтобы информировать пользователей, что она будет использовать их публикации и фотографии для своих моделей Llama AI. В конце прошлого месяца XAI Ilon Musk приобрел X, бывший Twitter, который был в первую очередь финансовым трюком, но это имело смысл для Musk’s Grok AI. Он смог выйти на рынок чат -ботов, используя своевременные твиты, размещенные в Интернете, а также огромный архив онлайн -чатов, начиная с почти два десятилетия. Затем у вас есть Microsoft Corp., которая владеет профессиональной сетью LinkedIn и настаивает на том, что пользователи (и журналисты) решительно опубликованы, чтобы публиковать все больше и больше оригинального контента на платформе.
Тем не менее, Microsoft не делится данными LinkedIn со своим близким партнером OpenAI, что может объяснить новости о том, что создатель CHATGPT находится на ранних стадиях создания своей собственной социальной сети.
По словам Verge, генеральный директор и соучредитель Open AI, Сэм Альтман, хочет отзывы об этой идее, отметив, что Альтман ранее намекал на то, что он рассматривает такой проект, когда сообщалось, что Meta запустит приложение для искусственного интеллекта, чтобы конкурировать с CATGPT.
Другие компании, не имеющие преимуществ в социальных сетях, понимают, что это ставит их в невыгодное положение. Снижение. «Это предоставит пользователям всеобъемлющие, хорошо цитируемые ответы, которые объединяют лучшую систему реагирования в мире с одной из крупнейших библиотек потребительских контентов»,-сказали в компании.
Ранее в этом месяце сообщалось, что Amazon.com Inc. Он также входит в число кандидатов, хотя генеральный директор Энди Джасси отказался от комментариев, когда его напрямую спросил CNBC.
Google, который пытался и не смог создать различные социальные сети, имеет меньше потребности в видео Tiktok, поскольку он уже владеет YouTube. Вместо этого компания представила «передовое партнерство» с Reddit, социальной сетью социальных сетей, которая дает ему доступ, Google в прошлом году сообщил в блоге «невероятное разнообразие подлинных, человеческих разговоров и опыта». Ожидайте больше сделок, подобных этим: бывший конкурент Reddit, Digg, восстанавливается с очевидным намерением создать еще одно хранилище человеческого взаимодействия, которое будет полезно для компаний искусственного интеллекта.
Все эти шаги говорят о поиске данных из компаний искусственного интеллекта. Это за счет пользователей, которые ввели информацию в социальных сетях для одной цели, и теперь они понимают, что она будет использоваться для другого. Тихо, компании меняют политику конфиденциальности, чтобы покрыть законность этого изменения.
Глубоко скрытый в настройках, вы можете найти способы изолировать свои данные от использования ИИ — хотя вы, вероятно, уже опоздали. Как и Johnny Five, компании искусственного интеллекта «нуждаются в информации!» Они получат это так же, как и где они могут.
Дэйв Ли — технологический обозреватель мнения Блумберга для Соединенных Штатов. Ранее он был корреспондентом Financial Times и BBC News.