По данным знакомых, в Китае использовались процессоры, производимые в Китае для разработки методов обучения искусственного интеллекта, которые сократят стоимость на 20%.
ANT использовал местные чипсы, в том числе Alibaba Group Holding Ltd. и Huawei Technologies Co. для обучения моделей через SO -название. Смесь экспертов (MOE) Метод машинного обучения, утверждают они. По их словам, результаты, аналогичные результатам в чипах Nvidia Corp H800
Ant, основанный на Hangzhou, продолжает использовать NVIDIA для развития искусственного интеллекта, но в настоящее время опирается в основном на альтернативы, включая Advanced Micro Devices Inc. и китайские чипы для своих последних моделей, отмечает один из людей.
Модели отмечают вход ANT в гонку между китайскими и американскими компаниями, которая ускорилась после DeepSeek, показала, как эффективные модели могут быть обучены гораздо меньше денег, чем миллиарды, инвестированные OpenAI и Google. Это подчеркивает, как китайские компании пытаются использовать местные альтернативы новейшим процессорам Nvidia. Несмотря на то, что H800 не является самым сложным, является относительно мощным процессором и в настоящее время запрещен Соединенными Штатами за импорт в Китае.
В этом месяце компания публикует научное исследование, утверждающее, что ее модели иногда превышают Meta Platforms Inc. В некоторых показателях Bloomberg News не проверялась самостоятельно. Однако, если они работают, как объявлено, платформы ANT могут отметить еще один шаг вперед в разработке искусственного интеллекта в Китае, снизив стоимость создания или обслуживания услуг ИИ.
Поскольку компании вкладывают значительные деньги в искусственный интеллект, модели на основе MOE являются популярным вариантом, который получил признание благодаря использованию Google и Deep. Этот метод делит задачи на более мелкие наборы данных, очень похожие на наличие команды специалистов, каждый из которых фокусируется на сегменте работы, что делает процесс более эффективным. ANT отказался комментировать отправленную электронную почту.
Тем не менее, обучение моделей MOE обычно опирается на мощные чипы, такие как графические процессоры, которые продает Nvidia. До настоящего времени их цена была невозможна для многих небольших компаний и ограничивала их более широкую реализацию. ANT работает в способах изучения более эффективных языковых моделей и устранить это ограничение. Название документа ясно показывает это, так как компания стремится просмотреть модель «без первых графических процессоров».
Это противоречит концепции Нвидии. Главный генеральный директор Дженсон Хуан утверждает, что поиск вычислительной власти будет расти даже с появлением более эффективных моделей, таких как DeepSeek R1, указывая на то, что компаниям потребуется лучшие чипы, чтобы получить больший доход, а не более дешевый, чтобы снизить их затраты. Он придерживается стратегии создания больших графических процессоров с большим количеством ядер процессоров, транзисторов и повышенной способностью памяти.
Что говорит интеллект Bloomberg:
В документе Ant Group фокусируется рост инноваций и ускорение технологического прогресса в области искусственного интеллекта в Китае. Если претензии компании подтверждены, они показывают, что Китай собирается стать самодостаточным в области искусственного интеллекта, поскольку страна направлена на более дешевые и более вычислительные модели, чтобы обойти контроль над чипами NVIDIA.
— Роберт Лиа, старший аналитик BI
Муравей указывает, что тренировка 1 триллиона. Tokena стоит около 6,35 млн. Юаней (880 000 долл. США), если используется высокопроизводительное оборудование, но его оптимизированный подход уменьшит эту сумму до 5,1 млн. Долл. США (700 000 долл. США), если будет использовано оборудование для более низкой производительности. Токены — это информационные единицы, которые модель принимает, чтобы узнать мир и предоставить полезные ответы на запросы пользователей.
В этом году ANT приобрела китайскую платформу HAODF.com для расширения своих искусственных медицинских услуг. В создании AI Assectant помогает 290 000 врачей HAODF в выполнении таких задач, как медицинские записи, говорится в отдельном заявлении в отдельном заявлении в понедельник.
Компания также подает заявку на «ассистента по жизни» с искусственным интеллектом под названием Zhixiaobao, а также услугу для финансовых консультаций с искусственным интеллектом Maxiaocai. Что касается понимания английского языка, в своем документе ANT указывает, что модель Ling-Lite добилась большего успеха в ключевом сравнении по сравнению с одной моделью LLA по сравнению с одной из моделей LLA. Модели Ling-Lite и Ling-Plus работали лучше, чем эквиваленты Deepseek в сравнительных тестах на понимание Китая.
«Если вы найдете даже одну точку атаки, чтобы победить лучшего мастера кунг-фу в мире, вы все равно можете сказать, что выиграли ее, поэтому применение в реальном мире важно»,-говорит Робин Ю, главный технологический директор из Пекинского Солт Сол Сол Сол Сол, Шеншанг Tech Co.
Ant сделал модели Ling с открытым исходным кодом. Ling-Lite содержит 16,8 миллиарда параметров, которые являются регулируемыми настройками, которые работают в качестве кнопок и циферблатов для руководства работой модели. Ling-Plus имеет 290 миллиардов параметров, что считается относительно большим объемом в сфере языковых моделей. Для сравнения, согласно обзору технологий MIT, эксперты считают, что CHATGPT GPT-4.5 имеет 1,8 триллиона. Параметры. DeepSeek-R1 имеет 671 миллиард параметров.
Компания столкнулась с проблемами в некоторых областях обучения, включая стабильность. Даже небольшие изменения в оборудовании или структуре модели приводят к проблемам, включая скачок в процентах ошибок модели, говорится в документе.
В понедельник ANT объявила, что он построил крупные машины с моделями здравоохранения, которые используются семью больницами и медицинскими поставщиками в таких городах, как Пекин и Шанхай. Большая модель использует DeepSeek R1, QWEN of Alibaba и собственную большую языковую модель ANT и может провести медицинские консультации, говорится в сообщении.
Компания также заявила, что запустила два агента искусственного интеллекта — Angel, который обслуживает более 1000 медицинских учреждений, и Yibaoer, который поддерживает услуги медицинского страхования. В сентябре прошлого года компания запустила Сервис управляющего AI Healthcare в рамках своего платежного приложения Alipay.