Статья исследователей из хедж -фонда AQR Capital Management и Йельского университета обращается к одному из самых важных вопросов в финансах: будут ли человеческие исследователи и торговцы заменить искусственный интеллект и машинное обучение?
На 44 страницах с плотно написанной теорией и эмпирическими результатами, уполномоченный «Добродетель сложности в прогнозировании возвратов»,-Брайан Келли, Семон Маламуд и Кангин Яо утверждают, что более сложные модели немного сложны для обработки человеком из-за более простых моделей. Негативная реакция была быстрой, по крайней мере, шесть статей, бросая вызов выводам, которые впоследствии Келли защитаС
Как это будет развиваться? Бьюсь об заклад, Келли и его со -исследователи. Теоретические аргументы технически обескураживают, но главный вопрос — древний и легко понять.
Одним из подходов к прогнозированию является поиск нескольких ключевых показателей с четкой причиной и влиянием отношений с тем, что вы хотите предсказать, и комбинировать простыми способами. Чтобы предсказать, например, доходность на фондовом рынке в течение следующего месяца, вы можете посмотреть на доход за этот месяц, процентные ставки, коэффициенты цены и аналогичные переменные. Все остальное рассматривается как случайный шум, который следует игнорировать. Проблема с использованием слишком большого количества индикаторов или их слишком сложным образом сочетает их в себе «слишком много корректировки». Вы получаете модель, которая идеально объясняет прошлое, и будущее вообще не будет. Вы создали модель, которая в прошлом использовала шум, чтобы объяснить все, но эти шумовые соединения не будут сохранены в будущем.
Если вы заинтересованы в том, чтобы понять или объяснить вещи, простой подход выше, очевидно, является правильным путем. Но если вы заинтересованы только в прогнозировании, есть и другой способ: бросить каждый возможный индикатор в модель (технический термин — «кухонная раковина») и попробуйте каждую сложную комбинацию. Если «V» разделяет их символ тикера, как правило, поднимается в дождливых вторниках, это входит в вашу модель. Идея состоит в том, что даже если индикатор не имеет прогнозирующей ценности, он не вредит вашим прогнозам; Это просто добавляет шум. Вы можете включить все, а затем сильно уменьшить шум или торговлю, чтобы шум был диверсифицирован.
Дебаты, вызванные статьей, являются более ядерными, чем эта иллюстрация. Келли и остальные не включают в себя все возможные индикаторы в свою модель, но только 15 переменных с 12 ежемесячными значениями — в общей сложности 300, из которых они соответствуют 12 000 параметров для прогнозирования доходности фондового рынка в течение следующего месяца. Они не используют буквы в символах фондовой биржи или во вторник. Их противники не только спорят о самых простых моделях; Они просто отрицают, что сложность всегда является добродетелью.
Очень похожие дебаты состоялись полвека назад в контексте рулетки. В начале 1960 -х годов Эд Торп, профессор математики, который изобрел подсчет карт в Блэкджеке, и Клод Шеннон, отец теории информации, построил первый в мире, мы несем компьютер для прогнозирования рулетки. Предыдущая рулетка, побеждающая системы, опирающиеся на таблицу презентации прошлых результатов, чтобы найти числа, которые появлялись чаще, чем другие. Многие люди утверждали, что рулетка была слишком хорошо сделана, чтобы получить полезное преимущество.
Ключевым пониманием Торпа было то, что если рулетка была построена достаточно точно, так что каждое число появляется на одной и той же частоте, они должны быть предсказуемыми. Его первоначальная работа показала, что вращение рулетки имело две фазы. Когда шарик вращается на внешнем краю чаши — шариковая дорожка — и головка рулетки (движущаяся часть со всеми числами) вращается в противоположном направлении, система контролируется простой ньютоновской физикой.
Если бы вы знали скорость мяча и рулетки, а также коэффициенты трения, было бы легко предсказать, какое число будет под мячом, когда он покинет дорожку и падает на рулетку. После того, как мяч покинет дорожку, дефлекторы, вращение и отскоки делают его движение хаотичным и трудно предсказать. Тем не менее, само знание того, какое число находится под мячом при выходе на дорожку, позволяет идентифицировать треть колеса, в котором мяч приземлится в 40% случаев — более чем достаточно для победных ставок.
Это привело к одному из основных принципов для квантовых инвесторов: возможность найти предсказуемость вещей, которые другие люди рассматривают как случайные, и неопределенность в вещах, которые другие люди считают детерминированными. До 70 -х годов прошлого века строительство ношения компьютерной рулетки и доказывало, что она работает, была одним из ритуалов для перехода на квантовые инвесторы. Улучшения в технологии привели к огромным улучшениям в точности и надежности.
Кстати, эти устройства были законными в то время. Казино обычно имели правила против таких устройств, как магниты, которые повлияли на результаты, но не на устройства, которые просто предсказывали их. В 1985 году Невада запретила устройства прогнозирования. Другие юрисдикции, такие как Соединенное Королевство, оставляют это в отдельные казино, но есть все еще без правил против них.
К тому времени, когда я попробовал это в середине 1970-х годов, область рассталась. Одна группа, физики, вложила свою энергию в улучшенные измерительные устройства. Они использовали сложные уравнения для обработки соответствующих данных, используя причинные модели, извлеченные из физики. Я был склонен к другой группе, статистикам. Мы использовали примитивные версии алгоритмов машинного обучения для производства моделей. Мы хотели воспользоваться не только детерминированными факторами, взяв идеальное колесо рулетки, но и из моделей дефектов, таких как некоторые слоты чисел, которые немного мягче или прочильнее, чем другие, или колесо не совсем горизонтально. Мы измерили гораздо больше факторов, чем физики, но с меньшей точностью для каждого из них, и мы обработали много данных, которые могли бы выглядеть без какого -либо значения.
У двух групп были довольно похожие аргументы для текущего относительно преимущества сложности. Большим преимуществом физиков были устройства, которые требовали незначительного обучения для отдельной рулетки, поскольку они полагались на универсальный физический закон, а не на недостатки отдельных колес. Наши преимущества были низкой стоимостью и более высокой точностью прогнозирования, особенно в самых случайных казино с более дешевой рулеткой и низким содержанием обслуживания в зависимости от необходимости часов калибровки, прежде чем ставки стали прибыльными. (Хорошо управляемые казино меняют рулетку и покупать каждую ночь, поэтому мы не можем полагаться на вчерашнюю калибровку для сегодняшних ставок.)
Я полагаюсь на сложность 50 лет теории и прогнозирование, чтобы понять. Я давно верил, что машинное обучение и искусственный интеллект заменят человеческих аналитиков и торговцев (а также человеческих водителей, врачей, адвокатов и ученых, среди многих других). Победные алгоритмы машинного обучения и искусственного интеллекта найдут свои собственные модели как можно большего количества данных, вместо того, чтобы руководствоваться людьми для выбора правильных данных и навязывать априорные теоретические ограничения на ответы. Но я часто ошибаюсь, так что не держите все свои деньги на номер, который любит мой компьютер в рулетке.
Аарон Браун — бывший глава финансового рынка Management Management AQR. Он также является активным крипто -инвестором и имеет инвестиции в капитал риска и консалтинговые отношения с криптофирами.
