Компьютеры (немного) лучше, чем люди могут предсказать, что будет иметь значение в будущем.

Как и то, что 2019 год заканчивается, давайте приготовим на бесконечные сводки основных моментов последних 12 месяцев. Хотя только немногие из них мы будем вспоминать через 20 лет – последние исследования показывают, как трудно предсказать, какие события действительно поступают на картах (учебников) истории.

Философ Arthur Danto заявил в 1965 году, что даже самый эрудированный, „летописец подходит”, не в состоянии оценить подлинного смысла текущих событий, зависит от целой цепи реакций, которые еще не произошли. Дункан Уоттс, социолог из Университета штата Пенсильвания, давно хотел этот тезис проверить. Возможность появилась, когда историк из Колумбийского Университета, Мэтью Коннелли, предложил анализ сбора двух миллионов рассекреченных телеграмм госдепартамента, переданных в 1973-1979 годы, вместе с сборником, содержащим 0,1% тех, которые, как оказалось, иметь исторически значение (созданным историками на долгие годы после их отправки).

Коннелли, Watts и их коллеги сначала рассчитали компьютерный индикатор „в настоящее время воспринимается значимости” (PCI – perceived contemporaneous importance), на основе метаданных, таких как вес или степень конфиденциальности, которые им тогда были назначены. Этот показатель в незначительной степени совпало с включением для упомянутого сборника, как утверждают в Nature Human Behavior: вероятность появления в таблице, находящихся высоко в рейтинге телеграмм было только на 4% выше, чем в случае тех, которые оцениваются ниже. Самая распространенная ошибка предсказания были результаты ложно положительные – когда телеграмму получил высшую оценку, а потом оказалась, однако, совершенно неуместно. „Я думаю, что есть явление определенного нарциссизма по отношению к текущей ситуации, – говорит Коннелли. – Поразительно, как часто любители спорта уверены, что в какой-то момент это, несомненно, исторический”.

Затем, как поясняет Watts, для приближения идеального летописца, решили „построить наиболее оцени прикол и купил модель машинного обучения, как только возможно, и впустить в него собранные данные – все метаданные, весь текст”. Так возникли алгоритм искусственного интеллекта существенно превышает человеческую способность оценки текущих событий. В одном из измерений статистических его умения отбирать телеграмм, которые позже должны были стать исторически важным, по шкале, где 1 означает отсутствие неправильных выборов, были оценены на 0,14, в то время как PCI только на 0,05. Хотя эффект действия алгоритма далек от идеала, однако исследователи предполагают, что „искусственный архивариус” мог бы помочь в реальном времени сузить диапазон событий, неподалеку-передачи потомкам. Настроена для этой задачи модель выбрал около 5% всех телеграмм, из которых до 80% на самом деле оказалось в списке.

Эмили Эриксон, социолог из Йельского Университета, которая не принимала участие в этих исследованиях, утверждает, что, несмотря на использование несовершенных данных – хотя бы потому, что используемые компендиум был создан на основе субъективной оценки несколько историков – же исследование предлагает практический инструмент и относится к гипотезе Danto. „Уже сам тест этой концепции с помощью методов машинного обучения очень увлекательный, – говорит Эриксон – анализ результатов-это еще большее удовольствие”.