Искусственный интеллект VS машинное обучение: проигравших нет

В рамках форума U-NOVUS управляющий директор лаборатории Сбербанка по искусственному интеллекту Максим Савченко рассказал о том, как наряду с решением прикладных задач Сбербанк решает социальные проблемы, применяя технологии искусственного интеллекта (ИИ).

Лаборатория по искусственному интеллекту, созданная в Сбербанке год назад, сегодня не ограничивается решением задач, значимых для банковской деятельности.

То, чем занимается лаборатория, это, по сути, прикладная математика, которая и раньше в Сбербанке была работающим инструментом - рассказал Максим Савченко. Важно, чтобы в банке были люди, способные правильно поставить задачу.

Исследовательская структура внутри банка готова создавать работающие модели для решения социально значимых проблем, в частности, медицинских. Эксперт привел пример: в удаленных районах была выявлена проблема нехватки квалифицированных экспертов для диагностики типа инсульта. В зависимости от типа, инсульт лечится совершенно разными и даже противоположными методами, и выбор метода во многом определяет исход лечения. Медики предоставили лаборатории Сбербанка снимки с разными типами инсульта. Весь объем данных был внесен в машину, которая обучилась распознавать типы и даже давать рекомендации по лечению. Следующим шагом могла бы быть интеграция работающей модели с томографом, а далее – закупка таких «специально обученных» аппаратов для конкретных больниц, в том числе в районах. Но, по мнению Савченко, на данном этапе возникает главная трудность: реализация становится слишком дорогостоящей, и за нее некому заплатить. Таким образом, есть работающая модель, но применить ее пока не представляется возможным.

Если нет операционной структуры, куда будет встраиваться модель, то выхлоп у всех научных изысканий нулевой! – уверен Максим Савченко. - Вот на что нужно обращать внимание! У нас в стране значительная часть исследований основана на энтузиазме и не подкреплена реальным практическим запросом.

Максим Савченко также рассказал о способах работы с большими данными. Два основных инструмента – искусственный интеллект и глубинное машинное обучение. Каждый метод хорош для своих задач: не может быть универсальной «таблетки», позволяющей решать абсолютно все задачи одним методом.

Сегодня в банке аккумулируется огромное количество данных, в том числе о клиентах. Раньше решения (например, о выдаче кредитов) принимались на основе данных, предоставляемых клиентом. Но со временем стало ясно, что более объективными являются данные, которые формируются в результате его поведения: как он тратит деньги, его активность в интернете и т.д. Например, клиент скажет: «Я Лев Толстой», но при этом будет очень неграмотно писать. Машина очень быстро сделает заключение, что этот клиент – точно не Лев Толстой. Но при таком подходе количество информации о клиенте вырастает в разы. Здесь возникает вопрос: а можно ли все эти данные обрабатывать иначе, получать из них максимум полезной информации?

И здесь как раз встает вопрос о разграничении методов работы с Big data.

Максим Савченко перечислил основные:

Машинное обучение. Начиная с конца 19 века этот тип обучения уже применялся в разных областях. У классического машинного обучения есть существенное ограничение: машина ответит только на тот вопрос, который вы ей задали.

Искусственный интеллект и нейронные сети. В сети направляется набор исходных данных в виде последовательностей, которые затем попадают в кодировщик (сжимаются посредством определенного кода). Затем данные восстанавливаются в исходном виде и результат сжатия представляет огромный интерес: нейронная сеть способна найти определенные признаки самостоятельно – те, которые еще не смог увидеть человек. Этот метод имеет ряд важных ограничений.

• Он работает только там, где есть внутренняя структура данных (например, обучение языкам, логические последовательности и пр.). Если структуры данных нет, то метод не будет работать – нужно использовать классическое машинное обучение.

• Исходных данных должно быть очень и очень много. Одним из преимуществ Сбарбанка Максим Савченко назвал то, что он обладает огромными массивами данных по клиентам, в том числе по количеству лет на рынке, чего него у других банков.

• Исходные данные должны быть разнообразны и подробны (большое количество подробностей).

Метод глубинного обучения нейронных сетей – очень мощный инструмент, он во многом превосходит человека и способен произвести революцию: в области здоровья, в финансовой сфере и многих других, - неоднократно подчеркивает Савченко. Сегодня в Сбербанке как раз запускается пилотный проект по нейронным сетям.

Завершил лекцию Савченко тем, что призвал заинтересованных партнеров к сотрудничеству. «Нам необходим портфель инициатив, - отметил он. – Квалифицированный инвестор всегда вкладывается в разные задачи. Поэтому лаборатория Сбербанка по искусственному интеллекту старается взять несколько крупных задач. И мы ищем инициативы».

В свою очередь Сергей Орлов, директор межрегионального супервычислительного центра ТГУ, подтвердил важность данных, которые можно собрать: «Сегодня дефицит уже не в технологиях, а в данных, которые мы можем получать. Решая эти вопросы, мы создали консорциум университетов по большим данным: предполагается обмен данными между университетами, чтобы на основе этих сведений строить работающие математические модели».

16Октябрь
2018