19 февраля 2015

Специалист по машинному обучению — о том, как учатся компьютеры и случится ли восстание машин

Первый в этом году Science Slam, который проводит «Бумага» и компания Playkot, состоится 22 февраля. Молодые ученые за десять минут расскажут о геноме бактерий, лаборатории размером с чип, определении лжи, лечении болезней с помощью имплантатов, а также об искусственном интеллекте.

Как алгоритмы позволяют компьютеру самостоятельно принимать решения, осуществится ли сценарий «Терминатора» и что аналитики могут сказать о пользователях интернета, изучая их поведение, — рассказывает участница февральского слэма Любовь Пенюгалова.

Любовь Пенюгалова. Фото: Егор Цветков / «Бумага»

— Учитывая, что компьютер можно обучить, насколько велика вероятность появления машин, не зависящих от человека? Можем ли мы в будущем столкнуться со сценарием наподобие «Терминатора»?

— Если мы сами себя не уничтожим в ближайшее время, рано или поздно такая вероятность появится. Развитие технологий идет в направлении создания машин, максимально схожих с человеком в плане способности к самообучению. Рано или поздно машины этого достигнут. Тогда может произойти интересный поворот: когда компьютеры себя осознают, мы этого не поймем и не будем знать, что они делают без нашего ведома. Но это всего лишь один из возможных сценариев развития событий.

— На каком этапе развития находится machine learning? Другими словами, что им мешает осознать себя сейчас?

— Для развития такого сценария есть множество преград. Одна из них заключается в том, что, когда обучается человек, его формирует многолетний опыт. Он проживает 10–15 лет жизни, прежде чем сформируется как личность с собственным багажом знаний и опыта.

Для того чтобы компьютер стал таким же, как человек, ему необходимо получить тот же объем зрительной, сенсорной, звуковой информации о мире. Проблема в том, что мы не можем скормить машине всю эту информацию. Можем очень много — но не всю.

Машина сама классифицирует информацию по различным параметрам, но сказать, что все это значит, как назвать ту или иную группу пользователей, она не может. Для этого и нужен человек

Вторая важная проблема заключается в том, что компьютер устроен иначе, нежели человеческий мозг, об этом я подробнее расскажу на выступлении. Чтобы научиться, машине требуется отдельный алгоритм на каждый шаг обучения. Пока для искусственного развивающегося разума, похожего на человеческий, не хватает этих алгоритмов и нет способа для их универсализации и объединения. Но такая работа ведется.

Роботов вроде терминаторов, я думаю, простые смертные не увидят, но их точно увидят военные — такие проекты уже реализуются. Например, разрабатывают механизмы, позволяющие солдатам переносить большие грузы.

— Чему вы учите компьютеры и как применяете их знания?

— Я занимаюсь анализом больших объемов данных в компании, разрабатывающей игры для социальных сетей. В них ежедневно играют миллионы человек, и моя работа необходима для того, чтобы вовремя понять изменения в поведении игроков и их реакцию на обновления. Машинное обучение — один из способов делать такого рода анализ быстро, эффективно и без ошибок. Поведение пользователей в игре может быть разным: кто-то заходит в игру раз в день, кто-то реже, кто-то больше любит воевать, кто-то строить. Например, в одном приложении у нас больше «воинов» — примерно 80 %, поэтому в развитии игры мы будем ориентироваться на их интересы.

— Как это выглядит с технической точки зрения?

— Машинное обучение начинается тогда, когда мы создаем алгоритм обработки данных о поведении игроков. В процессе обработки компьютер начинает обучаться: вырабатывается некая модель поведения пользователя, с помощью которой можно прогнозировать поведение игроков. Помимо прочего, такие прогнозы позволяют понять, какой тип людей готов совершить внутреннюю покупку в приложении, за что они готовы платить и насколько сильно покупка их вдохновляет.

— Можно ли получить таким образом персональные данные о пользователе?

— Хоть наши игры отчасти и размещаются в социальных сетях, у нас нет доступа к достоверным личным данным. Зато мы можем с помощью поведенческих моделей понять, из какого региона наш игрок, если он играет, например, в Facebook. Отличить азиата от жителя западных стран довольно легко по платежным паттернам: по большей склонности к электронным платежам, доверии к ним, а также большим техническим возможностям сделать платеж.

Казалось бы, как машина, не понимая сути самого текста и идеи высказывания, может определить его тематическую и эмоциональную направленности?

Кроме того, можно определить и возраст. Люди постарше гораздо более терпеливы, они остаются заинтересованными, даже когда игра теряет свою первоначальную новизну. Например, в одном из приложений средний возраст игрока увеличивается на полгода с каждым новым уровнем.

Можно также попытаться узнать и пол игрока, но тут больше сложностей и меньше достоверных закономерностей.

— Что происходит, когда компьютеру предстоит принять решение: кто в потоке обезличенных данных мужчина, кто женщина, кто будет платить, а кто нет?

— Существует два типа алгоритмов, с помощью которых машины строят такие поведенческие модели: одни работают на примерах, другие без них. Обучение с примерами крайне похоже на то, как учатся люди. При этом существуют и отличия, о них я расскажу подробнее на Science Slam.

В случае обучения без примеров речь идет о классификации массива данных. Машина сама классифицирует информацию по различным параметрам, но сказать, что все это значит, как назвать ту или иную группу пользователей, она не может. Для этого и нужен человек.

— Где кроме игр можно применить машинное обучение?

— Алгоритмы по отдельности могут применяться в совершенно различных сферах, связанных с обработкой данных. Их, например, используют банки при анализе платежеспособности заемщика на основании его анкетных данных. С помощью полученной информации банк принимает решение об одобрении кредита: на основе двенадцати характеристик заемщика машина понимает, будут ли просрочки и если будут, то как часто.

Еще одна сфера применения обучаемых машин — это лексический и семантический анализ сообщений на форумах и в соцсетях. Его используют как PR-специалисты, следящие за имиджем компании, так и сотрудники спецслужб. Казалось бы, как машина, не понимая сути самого текста и идеи высказывания, может определить его тематическую и эмоциональную направленности? Но при всем разнообразии языка и использовании метафор машины здесь работают без ошибок.

IBM обучила свой суперкомпьютер Watson определять у пациентов рак на основе истории болезни и массы других показателей

Сейчас обучаемые компьютеры позволяют решать задачи, которые никогда бы не осилил человек, например, при исследовании космоса. Ученые получают огромные объемы данных о космосе. Чтобы их обработать, не всегда хватает даже возможностей компьютеров NASA. Для этого существует сервис, где каждый пользователь может выступить волонтером и помочь ученым раскодировать эти данные на своем компьютере.

— Вы говорите, что восстание машин, как в кино, кажется фантастикой, а возможно ли, что компьютеры благодаря обучению смогут заменить людей на интеллектуальной работе? Вытеснят ли машины людей из офисов, как это случилось на заводах и фабриках?

— Такое происходит уже сейчас. Например, IBM обучила свой суперкомпьютер Watson определять у пациентов рак на основе истории болезни и массы других показателей. Для этого исследовались подробные анализы нескольких сотен тысяч пациентов, в итоге компьютер научился ставить такой диагноз точнее любого врача.

Конечно, до замены руководителя, который вынужден постоянно общаться с людьми, дело, видимо, не дойдет, но тенденция к тому, что доля человеческого труда уменьшается в пользу компьютерного, нарастает.

Футуристы часто предсказывают, что в будущем работать будут только машины, а небольшое количество специалистов — лишь контролировать их. Отвечая на вопрос, вытеснят ли машины людей из офисов, как вытеснили из заводов, можно сказать — да, такое однажды произойдет. В этом смысле гораздо важнее подумать о том, что тогда произойдет с людьми и чем они станут заниматься.

Авторы: Дмитрий Гвоздев

Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите появившуюся кнопку.

Подписывайтесь, чтобы ничего не пропустить

Все тексты