19 февраля 2015

Специалист по машинному обучению — о том, как учатся компьютеры и случится ли восстание машин

Первый в этом году Science Slam, который проводит «Бумага» и компания Playkot, состоится 22 февраля. Молодые ученые за десять минут расскажут о геноме бактерий, лаборатории размером с чип, определении лжи, лечении болезней с помощью имплантатов, а также об искусственном интеллекте.
Как алгоритмы позволяют компьютеру самостоятельно принимать решения, осуществится ли сценарий «Терминатора» и что аналитики могут сказать о пользователях интернета, изучая их поведение, — рассказывает участница февральского слэма Любовь Пенюгалова.
Любовь Пенюгалова. Фото: Егор Цветков / «Бумага»
— Учитывая, что компьютер можно обучить, насколько велика вероятность появления машин, не зависящих от человека? Можем ли мы в будущем столкнуться со сценарием наподобие «Терминатора»?
— Если мы сами себя не уничтожим в ближайшее время, рано или поздно такая вероятность появится. Развитие технологий идет в направлении создания машин, максимально схожих с человеком в плане способности к самообучению. Рано или поздно машины этого достигнут. Тогда может произойти интересный поворот: когда компьютеры себя осознают, мы этого не поймем и не будем знать, что они делают без нашего ведома. Но это всего лишь один из возможных сценариев развития событий.
— На каком этапе развития находится machine learning? Другими словами, что им мешает осознать себя сейчас?
— Для развития такого сценария есть множество преград. Одна из них заключается в том, что, когда обучается человек, его формирует многолетний опыт. Он проживает 10–15 лет жизни, прежде чем сформируется как личность с собственным багажом знаний и опыта.
Для того чтобы компьютер стал таким же, как человек, ему необходимо получить тот же объем зрительной, сенсорной, звуковой информации о мире. Проблема в том, что мы не можем скормить машине всю эту информацию. Можем очень много — но не всю.
Машина сама классифицирует информацию по различным параметрам, но сказать, что все это значит, как назвать ту или иную группу пользователей, она не может. Для этого и нужен человек
Вторая важная проблема заключается в том, что компьютер устроен иначе, нежели человеческий мозг, об этом я подробнее расскажу на выступлении. Чтобы научиться, машине требуется отдельный алгоритм на каждый шаг обучения. Пока для искусственного развивающегося разума, похожего на человеческий, не хватает этих алгоритмов и нет способа для их универсализации и объединения. Но такая работа ведется.
Роботов вроде терминаторов, я думаю, простые смертные не увидят, но их точно увидят военные — такие проекты уже реализуются. Например, разрабатывают механизмы, позволяющие солдатам переносить большие грузы.
— Чему вы учите компьютеры и как применяете их знания?
— Я занимаюсь анализом больших объемов данных в компании, разрабатывающей игры для социальных сетей. В них ежедневно играют миллионы человек, и моя работа необходима для того, чтобы вовремя понять изменения в поведении игроков и их реакцию на обновления. Машинное обучение — один из способов делать такого рода анализ быстро, эффективно и без ошибок. Поведение пользователей в игре может быть разным: кто-то заходит в игру раз в день, кто-то реже, кто-то больше любит воевать, кто-то строить. Например, в одном приложении у нас больше «воинов» — примерно 80 %, поэтому в развитии игры мы будем ориентироваться на их интересы.
— Как это выглядит с технической точки зрения?
— Машинное обучение начинается тогда, когда мы создаем алгоритм обработки данных о поведении игроков. В процессе обработки компьютер начинает обучаться: вырабатывается некая модель поведения пользователя, с помощью которой можно прогнозировать поведение игроков. Помимо прочего, такие прогнозы позволяют понять, какой тип людей готов совершить внутреннюю покупку в приложении, за что они готовы платить и насколько сильно покупка их вдохновляет.
— Можно ли получить таким образом персональные данные о пользователе?
— Хоть наши игры отчасти и размещаются в социальных сетях, у нас нет доступа к достоверным личным данным. Зато мы можем с помощью поведенческих моделей понять, из какого региона наш игрок, если он играет, например, в Facebook. Отличить азиата от жителя западных стран довольно легко по платежным паттернам: по большей склонности к электронным платежам, доверии к ним, а также большим техническим возможностям сделать платеж.
Казалось бы, как машина, не понимая сути самого текста и идеи высказывания, может определить его тематическую и эмоциональную направленности?
Кроме того, можно определить и возраст. Люди постарше гораздо более терпеливы, они остаются заинтересованными, даже когда игра теряет свою первоначальную новизну. Например, в одном из приложений средний возраст игрока увеличивается на полгода с каждым новым уровнем.
Можно также попытаться узнать и пол игрока, но тут больше сложностей и меньше достоверных закономерностей.
— Что происходит, когда компьютеру предстоит принять решение: кто в потоке обезличенных данных мужчина, кто женщина, кто будет платить, а кто нет?
— Существует два типа алгоритмов, с помощью которых машины строят такие поведенческие модели: одни работают на примерах, другие без них. Обучение с примерами крайне похоже на то, как учатся люди. При этом существуют и отличия, о них я расскажу подробнее на Science Slam.
В случае обучения без примеров речь идет о классификации массива данных. Машина сама классифицирует информацию по различным параметрам, но сказать, что все это значит, как назвать ту или иную группу пользователей, она не может. Для этого и нужен человек.
— Где кроме игр можно применить машинное обучение?
— Алгоритмы по отдельности могут применяться в совершенно различных сферах, связанных с обработкой данных. Их, например, используют банки при анализе платежеспособности заемщика на основании его анкетных данных. С помощью полученной информации банк принимает решение об одобрении кредита: на основе двенадцати характеристик заемщика машина понимает, будут ли просрочки и если будут, то как часто.
Еще одна сфера применения обучаемых машин — это лексический и семантический анализ сообщений на форумах и в соцсетях. Его используют как PR-специалисты, следящие за имиджем компании, так и сотрудники спецслужб. Казалось бы, как машина, не понимая сути самого текста и идеи высказывания, может определить его тематическую и эмоциональную направленности? Но при всем разнообразии языка и использовании метафор машины здесь работают без ошибок.
IBM обучила свой суперкомпьютер Watson определять у пациентов рак на основе истории болезни и массы других показателей
Сейчас обучаемые компьютеры позволяют решать задачи, которые никогда бы не осилил человек, например, при исследовании космоса. Ученые получают огромные объемы данных о космосе. Чтобы их обработать, не всегда хватает даже возможностей компьютеров NASA. Для этого существует сервис, где каждый пользователь может выступить волонтером и помочь ученым раскодировать эти данные на своем компьютере.
— Вы говорите, что восстание машин, как в кино, кажется фантастикой, а возможно ли, что компьютеры благодаря обучению смогут заменить людей на интеллектуальной работе? Вытеснят ли машины людей из офисов, как это случилось на заводах и фабриках?
— Такое происходит уже сейчас. Например, IBM обучила свой суперкомпьютер Watson определять у пациентов рак на основе истории болезни и массы других показателей. Для этого исследовались подробные анализы нескольких сотен тысяч пациентов, в итоге компьютер научился ставить такой диагноз точнее любого врача.
Конечно, до замены руководителя, который вынужден постоянно общаться с людьми, дело, видимо, не дойдет, но тенденция к тому, что доля человеческого труда уменьшается в пользу компьютерного, нарастает.
Футуристы часто предсказывают, что в будущем работать будут только машины, а небольшое количество специалистов — лишь контролировать их. Отвечая на вопрос, вытеснят ли машины людей из офисов, как вытеснили из заводов, можно сказать — да, такое однажды произойдет. В этом смысле гораздо важнее подумать о том, что тогда произойдет с людьми и чем они станут заниматься.
Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите Ctrl + Enter.
Читайте еще
Новый Science Slam пройдет 22 февраля: ложь, генетика и искусственный разум
Все выступления летнего Science Slam в Петербурге
Все выступления с апрельского Science Slam в Петербурге
Вторая волна коронавируса
БДТ отменил три спектакля из-за положительных тестов на коронавирус у артистов
У петербургского бизнеса начали отзывать разрешения на работу за нарушение масочного режима
«Доктор Питер» создал онлайн-мемориал умершим во время пандемии врачам. Там уже можно прочитать истории 37 медиков
Как растет число заболевших коронавирусом в Петербурге — показываем на графике
В Петербурге из-за ситуации с коронавирусом ограничат время работы ресторанов и баров до 23:00
Поддержка протестующих в Беларуси
Беларусь объявила Тихановскую в межгосударственный розыск за призывы к свержению конституционного строя
На «Марше гордости» в Беларуси задержали почти 600 человек, сообщают правозащитники
В Минске произошли столкновения милиции и протестующих. На акциях задержали несколько десятков человек, в том числе журналистов
В Петербурге прошла акция солидарности с протестующими в Беларуси. Ее участники проехали по рекам и каналам с бело-красно-белыми флагами
В центр Минска стянули автобусы с силовиками, бронетехнику и водометы. На акции протеста накануне в городе задержали около 400 человек
Коллеги «Бумаги»
Документальное кино о женщинах в ожидании свободы
В московских школах из-за ковида пожилых учителей заменят студентами
Надежда малых городов
Отравление Навального
Евросоюз ввел санкции против нескольких российских чиновников из-за отравления Навального
Из-за чего обвалился рубль, как на него повлияло отравление Навального и будет ли доллар по 100? Рассказывает экономист
«Санкции против всей страны не работают». Навальный призвал ЕС ввести санкции против окружения Путина
Эксперты ОЗХО подтвердили, что Алексея Навального отравили «Новичком»
«Это как дементор: тебе не больно, а жизнь уходит». Алексей и Юлия Навальные дали двухчасовое интервью Дудю — об отравлении и выздоровлении
Конфликт баров и жителей Рубинштейна
Улица Рубинштейна будет пешеходной в выходные только ночью. В праздники — целый день
Улица Рубинштейна официально станет пешеходной по выходным и в праздники с 20 октября
За порядком на Рубинштейна теперь следит союз владельцев баров: они наняли ЧОП и запустили «горячую линию». Но местные жители считают, что это не защитит их права
На Рубинштейна постоянно проходят уличные вечеринки, где веселятся сотни людей. Местные жители жалуются на шум, а полиция устраивает рейды
Жители Рубинштейна попросили ужесточить правила работы летних кафе во время пандемии
Озеленение Петербурга
Петербургские активисты высадили каштаны на площади Шевченко в Петроградском районе
Смольный продлил компании «Анна Нова» аренду участка в Муринском парке до августа 2024 года, сообщают активисты
Кто и как борется за сохранение деревьев в Петербурге и почему в городе так мало зелени
Петербуржцы убрались и посадили многолетние растения во дворе на Загородном проспекте
Активисты высадят каштаны на площади Шевченко у «Петроградской». Акцию согласовали с властями
Закон о «наливайках»
В Закс Петербурга внесли новый проект закона о «наливайках». Требование о 50 квадратных метрах будет касаться только заведений в домах массовой серии. Обновлено
В центре Петербурга могут разрешить работу баров площадью более 20 квадратных метров, сообщила рабочая группа по «закону о наливайках»
Закон о «наливайках» могут смягчить. Барам меньше 50 метров разрешат работать, если они находятся в историческом центре
Беглов посетил петербургский бар Spontan, попадающий под закон о «наливайках». Губернатор выпил там соку и пригласил владельца на встречу в Смольном
Автор закона о «наливайках» объяснил, почему площадь баров ограничили 50 метрами. Так депутаты борются с заведениями в хрущевках

Спасибо!

Теперь редакторы в курсе.