3 июля 2013

Аркадий Волож — об антипиратском законе и о том, как big data влияет на экономику

Президент Владимир Путин подписал антипиратский закон, против которого выступили крупнейшие российские интернет-компании. Больше всех документ критиковала компания «Яндекс». Ее глава Аркадий Волож объяснил «Бумаге», почему новый закон усложнит развитие всей интернет-отрасли страны и как умение работать с большими данными может привести к новой индустриальной революции.

Иллюстрации: Катерина Чуракова / «Бумага»
Законодательная деятельность в России ведется без работы с отраслью, в лучшем случае нас слушают, но делают все равно по-своему. Мы пытаемся участвовать в законотворческой работе на разных уровнях: в комитетах, министерствах, администрации президента и правительстве есть и официальные, и неофициальные контакты. Закон начнет действовать с первого августа, и тогда мы посмотрим, как именно он будет работать и какое влияние окажет на интернет-компании. Пока рано говорить, но очевидная слабость этого закона в том, что он, к сожалению, может быть применен как угодно. Документ написан не очень аккуратно, и если следовать его букве до конца, можно закрыть все, что вздумается. В этом смысле существуют риски не столько для компании, сколько для отрасли. Закон, который вышел год назад (поправки к закону «О защите детей от информации, причиняющей вред их здоровью и развитию», принятые в июле 2012 года — прим. «Бумаги»), был про общественное благо — детская порнография действительно опасна для общества. А сегодняшний закон касается, по сути, споров хозяйствующих субъектов. Вместо того чтобы устраивать арбитраж, закон применяют в одну сторону — в сторону запрета. В документе почти все нужно править: и блокировку по IP, и процедуру «превентивных обеспечительных мер», когда до решения суда может блокироваться не только конкретный материал, но фактически вся служба. Потому что правообладатель не обязан точно указывать, что именно нарушает его права, он может просто сказать: «Заблокируйте, пожалуйста, все песни такого-то певца». Где их искать, непонятно, поскольку в любом сервисе или социальной сети миллион страниц, которые создаются ежесекундно, найти все это — большая проблема. Вместо того чтобы организовать в своей стране службу, которая ищет пиратов, а мы инженерно блокируем их, вся проблема просто переносится на наши плечи. Нам скажут: «Заблокируйте там что-нибудь», и нам придется думать, что и где. Это технически слабореализуемо. И теперь это наша проблема.
«Сегодняшний закон касается, по сути, споров хозяйствующих субъектов»
В мире всего шесть более или менее хорошо известных поисковиков, которые обслуживают шесть миллиардов людей. В хронологическом порядке это чешский Senznam, «Яндекс», Google, позднее в Корее появился Naver, в КНР — Baidu, сравнительно недавно Microsoft запустил свой поисковик Bing. Это условный список, но картина понятна: народу много, интернетом пользуются все, а технология при этом очень редкая. И из всего этого списка только Google, «Яндекс» и Bing занимаются поиском по всему мировому интернету, остальные компании локальные. Почему так случилось? Потому что сегодняшний поиск можно сравнить с тем, что 50 лет назад называлось ядерной индустрией: очень легко объяснить, как все работает, но почему-то никто не может это сделать. С атомной бомбой еще как-то разобрались: взрывать ее умеет полтора десятка стран, технология расползлась по всему миру. С поиском пока не так. Только в нескольких странах и компаниях умеют это делать. Почему? Потому что за поиском стоит два очень серьезных умения. Первое — это фундаментальная математика, второе — фундаментальная инженерия, то есть умение работать с огромными данными, перекладывать их с места на место, сортировать и оценивать. Комбинация двух этих навыков оказалась очень редкой. «Яндекс» применяет свои умения в пользовательском интернете, хуже того, в пользовательском интернете в России — это совсем узкое направление. Пользовательский интернет — это умение делать такие сервисы, которые интересны большому количеству людей, сродни тому, чем занимается индустрия кино или музыки.
«Если следующая революция затронет не обработку пластмассы, а обработку данных, то экономика тоже передвинется»
Но под этим лежит нечто большее. Во-первых, это огромные фабрики серверов и дата-центры, которые расположены по всему миру. Большие массивы «железа» не видны, но они потребляют десятки мегаватт энергии. Во-вторых, на эти серверы нужно сложить огромное количество данных и уметь ими оперировать: загрузить и выгрузить, уметь отсортировать 10 терабайт за 10 или 20 секунд. Это редкие навыки: пересчитать компании, которые способны работать с огромными данными, можно по пальцам. Дальше совсем уникальное умение — то, что называется машинным обучением, которое благодаря алгоритмам делает данные на серверах умными. Машинное обучение используется в десятках мест поиска: как отсортировать данные, как их прокомментировать, какую рекламу показать. С точки зрения математики все это задачи, решение которых приводит к тому, что реклама, например, становится неназойливой. Любые рекомендательные системы, перевод, распознавание образов и звуков, фильтрация спама на почте возможны тоже благодаря машинному переводу. Кроме трех важных навыков, для работы с big data должны быть люди — аналитики данных, алгоритмисты и инженеры. Свои умения в области обработки данных «Яндекс» научился применять в других областях — в физике, биологии, геологии. Например, «Яндекс.Терра» обрабатывает геологические данные для разных нефтедобывающих компаний — Statoil, «Роснефть», Shell. То, что раньше считалось 26 дней, теперь можно посчитать за четыре часа. В авиастроении также важна работа с информацией. В самолете стоит полторы тысячи датчиков, которые измеряют температуру, давление, вибрации. Они генерируют 28 мегабайт данных во время одного полета. При посадке генерируется еще больше данных — почти терабайт. Эти данные говорят о многом: от погоды до того, какая деталь выйдет из строя завтра. Если их оценить с помощью алгоритмов, то такие вещи можно предсказывать на несколько процентов лучше. Что такое несколько процентов в индустрии? За год в небе сжигается горючего на 500 000 000 долларов, если вы сэкономили 2 % — это миллиарды долларов. Если раньше говорили, что нефть — это кровь экономики, то сейчас кровь экономики — это данные. Обработка и управление ими станет самым важным и востребованным процессом в мировом бизнесе. В 90-е годы все производство мира переехало на Дальний Восток, где нашли способ дешево обрабатывать пластмассу и металл. Благодаря этому за 20 лет произошла смена всей индустриальной экономики. Если следующая революция затронет не обработку пластмассы, а обработку данных, то экономика тоже передвинется.
График, иллюстрирующий закон Мура
Пока всерьез с данными работают в двух зонах: во-первых, это Сиэттл и Кремниевая долина, во-вторых, Скандинавия, Россия и Израиль. На сегодняшний день большими данными занимаются только тут, хотя пытались заниматься по всему миру. Если за данными большой сдвиг в экономике, значит, сдвинется она в нашу сторону. Все необходимые данные есть, их просто пока никто не обрабатывал. Что происходит в мире? По закону Мура каждые полтора года удваивается количество транзисторов. С данными происходит что-то еще более немыслимое: их объемы растут быстрее, чем описывает закон Мура. Их генерируем мы как пользователи, приборы, которые на нас висят, датчики, которыми скоро будет обвешано все — от самолетов до рельсов. Всю эту информацию нужно обрабатывать, потому что это позволит сэкономить пару процентов необходимых ресурсов, а в мировом масштабе — это большие деньги.
Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите появившуюся кнопку.
Подписывайтесь, чтобы ничего не пропустить
Все тексты
К сожалению, мы не поддерживаем Internet Explorer. Читайте наши материалы с помощью других браузеров, например, Chrome или Mozilla Firefox Mozilla Firefox или Chrome.