Читать онлайн Big data изменяют Китай бесплатно
ПРЕДИСЛОВИЕ
В своей повседневной жизни мы имеем дело с разнообразными источниками информации – документами, изображениями, песнями, видеолекциями и др. Все они представляют собой регистрацию фрагментов общественной, экономической, производственной и бытовой реальности. Существуя в оцифрованном виде и становясь проводником информации, результаты этой регистрации представляют собой данные. Это оцифрованная информация, а большие данные – это огромные и сложно устроенные массивы информации.
Наблюдая за скачкообразной траекторией развития, которое информационные технологии совершили за прошедшие более чем полвека, отметим, что объём оцифрованных материалов, о которых шла речь выше, начал увеличиваться с поразительной скоростью. Данные «хлынули» сокрушительным потоком. Поиск способов обработать эти данные стал огромным вызовом для учёных. Однако в то же самое время мы с радостью обнаружили, что когда данные накапливаются до определённой величины, начинают обнаруживаться стоящие за ними объективные закономерности развития природы и общества и то, что человечество может посредством интеллектуального отбора (data mining) и анализа этих огромных по объёму материалов дифференцировать особенности и тенденции явлений, а также существующие между различными явлениями взаимосвязи и тем самым высвободить великую научную силу, которой наделены данные. По предварительным расчётам, на протяжении значительного времени в будущем ценность интеллектуального анализа данных в самых различных областях и соответствующий переход от данных к информации и далее к знаниям и стратегическим решениям станет основным направлением общественно-научной деятельности. Эпоха больших данных уже наступила.
И хотя не прошло ещё и десяти лет с тех пор, как человеческое общество вступило в эту новую эпоху, ценность больших данных увидели, не сговариваясь, во всех станах мира. Поскольку большие данные, с одной стороны, представляют собой основное производственное средство для перестройки социальной экономики и совершенный инструмент стимуляции производительных сил, а с другой стороны, центральную движущую силу инновационного развития государства, развитие и распространение технологии их обработки, как и развитие соответствующей культуры их использования, чрезвычайно актуальны и важны.
В общемировом масштабе цифровизацию экономики во многих странах считают важным драйвером для осуществления инноваций и развития. В нескольких передовых странах при этом появились программы развития больших данных, что возвело последние на уровень государственной стратегии. В этом отношении Китай, находящийся в первом эшелоне среди стран мира, обладает уникальным преимуществом в развитии больших данных. Это, с одной стороны, связано с отличающими Китай богатством источников данных, огромными масштабами рынка и высоким уровнем распространения Интернета. С другой стороны, со способностью аккумулировать силы для решения больших задач, что также обеспечило решение базовых вопросов по сбору и возврату данных и стандартизации больших данных.
Книга «Успешен тот, кто цифрами владеет: большие данные меняют Китай» – это актуальная работа, в которой в научно-популярном стиле углублённо и пристально рассматриваются те феномены и радикальные изменения, которые влекут за собой большие данные в настоящий момент. В этой книге раскрыты обладающие огромной ценностью сведения о применении больших данных в самых различных областях – от управления в обществе до предпринимательства и экономики, от транспорта и медицины до окружающей среды и экологии. Книга с её жизненными кейсами, отличающаяся мягким и выразительным стилем изложения и большим количеством размышлений и инсайтов, дала мне совершенно новое впечатление и оказалась весьма полезной.
У книги два составителя – Ту Цзыпэй и Чжэн Лэй. Ту Цзыпэй является одним из первопроходцев в сфере больших данных в Китае, он обладает огромным влиянием как тот, кто «прокладывал путь» большим данным и является автором серии посвящённых данной теме работ. Второй составитель книги, профессор Чжэн Лэй, на протяжении своей карьеры занимается научными исследованиями и консультациями по вопросам больших данных. И добился в этой сфере значительных результатов. Благодаря проделанной составителями кропотливой работе и глубокой проработке темы книга заслуживает высокой похвалы.
Как говорят авторы, новое развитие повлекло за собой новые вопросы, а возникшие в эпоху больших данных всеобщие вопросы в особенности заслуживают нашего внимания. Это, например, вопросы, касающиеся разрыва в использовании данных, безопасности данных, прав на данные, трансграничных потоков данных и защиты конфиденциальности. Только при условии решения этих вопросов становятся возможными более качественная экстракция и использование ценности данных и, как следствие, усиленная стимуляция экономической трансформации и развития, повышение уровня модернизации управления государством, создание новых конкурентных преимуществ страны в условиях сложной и разнородной внешней среды. Однако в настоящее время готовых решений для этих новых вопросов нет. Вот что сказал Ту Цзыпэй в своей книге «Цифровая цивилизация» («Шу вэньмин»): «Дорога к лучшему обществу всегда находится в процессе строительства. Их решение по-прежнему требует непрерывного осмысления и усилий со стороны научных, политических и производственных кругов».
Подводя итог, сейчас, когда большие данные только-только начинают менять Китай, давайте ожидать, приветствовать и строить эту новую эпоху.
Сюй Цзунбэнь, Академик Китайской академии наук
Человечество вступило в не имеющую аналогов эпоху больших данных. Развитие социальных медиа, мобильного Интернета и Интернета вещей принесло для человечества не имеющий аналогов лавинообразный рост объёма данных; в свою очередь прогресс технологий по их обработке и анализу сделал возможным невероятное развитие возможностей использовать огромные массивы данных. Благодаря этому человечество смогло лучше выявлять знания, улучшать возможности, создавать ценность, что принесло новые возможности развития во все крупные области: политику, экономику и науку.
Большие данные меняют мир и меняют Китай. В последние годы развитие индустрии больших данных не останавливается ни на день, непрерывно появляются новые методы работы, уровень совместного развития больших данных и реальной экономики уверенно повышается. Постоянно ускоряется и процесс снятия ограничений на совместное использование данных со стороны Правительства Китая, уже имеются первые результаты использования больших данных для повышения уровня административного регулирования, государственных услуг и общественного управления. Заглядывая в будущее, отметим, что Китай будет продолжать развивать объём рынка в сфере больших данных и ресурсные преимущества данных. Исследования и разработки ключевых технологий, можно надеяться, продолжат совершать прорывы, ведь процесс изменения Китая посредством больших данных только-только начался.
Итак, каким же образом большие данные меняют Китай сейчас ? Какие ещё будущие изменения они могут принести Китаю? Цель нашей книги как раз и состоит в том, чтобы ответить на эти вопросы. В первой главе книги мы поговорим о прошлом и настоящем больших данных, расскажем о стартовой точке эпохи больших данных и её особенностях. В последующей части книги (главы 2–10) мы поговорим об изменениях, которые, благодаря большим данным, произошли в девяти важных областях жизни Китая: начиная от сферы правительственных услуг и общественного управления, а также промышленного, коммерческого и финансового секторов и заканчивая непосредственно связанными с повседневной жизнью простых людей транспортной, образовательной и медицинской сферами. Во всех этих сферах экономической и общественной жизни страны можно увидеть позитивные изменения, привнесённые большими данными. В заключение мы заглянем в будущее больших данных, поговорим о том, что продолжит меняться, с какими трудностями мы столкнёмся в процессе изменений и что подвергать изменениям не следует.
Настоящую книгу как «углублённое научно-популярное» произведение отличают три особенности. Во-первых, это активное стремление к балансу между теорией и историями. Мы попытались посредством реальных кейсов и подлинных историй продемонстрировать широкому читателю те огромные изменения, которые большие данные в Китае привнесли в самые разные отрасли, в надежде тем самым расширить его кругозор и побудить к размышлениям. Однако кейсы и истории неотделимы от научных достижений и теоретических рамок китайской и зарубежной науки о данных, от компьютерной науки, теории управления информацией и государственного управления.
Во-вторых, это активное стремление к балансу между технической и гуманитарной сторонами. Несмотря на то, что фокус нашей книги сосредоточен на рассказе о научно-технических достижениях, мы считаем, что развитие науки и техники должно освобожать, а не связывать человечество. Исследуя технические возможности, мы не должны забывать о тепле человеческой цивилизации, нам следует призывать к уменьшению разрыва в данных, сохранению их конфиденциальности и противостоять связанным с ними предрассудкам. В центре развития больших данных должен быть человек, важно сохранять его права и авторитет, стимулировать его всестороннее развитие, удовлетворять его устремления к лучшей жизни, а не двигаться в противоположном направлении.
И наконец, это активное стремление к балансу между популяризацией, продвижением и переосмыслением. Несмотря на то что развитие больших данных в Китае переживает стремительный подъём и показывает блестящие успехи, мы всегда должны сохранять ясную голову и ни в коем случае не успокаиваться на достигнутом. Между реальным положением и идеалом всё ещё существует разрыв, и в текущем положении есть как достоинства, так и недостатки. На протяжении всей книги мы рассказываем о примерах успешного применения больших данных, но при этом рефлексируем и в отношении недостатков, проясняем возможные проблемы. Стимулирующая роль развития науки и техники для прогресса общества – это не бег на короткую дистанцию, но марафон. И чтобы ожидать устойчивости и долгосрочности, хватаясь за возможности и принимая вызовы, будем помнить, что следует заранее принимать меры предосторожности.
Надеемся, что уважаемый читатель получит наглядное и глубокое представление о тех огромных изменениях, которые произошли в Китае благодаря большим данным, будет всесторонне подготовлен к возможностям и вызовам, которые принесут нам большие данные в будущем, сможет поразмышлять о том, как должны изменяться и эволюционировать отношения между наукой и техникой, с одной стороны, и человеком – с другой.
Мы хотели бы в первую очередь поблагодарить коллектив авторов за тяжёлый труд, который они вели в течение полугода, поблагодарить главного редактора серии «Технологии меняют Китай» Академика Ни Гуаннаня за его внимательное наставничество. Без вас книга не состоялась бы.
Авторы книги живут в разных местах: Гуанчжоу, Шанхае, Сянтане, Наньнине. По причине удалённости мест проживания на этапе создания рукописи еженедельно проводились конференции в WeChat, на которых авторы обменивались своими достижениями, обсуждали спорные вопросы, делились мнениями. Членам авторского коллектива зачастую доводилось править и шлифовать текст сверхурочно, по ночам, в выходные и праздники. Все члены команды прилагали максимум усилий во время подготовки текста, тщательно его дорабатывали.
В настоящей книге одиннадцать глав. Первая и шестая главы написаны Ту Цзыпэем, вторая глава написана Ван Сяном (докторант Фуданьского университета), третья глава – Чжу Сяотин (Фуданьский университет), четвёртая глава – Вэнь Цзюйцином (Фуданьский университет), пятая глава – Ту Сыцзин (Университет китайской традиционной медицины Гуанси-Чжуанского автономного района), седьмая – Доктором наук Е Цзюньцзе (компания «Шу вэньмин кэчжи»), восьмая – Чжу Сяотин и Ту Сыцзин, девятая – Ду Вэйси и Ли Нанем (компания «Шу вэньмин кэчжи»), десятая – Чжан Бинцзянем и Ши Даи (компания «Шу вэньмин кэчжи»), одиннадцатая – Ван Сяном и Чжэн Лэем. Общая рукопись всей книги была подготовлена Ту Цзыпэем и Чжэн Лэем.
Выражаем благодарность компании «Шу вэньмин кэчжи», а также сотрудникам и коллегам лаборатории цифрового и мобильного управления Фуданьского университета и коллегам из профессиональной сферы за их поддержку в создании настоящей книги. Ли Нань содействовал редактуре и подготовке текста к печати, контролировал план-график проекта; Дэн Чжисинь внёс ценные замечания касательно редактуры некоторых глав. Огромную поддержку для проведения опроса в процессе создания книги оказал председатель правления компании «Чжухай исыцзя» Ван Дэю. Также особо благодарим Ван Вэя, Хэ Жуйцзюня и других редакторов издательства «Жэньминь Юдянь чубаньшэ» за высказанные ими конструктивные предложения при подготовке рукописи. Они проделали предельно кропотливую работу, для того чтобы эта книга увидела свет.
Мы также благодарны за предоставленную нам честь и возложенную на нас ответственность внести данной книгой свой вклад в чествование семидесятой годовщины со дня основания Китайской Народной Республики. Мы прекрасно понимаем, что данная книга даёт лишь небольшое, промежуточное, представление о развитии больших данных в Китае. Наши знания и способности, безусловно, ограничены, истории и теоретические положения, представленные в книге, едва ли являются полными, поэтому мы с радостью примем замечания и поправки от уважаемых читателей.
ГЛАВА 1. ПРОШЛОЕ И НАСТОЯЩЕЕ БОЛЬШИХ ДАННЫХ
В эпоху интернет-экономики данные являются новым производственным фактором, основополагающим и имеющим стратегический характер ресурсом и важной производительной силой.
Научное суждение, сделанное Председателем Си Цзиньпином во время второй коллективной учебной сессии Политбюро ЦК КПК
1.1. Правильное понимание больших данных: в реальном мире чисел не существует
[2]
В традиционном понимании «численные данные» – это «обоснованные числа». Числа появились потому, что человек в своей практической деятельности обнаружил: описание существующей реальности с помощью только устного и письменного языка и изображений не является точным и средств этих недостаточно. Так, если на вопрос: «Насколько Яо Мин высокий?» – ответить: «Очень высокий», «Необыкновенно высокий» или «Самый высокий», – спрашивающий о росте баскетболиста сможет составить лишь абстрактное представление, ведь каждый по-разному понимает «очень», да и понятия «необыкновенно» и «самый» тоже являются относительными. При этом ответ «2,26 метра» ни малейшей неопределённости не оставит. Числа не только описывают реальность, но и являются важным инструментом её изменения. Можно сказать, что вся производственная и обменная деятельность человека базируется на численных данных: именно они лежат в основе системы измерения и денежной системы, изобретение и возникновение которых в значительной мере содействовало прогрессу человеческой цивилизации.
Как показано на рисунке 1.1, выделяют такие источники численных данных, как измерение, регистрация и вычисление. Первоначально численные данные получают в ходе измерений, и так называемые «обоснованные числа» – это регистрация результатов измерений объективной реальности, а не что-то произвольным образом возникшее. С древности и до наших дней измерение является ведущим методом научного исследования. Без измерений не было бы науки; можно также сказать, что сущностью науки в целом являются измерения. В этом отношении значение численных Три основные источника численных данных Измерение Регистрация Вычисление данных для науки сопоставимо со значением языка для литературы, нот для музыки, формы и цвета для изобразительного искусства, – в отрыве от численных данных наука невозможна.
Рисунок 1.1. Источники численных данных
Помимо измерения и говорящей самой за себя регистрации данных новые численные данные также появляются из уже имеющихся посредством вычислений. И измерения, и вычисления осуществляются людьми, иными словами, в реальном мире чисел не существует, все данные – это то, что произведено человеком. Значение слова «первичный» в выражении «первичные данные» совсем не то же, что в выражении «первичный лес». «Первичный (первобытный) лес» – это лес, существующий в созданном природой виде, тогда как «первичные данные» – это всего лишь данные, полученные из первоисточника и не изменявшиеся человеком.
Рисунок 1.2. Данные, информация, знания
Как показано на схеме 1.2, в традиционном понимании, «данные», «информация» и «знания» – это совершенно разные понятия. Данные являются проводником информации, информация представляет собой данные с контекстом, а знания – это конечная информация, обладающая закономерностями, полученными в результате произведённых человеком обобщения и упорядочивания.
В 60-е годы 20 века, когда наблюдался огромный прогресс в теории программного обеспечения, были изобретены базы данных. После этого численные данные, тексты и изображения стали без дифференциации храниться в базах данных компьютеров, единицей, в которой осуществлялось хранение, был «бит», а значение слова «данные» начало расширяться. Понятие «данные» указывает не только на являющиеся результатом измерений числовые значения, то есть «числовые значения измеряемой величины», постепенно оно стало общепринятым обозначением «чисел, текстов, изображений, аудио и видео», то есть синонимом «информации». Поскольку такая информация существует как своего рода свидетельство и базис, её можно назвать «опорными данными».
Исходя из этого автор считает, что определение понятия «большие данные» достаточно ясно и точно выражает следующая формула:
Большие данные = традиционные числовые + современные значения измерений опорные данные
(Источником количественных данных являются измерения, как в случае с температурой 28° C; источником опорных данных является регистрация, как в случае с фотоснимком, например.)
Хотя количественные данные ближе к «числам», чем опорные данные, с исторической точки зрения последние возникли раньше, чем первые. Регистрация событий собственной жизни, которую человек вёл уже в древние времена, так называемые «летописи», и есть ранние опорные данные, можно даже сказать, что опорные данные – это тень истории. Количественные данные в практике регистрации событий и явлений реальности появляются медленно, их ключевой смысл заключается в точности. Обилие или, напротив, нехватка количественных данных напрямую определяли возможность науки развиваться. Если отталкиваться от этой точки зрения, источники данных – это уже не только измерения реальности, но и её регистрация. Таким образом, в информационную эру добавился ещё один источник данных – регистрация.
С её наступлением данные стали синонимом информации, и оба слова могут использоваться как взаимозаменяемые. Несмотря на то, что, например, письмо содержит много информации, с технической точки зрения она может представлять собой «единицу данных». Сфера «Данные» в современном толковании шире, чем сфера «Информация» (показано на рисунке 1.3).
Рисунок 1.3. Категории современных данных
Наряду с расширением внутреннего содержания понятия и созданием баз данных возникло ещё одно важное явление – непрерывное увеличение объёма данных, происходящее при этом с постоянно нарастающей скоростью.
Для описания названного феномена в 80-е годы ХХ века один американский специалист предложил использовать понятие «большие данные». И хотя в то время эпоха «большого взрыва данных» ещё не началась, некоторые специалисты были способны предсказать, что вслед за прогрессом информационных технологий важность программного обеспечения будет снижаться, а важность данных, напротив, возрастать. В те годы определение «большой», как и в случае с выражениями «большой человек», «большой шаг», главным образом имело ценностное значение. В 21 веке, особенно после возникновения социальных медиа в 2004 году, объём данных начал увеличиваться как при большом взрыве: как показывают данные компании International Data Corporation (IDC), в период с 2011 по 2018 годы объём общемировых данных увеличился в 18 раз, и вопрос формулировки понятия «большие данные» снова попал в поле зрения широких масс и привлёк к себе пристальное внимание. В этот период значение определения «большой» стало ещё более широким и указывало и на большой объём, и на большую ценность.
И всё же насколько большие данные могут называться «большими»? За десять с небольшим прошедших лет по этому вопросу велось огромное множество споров. Ответ на него в первую очередь связан с размерами единиц измерения данных. В 2000 году, как правило, считалось, что большие данные – это данные, измеряющиеся в терабайтах. В тот период предприятий, где использовались бы данные терабайтного порядка, было представлена текстами, изображениями и музыкой, стал настолько велик, что традиционным предприятиям было бы немыслимо достичь того же уровня.
УГЛУБЛЁННЫЙ ВЗГЛЯД
Разберёмся в нескольких важных единицах хранения информации
Одна песня со стандартным качеством звука – это 4 мегабайта (Мб).
Один фильм со стандартным качеством графики – это 1 гигабайт (Гб, 1 гигабайт = 1024 мегабайтам, то есть размер фильма равен размеру 250 песен со стандартным качеством звука).
Книжный фонд обычной библиотеки – это 1 терабайт (Тб, 1 терабайт = 1024 гигабайтам, это размер 1024 фильмов со стандартным качеством графики).
В действительности лавинообразное увеличение объёма самых разнообразных данных наблюдается не только в интернет-индустрии, но и во множестве других отраслей и индустрий, с единственным отличием – в масштабе. Если критерии больших данных ограничить исключительно интернет-индустрией и считать, что они используются только в ней, это серьёзно сузит смысл понятия «большие данные». В конце концов объём – это только одно проявление, а сущностью больших данных является как раз их ценность, и при этом большой объём совсем не обязательно представляет большую ценность. Подлинное значение больших данных заключается всё же в большой ценности, которая, в свою очередь, приобретается прежде всего за счёт консолидации, анализа и открытия данных. С этой точки зрения подлинное значение больших данных состоит в том, что человек, получив беспрецедентные возможности для использования огромного массива данных, выявил в них новые знания, создал новые ценности и тем самым принёс обществу «большое знание», «большую науку и технику», «большую эффективность», «большой интеллект» и другие возможности для развития.
Выше мы обсудили понятийное различие между «данными» и «большими данными», однако самый лучший способ постичь какое-либо понятие – это понять его происхождение в динамике. Формирование больших данных объясняется не только прогрессом в информационных технологиях, но и результатом того влияния, которое оказывали друг на друга многочисленные достижения, сделанные в разное время в области информационных технологий.
1.2. Революция запоминающих устройств: эволюция, приведённая в движение действием закона Мура
В 1965 году один из создателей компании Intel Гордон Мур, проведя исследование закономерностей развития аппаратных средств вычислительных устройств, сформулировал знаменитый закон Мура. Согласно которому количество транзисторов, которое может быть размещено на микросхеме одной площади, увеличивается вдвое за период от одного года до двух лет2.
Постичь значимость увеличения числа транзисторов совсем непросто. Первоначальная идея Мура состояла в том, что увеличение плотности транзисторов на удельную площадь микросхемы приведёт к тому, что быстродействие аппаратных средств вычислительных устройств и их запоминающая способность, то есть их основные характеристики, будут увеличиваться вдвое за срок от одного года до двух лет. Было бы правильным, если бы улучшение характеристик влекло за собой повышение цены, однако в реальности происходит ровно наоборот: в последние полвека характеристики аппаратных средств непрерывно улучшались, при этом их стоимость непрерывно снижалась. Главная стоящая за этим причина, как ни удивительно, в постоянном уменьшении размеров транзисторов, поскольку уменьшение габаритов приводит и к снижению себестоимости; помимо этого, спрос на транзисторы возрастает с течением времени, а крупномасштабность производства также влечёт за собой непрерывное удешевление.
Оглядываясь на последние более чем полвека, отметим, что развитие аппаратных средств вычислительных устройств в принципе соответствовало закону Мура, что схематично показано на рисунке 1.4. Рассмотрим в качестве примера физическую память. Её свойства действительно постоянно улучшаются, в то же время стоимость неизменно падает. В 1955 году компания IBM выпустила первый блок памяти для коммерческого использования, запоминающее устройство ёмкостью 1 мегабайт стоило более 6 000 долларов США. Впоследствии его цена непрерывно снижалась: в 1960 году она снизилась до 3 600 долларов, в 1993 году – до 1 доллара, в 2000 году – примерно до 1 цента, к 2010 году стоимость каждого мегабайта составляла около 0,005 цента. За период чуть более полувека цена на запоминающее устройство опустилась до одной стомиллионной от первоначальной цены – масштаб и стремительность подобной перемены поистине поражает. В реальности за всю историю человечества не было ни одного другого продукта, размах снижения цены на который был бы настолько огромным!
Рисунок 1.4. Соотношение реального количества транзисторов на микросхеме центрального процессора в 1971–2011 годах и предполагаемого законом Мура
Примечание: вертикальная ось показывает количество транзисторов, горизонтальная – годы. Данная кривая демонстрирует, что в 1971–2011 гг. количество транзисторов на микросхемах центральных процессоров одинаковой площади увеличивалось вдвое примерно каждые два года. Необходимо отметить, что на самом деле от 2 300 до 10 000 и затем 100 000 на вертикальной оси увеличение показано не в пропорциональном виде. Если строить график строго в соответствии с пропорциями, из-за крайне резкого взлёта кривой было бы невозможно вместить его на страницу (источник материала: Википедия).
УГЛУБЛЁННЫЙ ВЗГЛЯД
Количество произведённых транзисторов значительно превосходит количество имеющихся в мире зёрен риса
Транзисторы производятся из кремния, по сути своей, они являются переключателями: когда транзистор пропускает через себя ток, это выражает результат «1», когда не пропускает – результат «0». Это самый маленький составной элемент электронной продукции. В одном ноутбуке имеется около 40 миллиардов транзисторов, в смартфоне – приблизительно 1 миллиард. Производство транзисторов (то есть полупроводниковая индустрия) заслуженно считается самой высокопродуктивной отраслью в истории человечества. В настоящее время количество производимых во всём мире в год транзисторов превосходит даже количество ежегодно потребляемых зёрен риса: в 2002 году количество произведённых транзисторов превышало количество зёрен риса примерно в 40 раз, а по цене 1 зёрнышка риса можно было купить 100 транзисторов [3]; к 2009 году количество производимых транзисторов ещё увеличилось и стало превышать количество зёрен риса в 250 раз, теперь по цене 1 зёрнышка можно купить 100 тысяч транзисторов [4].
В наше время в соответствии с действием законом Мура развитие аппаратных средств достигло такой степени, что на площади, аналогичной площади кончика волоса, можно разместить десять тысяч транзисторов. Конечно, размер транзисторов не может уменьшаться до бесконечности, поэтому в последние десять с небольшим лет в профессиональной среде ведётся жаркая полемика вокруг следующего вопроса: продолжит ли наблюдаться описываемый законом Мура феномен, то есть может ли количество транзисторов на удельной площади увеличиваться и даже удваиваться? Если может, то на протяжении ещё какого времени?
В 2003 году этот вопрос задали Гордону Муру как человеку, обнаружившему рассматриваемую нами закономерность. По его мнению, «инновациям нет предела, и в следующее десятилетие закон Мура, вероятно, всё ещё будет действовать».
Как свидетельствуют факты, Мур был прав. В 2011 году компания Intel объявила об изобретении 3D (трёхмерных) 22-нанометровых транзисторов, что временно поставило в полемике точку. 22-нанометровые транзисторы оказались примерно на треть меньше своих самых маленьких по 23 размеру предшественников – 31-нанометровых транзисторов. Учитывая крошечный размер, новые транзисторы оказались, безусловно, более дешёвыми и более энергосберегающими. В 2012 году Intel объявила об инвестиции 5 миллиардов долларов США для строительства завода в штате Аризона, где в 2014 году было запущено производство 14-нанометровых транзисторов – их размер уменьшился по сравнению с размером 22-нанометровых транзисторов ещё на треть. В январе 2019 года Intel обнародовала первый процессор Ice Lake, созданный по 10-нанометровой технологии, то есть таким образом на одном квадратном миллиметре площади было помещено 100 миллионов транзисторов. Планируется, что продукт будет выпущен в конце 2019 года и в 2020 году будет поставлен на рынки [5].
Изобретение компании Intel заставило большую часть учёных поверить в то, что миниатюризация транзисторов может продолжаться ещё как минимум десятилетие, то есть срок жизни закона Мура до сих пор не истёк. В будущем цена 1 терабайта объёма жёсткого диска будет равняться стоимости одной чашки кофе, о чём свидетельствует кривая его цены в последние годы, показанная на рисунке 1.5. Объём данных собрания печатных изданий крупнейшей библиотеки мира – библиотеки Конгресса США – составляет примерно 15 терабайтов, объем данных обычной университетской библиотеки, возможно, около 1–2 терабайтов. То есть в недалёком будущем будет возможно, потратив деньги, эквивалентные стоимости одной чашки кофе, скопировать всю информацию какой-либо библиотеки на миниатюрный жёсткий диск. Ещё никогда в истории информация не была столь удобной с точки зрения хранения и столь дешевой с точки зрения себестоимости.
Рисунок 1.5. Изменение цены на 1-терабайтные жёсткие диски
Примечание: автор отследил стоимость жёстких дисков компании Seagate Technology на сайтах amazon и JD в разные периоды времени: в 2012–2019 годы цена 1-терабайтных жёстких дисков очевидным образом снижается.
УГЛУБЛЁННЫЙ ВЗГЛЯД
Благодаря действию закона Мура аппаратные средства стали продуктом массового потребления
Действие закона Мура привело к значительному снижению цены на аппаратные средства и в конечном итоге к тому, что некогда дорогостоящие компьютерные компоненты стали предметом массового потребления, а изначально относившиеся к высокой ценовой категории продукты, такие как лазерные принтеры, серверы и смартфоны, постепенно распространились за пределы научно-исследовательских организаций и крупных предприятий и вошли в нашу повседневную жизнь. В связи с описанной популяризацией оборудования в некоторых компаниях США наблюдается даже новая тенденция: поощрение сотрудников к тому, чтобы они приносили на работу свои собственные устройства (Bring Your Own Device, BYOD), сами компании предоставляют только сеть и рабочее пространство, становясь таким образом «облегчёнными» компаниями.
Помимо удешевления и улучшения характеристик действие закона Мура приводит также к постоянному уменьшению размеров самой разнообразной вычислительной техники. В 1988 году это явление было резюмировано американским учёным Марком Уайзером как «повсеместные вычисления». Теория повсеместных вычислений гласит, что после своего изобретения компьютеры должны пройти три основных этапа. Первый – это этап «главного устройства», подразумевающий совместное использование суперкомпьютера большим количеством людей, суперкомпьютер при этом занимает половину комнаты. Второй – этап персональных компьютеров: они станут меньше, и у каждого человека появится по компьютеру. Так Уайзер смог «перешагнуть» из своего времени в наше. Описанное положение вещей уже практически реально, однако Уайзер гениально предвидел, что «у каждого по компьютеру» не есть конец эпохи. На третьем этапе компьютеры станут ещё меньше – настолько маленькими, что их будет не видно человеческому глазу, и люди смогут широко разместить в своей повседневной среде самые разные микрокомпьютеры и иметь таким образом возможность в любое время и в любом месте получать и обрабатывать данные. В итоге произойдёт слияние вычислительных устройств и окружающей среды. Такой этап получил название этапа повсеместных вычислений.
Сегодня волна третьего этапа повсеместных вычислений стремительно движется на нас, крошечные смартфоны по своим свойствам уже ни в чём не уступают полноценным компьютерам, всё меньше становятся разнообразные датчики, бурно развиваются тэги RFID (радиочастотной идентификации), всё ближе устройства, которые могут быть вмонтированы в мир вокруг нас.
Тэги RFID получили широкое применение в розничной продаже, медицине, городском управлении, системах кормления животных и других областях. В последние два года в Шанхае и Учжэне непрерывно развивают сферу применения умных контейнеров для мусора, внутри которых установлены датчики RFID, в режиме реального времени считывающие количество положенного мусора и объём хранения. Контейнеры также могут автоматически «уведомлять» дворников о том, какой из них наполнен и требует очистки, что в значительной мере повысило эффективность работы в сфере городского управления. RFID меняет и авиаиндустрию. В 2019 году компания China Eastern Airlines установила технологию RFID в систему транспортировки багажа, таким образом наделив этого «безмолвного пассажира» способностью к «выражению». Через мини-приложение WeChat пассажиры могут запросить перевозочный статус зарегистрированного багажа, его точное закреплённое положение, в реальном времени отслеживать изменение статуса, как если бы для багажа была установлена система отслеживания позиции GPS [6].
«Начальным годом эры носимой электроники» можно считать 2012 год, когда были выпущены очки Google Glass. После этого одно за другим стали появляться носимые электронные устройства – миниатюрные электронные устройства, которые можно носить на себе и которые не стесняют движений. Такие устройства могут регистрировать физическое положение человека, на котором они находятся, количество сожжённых им калорий, температуру тела, сердцебиение, режим сна, количество шагов, показатели здоровья и другие данные. В 2015 году опубликованная в СМИ фотография игроков команды Китая на Кубке Азии по футболу, тренирующихся в чёрных «бикини», заняла одно из самых высоких мест в рейтинге «горячих запросов». В действительности же привлекательно минималистичные тренировочные майки футболистов представляли собой не что иное как носимое электронное оборудование под названием GPSports, способное вести сбор и мониторинг таких параметров, как расстояние, которое пробежал спортсмен, траектория его бега, скорость, ускорение и изменение частоты сердечных сокращений. На основе сравнения и углублённого анализа данных тренер может разработать план тренировки, определить состав, ко-торый будет участвовать в матче, непосредственно в ходе матча принять ключевые командные решения [7].
Приведём ещё один пример. Французский производитель спортивного инвентаря Babolat установил на ручки теннисных ракеток датчики, способные регистрировать параметры состояния в то время, когда игрок ударяет по мячу, в частности тип удара (форхенд или бэкхенд), точку удара в мяч, силу удара по мячу, скорость мяча, направление вращения мяча и др. Все эти данные практически в режиме реального времени передаются в находящиеся здесь же, на спортивной площадке, смартфоны и планшеты тренеров и спортсменов, предоставляя им доступ к данным в любое удобное время. На Открытом чемпионате по теннису в Австралии 2014 года «первая леди» китайского тенниса Ли На использовала ракетку именно этой фирмы. В целях содействия использованию таких ракеток Международная федерация тенниса (International Tennis Federation, ITF) поменяла в 2013 году устав: начиная с января 2014 года спортсменам разрешалось использовать на международных соревнованиях ракетки с датчиками для того, чтобы записывать и анализировать собственные данные. На будущих соревнованиях при условии согласия спортсмена возможна даже демонстрация собранных данных на установленных непосредственно на месте состязаний экранах для широкой публики.
Использование датчиков быстро вошло не только в футбол и теннис, но и в бейсбол, регби и другие виды спорта. По мнению одной исследовательской организации США, выручка спортивной индустрии США в ближайшие несколько лет может существенно возрасти, и главная причина этого заключается как раз в изменении характера функционирования индустрии в целом, вызванном технологией сбора и анализа данных с помощью датчиков.
Носимое электронное оборудование имеет множество других применений, помимо спорта, уже даже крошечные подгузники начали наращивать «собственный ум». В 2015 году китайский бренд Backkom изобрёл умные подгузники нового типа: с помощью Bluetooth установленное внутри подгузника лёгкое интеллектуальное устройство для считывания температуры привязывается к телефону того, кто ухаживает за ребёнком, и каждый раз, когда ребёнок пописает, чувствительное интеллектуальное устройство посредством мелодии или вибрации об этом уведомляет. Кроме того, продукты, аналогичные наиболее репрезентативному среди носимых электронных устройств изделию – одно время модным очкам Google Glass, – получили широкое распространение и за пределами развлечений. В феврале 2018 года Чжэнчжоуская железнодорожная полиция самой первой в железнодорожной системе Китая использовала полицейские очки для сопоставления лиц. По сообщениям новостей, такие очки способны путём идентификации лиц проводить скрининг пассажиров и выявлять среди них правонарушителей, чтобы тем самым улучшить общественный порядок и обстановку в поездах [8].
Сущность повсеместных вычислений состоит в том, что физическая среда повседневной жизни человека широко наполняется крошечными вычислительными устройствами, повсеместно осуществляющими автоматический сбор данных, что означает улучшение возможностей человека. До описанного положения вещей цифровые данные производились преимущественно разнообразными информационными системами, которые главным образом регистрировали данные, возникшие в ходе бизнес-процессов. Однако в результате появления датчиков и становления соответствующей технологии у человека появилась возможность крупномасштабной регистрации явлений физического мира, и этот прогресс подстегнул приход эпохи больших данных.
1.3. Социальные медиа: всеобщий вклад, или Как каждый из нас производит данные
Подлинный «взрыв данных» произошёл в эпоху социальных медиа.
С 2004 года на свет одно за другим стали появляться социальные медиа, например: Facebook и Twitter, – что стало толчком к началу новейшей эры в истории Интернета – Веб 2.0. До этого основное назначение Интернета состояло в распространении и совместном использовании информации, главной формой организации чего были интернет-сайты. Однако сайты статичны. С наступлением эры Web 2.0 Интернет начал становиться проводником для происходящих в реальном времени взаимодействия, коммуникации и коллаборации.
Помимо обеспечения невероятного по уровню роста возможностей для взаимодействия и коллаборации ещё одна важная роль социальных медиа состоит в предоставлении площадки для бесчисленного количества пользователей Интернета со всего мира, благодаря чему они могут в любое удобное время и в любом удобном месте фиксировать свои поступки и мысли. Это фиксирование, по сути своей, и является тем, что вносит вклад в производство данных. Выше мы уже говорили о том, что все данные являются искусственно произведёнными, все данные – это выполняемые нами в отношении реального мира измерения, фиксации и вычисления. Начиная с 1946 года, когда с изобретением вычислительного устройства человечество вошло в информационную эру и ещё не были созданы социальные медиа, данные главным образом производили и собирали информационные системы и датчики. Однако в связи с внезапным появлением социальных медиа человек начал и сам производить данные в Интернете. Публикуемые пользователями записи в Weibo и отправляемые ими через WeChat сообщения, фиксирующие личные действия и поступки, – такие данные получили название «поведенческие», их отношение к другим типам данных показано на рисунке 1.6.
Благодаря появлению социальных медиа пользователи Интернета со всего мира начали становиться создателями данных. Каждый из нас, будто информационная система или датчик, непрерывно создаёт данные. Это повлекло за собой беспрецедентный по своему размаху «взрыв данных».
Помимо резкого увеличения объёма данных социальные медиа привели также к усложнению устройства вселенной данных. Кто-то, создавая пост в микроблоге, прикрепляет изображение, кто-то – видео, произведённые ими данные и по размеру, и по структуре совершенно различны. В связи с отсутствием строгой структуры данные, созданные в социальных медиа, называются также неструктурированными.
Рисунок 1.6. Разные данные с точки зрения размера и типа
Примечание: взаимное влияние разных типов данных. Коммерческие данные могут естественным образом содержать в себе и производить данные о поведении человека и окружающей природной среде, точно так же данные о поведении человека и окружающей природной среде являются взаимовключающимися, перекрёстными и взаимовлияющими. В прошлом мы фиксировали что-либо, только предварительно выбрав, что именно должно быть зафиксировано. В эпоху больших данных мы выбираем то, что зафиксировано быть не должно, и затем удаляем запись об этом. По мере непрерывного расширения сферы фиксирования можно быть уверенным: в будущем совокупный объём данных, имеющихся в распоряжении человека, будет нарастать подобно снежному кому.
Обработка подобных данных несопоставимо сложнее, чем обработка данных, имеющих строгую структуру. 15 марта 2019 года сервис микроблогов Sina Weibo опубликовал «Отчёт о развитии пользователей Weibo в 2018 году», согласно которому по состоянию на четвёртый квартал 2018 года среднее количество текстов, которые пользователи сервиса публиковали в сутки, составил 130 миллионов, среднее количество публиковавшихся за сутки изображений – 120 миллионов, среднее количество публиковавшихся за сутки видео и проведённых прямых эфиров – более 1,5 миллионов. Для сравнения: суммарный объём информации, опубликованной New York Times за прошедшие пятьдесят лет, не превышает 3 миллиардов слов.
Учитывая беспрецедентную скорость производства данных, примерно 75 % от общемировых данных в настоящий момент – это неструктурированные данные. Оглядываясь назад, мы можем сказать, что появление социальных медиа оказало на большие данные определяющее воздействие. Отталкиваясь от приведённого выше анализа, мы можем принять следующее:
Большие данные = структурированные данные + неструктурированные данные.
Однако, как мы уже упоминали, определение «большой» в понятии «большие данные» указывает не только на большой объём данных, но и на их большую ценность. Ценность же заключается в использовании. Как в случае с погребённой в недрах земли нефтью: она хотя и существовала с глубокой древности, человечество вошло в нефтяную эпоху благодаря тому, что появились технологии её добычи и переработки, – точно так же главная причина начала эпохи больших данных состоит в значительном прорыве и прогрессе в возможностях эти данные использовать.
1.4. Как интеллектуальный анализ данных «превращает цифры в золото»
Прорыв, сделанный в отношении возможностей использовать данные, проявляется в интеллектуальном анализе данных.
Под интеллектуальным анализом данных (data mining) подразумевается осуществляющийся с помощью специальных алгоритмов автоматический анализ больших объёмов данных, имеющий целью выявление скрытых в них закономерностей и тенденций, иными словами, получение из данных большого объёма новых знаний, от которых можно отталкиваться, принимая те или иные решения. Основная причина прогресса в интеллектуальном анализе данных, то есть способность человека непрерывно изобретать всё более сложные алгоритмы распознавания образов3 в сущности является прогрессом в программном обеспечении. Самой знаменательной вехой развития интеллектуального анализа данных стала 1-я ежегодная научная конференция по data mining, организованная в 1989 году американской Ассоциацией вычислительной техники (Association for Computing Machinery, ACM), Специальной группой по обнаружению информации и интеллектуальному анализу данных (Special Interest Group on Knowledge Discovery and Data Mining, SIGKDD). Результаты работы конференции были отражены в специальной периодике. После этого развитие интеллектуального анализа данных получило огромное ускорение.
И действительно, в последние десятилетия благодаря технологиям интеллектуального анализа данных в самых разных крупных компаниях отмечалось немало удивительных историй, связанных с «превращением цифр в золото». Приведём несколько примеров. Накапливавшиеся в течение долгого времени записи о финансовых операциях пользователей позволили компании Alibaba проникнуть в финансовую сферу. Теперь сервис может за несколько минут определить кредитные данные пользователя и на этом основании принять решение о выдаче ему кредита. Walmart повысил объём продаж товаров в магазинах за счёт связи «пиво и подгузник». Netflix, используя учёт смены предпочтений своих пользователей, строит предположения о том, что им понравится смотреть, на основании чего осуществляется целенаправленный маркетинг.
Непрерывное обновление, которое в последние годы характеризует применение интеллектуального анализа данных, позволяет надеяться на новые достижения в этой сфере в будущем. Например, к переломному моменту своего развития приближаются продовольственные рынки, с которыми мы вот уже несколько тысяч лет «смотрим друг на друга и не можем насмотреться». На проводившемся в начале 2019 года собрании местных партнёров Alibaba по поставкам свежей пищевой продукции компания Ele. me заявила о намерении «изменить продовольственный рынок», создать совершенно новую открытую платформу для доставки свежих продуктов, переместить продовольственный рынок в онлайн-формат, заставить традиционный продовольственный рынок попрощаться с существовавшей в течение нескольких тысяч лет моделью функционирования, когда «каждый сам за себя» и «продаёт не по спросу, а то, что выросло», кроме того, сделать так, чтобы платформа содействовала превращению продажи овощей в тренд.
Каким же образом осуществить это содействие? Основным инструментом для этого как раз и является интеллектуальный анализ данных. Главная болевая точка традиционного продовольственного рынка – это информационная асимметрия: продавцы, завозят продукцию на продажу и не имеют в своём распоряжении точной информации о рыночном спросе, что приводит к накапливанию товаров или возникновению проблем с качеством. В этой ситуации Ele.me, опираясь на огромные массивы данных, накопленных Alibaba, может предоставить продавцу максимально точный портрет покупателя, что позволит регулировать деятельность по поставкам продукции на продажу. Таким образом поставки продукции на продовольственные рынки больше не будут произвольными – процесс принятия решения передаётся алгоритмам, и уже они решают, какие товары необходимо завезти. Резонанс интересов предпринимателей и самой платформы, достигающийся за счёт подобного рода цифрового маркетинга, может стимулировать возникновение огромной коммерческой стоимости. Описанная модель была опробована и на рынке: после того, как сервис Dingdong Maicai вошел в Ele.me, количество заказов на платформе за 2018 год увеличилось в 20 раз, а ежемесячный оборот торговли превысил 10 миллионов юаней [9].
Приведём ещё одну небольшую историю об интеллектуальном анализе данных. Во время проведения Чемпионата Европы по футболу в июне 2012 года в Китайских ресурсах появилось много сообщений о том, что «пока мужчины смотрят футбол, женщины занимаются онлайн-шоппингом» [10]. Сообщалось, что, согласно данным Taobao по продажам, после открытия чемпионата Европы торговый оборот женского сегмента онлайн-шоппинга очевидным образом вырос, при этом «пиковое время онлайн-продаж сдвинулось на два часа позднее, переместившись на отрезок с 23 до 24 часов». Кроме того, в период между окончанием первого матча в 1:45 ночи и началом второго матча в 2:45 ночи возник ещё один пик онлайн-продаж, и торговый оборот увеличился более чем на 260 % по сравнению с торговым оборотом в тот же отрезок времени в период до начала кубка.
Логику, составившую основу этого явления, несложно понять. Во время футбольного матча мужчины полностью погружались в просмотр, оставляя жён (или подруг) и детей без внимания. Женщины, особенно замужние, могли испытывать подавленность, раздражение и разочарование. Каждый раз, когда вечером начинался матч, у каждой женщины в такой ситуации появлялся большой выбор: например, начать делать домашние дела, болтать с подругами, звонить родителям, заниматься онлайн-шоппингом. Её поведение характеризует неопределённость, и предсказать, что именно она в конечном итоге будет делать, сложно. Однако если мы суммируем данные о продажах нескольких электронных торговых площадок и проанализируем их, то увидим, что групповое поведение женщин демонстрирует закономерности, поддающиеся отслеживанию. С началом кубка стал расти объём товаров, купленных женщинами онлайн, среди них увеличилось, по сравнению с обычным временем, и количество товаров высокой ценовой категории, то есть клиентки наконец позволили себе те вещи, на которые в обычной жизни у них не поднималась рука. До наступления эпохи больших данных утверждение «пока мужчины смотрят футбол, женщины занимаются онлайн-шоппингом» так и осталось бы не более чем догадкой, которую невозможно ничем подтвердить. Теперь же, в эпоху больших данных, получить ей подтверждение невероятно просто, причём мы можем проанализировать даже то, какие особенности отличают купленные товары. Во время следующего чемпионата магазины могли давать уже более предметную рекламу, они смогли не только более точно сфокусировать рекламные объявления исходя из адресата рекламы, выбор продвигаемых в них товаров также стал более адресным. Когда догадка выросла в знание, знание создало прибыль.
Помимо описанного выше применения в коммерции всё более распространённым становится использование интеллектуального анализа данных для решения общественных проблем. В июне 2013 года появились сообщения, что некая девушка из Восточно-китайского педагогического университета получила смс от администрации университета следующего содержания: «Уважаемый студент, мы обнаружили, что в прошлом месяце ваши затраты на питание в столовой были сравнительно небольшими. Возможно, вы испытываете финансовые трудности?» [11] Происхождение этого заботливого сообщения также объясняется интеллектуальным отбором данных: в результате анализа данных о тратах, полученных с университетских карточек на питание, администрация обнаружила, что затраты девушки на каждый приём пищи оказались сниженными, что и вылилось в отправку приведённого выше участливого сообщения. Впоследствии, однако, обнаружилось, что была допущена прекрасная ошибка: в действительности девушка просто хотела похудеть. Можно подумать, что причина возникновения ошибки в том, что данные были недостаточно «большими». Особенность больших данных в том, что помимо «большого объёма» они также являются «многоисточниковыми». Если бы помимо карточек на питание были проанализированы другие вспомогательные источники данных, вывод, вероятно, был бы более точным.
Несмотря на расцвет интеллектуального анализа данных, в определённой степени он уже не является передовым и горячим направлением в рамках больших данных, на лидирующих позициях его сменило машинное обучение. Интенсивно развивающееся в настоящий момент машинное обучение также опирается на компьютерные алгоритмы, но его алгоритмы, по сравнению с алгоритмами, использующимися в data mining, вовсе не являются фиксированными, они содержат саморегулирующиеся параметры, то есть в процессе машинного обучения по мере увеличения количества выполненных вычислений и анализов данных параметры алгоритмов непрерывно саморегулируются, вследствие чего результат анализа данных и прогнозирования становится более точным. Кроме того, предлагая компьютеру большой объём данных, мы даём ему возможность, подобно человеку, путём обучения постепенно самосовершенствоваться, поэтому данная технология и получила название «машинное обучение».
Наравне с интеллектуальным анализом данных и машинным обучением очень зрелыми являются также технологии анализа и применения данных, сформировавшие при этом единую систему. Хранилища данных, интерактивная аналитическая обработка (OLAP), визуализация данных, анализ машинной памяти – всё это важные составные элементы данной системы, и в процессе развития технологий сбора и обработки данных они все сыграли важную роль4.
Оглядываясь на более чем полувековую историю информационного общества, отметим, что материальный базис феномена больших данных был заложен только благодаря непрекращающемуся уменьшению размеров транзисторов и снижению их себестоимости, в результате чего у людей появилась возможность создать колоссальное, подобное огромному литому сосуду, хранилище для огромного массива данных. Технология же интеллектуального анализа данных, расцвет которой начался в 1989 году, сопоставима с технологией перегонки сырой нефти в готовый продукт: она является ключом к тому, чтобы большие данные произвели «большую ценность», без этой технологии, насколько огромен бы ни был массив данных, мы могли бы только «глядеть на нефть и бессильно вздыхать». Появившиеся в 2004 году социальные медиа, в свою очередь, сделали каждого из нас потенциальным создателем данных, который вносит свою лепту в наполнение отлитого вследствие действия закона Мура «сосуд», что и является главным фактором формирования «большого объёма». Схематично совокупность описанных факторов показана на рисунке 1.7.
Рисунок 1.7. Три основных формирующих элемента больших данных
Проанализировав статичное понятие «большие данные» и формирующие их динамичные элементы, мы можем более ясно представить особенности этого явления, а также раскрыть его и дать ему определение исходя из разных точек зрения, как это показано на рисунке 1.8.
Рисунок 1.8. Понятие «большие данные» и характеризующие его факторы
Как мы уже говорили выше, в настоящее время 75 % производимых человеком данных – это данные неструктурированные, и именно в форме неструктурированных данных воплощаются крупные массивы зарегистрированных данных. Если мы хотим обнаружить ценность крупных массивов зарегистрированных данных и неструктурированных данных, главный способ обработки их в настоящее время – это всё же преобразование их в строго структурированные, то есть традиционные малые данные. Поэтому, по мнению автора, ценность больших данных главным образом заключается в малых данных и структурированных данных, а их объёмность – прежде всего в существующих в настоящее время крупных массивах зарегистрированных данных и в неструктурированных данных.
Подъём больших данных заставил учёных всего мира строить предположения и гипотезы о том, какое влияние эта «новая волна», вызванная развитием информационных технологий, принесёт человеческому обществу и в каком направлении она поведёт Китай и мир в целом. В следующих главах мы попробуем ответить на эти вопросы применительно к нескольким областям.
ГЛАВА 2. ЦИФРОВОЕ УПРАВЛЕНИЕ: ИСПОЛЬЗОВАНИЕ БОЛЬШИХ ДАННЫХ ДЛЯ ПОВЫШЕНИЯ УРОВНЯ ГОСУДАРСТВЕННОГО И МУНИЦИПАЛЬНОГО АДМИНИСТРИРОВАНИЯ И ГОСУДАРСТВЕННЫХ УСЛУГ
Необходимо построить полноценный механизм, с помощью которого большие данные будут содействовать наукоёмкости процессов принятия решений и социального управления и внедрению инноваций в модели государственного и муниципального администрирования и социального управления, чтобы тем самым достичь научной обоснованности принимаемых органами управления решений, точности социального управления и высокой эффективности государственных услуг.
Высказывание Председателя Си Цзиньпина во время второй коллективной учебной сессии Политбюро ЦК КПК
До 2016 года жителям Чжэцзяна для оформления регистрации купли-продажи вторичного жилья требовалось принести отдельные пакеты документов в три инстанции: министерство земельных и природных ресурсов, министерство жилищного и городского строительства и налоговую службу, – после чего самого оформления следовало ждать ещё какое-то время. Теперь же достаточно обратиться в одно окно с одним пакетом документов, и в течение часа процедура будет полностью выполнена. Оформление свидетельства о праве собственности на недвижимое имущество изначально требовало пятнадцати шагов, для совершения многих из которых нужно было стоять в очередях. На сегодняшний день, благодаря реализации принципа «один номер очереди – получение услуги в одном окне» [14], прежние пятнадцать шагов сведены к трём. Проведённая в Чжэцзяне реформа по «минимизации количества обязательных посещений госучреждений до одного» сделала жизнь обычных людей по-настоящему удобной и приятной.
Сущность реформы по «минимизации количества обязательных посещений госучреждений до одного» состояла не просто в том, чтобы физически свести в одно окна многочисленных государственных и муниципальных учреждений, а в однократной, направленной внутрь «революции» самих этих учреждений. Этот процесс был обеспечен в первую очередь реструктуризацией учреждений и реорганизацией административных процессов, а его ключевыми звеньями стали преодоление обособленности данных и совершенствование механизмов управления данными.
Тем не менее реформа по «минимизации количества обязательных посещений госучреждений до одного» – это всего лишь отправная, но никак не конечная точка в реформировании системы государственных услуг. Существует ещё огромное число направлений для развития той помощи, которую большие данные могут дать в сфере модернизации системы государственного управления и возможностей управления и удовлетворения с каждым днём возрастающей потребности людей в лучшей жизни.
2.1. От «ухода от причудливых справок» до «ухода от справок»
Ещё не так давно СМИ пестрели сообщениями о «причудливых справках», «замкнутом круге справок» и «дублирующих справках». Например, некоторым гражданам при оформлении наследства на недвижимость требовалось предоставить свидетельство о смерти умершего родственника, а некоторым пожилым людям для получения пенсии приходилось документально подтверждать, что они ещё живы. Премьер Государственного совета КНР Ли Кэцян выступил с критикой этого явления на собрании членов Постоянного комитета Госсовета в мае 2015 года. Если в реальности вся подобная информация о жителях страны имеется в распоряжении государства, почему для того, чтобы люди могли получить какую-либо услугу в государственных и муниципальных учреждениях, им нужно самим ходить по всем инстанциям и собирать соответствующие удостоверяющие документы?
Феномен «причудливых справок» объясняется отсутствием совместного межведомственного и межмуниципального доступа к данным, имевшимся в распоряжении части учреждений страны. Раз данные не могли «бегать по делам», делать это приходилось людям и организациям, а сама ситуация, ко всему прочему, оставляла лазейки для фальсификации справок и документов. Наступление эпохи Интернета и больших данных дало решающий ключ для решения этой проблемы.
В 2019 году городском округе Цзиньхуа провинции Чжэцзян, первом среди городских округов страны, развернули работу по созданию «города без справок»: было объявлено, что муниципальные ведомства и общественные учреждения на всей территории округа не должны требовать от граждан и организаций никаких справок или свидетельств, выпущенных каким-либо третьим полномочным органом. Это решение местного правительства образно представлено на рисунке 2.1. Отрадные результаты были получены всего за несколько месяцев ведения работы по созданию в Цзинхуа «города без справок». Была полностью упразднена необходимость предоставлять 18 типов справок и свидетельств, касающихся операций по фонду жилищных сбережений, в частности справка о доходах сотрудника, выписка о жилищном положении, документы, подтверждающие прямое родство того, кто претендует на получение накопительного фонда, и участника фонда, и требующееся в соответствии с политикой льгот на получение ипотечного кредита высококвалифицированными специалистами свидетельство с места работы, подтверждающее соответствующую квалификацию. Таким образом на территории всего округа было реализовано «не требующее справок» получение услуг по фонду жилищных сбережений. Прежде граждане, имеющие иную регистрацию, оформляя в Цзиньхуа разрешение на проживание, должны были сначала получить в министерстве социального обеспечения выписку, удостоверяющую уплату социального страхования за период более полугода, затем с этой выпиской, удостоверением личности и контрактом на аренду жилья прийти в полицейский участок, чтобы подать заявление на оформление разрешения. А сейчас, благодаря совместному доступу к данным, работник учреждения может напрямую запросить информацию о социальном страховании, и от заявителя не требуется никаких дополнительных справок [15].
Рисунок 2.1. Создание «города без справок» (Го Дэсинь/Жэньминь Тупянь)
Реформа по созданию «города без справок» представляет собой полезную попытку сделать государственные услуги более ориентированными на людей, однако местные ведомства не имели полномочий выдавать свидетельства и справки, которые должны оформляться ведомствами других районов. Так, во многих профессиях для осуществления практической деятельности требуется наличие «справки об отсутствии судимости», однако органы общественной безопасности какой-либо местности, оформляя подобную справку, могут удостоверить лишь то, что записи о судимости отсутствуют на подведомственной им территории, соответственно, приезжие служащие вынуждены за такой справкой ехать в место своей регистрации. Сколько же людям пришлось совершить напрасных поездок из-за того, что данные не умеют «бегать» между муниципалитетами?
«Оседлав» разросшийся до масштабов общегосударственной стратегии восточный ветер интеграционного развития региона дельты Янцзы, идёт ускоренное продвижение совместного межмуниципального и межведомственного использования данных правительственных учреждений всех провинций (районных и городских округов) региона. 24 января 2018 года на первой сессии комитета 13-го съезда Народного политического консультативного совета Шанхая лидеры Шанхайского городского комитета партии, обсуждая стимулирование интегративного развития региона дельты Янцзы с позиций подхода, осуществления и ближайших действий, обратили внимание на то, что в регионе необходимо усилить дорожную и информационную сети, а также продвигать реализацию совместного использования данных и предоставления открытого доступа к ним [16]. 11 июня того же года на совместной пресс-конференции с участием «Цзефан жибао», «Вэньхуэй бао» и других СМИ лидеры Шанхайского горкома предложили план по созданию «единой базы данных», подразумевающий совместное строительство регионального центра хранения и обработки данных и унификацию форматов данных, их спецификации, каталогов и интерфейсов, чтобы тем самым сделать источники данных более эффективными в использовании. С одной стороны, такой план направлен на скорейшее содействие созданию исходной базы данных, чтобы в соответствии с единым стандартом ввести в неё государственные, отраслевые и социальные данные разных муниципалитетов. С другой стороны, на осуществление деятельности с опорой на единую платформу для совместного использования данных, их межведомственное и межрайонное использование [17].
В эпоху больших данных конечная цель и идеальное состояние, на которые направлены реформы организационной структуры муниципального управления и реорганизация административных процессов, состоит в создании единого правительства. Упразднение «причудливых справок», «замкнутых кругов справок» и «дублирующих справок» является первым шагом на пути к единому правительству, в котором административные цели и методы ведомств разных районов не только не противоречат друг другу, но и способны друг друга усиливать. Отдав приоритет нуждам граждан, разные ведомства с помощью разработки единой структуры и процедуры, единого финансового контроля, единой технической поддержки и культуры взаимного доверия и ответственности сформируют одно «соединённое без швов» правительство.
К моменту, когда это будет реализовано, простым людям не нужно будет разбираться в разграничении обязанностей между ведомствами, которое даже служащие самих ведомств не всегда могут чётко обозначить; людям также не нужно будет выяснять, как открываются двери в то или иное учреждение, кто его руководитель, к кому лучше обратиться по тому или иному вопросу. И даже зал обслуживания людям не нужно будет посещать. Чтобы без суеты и напряжения получить ту или иную услугу, достаточно будет выполнить несколько действий в телефоне либо пройтись до местной общины. Как и писали учёные Сян Цзин и Ян Гуаньяо, «электронные государственные услуги только тогда смогут принести гражданам максимальную пользу и стать по-настоящему ценными, если смогут экономить время и силы, которые граждане вынуждены тратить при взаимодействии с госучреждениями при подаче заявлений на оказание каких бы то ни было услуг, если будет осуществлено видение граждан о спокойной жизни, состоящее в том, чтобы “не тревожиться ни о мелочах, ни о важных делах”».
2.2. Данные «12345» делают города лучше
В последние несколько лет горячие линии государственных служб, представленные, например, линией «12345», пережив продолжавшиеся много лет объединение и стандартизацию, постепенно становятся важным каналом, с помощью которого широкие массы получают консультации, подают жалобы и получают услуги. Ещё более важным является то, что огромные массивы информации, накопленные горячими линиями государственных служб разных районов, характеризуются большим объёмом, высокой достоверностью, обширной покрывающей площадью, значительной временной эффективностью и другими преимуществами, благодаря чему они смогли помочь правительственным ведомствам лучше понять требования общественности и существующие в муниципальном управлении проблемы и тем самым усилить точность предлагаемых услуг, а также оказали мощную поддержку в сфере повышения уровня управления внутри самих ведомств [18].
По словам руководителя центра по исследованию цифрового управления Чжуншаньского университета Чжэн Юэпина, благодаря горячей линии муниципальных услуг Гуанчжоу на основании анализа большого массива данных о запросах и жалобах со стороны населения за прошедшие несколько лет была сделана предварительная оценка телефонной нагрузки в ближайшие три года, что позволило лучше рассчитать потребности в человеческих ресурсах, рабочих площадках, определить их себестоимость и привести работу в систему, благодаря чему повысилась эффективность распределения ресурсов. Собранные данные также используются для проведения оценки результатов работы сотрудников горячей линии, что обеспечивает постоянное улучшение качества обслуживания. В то же время, благодаря взаимодействию с министерством охраны окружающей среды и органами муниципального управления в сфере использования данных, горячая линия помогает этим ведомствам решать вопросы, касающиеся, например, загрязнения окружающей среды, шумовых помех и незаконного строительства. В городском округе Чжуншань был проведён анализ собранных государственной горячей линией данных, связанных с защитой прав потребителей, что позволило лучше проанализировать существующие в разных микрорайонах, уличных комитетах и торговых центрах проблемы, касающиеся поддельных и низкокачественных продуктов и послепродажного обслуживания, а также выявить новые тенденции, появившиеся в последние годы. Анализ всех этих данных может помочь отделу контроля и управления рынками точно выполнять дифференциацию и категоризацию проблем и тем самым повышать адресность и эффективность контроля и управления.
Дальнейшим шагом станет расширение сферы применения данных горячих линий и их выход за пределы внутриведомственного использования: эти данные также могут быть открыты обществу, чтобы различные его субъекты имели возможность совместно определять ценность ставшей доступной новой информации. В этом плане в других странах есть большой опыт, достойный того, чтобы мы его изучали и перенимали. Например, в Нью-Йорке с жалобой на обнаруженные в парке или на пешеходной дорожке собачьи экскременты можно обратиться на горячую линию: 311. После того, как собранные данные стали доступны общественности, учёные, занимающие наукой о данных, провели комплексное исследование, в котором проанализировали данные жалоб о собачьих экскрементах, данные о велосипедных дорожках Нью-Йорка, данные о расположении велосипедных стоянок, данные о лицензиях на создание уличных ресторанов, а также данные о всеобщем обследовании деревьев на улицах города, и выявили наиболее пригодные для прогулок в летнее время места Нью-Йорка.
В настоящее время горячие линии государственных служб движутся к новой фазе – интеллектуализации. Горячие линии государственных услуг в эпоху больших данных и искусственного интеллекта – это уже не просто колл-центры, для городов они, скорее, стали центрами хранения и обработки данных и смарт-платформами по предоставлению услуг: с помощью интеллектуального анализа больших данных горячих линий можно эффективно идентифицировать общественные потребности и существующие в городах проблемы, чтобы тем самым поддержать движение правительственных стратегий и городского управления в сторону научного подхода и, соответственно, точности [19]. Одновременно с этим открытие подобных горячих линий предоставило ведомствам, предприятиям и жителям города новые возможности для совместного решения существующих общественных проблем, таким образом каждый житель города способен сделать нашу жизнь в городах лучше.
2.3. Как большие данные распознают подлинные «города-призраки»
В 2010 году в одном из новостных сообщений новый район Кангбаши городского округа Ордос автономного района Внутренняя Монголия был назван «городом-призраком». После этого новости, в которых случаи избыточного строительства в разных местах Китая назывались «городами-призраками», следовали одна за другой. Однако встаёт вопрос, являются ли подобные сообщения истинными? Может быть, они частично преувеличены или не соответствуют действительности? Даже имея доказательства, такое сообщение сложно опровергнуть. Например, одни СМИ сообщали о серьёзной ситуации с пустующим жильём в городском уезде Жушань провинции Шаньдун, но при этом есть сообщения и о росте населения Жушаня, что снимает с него ярлык «города-призрака». Кроме того, в некоторых городах из-за стремительного развития туристической индустрии в последние годы было построено множество жилых комплексов для удовлетворения потребностей приезжающих в отпуск людей. В пик туристического сезона количество проживающих в этих комплексах увеличивается, в другие сезоны соответствующим образом уменьшается, превращая их в так называемые «города-призраки». И в действительности описанный феномен спада и подъёма людского потока является нормальным. И всё-таки сказанное вызывает вопрос: каков же настоящий «город-призрак»?
Команда одного из занимающихся наукой о данных китайского учёного – У Хайшаня, проанализировав данные о местонахождении смартфонов, впервые в Китае провела количественное исследование «городов-призраков». Учёные вели мониторинг двадцати районов с относительно высокой долей пустующего городского жилья и смогли дифференцировать застройку, пустующую по причине туристической сезонности, и настоящие «города-призраки». Как показало исследование, коэффициент заселения в некоторых «раскрученных СМИ» как типичные «города-призраки» новых городских районах очевидным образом растёт, тогда как в некоторых старых городских районах, а также модифицированных ресурсно-ориентированных городах была обнаружена пустующая жилая застройка. Так, самый первый «город-призрак», о котором сообщали СМИ, – новый район Кангбаши городского округа Ордос – «призраком» уже не является, чего нельзя сказать о старых городских районах Ордоса, отток населения в которых является более значительным. Похожая ситуация возникла в Тяньцзине. Очень многие считали, что здесь лишь один «город-призрак» – новый район Биньхай, однако анализ данных показал относительно серьёзную ситуацию с пустующим жильём в районе Цзиньнань, располагающемся, что удивительно, далеко не на окраине и имеющем жилую застройку рядом с учебными заведениями и станцией метро. Кроме того, довольно много случаев пустующего жилья обнаружено в таких модифицированных ресурсно-ориентированных городах, как Дунъин в провинции Шаньдун и район Хорчин городского округа Тунляо автономного района Внутренняя Монголия [20]. Известный учёный в области искусственного интеллекта Эндрю Ын прокомментировал это следующим образом: «Пришло время дать возможность машинам планировать городскую застройку на основе данных».
Премьер Государственного совета КНР Ли Кэцян отметил, что «в продвижении урбанизации центральной проблемой является урбанизация населения, а ключевой – повышение качества урбанизации, целью же является принести пользу простым людям и обеспечить крестьян»5. Человек является субъектом всей общественно-экономической деятельности, стимулирование урбанизации нового типа не должно быть «спортом по созданию городов», её отправная и конечная точки должны быть ориентированы на человека. Описанный выше основанный на мобильном Интернете и технологии обработки больших данных анализ даёт новые идеи для ориентированных на человека исследований.
Благодаря большим данным Правительство при принятии стратегических решений ориентируется теперь в большей степени на данные, а не на опыт. Заглядывая в будущее, можем сказать, что системный сбор объективных данных, всестороннее использование технологий цифрового корреляционного анализа, математического моделирования, виртуальной реальности, искусственного интеллекта, проведение модульного анализа и имитационного моделирования политического курса даст более точные основания для его выработки и принятия решений, обеспечит более полное и надёжное отслеживание его осуществления в реальном времени, предоставит более научно обоснованные и комплексные методы для оценки результатов его реализации. Большие данные обладают огромным потенциалом для применения в самых разных сферах: будь то проведение динамического контроля с предварительным оповещением по безопасности в отношении населения, транспорта, ресурсов и окружающей среды или предоставление поддержки данных для стратегического планирования моделей развития макроэкономической сферы.
Предварительным условием для проведения корреляционного анализа и применения данных является совместный межведомственный доступ к данным и управление данными. Разделение и обособление данных разных ведомств приведёт, с одной стороны, к невозможности применить к ним методы анализа больших данных и, соответственно, реализовать их суммарный потенциал, с другой стороны, будет неблагоприятным для интенсивного управления и снижения себестоимости и, кроме того, может легко привести к возникновению серьёзных угроз безопасности. Активное продвижение совместного согласованного использования информационной системы государственных услуг, которому в последние годы активно содействовал Госсовет, принесло положительные результаты, произошло заметное улучшение в отношении «обособленного управления, сегментации, использования разных, несинхронизированных компьютерных систем, обособленности информации».
Тем не менее для того чтобы по-настоящему осуществить совместный согласованный доступ ведомств к данным, необходимо выйти за рамки подхода «совместный доступ ради совместного доступа», необходимо подняться на уровень управления данными, чтобы детально рассмотреть, распланировать и привести в движение работу по организации совместного доступа к данным. Во-первых, необходимо содействовать созданию законодательных и нормативных актов в отношении управления данными, создать благоприятную среду для «управления данными в соответствии с законом». Во-вторых, необходимо выстроить полноценную структуру организации управления данными, усовершенствовать механизм контроля управления данными. В-третьих, требуется укреплять систему управления ресурсами данных и всесторонне повышать возможности управления данными. Это касается качества данных, их безопасности, стандартов, структуры данных, управления метаданными и полного жизненного цикла данных. В-четвёртых, следует ускорить темпы организации совместного и открытого доступа к данным, создать экосистему использования данных и привлекать общество к согласованному использованию открытых данных, исходящему из реальных нужд городов и сфер применения в них, создать общественную и экономическую ценность и сформировать позитивный фидбэк, предпринимать дальнейшие действия для продвижения муниципального управления данными, предоставления совместного и открытого доступа к ним, чтобы тем самым создать динамично-циклическую экосистему открытых данных [21].
2.4. Как «железная клетка данных» остановила произвол полномочий
«Платформа отслеживания больших данных превратилась в не подверженный коррупции эффективный инструмент», «ослабли ли убеждения, «расслабился» ли образ мысли, упала ли заинтересованность на самую нижнюю ступень, стала небрежной работа… Признаки всего этого можно найти с помощью больших данных». В начале мая 2019 года, когда в сети стала циркулировать новость о том, что «антикоррупционная система, основанная на больших данных, была закрыта из-за слишком высокой эффективности, которую показало её применение в отдалённых районах», ответственный за проект доктор наук Фан Цзиньюнь из Исследовательского института вычислительной техники Китайской академии наук вышел «из закулисья», чтобы опровергнуть сообщение как не соответствующее действительности. Пробное использование этой системы дисциплинарного мониторинга и контроля началось в уезде Маян провинции Хунань, на текущий момент она используется более чем в тридцати уездах (городских округах, районах) по всей стране [22].
«Если бы не эта система, мы бы, конечно, до сих пор и не знали о людях, которые столько лет присваивали чужие деньги, а теперь можно больше не бояться, что нас проведут!» Один крестьянин зарегистрировался в системе мониторинга фонда материального обеспечения и обнаружил, что он в 2014 году получил 8 000 юаней компенсации пострадавшим от стихийного бедствия, что отличалось от суммы, полученной им в реальности. Крестьянин оставил в системе жалобу. Когда её проверили соответствующие органы, выяснилось, что полагавшуюся крестьянину компенсацию оставил себе секретарь партийной ячейки деревни. Ещё один крестьянин проверил в терминале мониторинга фонда материального обеспечения пенсии членов своей семьи и, к удивлению своему, обнаружил, что его два года назад умершая мать продолжает регулярно получать деньги. Очень быстро обнаружилось, что чужую пенсию получал деревенский координатор социального обеспечения, и дело было передано в суд. И это не единичные случаи. После того как месячные траты медико-санитарной службы одного городского округа на покупку канцелярских товаров превысили 150 тысяч юаней, система автоматически создала предупреждение, повлекшее за собой расследование со стороны комиссии по проверке дисциплины. Выяснилось, что противоправные действия совершались руководителем службы, который по чекам на канцтовары проводил траты, сделанные на самом деле при покупке спиртного.
Для усиления мониторинга и контроля внутри государственных ведомств в Гуанчжоу создали так называемую «железную клетку данных». Контрольный комитет провинциальной комиссии по проверке дисциплины ввёл в систему десять моделей для сравнения данных государственных служащих, в том числе их персональную информацию, данные в отношении промышленной и коммерческой деятельности, данные о смертности, информацию в сфере жилищного фонда, информацию о транспортных средствах, анализ отклонений в лечении тяжёлых заболеваний и др. Одновременно с этим был открыт совместный доступ к данным органов гражданской администрации, к данным по управлению трудовыми ресурсами и социальному обеспечению, управлению жилищным и городским строительством, управлению в области санитарии, планирования семьи, иммиграционного управления. Сопоставление данных позволило быстро обнаружить проблемы и предпринять меры для их решения. Таким образом был реализован постоянный контроль за государственными служащими, вовлечёнными в работу над проектами по благосостоянию народа. Финансовое управление провинции создало динамичную систему мониторинга исполнения бюджета, в которую были заложены принципы мониторинга дисциплины, в частности предотвращение «денежных переводов баням, кортам для гольфа и другим особым получателям», прекращение «денежных переводов со служебных кредитных карт особым получателям», сигнализирование о «представительских расходах административных учреждений». В случае незаконного присвоения или расходования средств, выделяемых на так называемые «три типа служебных расходов», система может предотвратить их или своевременно остановить. С момента запуска системы были получены данные, позволившие предупредить и остановить нарушения, а также оповестить об уже совершённых нарушениях в 1 137 случаях, связанных с общей суммой в 15,584 миллиона юаней [23]. В феврале 2015 года премьер Государственного совета КНР Ли Кэцян посетил с инспекцией Пекинско-Гуйянский выставочный центр применения больших данных, где детально ознакомился с тем, как в Гуйяне используют персональные носимые видеорегистраторы и облачную платформу больших данных для мониторинга исполнения правоохранительных полномочий. По словам Ли Кэцяна, благодаря заключению правоохранительных полномочий в «железную клетку данных» недобросовестные рыночные действия становится невозможно скрыть: повсюду остаются следы действия полномочий, и это даёт прямое научное обоснование для принятия решений Правительством. Таким образом реализуется принцип: «Пока человек делает, облако вычисляет» [24].
Большие данные дали новые методы для усовершенствования внутреннего администрирования органов управления. Благодаря большим данным, облачным вычислениям и мобильному Интернету весь процесс осуществления властных полномочий стандартизован, оцифрован и на всех этапах оставляет прослеживаемые следы. Это в особенности справедливо для многих звеньев административно-исполнительных процессов, административных проверок и разрешений, нарушений закона и дисциплины: благодаря интеллектуальному анализу данных возможно своевременно обнаруживать и разрешать разного рода случаи преступного бездействия, нарушений порядка и коррупции. Таким образом был сделан переход от мониторинга, проводимого человеком, к мониторингу, осуществляемому данными, от мониторинга постфактум к мониторингу в процессе, от индивидуального мониторинга к комплексному – всё это в значительной мере сузило пространство для вымогательств со стороны полномочных лиц. В то же время помещение мониторинга на передний план благоприятно и для своевременного оповещения о тех случаях нарушений закона и дисциплины со стороны государственных служащих, когда «болезнь только начинается», и возможности их коррекции, позволяющей предотвратить накапливание и превращение небольших ошибок в крупные. Также это является одним из видов защиты для должностных лиц.
Стоит обратить внимание на то, что функционирование данных во внутреннем администрировании госучреждений не может существовать обособленно, по-настоящему раскрыть скрытый потенциал данных можно только при совмещении их использования с системным, организационным и культурным аспектами управления. Полностью разработанные перечни полномочий, ответственности и ограничений помогают достичь детализации, фиксации и цифровизации процесса осуществления властных полномочий и его звеньев. Создание безукоризненного механизма оценки рисков процесса осуществления властных полномочий позволяет при поддержке технологии своевременно предупреждать и обнаруживать случаи преступного недеяния и нарушения порядка. Сколь бы ни были продвинутыми технологии, в конечном итоге исполнение принадлежит человеку. Только по-настоящему укрепив исполнительную силу системы, мы можем вплотную соединить «железную клетку данных» и «железную клетку системы» и получить силу, превышающую простую сумму этих двух слагаемых.
2.5. “GovStore”: открытый доступ к данным и создание экосреды
Данные – это стратегический ресурс страны, это большой объём основополагающих, ключевых данных государства, сосредоточенный в руках органов управления. Государственные данные являются общественным ресурсом, и максимально открыть к ним доступ общества для полноценной совместной обработки и использования при условии сохранения государственной тайны, коммерческой тайны и неприкосновенности частной жизни имеет практическую значимость с точки зрения раскрытия потенциала данных, стимуляции энергии инновации, создания общественной ценности.
К 2016 году 106 стран среди 193 стран – участниц ООН предоставили каталоги открытых государственных данных, что вдвое больше, чем в 2014 году [25]. В Китае платформа открытых данных государственного уровня также находится в процессе интенсивного создания. А в Шанхае – городе, являющемся «авангардом политики реформ и открытости» и «пионером инноваций и развития» [26], работа по предоставлению открытого доступа к государственным данным, которая велась в последние несколько лет, уже принесла заметные результаты. В июне 2012 года начала свою работу первая в Китае платформа открытых данных – «Сеть доступа к данным муниципального правительства Шанхая» (общий вид сайта можно увидеть на рисунке 2.2). Во главе с канцелярией Правительства Шанхая и городской комиссией по информатизации в сфере экономики участниками платформы в пробном режиме стали девять ведомств, в том числе городское управление общественной безопасности, городское управление промышленно-торговой администрации и городской транспортный комитет. После своего запуска сайт получил немало откликов. За первый месяц работы его посещаемость достигла 350 тысяч человеко-раз. По состоянию на май 2019 года на сайте Шанхайской сети доступа к данным муниципального Правительства было открыто более 2 000 источников данных 45 разных правительственных учреждений, число посещений страницы превысило 1,7 миллиона. В рейтинге платформ провинциального уровня «Индекс открытых данных в Китае за 2019 год» Шанхайский сервис открытых данных занял первое место [27].
Основная цель предоставления открытого доступа к государственным данным состоит в стимулировании их использования. Одновременно с созданием и совершенствованием платформы открытых данных Шанхай усиленно продвигает социум-ориентированное использование открытых данных и культивирует экосистему открытых государственных данных. В результате возник Шанхайский чемпионат по созданию приложений с использованием открытых данных. Сокращённое название чемпионата SODA (Shanghai Open Data Apps) точно совпадает с написанием английского слова soda, содовая. «Большой объём тесно связанных с жизнью города данных, которые кроются в руках правительственных и общественных учреждений, напоминают газированную воду, закупоренную в стеклянной бутылке: она кажется спокойной, стабильной и беззвучной, но стоит открыть крышку, как в мгновение ока высвобождается неисчерпаемая энергия» [28].
На чемпионате SODA, который проводится без перерыва с 2015 года, открытые государственные данные помогают аккумулировать общественную мудрость и высвободить потенциал открытых данных. В ходе прежних турниров SODA многие правительственные ведомства сообща предоставили открытый доступ к большому массиву качественных данных, что привлекло множество участников, предоставивших креативные проекты, и дало отличные результаты.
В 2015 году главной темой SODA стал городской транспорт. Был предоставлен открытый доступ к десяти наборам данных: транспортным показателям улиц города, данным по работе метро, данным по использованию многофункциональных карт пассажиров, данным по общественному транспорту в Пудуне в режиме реального времени, данным по движению такси компании Цяншэн, состоянию качества воздуха, метеорологическим данным, данным о дорожных авариях, опорным съездам с автомагистралей и данным Sina Weibo. Общий объём опубликованных в машиночитаемой форме данных составлял около 1 терабайта, при этом большая часть наборов данных была опубликована в Китае впервые. Чемпионат был ориентирован на глобальный сбор решений по усовершенствованию городского сообщения, обеспечению удобства поездок горожан, созданию новых бизнес-моделей. В итоге было привлечено почти 3 000 участников, конкурсанты представили в общей сложности 505 креативных проектов, касающихся комплексного анализа движения транспорта, оптимизации общественного транспорта, планирования поездок, использования экологически чистых видов транспорта, финансовых (страховых) моделей в транспортной сфере. Проекты включали в себя приложения для планирования поездок, совместных поездок на такси («такси-шеринга»), оптимизации эксплуатации метро, организации умного пылеподавления, совместного использования велосипедов («велошеринга») и др.
Рисунок 2.2. Платформа открытых данных Правительства Шанхая – скриншот главной страницы официального сайта «Сеть доступа к данным муниципального правительства Шанхая»
Существует также множество зарубежных идей и решений, демонстрирующих, как предоставление открытого доступа к государственным данным позволяет решать общественные проблемы путём краудсорсинга и коллективных инноваций. Например, пожарные гидранты в Бостоне зимой в значительной степени засыпает снегом, и это при случае могло бы стать помехой для оказания помощи во время пожара. Для решения данной проблемы одна спонтанно сложившаяся группа программистов, опираясь на открытые Правительством Бостона данные о местах расположения гидрантов, разработала игру под названием «Усынови гидрант». Человек, который первым раскопал какой-либо гидрант после снегопада, может «усыновить» и даже дать ему любое имя на своё усмотрение [29]. Жители Бостона, и особенно дети, с удовольствием усыновляли гидранты. И хотя некоторые гидранты остались «неусыновлёнными», муниципальные органы могли легко отследить их местоположение по карте и отправить туда сотрудников для уборки.
Благодаря предоставлению правительственным учреждениям открытого доступа к данным больше необязательно быть единственными поставщиками государственных услуг. Услуги могут быть предоставлены во взаимодействии с теми, кто использует данные, и это наряду с решением вопросов поможет сокращать траты. В прошлом оказание государственных услуг ведомствами напоминало торговый автомат: граждане вкладывали деньги – ведомства «создавали продукт». И хотя правительство со своей стороны вкладывало значительные человеческие силы, материальные ресурсы и денежные средства, количество и качество оказанных услуг всё же не полностью соответствовало ожиданиям людей, ко всему прочему зачастую возникали сбои. В магазине приложений компании Apple, AppStore несколько миллионов приложений, доступных пользователям для загрузок, однако подавляющая их часть была разработана не Apple. Что сделала Apple: создала платформу и следит за соблюдением порядка на ней.
Аналогично, различные ведомства, предоставив открытый доступ к данным, могут создать экосистему правительственных приложений GovStore, которая позволит предприятиям, общественным организациям, гражданам и другие субъектам общества использовать опубликованные государственные данные для создания приложений на платформе [28]. По словам создателя понятий «Веб 2.0» и «Правительство как платформа» Тима О’Райли, в эпоху Интернета «горожане, как никогда прежде, связаны между собой и обладают компетенциями и энтузиазмом для решения затрагивающих их проблем», и Правительство должно создать открытую платформу, с помощью которой входящие и не входящие в его состав люди смогут осуществлять инновации, и таким образом создать «рынок», в котором члены сообщества будут обмениваться товарами и услугами.
Открытие правительственной информации является базисом для коллаборации и крауд-криэйтинга общественных услуг. Однако данные не должны открываться только ради открытия, это должно происходить для дальнейшего возвращения «управления» к истокам. «Управление есть совокупность многочисленных способов, которыми общественные или частные фигуры и институты осуществляют свои общие дела. Это непрерывный процесс примирения конфликтующих или отличающихся интересов и осуществления совместных действий» [30]. Основа процесса управления – это не контроль, а согласование, не владычество, а сотрудничество. Поэтому мы продолжаем продвигать модернизацию системы государственного управления и возможностей управления, удовлетворяем непрерывно возрастающие потребности людей в лучшей жизни, повышаем конкурентоспособность и привлекательность Китая на мировом уровне.
2.6. Куда не достигают данные, или Место для человеческого участия
Большие данные способны сыграть огромную роль в общественном управлении и оказании государственных услуг. Но нам следует избегать «инноваций ради инноваций» и погони за поверхностной новизной; избегать того, чтобы из-за «раболепства перед данными» работники занимались только их подсчётом, игнорируя повышение реальной эффективности работы; избегать того, чтобы из-за накопления данных без должного внимания к управлению ими неактуальные и ошибочные данные получали эффективную обработку; избегать того, чтобы ставить во главу угла создание центров хранения и обработки данных, игнорируя сферы реального применения больших данных.
Большие данные могут помочь согласовать между собой оптимизацию, уточнение и персонализацию государственных услуг. Эти перемены, безусловно, невозможны без поддержки данных. Но более важны перемены в сознании: от ориентированности на предоставление – к ориентированности на потребности, от ориентированности на управление – к ориентированности на услуги, – чтобы не допустить «преклонения перед данными» и «преклонения перед технологией». В конце концов самые продвинутые технологии не способны поменять нерациональные рабочие процессы и отсталые идеи о предоставлении услуг.
Помимо данных для улучшения и усовершенствования государственного и муниципального администрирования и государственных услуг требуется повышение осознанности со стороны работников госучреждений в сфере оказания услуг, создания новых методов и способов, определение приоритета оказанию услуг. Не стоит забывать, что данные тоже не всемогущи и далеко не все справки можно отменить, опираясь на совместное использование данных. Например, выше мы говорили о создании в Цзиньхуа «города без справок». Прежде здесь, чтобы оформить строительство на месте снесённого вследствие аварийного состояния жилья, нужно было предоставить свидетельство о сносе старого жилья, теперь справка не нужна, но факт сноса проверяется во время посещения административно-кадровым работником. В тех случаях, когда мы пока не можем заставить данные «ходить по делам», граждан избавили от этой необходимости, переложив её на работников ведомств, в чём выразилось проявление осознанности в сфере предоставления услуг народу со стороны госучреждений.
В 2017 году группа аспирантов Дуннаньского университета разработала платформу визуализации данных для решения проблемы социального сиротства и получила за неё высшую награду на чемпионате по большим данным. Эта платформа, используя метод визуализации данных, показывает состояние здоровья, уровень образования и безопасность социальных сирот из разных районов, кроме того, она может дать комплексную оценку тому, как работают с социальными сиротами в каждой конкретной деревне, и присвоить ей соответствующий балл. Платформа также может рассчитать лучшее местоположение для центров заботы о социальных сиротах, что позволяет правительственным ведомствам более адресно и эффективно оказывать детям необходимые услуги [31]. Но более важно, чтобы, когда результат анализа данных, выполненного платформой, показывается служащим ведомств, их работники «пошли по делам», чтобы заботой со стороны госучреждений и общества был охвачен каждый оставленный родителями ребёнок. Только тогда работа данных и функционирование системы не будут напрасными.
«И Озёра Персиковых Цветов, бездонной пучины глубь, – // Не мера для чувства, с каким Ван Лунь меня провожает в путь»6. В некоторых случаях человеческое взаимодействие лицом к лицу превосходит миллионы единиц данных. Там, куда не добираются данные, необходимо человеческое участие. Адресат государственных услуг, оказываемых государственными и муниципальными учреждениями, – человек. Люди только тогда смогут по-настоящему получить «подобное весеннему тепло», если при поддержке данных работниками госучреждений будут оказываться детальные услуги с сердечностью и участием.
«Змея шипит там, где нежно поют птицы»7 (Томас Гарди). Данные не могут проникнуть в некоторые места, при этом они уязвимы. И это невозможно предотвратить. В последние годы постоянно учреждениями, оказывающими государственные услуги, раскрываются случаи утечек данных и в Китае, и за рубежом. Потрясшее всю страну в 2016 году «дело о телефонном мошенничестве против Сюй Юйюй» произошло потому, что данные сдающих экзамен гаокао незаконным образом попали в руки преступников. В 2019 году в Китае был введён новый «Закон Китайской Народной Республики о личном подоходном налоге». Всего через один день работы выпущенного Главным государственным налоговым управлением приложения по личным подоходным налогам сотрудники службы безопасности выявили 62 случая использования троянских программ в попытке похитить данные граждан. Необходим строгий баланс между использованием больших данных для усовершенствования общественных услуг и обеспечением безопасности и конфиденциальности данных людей.
Государственное и муниципальное администрирование и государственные услуги в эпоху больших данных – это слияние стремления к формированию ориентированной на пользователя ценности и стремления к эффективности с повышающимся коэффициентом. Сила данных наполняет энергией каждое звено системы управления, всесторонне повышая координацию между её системным, организационным и культурным аспектами, обеспечивая комплексную внутреннюю реорганизацию, внешнюю связность и доступность. Данные принесут ещё немалую пользу обществу и народу.
ГЛАВА 3. РЕФОРМИРУЯ ПРОСТРАНСТВО И ВРЕМЯ: ДАННЫЕ МЕНЯЮТ ТУРИЗМ И ЛОГИСТИКУ
Прогноз даёт нам знание, а знание даёт нам мудрость и инсайт.
Джек Льюис [32]
Во время чуньюнь (кит. 春运 chūnyùn), наиболее крупномасштабной периодической внутренней миграции китайского населения, связанной с подразумевающим воссоединение семьи Праздником весны, всю страну накрывают грандиозные людские потоки, сливающиеся воедино и разделяющиеся вновь. На каком транспорте прибывают эти людские потоки? Куда направляются? Где отправная точка? Каковы промежуточные пункты? Где будет проходить путь назад? Всё это ясно показывает картина пассажирских перевозок в период Китайского нового года, «нарисованная» большими данными.
Наиболее свежие большие данные по чуньюнь показывают новую тенденцию в перемещениях, которые население страны совершает, чтобы встретить Новый год в кругу семьи, – смещение от «поездок к родителям» к «приезду родителей». Если прежняя траектория внутренней миграции представляла собой движение перед праздником из прибрежных районов в глубь страны, из городов в деревни и обратно, в прибрежные районы и города после него, то теперь выбором всё большего числа китайцев становится «обратный чуньюнь».
23 января 2019 года работающий по найму в Фошане провинции Гуандун господин Сунь вместе с женой, едва сдерживая нетерпение, спешили на вокзал Гуанчжоу Южный, чтобы встретить родных, с которыми они давно не виделись, – сына и госпожу Сунь, маму господина Суня. Внук и бабушка, в это же самое время следовавшие в вагоне поезда G825 из Чанша в Гуанчжоу Южный, радостно рассматривали непрерывно меняющиеся за окном пейзажи. На вокзале их ожидали не только соскучившиеся близкие, но и новые впечатления: это их первый приезд в Гуанчжоу. «Жизнь теперь стала лучше, чем сыну с невесткой ехать на Новый год домой в Хунань, сподручнее мне с внуком приехать в Фошань», – говорит мать мистера Суня [33].
Ещё один фрагмент нашей сегодняшней реальности: проводник направляющегося в Гуанчжоу поезда G1755 24 января 2019 года, играющий с «птенцом перелетной птицы»8. Поскольку во время чуньюнь огромное число детей рабочих-мигрантов вместе со своими старшими родственниками отправляются в путь, чтобы встретить Новый год с родителями, на участке железной дороги Наньчан-Фучжоу заранее провели для экипажей ключевых маршрутов инструктажи по присмотру за такими детьми. В поездах были подготовлены книги и игрушки, чтобы с заботой сопроводить «птенцов перелетных птиц» по пути к родным.
Благодаря наличию в пассажирском потоке «весенней миграции» 2019 года бесчисленного множества таких же, как мама господина Суня, людей увеличилось разнообразие направлений перемещений во время чуньюнь. Вслед за стремительным распространением железнодорожной сети в Китае поезда стали тем средством транспорта, который выбирают всё большее число людей, отправляющихся встретить Праздник весны вместе с семьёй и в «обратный чуньюнь», который, с одной стороны, позволяет избежать больших скоплений людей в пик всеобщих перемещений, а с другой – всё так же даёт встретиться с родными, становится всё более популярным. Немало работающих в городах пар, принадлежащих к поколению 80-х и 90-х, стали привозить своих родителей и детей на Новый год в города, в которых они работают, а после праздника отправлять их обратно в деревню. Данные показывают, что в период чуньюнь в 2019 году объём пассажирских перевозок по всей стране достиг 2,98 миллиарда человеко-раз, что практически не отличается от цифры 2018 года, но при этом структура трафика незаметно поменялась: в 2019 году объём железнодорожных перевозок составил около 410 миллионов человеко-раз, что на 6,7 % выше по сравнению с 2018 годом, а объём перевозок рейсовым автотранспортом – примерно 2,46 миллиарда человеко-раз, снизившись таким образом на 0,8 %. С точки зрения пунктов назначения в чуньюнь наблюдается заметное увеличение обратного пассажиропотока в предпраздничный период, общий прирост обратного пассажиропотока по всем наиболее популярным направлениям составил 7,4 %. В свою очередь, Пекин, Шанхай, Гуанчжоу, Шэньчжэнь и другие крупные города, в которых с наступлением Праздника весны изначально происходил отток населения, в 2019 году незаметно стали востребованными направлениями для встречи Нового года. На рисунке 3.1 показано, как механик подразделения China Railways в Сиане проверяет высокоскоростной состав после празднования Китайского Нового года в 2019 году, чтобы обеспечить безопасность перевозок во второй половине чуньюнь.
Рисунок 3.1. Механики Сианьского подразделения China Railways не оставляют свой пост после празднования Нового года (Ван Шутянь/Жэньминь Тупянь)
Во время чуньюнь каждое мгновение производятся данные, и технологии обработки больших данных позволяют собрать воедино разрозненные локальные данные по пассажирским перевозкам, делая их пригодными для использования человеком, тем самым с помощью виртуальных пространственно-временных измерений «проливая свет» на реальный мир. Технологии обработки больших данных позволяют подготовить, обработать и проанализировать огромные массивы данных, создаваемых в процессе функционирования реального мира. В сочетании с технологиями Интернета вещей и искусственного интеллекта они дают возможность выразить материальный мир в цифровом формате, сделать реальность более ясной и познаваемой, поток информации во времени и пространстве – более своевременным и понятным, человеческую жизнь – более прогнозируемой, что в конечном итоге ведёт к более интеллектуальным взаимосвязям и взаимодействиям.
3.1. «Цифровой мозг» городов: новые решения для улучшения ситуации с дорожными заторами. Проблема «перегруженного города» в Ханчжоу
13 октября 2016 года на церемонии открытия конференции Юньци Правительство Ханчжоу обнародовало запуск «Цифрового мозга города», намереваясь сделать его новым интеллектуальным центром Ханчжоу, одной из древних столиц Китая. В первой битве противником ханчжоуского «Мозга города» стала проблема дорожных заторов.
Почему же в качестве первого объекта его наступления были выбраны пробки? Дело в том, что из-за чрезмерной загруженности дорог Ханчжоу проблема пробок превратилась в тяжёлую, настоятельно требующую разрешения задачу!
Нидерландский поставщик оборудования для навигации, транспорта и карт TomTom каждый год на основании данных, переданных GPS-модулями, составляет рейтинг главных городов мира с точки зрения загруженности дорог. В опубликованном компанией в 2017 году отчёте о мировых показателях транспортного движения (основанном на базе данных TomTom за 2016 год) Ханчжоу занял 16 место среди городов с самыми серьёзными дорожными заторами и стал городом с самыми загруженными дорогами в регионе дельты Янцзы. Согласно отчёту, уровень транспортной загруженности дорог Ханчжоу в 2016 году достиг 43 %9, что на 5 % выше, чем в 2015 году, то есть если дорога среднестатистического жителя Ханчжоу в обычное время от дома до работы занимает один час, то в случае пробок он потратит ещё минимум 25 минут, чтобы добраться до места назначения. Эти украденные у него пробками 25 минут он мог бы потратить на то, чтобы спокойно съесть тёплый завтрак вместе с семьёй или вывести питомца на неспешную прогулку по микрорайону.
Согласно подсчётам, из-за пробок каждый житель Ханчжоу ежедневно должен тратить лишние 38 минут, а количество потраченного им в пробках времени за год достигает 144 часов. Получается, что пробки «похищают» время у каждого жителя города, увеличенное время на дорогу между домом и офисом сокращает время отдыха офисных работников, увеличившиеся дорожные расходы транспортных компаний подтачивают их эффективность и прибыль, затруднённая транспортная доступность сказывается на настроении и впечатлениях приезжающих в Ханчжоу полных ожиданий туристов… Общественный и экономический урон, который приносят пробки, трудно посчитать!
Когда отсутствие беспрепятственного транспортного сообщения стало одним из факторов, препятствующих развитию города, и потребовались срочные действия для решения проблемы дорожных заторов, большие данные дали Ханчжоу совершенно новое решение.
«Мозг города» успешно начинает битву по уничтожению заторов.
Доводилось ли вам оказываться в такой ситуации: долгий красный сигнал светофора наконец переключился, но вы, не проехав и нескольких минут, снова встаёте на красный, хотя нет ни пешеходов, переходящих дорогу, ни машин, пересекающих улицу, при этом под красным сигналом собирается огромная очередь из машин, с нетерпением ожидающих включения зелёного?.. Наверняка, многим приходилось терять время из-за нерационально распланированного графика переключения сигналов светофора. Именно светофоры и оказались под прицелом ханчжоуского «Мозга города» версии 1.0.
Ханчжоуский «Мозг города» представляет собой созданный на основе урбанистической теории «города как живого существа» и идеи сочетания интернет-технологий и современного управления, построенный с использованием технологий обработки больших данных, облачных вычислений, искусственного интеллекта и других передовых технологий платформенного типа «концентратор», источником «смартизации» которого являются сведённые воедино источники данных государства, предприятий и общества. Будучи интеллектуальным «головным мозгом» города, он обладает функциями оптимизации распределения общественных ресурсов, руководства выработкой общей стратегии, прогнозирования и предварительного оповещения, а также лечения «болезней города» [35].
В версию 1.0 транспортной системы «Мозга города», официально обнародованной на конференции Юньци в октябре 2017 года, были заложены такие функции, как «умное» восприятие ситуации на дорогах, «умная» оценка ситуации с заторами на дорогах, «умная» проверка в случае происшествий, «умное» распределение времени и «умная» помощь. С помощью «умных» камер, установленных на перекрёстках главных улиц, транспортная система «Мозга города» версии 1.0 в режиме реального времени собирала данные об интенсивности, скорости и других показателях движения. Используя эти данные, система строила виртуальную модель Ханчжоу и опять же в режиме реального времени анализировала интенсивность движения на ключевых улицах города, делала прогноз возможного уровня трафика, за секунды анализировала и рассчитывала наиболее оптимальную длительность сигналов светофора на перекрёстках и таким образом более «продуманно» регулировала настройки и длительность сигналов светофоров.
Транспортная система ханчжоуского «Мозга города» версии 1.0 приняла под свой контроль 128 оборудованных светофорами перекрёстков, покрыв таким образом район улицы Моганьшань и другие магистрали в главной части города, а также участок скоростной дороги от Чжунхэ до Шантана, она также обслуживает городской район Сяошань. В главной городской зоне, где «Мозг города» регулирует 24 светофора в районе улицы Моганьшань, среднее время прохождения сократилось на 8,5 %. На экспериментальном участке эстакады Чжунхэ-Шантан общей длиной 22 км среднее время задержки трафика сократилось на 15,3 %. В районе Сяошань, где «Мозг города» контролирует 104 перекрёстка, покрывая площадь 5 км2 в пределах улиц Шисиньлу, Юйдунлу и Бэйшаньнаньлу, средняя скорость трафика увеличилась на 15 % [36]. Какая ценность стоит за этими данными?
Рассмотрим в качестве примера участок эстакады Чжунхэ-Шантан, который в настоящее время является одним из самых загруженных участков ханчжоуских эстакад, – умное регулирование светофоров помогает каждому автомобилю экономить в среднем 4,6 минуты трафика. Не стоит думать, что 4,6 минуты ничего не значат: благодаря этому время трафика каждого автомобиля сократится на 4,6 минуты, себестоимость транспортного движения во всём городе уменьшится значительно! Можно сказать, что решение, основанное на технологии больших данных, в первом же «встречном бою» с дорожными заторами в Ханчжоу дало немедленный результат.
Некоторые из автомобилей в транспортных потоках Ханчжоу являются более чувствительными с точки зрения скорости и времени в пути, поскольку они несут ответственность за сохранение жизней и охрану правопорядка. Речь идёт о машинах экстренных служб – скорой помощи, полиции, пожарной и аварийной служб, в особенности это справедливо в отношении автомобилей скорой помощи, для которых каждая минута и секунда напрямую связана с жизнью пациентов. Особое внимание ханчжоуского «Мозга города» также сосредоточено на этих специальных машинах, и здесь впервые в стране было реализовано приоритетное регулирование машин специальных служб, которое значительно увеличило эффективность реагирования в экстренных случаях.
В первой половине дня 9 октября 2017 года в районе Сяошань были проведены учения для машин скорой помощи. Находившийся неподалёку от улицы Шисиньнаньлу ханчжоуского района Сяошань в полной готовности водитель скорой помощи господин Ни принял вызов от пациента, находящегося на расстоянии 7 км. Водителю нужно было ехать всё время по одной улице на север, по пути преодолеть 21 перекрёсток со светофорами. Он смог доехать до места вызова практически со всеми зелёными светофорами со средней скоростью 36 км/ч, потратив примерно 14 минут [37]. Не стоит недооценивать эти недолгие 14 минут, при внезапной остановке сердца эффективность сердечно-лёгочной реанимации в первые 4 минуты достигает 50 %, по прошествии этого времени надежды на спасение очень смутные, поэтому коротенькие 14 минут могут дать пациенту больше шансов выжить и, возможно, спасут немало людей.
Как обеспечить беспрепятственный проезд скорой помощи на зелёные сигналы светофора? Решение может дать «Мозг города». С учётом начального местонахождения и конечной точки назначения система просчитала лучший маршрут для скорой помощи общей продолжительностью около 7 км и отправила его на телефон водителю скорой помощи, чтобы тот мог использовать его как навигатор. «Мозг города» также, опираясь на получаемые им в режиме реального времени результаты GPS-отслеживания машины скорой помощи и отчёты о ситуации с трафиком по маршруту следования автомобиля, заранее регулировал сигналы светофоров.
Чтобы не допустить остановки машины на красных светофорах или её попадания в пробку, в ходе данных учений для машин скорой помощи «Мозг города» выполнил ряд высокоточных вычислений. Требовалось, чтобы во время проезда скорой помощи предшествующий трафик уже покинул дорогу, и, получив сигнал о помощи, система запустила занявшие секунды анализ и вычисление, уровень детальности которых доходил до того, в какое время включать зелёный сигнал на светофорах, через которые будет проезжать машина скорой помощи на перекрёстках по маршруту, на каких именно перекрёстках его включать и т. д.
«Мозг города» автоматически конвертировал видео, снятые дорожными камерами по ходу маршрута, в данные, собрал данные о продолжительности очередей машин на ближайших перекрёстках, рассчитал время, за которое поток машин сможет освободить путь для беспрепятственного проезда скорой помощи. Исходя из результата вычислений, он автоматически отрегулировал светофоры таким образом, чтобы, когда проезжала машина скорой помощи, сигнал был зелёным, а впереди не было бы очереди из машин. В то же время камеры слежения могли по GPS-координатам скорой помощи отслеживать её перемещение в режиме реального времени, помогая регулировщикам контролировать продвижение машины в ответ на срочный вызов [36]. На рисунке 3.2. показан большой экран центра управления транспортной системой ханчжоуского «Мозга города» версии 2.0.
Транспортная система ханчжоуского «Мозга города» версии 2.0, сохранив изначально имевшуюся приоритетную регулировку движения для машин специального назначения, получила расширенные функциональные возможности: для пожарных машин, машин скорой помощи и других машин спасательных служб была добавлена функция «сопровождение в один клик», которая обеспечивает для экстренных служб ещё более эффективное и быстрое беспрепятственное следование по маршруту. По расчётам, к 2022 году транспортная система ханчжоуского «Мозга города» версии 2.0 покроет всю территорию города, то есть будет установлена взаимосвязь на уровне уездов (городов), она начнёт применяться в отношении движения транспорта на второстепенных улицах. По сравнению с версией 1.0 система версии 2.0 стала более воспринимать городской трафик с большей детализацией и ещё более близко к реальному времени. Она рассматривает город как живое существо, подобно КТ, всесторонне сканирует и воспринимает транспортное движение: его скорость, объём, уровень загруженности дорог, показатели задержки и другие «жизненные показания», − точно рисует полноценный, соответствующий реальному времени «портрет» ситуации с движением транспорта в городе в виде количественных данных. Кроме того, в транспортной системе ханчжоуского «Мозга города» версии 2.0 был увеличен уровень открытости доступа к её содержанию. Используя в качестве посредников интернет-карты, приложения, связанные с государственными услугами и радиостанциями, она сразу же публикует данные о ситуации, связанной с движением транспорта в городе, информацию о трафике и контролирующие мероприятия. Водители и другие участники транспортной системы, в свою очередь, тоже могут в любое время взаимодействовать с «Мозгом города» через соответствующие приложения государственных услуг. Благодаря тому, что каждый житель города получил возможность стать «умной клеткой» «Мозга города», был реализован совместный доступ к повышению уровня смартизации города [38].
Рисунок 3.2. Большой экран центра управления транспортной системой ханчжоуского «Мозга города» версии 2.0
Существующая при поддержке больших данных в сфере транспорта и аналитических технологий транспортная система ханчжоуского «Мозга города» оказала неоспоримо большую помощь в решении проблемы с загруженностью дорог в Ханчжоу. В «Отчёте по анализу транспортной ситуации в главных городах Китая» [39] за 2016 год Ханчжоу занял 8 место в ежегодном перечне самых загруженных городов страны и 1 место среди городов региона дельты Янцзы по этому показателю. После внедрения транспортной системы «Мозга города» в 2017 году Ханчжоу занял более низкое положение в рейтинге – 48-е место, к 2018 году – 57-е место. Очевидным является улучшение ситуации в отношении загруженности по утрам и вечерам, скорость автомобилей горожан эффективно возросла, и Ханчжоу успешно избавился от ярлыка «города с самыми загруженными дорогами в дельте Янцзы».
Улучшение транспортной ситуации напрямую касается каждого из нас: оно означает, что нам, скорее всего, больше не придётся терпеть утомительные транспортные потоки и черепашью скорость движения, тревожиться о пробках, отправляясь на работу или возвращаясь домой, драгоценное время наших жизней больше не будет утекать сквозь пальцы из-за необоснованных дорожных заторов. Оно означает более высокую социально-экономическую эффективность и более приятную и более свободную жизнь! В недалёком будущем, используя большие данные для осмысления городского трафика и принятия решений, «Мозг города» сможет оказать ещё большую помочь в решении проблемы дорожных заторов и превратить Ханчжоу в способный к саморегулированию, позитивно взаимодействующий с человеком город.
3.2. Смарт-логистика: сделать «последнюю милю» более близкой. За сумасшедшими масштабами «11.11» – скорость логистики в Китае
Уникальный китайский торговый фестиваль «11.11», с его огромным торговым оборотом и поразительным процессом развития, демонстрирует скорость развития электронной коммерции в Китае, вызывающую изумление и пристальное внимание мирового сообщества.
15 ноября 2018 года пресс-секретарь Министерства коммерции Гао Фэн сообщил, что, согласно наблюдениям за большими данными, касающимися коммерции, в 2018 году оборот розничной интернет-торговли в Китае за время «11.11» превысил 300 миллиардов юаней, а доход от продажи товаров посредством международной электронной торговли превысил 30 миллиардов юаней, что стало очередным мировым рекордом. Учитывая выросший за десять лет с первоначальных 52 миллионов юаней до 300 миллиардов юаней оборот торговли, скорость развития и масштабы «11.11» заслуженно можем назвать «сумасшедшими».
И отражает этот «сумасшедший» фестиваль распродаж стремительно развивающуюся в Китае отрасль электронной коммерции. В 2009 году оборот электронной торговли в Китае составлял только немногим более 3 триллионов юаней, к 2018 году он достигал уже более 30 триллионов. Объём рынка электронной коммерции всего за десять лет вырос практически в 10 раз. За этим поражающим воображение уровнем электронной коммерции стоит поддержка логистики: скачок в электронной коммерции сопутствовал непрерывному развитию логистической отрасли. Кроме того, несмотря на то, что вслед за стремительным развитием электронной коммерции объём логистических операций ежегодно возрастает, качество логистического сервиса в электронной коммерции, логистический жизненный цикл и эффективность логистики не прекращают улучшаться.
Возможно, десять лет назад электронная коммерция была нам ещё не очень привычна и не вызывала у нас совсем никакого доверия, теперь же интернет-торговля стала образом жизни, без которого нам сложно себя представить, и обеспечила богатство выбора в самых разных областях нашей работы и жизни. С помощью распространившейся по всему миру логистической цепи разнообразные торговые марки, продукты с самыми разными особенностями доставляются нам в руки, получение и экспресс-отправления стали нашей обыденностью, выражения: «доставка включена в Цзянсу, Чжэцзяне и Шанхае», «доставка за один день» – стали частыми в нашей повседневной жизни. За период «11.11» в 2018 году самой быстрой экспресс-почте понадобилось лишь 8 минут для доставки товара (ящика минеральной воды) покупателю. Вероятно, что это быстрее даже, чем спуститься за бутылкой воды в ближайший магазинчик!
Составленной совместно Cainiao Smart Logistics Network научно-исследовательским институтом министерства транспорта и исследовательским институтом компании Alibaba «Отчёт о развитии применения больших данных в смарт-логистике Китая за 2017 год» показал, что несмотря на стремительный рост количества заказов в «11.11» возможности логистических сервисов непрерывно повышаются, в прошлом оказались перезагруженные склады и негативный пользовательский опыт, логистика пришла к слаженности и упорядоченности. Например, в 2016 году коэффициент выполненных посылок увеличился почти на 25 % по сравнению с 2015 годом, примерно на треть по сравнению с 2013 годом сократилось время доставки 100 миллионов посылок.
Каким же образом логистика электронной коммерции в Китае достигает одновременного прогресса в количестве и качестве в условиях столь стремительного развития? Секрет кроется в смарт-логистике, сочетающей в себе технологии больших данных, Интернета вещей и другие инновационные технологии и подходы.
Большие данные как инъекция «смартизации» для логистики.
С развитием технологии и общества в последние десять лет, и в первую очередь с развитием больших данных, расширилось и понятие «смарт-логистика». Обычно базовыми технологиями смарт-логистики считаются большие данные, Интернет вещей и Интернет. С помощью интеллектуального отбора и анализа данных торговых потоков и логистики большие данные могут более точно и наглядно отражать актуальное состояние логистики и рынка, а также прогнозировать их будущие изменения, помогая предприятиям лучше предсказывать потребительский спрос и формировать маршруты поставок, оптимизировать стратегии складских сетей, починки оборудования и др.
В 2009 году IBM впервые предложила понятие «Интеллектуальной логистической системы» (Intelligent Logistics System), согласно которому «умная логистика» основана на «умной цепи поставок», обладающей тремя особенностями: прогрессивностью, взаимосвязанностью и интеллектуальностью, – придаёт значение соединению Интернета вещей, сенсорных сетей и существующего Интернета, с помощью детального, динамичного и научно обоснованного управления осуществляется автоматизация, визуализация, регулируемость, интеллектуализация логистики и включение её в сеть «Интернет», результатом чего становится рост эффективности использования ресурсов и уровня производительности и создание большей общественной ценности.
Cainiao Smart Logistics Network стимулирует обновление логистики с помощью больших данных.
Cainiao Smart Logistics Network была одной из первых среди китайских компаний, применивших концепции больших данных и смарт-логистики в логистической отрасли. Cainiao Smart Logistics Network начала использовать технологии обработки больших данных для обслуживания фестиваля шопоголизма «11.11» на платформе Tmall в 2013 году, а в 2014 году точность прогноза, сделанного её «радаром раннего обнаружения», превысила 95 %, таким образом уже на начальном этапе использования эффективно снизив давление на логистику в период «11.11». К 2018 году, согласно информации финансового отчёта Alibaba, количество логистических заказов, обрабатываемых Cainiao Smart Logistics Network, в период «11.11» достигло поражающей цифры – 812 миллионов, и при этом сроки доставки и уровень обслуживания клиентов всё так же, не переставая, повышались. Каким образом Cainiao Smart Logistics Network удалось достичь успеха и в количественном, и в качественном отношении? Мы можем подробно рассмотреть каждый из важных этапов, в которых Cainiao Smart Logistics Network опирается на технологии обработки больших данных для трансформации всего логистического процесса.
На этапе складирования и упаковки Cainiao Smart Logistics Network использовала технологию обработки больших данных для настройки «умного» складирования товаров. В сочетании с релевантными данными по товарам и логистике автоматизированные склады Cainiao могут прогнозировать то, насколько ходовым будет товар, и в зависимости от этого производить умную настройку склада и полок с товарами, максимально уменьшая количество узлов в перевозке товара, сокращая путь его перемещения, увеличивая эффективность логистики и хранения [41]. «Умный» склад компании Cainiao показан на рисунке 3.3.
Помимо этого, Cainiao Smart Logistics Network, опираясь на большие данные и технологию искусственного интеллекта, реализовала «умную» упаковку. Как правило, в традиционных заказах упаковка товара выбирается сотрудником на основании его опыта, что имеет низкую эффективность и большую вероятность неэкономного использования крупногабаритной картонной тары. С помощью больших данных и технологии искусственного интеллекта склады Cainiao знают габариты и характеристики товара до его поступления на склад и могут автоматически распределять заказы в наиболее подходящие картонные упаковки и подбирать оптимальные способы укладки. Умная упаковка позволяет сэкономить в среднем на 5 % больше расходного материала, чем в случае, если бы соответствующие решения принимал человек. Это не только снижает себестоимость упаковки, но и является способом, более природосберегающим.
Рисунок 3.3. «Умный» склад компании Cainiao Smart Logistics Network (Юй Лянь / vcg.com)
В отношении распределения заказов и планирования маршрутов Cainiao, опираясь на систему обработки больших данных Hailiang (Hylanda) и систему Alibaba Cloud, предложила проект основанного на больших данных «умного» распределения заказов с электронными накладными Cainiao в качестве носителя, то есть позволяющий заменить ручное распределение заказов на основанное на технологиях больших данных. Результатом стала не только максимальная оптимизация планирования маршрутов доставки экспресс-почты, но и значительное сокращение числа ошибочных операций. Если при традиционном ручном распределении заказов частота ошибок составляет 5 %, после внедрения «умного» распределения заказов степень его точности в компаниях экспресс-доставки достигла более 98 %, эффективность складской рутинной сортировки повысилась более чем на 50 % [40]. В настоящее время этот проект одна за другой начинают использовать ведущие китайские логистические компании, что приводит к огромному росту эффективности движения посылок в сортировочных центрах [43].
Большие данные открыли для Cainiao Smart Logistics Network множество возможностей и в отношении доставки на «последней миле». Платформа логистических данных Cainiao Smart Logistics Network, собирая данные продавцов, логистических компаний, а также метеоданные, данные о дорожной обстановке и другие данные из различных ичсточников и выполняя глубокую предобработку огромного массива информации по товарам, транзакциям, пользователям и информации социальных логистических сетей на платформе Alibaba, обеспечивает цифровизацию и визуализацию логистических процессов. Она умеет прогнозировать перевозки, осуществляемые всеми крупными логистическими компаниями Китая на протяжении всех цепочек движения посылок, и снабжать их соответствующими оповещениями, благодаря чему логистические компании могут в режиме реального времени иметь полное представление об «ожидаемом количестве посылок» и «оповещениях о степени загруженности» для каждого звена логистической сети. В то же время благодаря платформе продавцы имеют понимание положения дел в логистических компаниях и на этом основании могут выбрать подходящую компанию для доставки своих товаров и достижения цели «умной» логистики, то есть более быстрой и безопасной доставки товара в руки клиента.
На всех этапах процесса – от прогноза спроса, упаковки и хранения до сортировки и доставки – большие данные принесли безграничные возможности для усовершенствования и обновления смарт-логистики, благодаря чему логистическая индустрия может предоставить более качественные услуги в более короткие сроки, реализуя таким образом более «близкую» «последнюю милю».
3.3. Данные открывают дороги, или Путешествия без помех и промедлений
Ключевой фигурой в сфере обращения туристического рынка является турист. Не товар, но туристический поток зачастую стимулирует распространение информации о связанных с путешествиями товарах. В этом смысле информация является базовым содержанием туристической индустрии. И большие данные предоставили совершенно новые возможности для интеллектуального отбора данных в сфере индустрии туризма, управления ими, их обработки, анализа и применения.
Описывая движение людских потоков, большие данные создают возможности для туристического бизнеса.
Mafengwo (кит. 马蜂窝) – известная китайская торговая и сервисная платформа для самостоятельных путешествий, созданная на базе стратегии персонализированных путешествий. Основным ресурсом Mafengwo являются превышающее 100 миллионов число зарегистрированных пользователей и данные создаваемого ими пользовательского контента (User Generated Content, UGC). Согласно статистике, пользователи Mafengwo ежемесячно создают более 130 тысяч записей о путешествиях, количество пользовательских комментариев превышает 180 миллионов, число уникальных пользователей сайта – более 130 миллионов, при этом среднемесячное количество активных пользователей превышает 80 миллионов. Опросы пользователей, создание контента, глубокие просмотры и оценки, а также информация о совершаемых пользователями на Mafengwo транзакциях – всё это сформировало огромный массив источников больших данных. Объём ежедневно создаваемых на Mafengwo новых данных превышает 3 терабайта, а всего на платформе охвачено более 50 миллионов достопримечательностей (Point of Interest, POI) по всей земле. Эти цифры поистине потрясают [45]. В настоящее время Mafengwo из чисто туристической платформы трансформировалась в платформу туризма и электронной коммерции, торговый оборот которой всего за три года достиг 10 миллиардов юаней. Ключевым фактором, стоящим за осуществлённым Mafengwo стремительным увеличением объёма операций, стал анализ и применение больших данных пользовательского контента, связанного с путешествиями.
В широком смысле под пользовательским контентом понимаются публикуемые пользователями в сети и обладающие определённой новизной тексты, изображения, аудио- и видеофайлы. С развитием Интернета данные пользовательского контента, касающегося путешествий, например: оставляемые путешественниками в сети комментарии, их блоги, распространяющиеся пользователями в социальных сетях тексты, изображения и другие виды контента – стали новым важным источником больших данных в сфере путешествий, который имеет чрезвычайно высокую прикладную ценность с точки зрения прогнозирования потребительского спроса, развития туризма и других аспектов. Например, известное американское туристическое онлайн-агентство Travelocity применяет анализ больших данных в отношении ежедневно меняющихся спроса и предложения, установления цены, наличных запасов и рекламы. Используя лучший «движок» для анализа транзакций и рекомендаций, Travelocity продвигает персонализированные товары целевым потребителям, помимо этого, с помощью аналитических моделей результаты передаются в смежные приложения, чтобы помочь разработчикам соответствующих приложений своевременно принимать решения.
Mafengwo – одна из самых успешных с точки зрения использования больших данных пользовательского контента китайских компаний. С помощью больших данных Mafengwo находит пользователей и формирует стратегии. Человек, прежде чем принять решение о путешествии, может на протяжении долгого времени производить на Mafengwo действия, связанные с поиском и просмотром контента, например, просматривать релевантные для его места назначения записи других путешественников и рекомендации по маршрутам или просить других путешественников дать свои комментарии и т. п. Осуществляя интеллектуальный отбор соответствующих данных, Mafengwo может нарисовать панорамный портрет целой потребительской группы, точно подобрать высококачественные конечные туристические товары для конкретного пользователя, достигая персонализации и «потребности в том, что увидел». В то же время можно с соответствии с тенденциями спроса, демонстрируемого огромным количеством пользователей, исходя из результатов анализа больших данных, улучшить предложение на туристические товары, что повлечёт за собой соответствующее увеличение поставок, кроме того, можно в зависимости от разных категорий пользователей улучшить презентацию своего товара и возможности по предоставлению услуг (продаж). Кроме того, и после совершения продажи на платформе Mafengwo создаются большие объёмы данных пользовательского контента, связанного с покупкой и оценкой, например, новые туристические заметки и комментарии, что, в свою очередь, ведёт к обратной оптимизации товара и ориентации контента [45].
Благодаря большим данным Mafengwo также получила возможность расширить коммерческое сотрудничество в сфере туризма, создав ситуацию взаимной выгоды с поставщиками туристических услуг. Ещё в 2014 году Mafengwo в коллаборации с поставщиком авиауслуг Zailushang (On the way) запустила продажу товаров, изготовленных по «обратному заказу». Заказ на выпуск таких товаров и их предпродажа базировались на данных о предпочтениях пользователей. Поскольку они не только соответствовали потребностям путешественников, но и обладали сравнительно хорошим соотношением цены и качества, их раскупили в течение 5 минут после начала продажи. В свою очередь, Хайнаньские авиалинии и управление по туризму штата Массачусетс (США) также разработали в сотрудничестве с Mafengwo ряд туристических товаров, изготовленных по «обратному заказу». Подобная модель C2B с предварительной продажей и «обратным заказом», основанная на огромных по объёму пользовательских данных, прогнозирует, что вызовет симпатию у потребителя и потребительские тенденции. Таким образом изготовление соответствующих туристических товаров удовлетворяет персонализированные потребности, связанные с поездками. Благодаря использованию больших данных для анализа потребительского поведения или совокупности социальных сил, эта модель может сдвинуть передовые туристические ресурсы с мёртвой точки и реструктурировать их [46].
Большие данные делают достопримечательности более «умными», а путешествия более спокойными.
Благодаря коротким видео множество достопримечательностей Чунцина стали хитами и «интернет-знаменитостями», лидирует в рейтинге популярности район Хунъядун. В 2017 году широкое распространение в социальных сетях получило короткое видео под названием «Ночной вид точной копии “Унесённых призраками”» (кит. «千与千寻同款夜景»), вслед за чем популярность Хунъядуна взлетела до второго места по стране, уступив только Запретному городу в Пекине. Хунъядун стал первой чунцинской достопримечательностью, завоевавшей бешеную популярность благодаря видеоролику. Огромные потоки туристов принесли туристической зоне популярность и внимание, но одновременно с этим – огромное давление с точки зрения управления и безопасности, и большие данные в этой ситуации позволили принять наиболее эффективные решения.
Информационная система управления туристической зоной и связанных с ней производств, система видеомониторинга, система датчиков и другие цифровые системы туристической зоны безостановочно производят огромные объёмы цифровых, текстовых и видеоданных; внешние социальные сети туристической зоны и другие платформы в Интернете также создают большое количество связанных с ней данных. Помимо этого, уникальные природно-географические характеристики туристического объекта и его историко-культурные особенности также могут быть преобразованы в пространственно-географические и историко-гуманитарные данные. Все эти огромные массивы данных предоставили источники информации для смартизации туристической зоны, а технологии обработки больших данных, в свою очередь, поспособствовали её осуществлению.
В 2018 году в Чунцине выпустили «Чунцинское туристическое облако». На основе больших данных, искусственного интеллекта, облачных вычислений, Интернета вещей и других технологий смартизации была выполнена интеграция данных по ресурсам и сервису туристических мест, способствовавшая повышению уровня управления туристической зоной, её точному маркетингу и улучшению качества продукции. Туристам облако даёт возможность для планирования маршрутов и поиска информации. Наиболее популярная туристическая зона «Хунъядун» стала испытательным полигоном «Чунцинского туристического облака». Оно отрегулировало систему функционирования района таким образом, чтобы человеческий поток был соразмерен его принимающей способности, была настроена система предварительных оповещений, реализованы цифровизация и смартизация мониторинга человеческого потока. Благодаря сбору и анализу данных в режиме реального времени менеджмент туристической зоны имеет полное представление о количестве принятых туристов, доходах от их посещений, количестве внутренних туристов и иностранных туристов в городе в целом, своевременно получает данные, касающиеся человеческого потока в туристической зоне, формирует механизм прогнозирования и предварительного оповещения и может своевременно регулировать ресурсы.