Ваши тезисы будут выглядеть убедительнее, если вы сошлетесь на факты и цифры, и понятнее, если свои данные вы удачно визуализируете. И то и другое умеют делать дата-журналисты. Вместе с институтом «Стрелка», который запускает курс «Как стать дата-журналистом», рассказываем, что нужно уметь, чтобы раскапывать в огромных массивах важные корреляции и превращать их в запоминающиеся истории.

О чем речь?

Один из первых примеров визуализации большого объема данных можно встретить уже в 1821 году. Появившееся в тот год английское издание The Guardian выпустило разворот со сведенными данными по стоимости обучения мальчиков и девочек в школах Манчестера.

Сегодня департаменты дата-исследований существуют во многих крупных мировых изданиях — The Guardian, The Washington Post, The New York Times, Financial Times и др.

Зачем (и кому) это нужно

Журналистика данных (data-journalism) — направление в журналистике, в основе которого лежит сбор, анализ и обработка данных для создания медиаматериалов.

Цель остается прежней — предоставить информацию читателям и рассказать о важных событиях или явлениях. В качестве источника используются не мнения экспертов или пресс-релизы, а данные. Основная задача дата-журналиста — превратить их в понятную историю и красивый визуальный продукт. Технологии и современные инструменты визуализации помогают создавать интерактивные карты, графики и даже персонализированные элементы.

Инструментарий, который используют дата-журналисты, достаточно универсален: навыки работы с данными будут полезны не только в СМИ, но и при работе с корпоративными медиа, клиентскими рассылками, PR, при создании отчетов для презентации вовне — то есть везде, где необходимо представить большой объем данных наглядно и убедительно.

Где лежат открытые данные

Пользователи до сих пор с трудом представляют, какой объем информации на самом деле они оставляют на хранение сайтам компаний, сервисам, онлайн-магазинам. Не обязательно даже открывать браузер, чтобы оставить свой цифровой след, — достаточно установить на телефон простой шагомер, и данные обо всех ваших перемещениях окажутся тщательно зафиксированы на сервере где-то за океаном.

Есть и более фундаментальные данные — например, те, что генерируются государственными органами. Результаты выборов, данные о покупках и перемещении — все это может быть использовано в медиаматериалах.

В России действует закон, согласно которому каждое министерство обязано выкладывать часть своих информационных данных в открытый доступ. Таким образом, любой человек может проверить реестр памятников культурного наследия на сайте Минкульта или каталог пестицидов на сайте Министерства сельского хозяйства. Вопрос только в том, сможет ли исследователь задать правильные вопросы и сделать выводы.

Большие города сводят все свою статистику в один дата-сет, где удобно искать данные по здравоохранению, дорогам, образованию одного региона. Порталы открытых данных есть, например, у Москвы и у Санкт-Петербурга.

В рамках проекта по популяризации открытых данных «Яндекс» собрал список самых интересных российских и международных ресурсов, которые помогут собрать нужную информацию, — от технических ресурсов Центробанка до портала Евросоюза.

Что искать

Данные можно собирать для конкретной темы, например чтобы узнать, в каком районе Москвы дешевле всего поужинать. На первый взгляд кажется, что за МКАДом цены должны быть ниже, но на деле оказывается, что самые низкие цены как раз таки в центре Москвы — в Басманном и Тверском районах. Дата-журналистика — это своего рода исследование: данные помогают журналисту подтвердить или опровергнуть выбранную гипотезу.

Но история может возникнуть и из готового набора данных. Например, дата-журналист, исследуя массив данных, может увидеть тенденцию или контраст, заметить неожиданные выбросы или обнаружить на первый взгляд невидимые связи. В России данных не так много, поэтому зачастую бывает проще идти от имеющихся данных и придумывать, какие истории из них можно достать. Начиная свое исследование, дата-журналист может заранее не знать, что именно он ищет. Иногда достаточно правильного вектора, а интересный угол зрения появится в процессе.

Что делать с собранными данными

Собранные данные непременно нужно очистить. Даже если речь идет об официальной выгрузке, всегда найдется место несоответствиям или ошибкам. Корректному анализу мешают пропуски, дубли, аномальные или противоречивые значения, ошибки ввода и т. д.

После этого исследователь погружается в аналитику. На данном этапе уже важно хорошо понимать, кто целевая аудитория вашего исследования и что вы хотите ей рассказать.

Когда все инсайты найдены, а выводы сделаны, нужно подготовить качественную визуализацию проекта, взять комментарии у экспертов, которые ответят на вопрос «Почему?», и «упаковать» историю.

Где всему этому учиться

В университетах США и Европы существуют целые образовательные программы, посвященные дата-журналистике, например в Университете Columbia в Нью-Йорке. В России же тема остается новой и существует не так много курсов и школ, специализирующихся на создании медиапродукта из больших данных.

Курс института «Стрелка» «Как стать дата-журналистом»

  • Когда: с 16 по 24 марта 2019 года. Заявки принимаются до 12 марта

  • Продолжительность: 9 дней

  • Стоимость: 35 000 рублей. Студентам скидка 10%

Недельный интенсив от Strelka Mag и дата-журналиста Андрея Дорожного поможет журналистам, блогерам, аналитикам и медиаменеджерам научиться работать с данными и создавать с их помощью продукты для медиа. В основе программы лежит идея о том, что можно работать с данными и визуализацией, не будучи программистом или дизайнером. В ходе учебы участники научатся видеть истории в данных, заниматься парсингом (сбором), очисткой и анализом данных самостоятельно, обрабатывать и визуализировать данные без навыков программирования, собирать на основе полученных результатов истории.

Магистратура ВШЭ «Журналистика данных»

  • Когда: зачисление в августе

  • Продолжительность: 2 года

Стоимость: 25 бюджетных мест, 10 платных (380 000 рублей в год в 2019 году)

Первая в России магистерская программа по дата-журналистике. Студенты учатся искать, фильтровать, анализировать и обрабатывать большие данные для оформления полученного материала в виде увлекательного медиатекста или инфографики. Кроме этого, они получают навыки организации стартапов на открытых данных в медийной сфере.

Курс «Яндекс.Практикум» «Дата-аналитика»

  • Когда: полная программа будет доступна для покупки в июне 2019 года. Сейчас можно пройти бесплатную часть

  • Продолжительность: 6 месяцев

  • Стоимость: 60 000 рублей

В феврале 2019 года «Яндекс» запустил сервис онлайн-образования «Яндекс.Практикум», который позволяет на практике освоить востребованные цифровые профессии, в том числе стать дата-аналитиком. Занимаясь 10 часов в неделю, вы получите навыки аналитика данных и соберете портфолио проектов. Курс также включает блок «Как рассказать историю с помощью данных», посвященный тому, как создавать отчеты, объясняющие выводы аналитика. В качестве наставников — аналитики из «Яндекса» и других IT-компаний.

Онлайн-курс «Дата-журналистика: первые шаги, навыки и инструменты» (на английском языке)

  • Когда: в любое время

  • Продолжительность: 6 часов

  • Стоимость: бесплатно

Онлайн-курс платформы Learno.net, который помогает развить навыки сторителлинга при помощи данных. Будет полезен даже тем, кто не планирует стать журналистом.

Онлайн-курс «Использование открытых данных для цифрового бизнеса»

  • Когда: в любое время

  • Продолжительность: 6 часов

  • Стоимость: бесплатный доступ к сокращенному функционалу на 5 недель. Полный курс — $84

Курс дает новое представление об истории открытых данных, их плюсах и минусах. Он включает в себя примеры бизнес-кейсов и бизнес-моделей, связанных с публикацией и использованием открытых данных.

Минская школа «Инфографика BY»

  • Когда: по запросу

  • Продолжительность: 6 месяцев

  • Стоимость: бесплатно (при условии пожертвований на социальные инициативы по вашему выбору в размере 7000 — 14 000 рублей)

Интенсивный курс от белорусской школы пригодится всем, кто хочет освоить принципы инфодизайна и визуального сторителлинга. В результате студенты научатся создавать интерактивные и статичные визуализации данных — лучшие работы опубликуют в СМИ.

Читайте нас в Facebook, VK, Twitter, Instagram, Telegram (@tandp_ru) и Яндекс.Дзен.

Где можно учиться по теме #digital