Выбор инструментов для визуализации данных. Интерактивная визуализация данных как инструмент управления бизнесом Интерактивная визуализация

3 D -визуализация уверенно занимает лидирующие позиции в рейтингах наиболее перспективных информационных технологий. Почему этот сегмент решений укрепляет и наращивает свои позиции, что является катализатором спроса, какие новые тенденции формируются в сегодняшних сложных условиях? Об этом мы поговорили с Сергеем Астаховым , руководителем консорциума Interactive Data Visualization Platform (IDVP ), финалиста конкурса «Лучшие информационно-аналитические инструменты - 2016» .

Какие движущие факторы рынка интерактивной визуализации данных являются ключевыми сегодня? Какие тенденции можно выделить?

Драйвером спроса на аналитические инструменты, как ни парадоксально, является сложная экономическая ситуация. В кризисный период руководителям нужно быстро получать точную, объективную информацию о состоянии бизнеса. Другим драйвером рынка является лавинообразный рост объёма данных, что требует новых подходов к работе с информацией.

Сегодня есть потребность в технологиях, которые обладают возможностями обработки больших массивов данных, интерактивной инфографики и имеют интерактивный интерфейс. Пользователи осознали, что визуализация данных и «живое» взаимодействие с ними может наилучшим образом помочь понимать смысл этих данных.

Для этих задач предназначена уникальная российская разработка Interactive Data Visualization Platform (IDVP) - технологическая платформа для оперативной визуализации и анализа данных. Этот управленческий инструмент основан на технологиях функционального моделирования для анализа ситуаций с применением пространственной трёхмерной инфографики. Применяется платформа для решения управленческих, экономических и финансово-хозяйственных задач.

Когда поставщики аналитических решений говорят о клиентских данных, то часто упоминают о проблемах с данными. Но если взять идеальный случай, когда у клиента данные находятся в образцовом порядке, как же отличить важные данные от неважных, влияющие на его непосредственно бизнес-процессы от второстепенных?

Самые «важные» данные получаются из систем, которые используют датчики и счётчики, например в АСУ ТП, системах управления трубопроводами, генерацией энергии и т. д., или из систем, которые автоматизируют операционную деятельность - банковских, платёжных, логистических систем и т. п., где роль человеческого фактора сведена к минимуму либо информация завязана на «живые» деньги.

Собственно, мы пока знаем два способа повышения качества данных: либо минимизировать человеческий фактор - получать данные посредством объективных технических средств, либо завязывать информацию на деньги.

Например, в Центре мониторинга медицинской информационной системы доступность врачей измеряется автоматически в момент записи пациента на приём, без человеческого фактора.

Полнота заведения ресурсов в систему контролируется тоже просто - врач не сможет получить зарплату, если он не заведён в систему и ежедневно не работает в ней. Пока бухгалтерия существовала отдельно от Центра мониторинга, в поликлиниках числилось сотрудников больше, чем вело приёмы. Когда их объединили, все быстро пришло в норму.

Поэтому создание аналитического решения нового поколения практически бессмысленно в отрыве от реорганизации низовой системы, как правило и управленческой, и информационной.

Как вы узнаете уязвимые точки в бизнес-процессах вашего клиента? Для генерального директора важно иметь понимание прошлого, настоящего и прогноза развития его бизнеса, быть в курсе текущих показателей результативности и эффективности. Как вы с этим справляетесь?

В своей работе мы ориентируемся на три основных принципа.

  1. Wow эффект - качество графики, анимация и скорость работы приложения делают работу, как минимум, не скучной. Все элементы разработаны для высококачественного отображения на «больших» экранах, а для руководителей - на мобильных устройствах или ПК.
  2. Ситуационный анализ - возможность быстро локализовать проблему на объектах управления, например по принципу светофора или специфическому изображению.
  3. Возможность не просто локализовать проблему, но и раскрыть все возможные причины её появления, тем самым подтолкнуть к решению проблемы.

Разработка любого аналитического решения - Центра мониторинга, на платформе IDVP начинается с определения кейса, по аналогии с бизнес-кейсом, включающим в себя различные показатели, характеризующие решаемую проблему и показывающие клиенту пути её решения.

Затем, когда сформирован кейс и выбраны показатели для решения проблемы, мы придумываем и разрабатываем трёхмерные интерактивные визуальные образы, которые формируют «пространство явления». Непосредственно за визуализацию данных отвечает специальная программа - «3D плеер», который собирается под управлением платформы индивидуально для каждого пользователя.

IDVP поддерживает достаточно большой набор интерактивных аналитических инструментов. Они имеют возможность масштабирования, изменения положения в пространстве для лучшего визуального восприятия, возможность множественного выбора отображаемых объектов или значений с поддержкой drill-down непосредственно с диаграммы или графика.

Например, для «Центра мониторинга финансовых организаций» мы использовали концепцию визуального графического интерактивного интерфейса «облака» заёмщиков, с которым легко и удобно работать. Размером шарика в облаке кодирована информация о величине полученных кредитов заёмщиком, а цветом - информация о количестве выявленных проблем у заёмщика. Специалист может кликнуть на интересующего его заёмщика и увидеть схему его финансовых отношений с контрагентами в различных разрезах, взаимосвязях и видах.

В приложении «Центр мониторинга «Интеллектуальный склад» используется трёхмерное визуальное представление склада и линейный график с интерактивно изменяемой шкалой.

Фактически это цифровой слепок складского бизнеса, в котором ответы на производственные проблемы представлены в интуитивно понятном виде - например, почему образуются на складе длинные очереди машин на погрузку-разгрузку?

Чем отличается подход к анализу информации в классических аналитических инструментах от вашего решения?

Несмотря на общепринятое позиционирование аналитических систем, традиционно их пользователем является подготовленный аналитик, крутящий «кубики» данных и ищущий в них закономерности. Для анализа данных он использует таблицы, графики, диаграммы и многое другое.

Мы для себя выбрали другого пользователя - это прежде всего топ-руководитель, владелец бизнеса, руководитель отрасли, который постоянно находится в условиях ограниченных временных рамок. Для него скорость принятия управленческих решений зачастую критична. При этом современный занятой человек все чаще хочет воспринимать информацию в виде трёхмерной интерактивной инфографики, позволяющей анализировать максимальные объёмы информации при минимуме временных затрат, быстро улавливать суть проблемы, различные тенденции изменений и оценивать возможные риски. Он привык существовать в трёхмерном пространстве.

Поэтому в наших разработках мы делаем акцент на тех направлениях, которые позволяют быстро и качественно довести до руководителей ситуацию по сложным отраслевым кейсам. с большими объёмами исходных данных. Среди них можно выделить следующие:

Новые приёмы интерактивной визуальной работы с большими массивами оперативной и стратегической информации - технология обеспечивает чёткое восприятие существующих проблем и возможных путей их решения через визуальные образы. На экране одновременно рассматривается множество аспектов, влияющих на проблему, проще понимать информационные, управленческие, финансово-экономические процессы, видна их взаимосвязь и взаимозависимости.

Внедрение элементов геймификации - это новый уровень взаимодействия с пользователем, делающий процесс анализа данных интересным, познавательным и запоминающимся. Соответственно повышается уровень и качество владения информацией.

Использование новых трёхмерных аналитических инструментов , не используемых в традиционных BI-системах ввиду невозможности получения нормального результата на браузерных платформах, например потоковых диаграмм санкей, диаграмм отношений «многие ко многим» и т. п.

Посмотрите сами на примеры интерфейсов наших аналитических систем. Я думаю, что все станет понятно без лишних слов.

СПЕЦПРОЕКТ КОМПАНИИ IDVP

Количество доступных на сегодня источников данных и инструментов для их обработки само по себе уже наглядно показывает, что ещё никогда столько людей не пыталось освоиться в мире визуализации данных. А когда есть такое число материалов, доступных к изучению, один только вопрос «С чего начать?» может напугать каждого новичка. Итак, какие же библиотеки являются лучшими и что советуют профессионалы? Об этом и пойдёт речь в данной статье.

Говорить о визуализации данных и не упомянуть – это всё равно, что рассказывать об истории создания персональных компьютеров и ни словом не обмолвиться о Стиве Джобсе. D3 (от англ. Data Driven Documents) – это без преувеличения самая важная и доминирующая на рынке JavaScript библиотека с открытым исходным кодом, которая обычно используется для создания SVG-графиков. SVG (от англ. Scalable Vector Graphics) – это в свою очередь формат векторного изображения, поддерживаемый веб-браузерами, но ранее мало использовавшийся.

Библиотека D3 во многом обязана своей популярностью внезапному интересу к SVG со стороны веб-дизайнеров, что в значительной степени объясняется тем, как выигрышно векторные графики выглядят на экранах с большим разрешением (в частности, на Retina-дисплеях, используемых в устройствах Apple), которые становятся всё более распространёнными.

«Будем честными, если задача состоит в визуализации данных на основе SVG, то для её решения все остальные библиотеки даже рядом не стояли», – говорит Moritz Stefaner , независимый эксперт в области визуализации данных и владелец компании Truth & Beauty . «Есть также немало интересных проектов, созданных на базе D3, как, например, NVD3 , который предоставляет стандартные графические компоненты – готовые к использованию, но кастомизируемые; или, скажем, Crossfilter – просто выдающийся инструмент для фильтрации данных».

Processing.js – это «родственный» проект Processing, который позволяет визуализировать данные, используя веб-стандарты и исключая необходимость в каких-либо плагинах. «Для того, чтобы начать работать с Processing, вам не нужно знать JavaScript, потому что у Processing свой собственный язык программирования», – поясняет эксперт по визуализации данных из Нидерландов Jan Willem Tulp . Как пользователь, вы просто пишете код на языке Processing, вставляете его на свою веб-страницу и спокойно позволяете Processing.js позаботиться обо всём остальном».

«Отрицательный момент ожидает вас, когда вы начнёте работать над более сложными проектами: IDE (от англ. Integrated Development Environment) покажется вам немного ограниченным», – продолжает Jan Willem Tulp.

И несмотря на это, свойственная Processing простота, а также многочисленное пользовательское сообщество, в любой момент готовое помочь тем, кто столкнулся с проблемой, сглаживают указанный недостаток и делают Processing одним из самых доступных инструментариев для визуализации данных.

В то время как D3 и Processing предоставляют общие инструменты для различных типов визуализации, Gephi решает более конкретные задачи. Gephi – это бесплатная библиотека с открытым исходным кодом, предназначенная для сетевой визуализации. Но даже в рамках этой узкой специфики Gephi предоставляет море возможностей. Хотите ли вы смоделировать взаимоотношения сотрудников внутри компании или передачи мячей во время футбольного матча, с помощью Gephi вы сможете визуализировать подобные взаимосвязи.

Как и Processing, Gephi очень прост в установке. Сразу после установки следует непосредственно импорт данных, их сортировка, и можно приступать к визуализации. «Получившиеся изображения могут быть экспортированы и вставлены в любой веб-документ, чтобы ваша аудитория могла в дальнейшем использовать их и делиться ими в сетях», – говорит Benjamin Wiederkehr.

Dygraphs

Dygraphs – это быстрая и гибкая в использовании JavaScript библиотека с открытым исходным кодом, предназначенная для построения интерактивных графиков и позволяющая анализировать и интерпретировать очень плотные массивы данных. В отличие от Vega, библиотека Dygraphs предлагает кастомные настройки, но обладает тем же преимуществом работы во всех основных браузерах. Кроме того, Dygraphs изначально интерактивна, а это значит, что некоторые функции (например, zoom, pan или mouseover) присутствуют по умолчанию, в то время как, скажем, функция “pinch-to-zoom” на мобильных устройствах – это уже просто приятный бонус.

С чего начать?

Даже при наличии такой информации мир визуализации данных может показаться новичку тёмным лесом. Так что же советуют эксперты?

«Первое, что я бы посоветовал, это познакомиться с максимальным количеством существующих на сегодня инструментов, чтобы быстро создавать стандартные графы», – говорит Moritz Stefaner. «Особенно на начальном этапе проекта очень важно иметь возможность быстро генерировать много диаграмм с целью изучения объёма, глубины и «текстуры» данных. Лично я использую Tableau и Gephi, но помимо них ещё CartoDB , незаменимый для работы с картами, и совсем недавно появившуюся библиотеку с открытым кодом RAW , отлично подходящую для быстрого создания интересных графов».

Также необходимо убедиться, что выбранная библиотека оптимально подходит для информации, которую вам предстоит отобразить.

«Очень важно с самого начала спросить себя, с каким именно форматом данных вам предстоит работать», – говорит Scott Murray. «Задача стоит в визуализации временного отрезка? Может быть это категориальные данные? Ответы на подобные вопросы могут повлиять на ваше решение. Некоторые библиотеки, вроде D3, универсальны и могут работать с различными типами данных. Другие же более специфичны в отношении типов данных, например, Gephi или Sigma.js – инструменты, предназначенные для сетевой визуализации. Если вы знаете с самого начала, с чем вы работаете, вдумчиво выбирайте из существующих библиотек ту, которая лучше всего подойдёт для вашего типа данных».

В чём плюсы онлайн комьюнити?

Для тех, кто только начинает заниматься визуализацией данных, важным пунктом в выборе библиотеки является наличие локального комьюнити, участники которого увлечены своим делом и готовы помочь.

«Начинающим я бы посоветовал для старта библиотеки Processing или D3», – говорит Jan Willem Tulp. «Обе они располагают большой пользовательской базой и солидным числом примеров, на которых можно поучиться».

Онлайн комьюнити в сфере визуализации данных не только даёт ответы на многие вопросы, но и наглядно демонстрирует один из главных парадоксов инфографики. Каждый приходит в отрасль со своим образованием и опытом, поэтому некоторые специалисты в области визуализации данных подходят к задачам с эстетической и художественной точек зрения, в то время как другие концентрируются на статистической составляющей вопроса. Статистики отлично разбираются в больших объёмах данных, но вынуждены изучать основы дизайна. Дизайнеры знают многое о создании эстетически привлекательных изображений, но им предстоит многое узнать о статистических методах.

«В центре всего – соглашение сторон о типе визуализации», – говорит программист-дизайнер

Сегодня в области визуализации исследуются методы преобразования данных в визуальные образы для лучшего понимания информации. Одно из самых распространенных визуальных представлений – линейная диаграмма – используется уже более тысячи лет. А такие инструменты, как столбчатая и круговая диаграмма, диаграмма рассеяния и гистограмма, были изобретены более двух веков назад.

С тех пор прошло много времени, и прогресс не стоял на месте. Сейчас в распоряжении пользователей – десятки программ, позволяющих визуализировать данные. При этом визуализация давно «перекочевала» в трехмерное пространство: ученые применяют ее для наглядного представления результатов исследований, метеорологи составляют погодные карты, руководители используют 3D-модели данных для принятия быстрых и эффективных управленческих решений.

Но остановится ли на этом процесс развития технологий визуализации? Конечно, нет. Что нас ждет в будущем? Ответ на этот вопрос можно найти, проследив историю визуализации, ведь не зря говорят: «Без знаний прошлого нет будущего».

Краткий экскурс в историю

Поскольку мы с вами говорим о визуализации, давайте и ее историю представим в наглядном виде – именно так ее изобразил Майкл Фрэндли (Michael Friendly), автор книги Handbook of Data Visualization:

До 17 века – Ранние карты и диаграммы

Первое зерно визуализации зародилось в геометрических диаграммах, в таблицах положений звезд, иллюстрациях частей тела и навигационных картах.

Среди ранних отображений количественной информации есть график перемещения звездных тел, где в двумерной системе координат показано движение планет. Этот график служит хорошей иллюстрацией данного периода:

1600-1699 – Измерения и теории

В XVII веке ученых интересовало, как измерить время, расстояние и пространство. Основной упор делался на карты и навигацию.

Именно в этот период появилась система координат, родилась теория верности и демографическая статистика.

Иллюстрацией того времени может послужить работа Кристофера Шайнера (Christopher Scheiner), датированная 1630 годом. Позднее Эдвард Тафти использовал для нее термин «маленькие множества», подразумевая под ним повторение одного элемента много раз для отображения динамики и происходящих изменений.

На этом рисунке запечатлены пятна на солнце, наблюдавшиеся в течение месяца:

1700-1799 – Новые графические формы

XVIII век – время выхода за рамки «очевидного». На картах теперь стараются отобразить не просто точку географического местоположения, появляются контуры и изолинии.

Примеры эпохи: тематические карты геологических разломов, экономические выкладки и медицинские иллюстрации. Абстрактные визуализации становятся все более распространенными. Начинает накапливаться больше информации о политических и экономических событиях, соответственно возникает необходимость в новых визуальных формах для их отображения.

Ниже – один из первых примеров наложения дополнительных данных на географическую карту:

1850 – Начало современной графики

К этому времени появились основные виды графиков: круговая, столбиковая, площадная диаграммы. Отправной точкой современной графики считается знаменитая визуализация холеры на улицах Лондона, сделанная Джоном Сноу:

В 1858 году сестра милосердия и общественный деятель Великобритании Флоренс Найтингейл изобрела первую круговую диаграмму — ее она использовала в Крымской войне с целью показать, что намного больше солдат умерло от болезней (синий), чем на поле боя (красный) или по другим причинам (черный):

1900-1950 – Смутные годы

Начались философские рассуждения и деление людей на «более визуальных» и «более табличных». Британцы считали себя более табличными. Девизом Британской академии в те времена был сбор данных («сбор пшеничных зерен»), а вот визуализация на их взгляд была уже из серии хлебопекарни.

1950 – 1975 – Возрождение

Ученые и писатели начали активно популяризировать идеи визуализации. Подобные труды выходили буквально один за одним. В 1962 году Джон Тьюки написал книгу «Будущее анализа данных», отделив математику от статистики. И если первая не терпит визуализаций, то статистика как раз обретает больший смысл и форму благодаря им.

В это время появляются первые интерактивные визуализации. Примером может служить визуализация Ричарда Бейкера:

В 1973 году американский ученый Герман Чернов использовал изображения лиц для визуализации данных. Лица Чернова - это отображение многомерных данных в виде человеческого лица, его отдельных частей. Ниже — пример оценки юристами 12 судей по Лицам Чернова:

1975 – н.в. – Интерактивная и динамическая визуализация высокого разрешения

Сегодня мы имеем широкий доступ к инструментам анализа и визуализации данных. Ключевыми моментами, которые ознаменовали эпоху интерактивной и динамической визуализации, можно считать возникновение интерактивных систем, возможность взаимодействовать с моделями (в том числе и 3D), увеличение мощности компьютеров наравне с удешевлением технологий.

Безусловно, ключевую роль в этом процессе сыграло появление Интернета и, как следствие, доступ к большим массивам данных.

Яркий пример визуализации этой эпохи – визуализация сети Интернет, сделанная Opte Project:

Создание графиков, карт, диаграмм и прочей инфографики может занять много времени. Но процесс можно ускорить, если воспользоваться специальными инструментами визуализации данных, в которых есть все, что нужно для того, чтобы быстро и без особых усилий создать красивые и информативные иллюстрации. Сегодня качественную инфографику можно создать буквально за несколько минут и при этом не требуется обладать какими-то специальными навыками. Все что нужно, это просто собрать и структурировать данные и загрузить их в программу. У современных инструментов для визуализации данных очень простой и интуитивной понятный интерфейс, зачастую графика строится путем перетаскивания нужных элементов при помощи мыши, так что создать интересные графики может даже новичок.

Большинство веб-сервисов и инструментов для визуализации работают во всех основных браузерах и предлагают большой выбор полезных функций. Их можно использовать для создания интерактивных визуализаций с анимацией, для сторителлинга, а также для создания дополнительных слайдов к презентациям. FreelanceToday предлагает вашему вниманию 20 инструментов для визуализации данных.


DataHero это очень полезный инструмент для визуализации данных, который можно использовать для построения замечательных графиков и диаграмм. Инструмент очень мощный и на первый взгляд может показаться немного сложным в использовании. Все дело в том, что в нем изначально заложены очень большие возможности для обработки огромных массивов данных. Для создания простенького графика можно найти более удобный инструмент, но если нужно обработать большое количество самой разной информации и затем представить ее в виде красочной графики, то здесь DataHero вне конкуренции.


Веб-сервис Tableau позволяет быстро и эффективно работать с открытыми данными. Качественные графики создаются необычайно легко: если есть нужные цифры, программа сама создаст зрительные образы, которые затем нужно будет расставить в нужном порядке. Созданную инфографику можно размещать в блогах, на различных сайтах, а также в социальных сетях. Не обязательно хранить созданные файлы на своем компьютере – Tableau предоставляет каждому пользователю до 10 GB облачного пространства, так что доступ к нужным данным можно получить в любое время и с любого устройства.


Инструмент Dygraphs позволяет создавать интерактивные диаграммы, которые прекрасно отображаются на всех типах устройств. Это достаточно мощный генератор графиков, с помощью которого можно обрабатывать большие массивы информации. В основной функционал программы по умолчанию включены такие функции как масштабирование и панорамирование. Для рядового пользователя Dygraphs может показаться несколько сложным в использовании, так как работа с этим инструментом требует знания основ HTML и JavaScript. Однако разобраться, как все работает, довольно легко, после чего создание уникальных графиков не займет много времени.

InstantAtlas изначально создавался как инструмент создания интерактивных карт для демонстрации различных статистических данных. Данное программное обеспечение может использоваться как обычный веб-сервис, также его можно установить на локальном компьютере. Кроме того, можно настроить интеграцию карт и отчетов с удаленным сервисом, что позволит создать собственную информационную систему. Большие возможности IstantAtlas позволяют использовать этот инструмент визуализации данных в таких сферах как общественная безопасность, здравоохранение, демография, образование и коммерция. Если нужно связать статистику с географией, то для создания красочных информативных карт лучше всего воспользоваться инструментов InstantAtlas.

Приложение Exhibit предлагает все необходимые инструменты для быстрого создания веб-страниц с визуализацией данных. Графики, диаграммы и другие графические элементы создаются с помощью различных фильтров, карт и другого функционала. Приложение позволяет создавать как обычную, так и интерактивную инфографику. Основное достоинство Exhibit – это хорошо отлаженная интеграция с картами Google. Для создания интерактивной веб-страницы нужно выбрать конкретный регион, собрать необходимые данные и затем представить всю информацию в максимально понятном виде.

Leaflet является одной из лучших JavaScript-библиотек с открытым исходным кодом для создания мобильных интерактивных карт. При весе всего в 38 Kb этот инструмент предоставляет практически все, что когда-либо может понадобиться веб-разработчикам. При создании Leaflet акцент делался на производительность, простоту и удобство. При этом нужно отметить, что для пользователей, плохо знакомых с HTML, данный инструмент будет несколько сложен в использовании. К достоинствам программы можно отнести эффективную работу на основных настольных и мобильных платформах, а также большое количество плагинов, позволяющих создавать красивую инфографику на основе карт.

JqPlot это плагин для построения графиков и диаграмм, позволяющий визуализировать самую разную информацию. С помощью плагина можно создавать различные диаграммы, графики с несколькими осями, расставлять в нужных местах всплывающие подсказки, а также автоматически рассчитывать линии трендов.

Инструмент для визуализации данных JavaScript InfoVis Toolkit позволяет создавать потрясающую веб-инфографику. Однако для работы с этим инструментом нужны навыки кодирования, нужно уметь работать со стилями и понимать, как создается анимированная графика. Если же необходимые навыки имеются, то возможности разработчика практически ничем не ограничены. JavaScript InfoVis Toolkit позволяет создавать любые зрительные образы на основе собранных статистических данных.

С помощью сервиса Plotly можно создавать потрясающую интерактивную инфографику. Инструмент позволяет создавать красочные графики, диаграммы, сводки и даже целые презентации. Plotly эффективно используется в таких сферах как финансы, страхование, фармацевтика, бизнес-аналитика, а также в таких отраслях, как космонавтика и автомобилестроение. Там где нужно работать с большими массивами данных, требуется мощный инструмент для работы со статистикой и проще всего представить данные в виде графиков с помощью инструмента Plotly.

Chart.js это простой, но очень гибкий инструмент для построения графиков и диаграмм. С его помощью можно комбинировать различные типы графиков, при этом обеспечивая четкое визуальное различие между разными видами данных. Инструмент также позволяет создавать интерактивную инфографику с элементами анимации. Вся графика является отзывчивой – любые образы мгновенно масштабируются в зависимости от типа устройства. Всего пользователю доступно 8 типов диаграмм. Это немного, но вполне достаточно для создания простой визуализации.

Разработчики инструмента RawGraphs заявляют, что этот инструмент является недостающим звеном между электронными таблицами и визуализацией данных. Работать с приложением очень легко, оно поддерживает перенос данных из различных типов таблиц. Не стоит волноваться, что конфиденциальные данные при этом попадут в открытый доступ – вся информация обрабатывается на стороне браузера, операции и хранение на сервере не используются. Табличные данные обрабатываются программой и выводятся в виде графических образов. Если результат не устраивает, можно выбрать другой тип визуализации. Все изменения происходят мгновенно, в режиме реального времени.

Инструмент ZingChart позволяет строить графики JavaScript с помощью простого декларативного синтаксиса. Это очень мощное подспорье для разработчиков, которым приходится работать с большими массивами данных. ZingChart предлагает на выбор более ста типов диаграмм, с помощью которых можно представить в наглядном виде любую статистику. С помощью ZingChart пользователь может добавить в графику интерактива: анимацию, 3D, зуминг, смешанные диаграммы и маркеры.

С помощью виджета Timeline можно создавать красивую информативную графику в виде временной шкалы. Это достаточно редкий, но очень интересный вид визуализации данных, который постепенно набирает популярность у пользователей. Любое событие, как историческое, так и современное, можно разбить на этапы и сопроводить каждое изменение отдельным комментарием. Переход между частями графики осуществляется с помощью мыши – пользователь крутит колесико и просматривает всю историю от начала до конца. Timeline позволяет создавать горизонтальный сторителлинг – очень необычную разновидность графической демонстрации данных.

WolframAlfa позволяет создавать красивые графики на основе собственных данных или на основе информации, предоставленной сервисом. Библиотека WolframAlfa охватывает практически все сферы жизни, а удобный интерфейс дает возможность включать в графику различные типы статистических данных.

Облачный сервис Visualize Free позволяет совместить подготовку данных и визуализацию данных. Пользователю достаточно загрузить цифры и другую информацию и тут же начать визуализировать ее. Visualize Free это прежде всего аналитический инструмент, который осуществляет поиск и анализ данных на достаточно высоком уровне. Простой интерфейс позволяет работать с аналитикой без специальных навыков, нужно лишь знать основные текстовые и табличные редакторы. С помощью Visualize можно создавать обычные линейные графики, столбчатые и круговые диаграммы, интерактивную инфографику, карты и многое другое.

С FusionCharts пользователю никогда не придется начинать работу с нуля. Огромная галерея актуальных примеров, различные графики, диаграммы и карты позволяют очень быстро найти нужный вид визуализации. В библиотеке FusionCharts насчитывается более 800 шаблонов для отображения данных. От других подобных сервисов FusionCharts отличается расширенным функционалом: инструмент позволяет создавать графики, работающие в режиме реального времени, добавлять пользовательские метки и визуально редактируемые диаграммы. Также инструмент осуществляет мультиязычную поддержку всей инфографики.

D3.js это JavaScript-библиотека для работы с документами на основе данных. D3 позволяет визуализировать данные с помощью HTML, SVG и CSS. Инструмент фокусируется на соблюдении веб-стандартов, что позволяет по максимуму использовать возможности современных браузеров. Несмотря на некоторую сложность в использовании, D3 позволяет создавать потрясающие графики. С его помощью можно воплотить практически любую идею, независимо от типа и сложности исходной информации.

Инструмент JpGraph позволяет создавать очень интересные визуализации без особых усилий. Большинство процессов автоматизированы, так что простой график или диаграмму можно создать в течение нескольких минут

Данный список был бы неполон без упоминания такого полезного инструмента, как Google Charts. Данный инструмент визуализации данных поддерживает несколько вариантов анимации и интерактивных элементов управления. Создание графики с помощью Google Charts не займет много времени благодаря интуитивно понятному интерфейсу.

Веб-сервис Carto это не просто инструмент для визуализации данных. Это прежде всего платформа для обнаружения и прогнозирования ключевых идей, которые содержатся в данных о местоположении. То есть это инструмент для анализа на основе геолокационных данных. Обрабатывая и визуализируя данные с помощью Carto, можно выявить интересные тренды и закономерности в самых различных отраслях.

Как легко догадаться из названия, визуализация данных - это графическое представление каких-либо данных. При этом на просторах интернета я нашёл множество определений, которые относят к визуализации данных:

  • Графики и диаграммы,
  • Инфорграфика и схемы,
  • Презентация и анализ данных,
  • Интерактивный сторителлинг,
  • Бизнес аналитика и дашборды,
  • Научная и медицинская визуализация,
  • Карты и картограммы.

Дальше каждый решает сам - что же для него понимать под визуализация данных. В конце заметки, я расскажу, что же решил для себя я. А пока давайте рассмотрим каждый из видов подробнее и найдём их отличия и особенности.

Графики и диаграммы

Наверное самый привычный для нас вид визуализации данных. Используется как для презентации данных, так и для анализа. Встретить их можно и на работе, и в журнале и в научном отчете. Обычно знания о существующих типах диаграмм и графиков мы получаем из школы или из стандартного набора в экселе. Однако, мало кто знает, что мир графиков и диаграмм не ограничивается точечным графиком, столбиковой и круговой диаграммой. Существуют порядка 15 общеизвестных типов диаграмм, а всего их более 60, при этом их количество увеличивается с каждым днём - люди придумывают новые типы для визуализации сложных и необычных данных. Подробно типы графиков и диаграмм мы рассмотрим в одной из следующих заметок.




Инфорграфика и схемы

Инфографика стала очень популярна в последние годы, хотя существуют уже давно. Инфографика относиться к журналистике данных, где графики и схемы объясняют какие-либо факты по выбранной теме. Обычно инфографика статична и представляет собой длинную «простыню» с картинками и текстом. Отличительной особенностью инфографики является то, что в ней приводятся уже готовые выводы, то есть читателя проводят за руку по выбранной теме и при этом приправляют это все цифрами и картинками. Часто используется рисованный или мультяшный стиль. Некоторые СМИ выпускают инфографику на ежедневной основе, например АиФ. Бум инфографики вызвал снижение общего уровня её качества. Часто используется не к месту или «для красоты», хотя конечно же есть замечательные и интересные примеры.

Примеры инфографики

Численность Наполеоновской армии во время русской компании, 1869 г.

Численность населения разных стран, 1912 г.

10 заповедей типографики

Взмах крыльев

Вегетарианцы в цифрах

Презентация и анализ данных

Один самых привычных способов использования визуализации данных - презентация информации в виде диаграмм или инфографики. И если с этим, я думаю, все понятно, то использование визуализации для анализа информации, в основном, используется только бизнес-аналитиками и учеными. В чем же заключается отличие?

При анализе данных с помощью визуализации используют так называемое быстрое прототипирование - то есть создание большого количества различных визуальных представлений одних и тех же данных. Делается это для возможности нахождения скрытых, на первый взгляд, взаимосвязей и зависимостей, а также первичной оценки набора данных для возможности применения в дальнейшем более сложных инструментов анализа. Этот подход называется Eploratory data analysis (EDA), что на русский можно перевести как разведочный анализ данных. Основное отличие от презентации данных - визуализация здесь может быть «черновой» и некрасивой, но выполняется быстро и одним человеком или небольшой рабочей группой. Для этого чаще всего используют эксель, R или матлаб

EDA - один из инструментов data mining’a, по его проведению есть даже учебники

Примеры визуализации для EDA





Интерактивный сторителлинг

Сторителлинг или по-русски сказительство (звучит забавно) - это преподнесение какой-либо полезной информации в форме интересного рассказа. Почему-то часто интерактивным сторителлиногм называют видео, но это не так, это всего-лишь еще один вид инфгорафики. Интерактивный сторителлинг - рассказ с которым слушатель может взаимодейтсовать. По своей сути он близок к журналистике данных и инфографике, но отличается тем, что пользователь может управлять отображением информации и находить те зависимости, которые не нашёл автор. В этом смысле он близок к разведочному анализу данных, но отличается тем, что данные заранее обработаны и представлены в удобном для анализа виде, а также имеются подсказки или заранее прописанные сценарии использования. Поэтому, чаще всего интерактивный сторителлинг называют интерактивной инфографикой, но для того чтобы ей стать не достаточно просто к статичной инфографике добавить всплывающие окошки.
Интерактивные визуализации активно развиваются в наше время. Сильные примеры можно встретить в крупных СМИ или в виде отдельных проектов.

Примеры инетрактивного сторителлинга (переход на сайт при клике на картинку)

Бизнес аналитика и дашборды,

Визуализация активно используется в бизнесе. Принцип «говорите с данными» помогает компаниям зарабатывать больше, а клиентам получать лучший сервис. Для разового анализа обычно используется эксель или R. Однако это не удобно если необходимо следит за какими-то показателями (KPI) на постоянной основе. Для отслеживания рутинных KPI используют дашборды - дисплеи на которых выведены все необходимые показатели в одном месте в виде графиков, диаграмм и таблиц.

Проектирование эффективных дашбордов - сложная и неординарная задача. Зачастую их перегружают ненужной информацией или стараются использовать все возможные типы шаблонных графиков. Часто для того чтобы спроектировать хороший дашборд необходимо создание новых типов визуализации информации. Тематика активно развивается за счет все большего применения аналитики в бизнесе. Также дашборды применяются и для личного использования (фитнес трекеры, анализ личных расходов и т. п.)

Карты - одни из древнейших способов визуализации, отображающих окружающую реальность. Картограмма - карта с нанесенной на неё информацией в виде цвета или других способов. Возможно я тут буду не точен с терминами, да простят меня картографы. Картограммы могут быть использованы для отображения любой информации - от плотности населения, до частоты использования ругательных слов в каждом районе страны. Их могут применять в любом из типов визуализаций, о которых мы говорили раньше. Я выделил их в отдельный пункт, так как их реализация достаточно отличается от других типов визуализаций (ждем про это заметку).

Примеры картограмм (переход на сайт при клике на картинку)

Подводя итоги

Заметка получилась неожиданно большой. Может быть оно и хорошо, сразу видно как много всего в мире визуализации данных. Что же понимаю под этим понятием я и о чем будет речь в данном блоге?
Для меня представление данных в первую очередь связанно с графиками и диаграммами, а также инетрактивной инфографикой. Это то, чему будет посвящена основная масса заметок, также будет интересно покопаться с картами и дашбордами.


Top