Мощные инструменты для визуализации данных MongoDB

moshhnye instrumenty dlya vizualizaczii dannyh mongodb

С множеством доступных инструментов визуализации трудно найти нужный для данных MongoDB, имеющий готовую функциональность.

Сегодня я хочу вам рассказать о своем опыте изучения таких инструментов визуализации.

Моя цель была проанализировать набор данных из базы данных MongoDB. Я хотел разработать рабочий процесс для анализа данных, объединяющий анализ управления базой данных, агрегацию данных и визуализацию данных.

Вот инструменты, которые я выбрал:

  • Компас это программа с графическим пользовательским интерфейсом для углубленного анализа и визуализации данных MongoDB и схемы коллекций. Он обеспечивает просмотр ваших данных в режиме реального времени. Интуитивно понятный интерфейс помог мне сосредоточиться на значении данных.
  • Flexmonster Pivot Table – это инструмент для расширенного веб-отчета и анализа. Хотя Compass является отдельным приложением, я обнаружил, что Flexmonster интегрирован непосредственно в веб-проект. Мне удалось встроить его в свою программу Angular 4 и использовать для анализа данных.

Первой частью процесса визуализации является подключение к базе данных MongoDB с помощью Compass. Затем вы сможете узнать, какие функции предлагает Compass и какой анализ можно провести с помощью этого инструмента.

Вторая часть посвящена дальнейшему анализу данных MongoDB. Мы загрузим данные в сводную таблицу и изучим возможности, которые предлагает.

Как источник данных для моего исследования, Я выбрал набор данных о 120-летней истории и результатах Олимпийских игр.

Этот набор данных имеет типичную структуру JSON, которая отличается от формата, требуемого MongoDB. Чтобы импортировать это в MongoDB, я выполнил такую ​​команду в CLI:

mongoimport - db <db-name> - collection athletes - type json - file athletes.json
 - jsonArray

Понимание данных с помощью компаса

Сначала я упомяну некоторые функции управления базами данных.

Компас может генерировать гистограмму для представления частоты данных. Это помогло мне проанализировать наличие документов, типов данных и распределения значений для конкретных полей в коллекции.

Прежде всего, я подключился к экземпляру MongoDB, работающему на локальном хосте, с помощью программы Compass.

На главной странице коллекции «спортсмены» я проверил информацию о сборнике, отредактировал данные в интерактивном режиме и опробовал простые и сложные запросы.

Инструмент визуализации схемы помог мне понять мои данные.

1*mlw7BqAOwmKGK0LylRtOsA

Здесь я проверил статистику типов данных полей: процент типов данных, используемых для этого поля во всех документах коллекции.

Я нашел, что для неких полей у меня смешанные типы данных. В моем примере я имею числовой тип для «Высоты» у 80% документов, но строчный тип встречается в 20% случаев.

1*8_VabJnhX1qDKbAqtg_LiQ

Для меня это означало, что в моем наборе данных есть пробел. Рост сохраняется по-разному между спортсменами.

Агрегация с компасом

Какие функции делают MongoDB и Compass такими популярными среди аналитиков, часто работающих с полуструктурированными и неструктурированными данными?

MongoDB полезен для аналитики в реальном времени, поскольку поддерживает конвейеры агрегации. Они могут включать операции сортировки и фильтрации, а также группировку данных.

Хотя Compass поддерживает создание запросов в реальном времени для агрегации.

Чтобы сосредоточиться на некоторых частях данных, я отфильтровал документы по полю «Возраст».

Чтобы показать только тех спортсменов младше 22 лет, я выбрал на гистограмме нужную область для создания запроса в поле «Возраст». В результате соответствующие документы возвращены.

1*nudvk6OBTCbPWu3OEB73QA

Таким же образом я отфильтровался по диапазону значений. Затем я отсортировал данные по «возрасту» в порядке возрастания:

1*1_Apj6daGZhK3b6fE0CTtg

Но чтобы построить этапы в конвейере агрегации и сгруппировать данные мне нужно было использовать свои знания языка запросов MongoDB. Это было легче сделать в сводной таблице.

Анализ данных с помощью сводной таблицы Flexmonster

В своих веб-проектах я использую Angular. Итак, я придерживался учебника Angular, чтобы вставить сводную таблицу. Для получения данных из моей базы данных я использовал этот учебник.

Я подключился к MongoDB из своего приложения и получил данные о спортсменах. Данные были сжаты, а затем переданы в сводную таблицу для рендеринга.

После загрузки выборочных данных о спортсменах в сводную таблицу, я хотел проанализировать минимальный и максимальный возраст среди спортсменов. Кроме того, я хотел определить лучшие команды в истории на основе их общего количества медалей.

Для начала анализа данных я выделил поля в столбце и строки.

Для работы с полем «Медаль» я выбрал его для измерений и достиг следующих результатов:

  1. Отфильтрованы записи по значению, чтобы отобразить 5 лучших команд с наибольшим количеством медалей
  2. Применил условное форматирование для моего отчета, чтобы выделить команды с более чем 185 медалями.
1*Yx0TrC9X_j8sWSKFOpkqiw

3. Далее я выбрал «Возраст» и проанализировал максимальный возраст среди спортсменов:

1*C8lcD5ZnabihXmSpb7SmxQ

4. Затем я перешел к сводным диаграммам и проанализировал данные в более наглядной форме, чтобы узнать лучшие команды летнего сезона:

1*LaVrjAbGNQ2Ey-W5TznK0g

Вывод

Итак, сегодня я поделился своим опытом использования Compass и Flexmonster Pivot Table. На мой взгляд, оба инструмента могут помочь создать креативную визуальную историю и разумно анализировать данные.

Надеюсь, вы нашли чтение о моем опыте полезным, и теперь вы на правильном пути к успешному анализу данных MongoDB.

Буду рад услышать любые отзывы по этому обзору. Пожалуйста, выскажите свое мнение в комментариях. Для каких инструментов Визуализация данных MongoDB вы могли бы порекомендовать? Хорошо ли они обрабатывают ваши данные?

Добавить комментарий

Ваш адрес email не будет опубликован.