Науковці в сфері медицини встановили, що якщо в інструкції до ліків знаходиться тільки текст, людина засвоює з неї лише 70% інформації. Якщо ж в інструкцію додати малюнки, людина засвоїть вже 95%.
Що таке візуалізація даних?
Перш за все, потрібно знати, що ж таке візуалізація даних і які її методи використовуються, в тому числі і в повсякденному житті. Найпростіші, а тому й найпоширеніші методи візуалізації – це графіки
Візуалізація даних – це наочне представлення масивів різної інформації. Існує кілька типів візуалізації:
• Звичайне візуальне представлення кількісної інформації в схематичній формі. До цієї групи можна віднести всім відомі кругові та лінійні діаграми, гістограми і спектрограми, таблиці і різні точкові графіки.
• Дані при візуалізації можуть бути перетворені у форму, що посилює сприйняття і аналіз цієї інформації. Наприклад, карта і полярний графік, тимчасова лінія і графік з паралельними осями, діаграма Ейлера.
• Концептуальна візуалізація дозволяє розробляти складні концепції, ідеї і плани за допомогою концептуальних карт, діаграм Ганта, графів з мінімальним шляхом та інших подібних видів діаграм.
• Стратегічна візуалізація переводить у візуальну форму різні дані про аспекти роботи організацій. Це всілякі діаграми продуктивності, життєвого циклу і графіки структур організацій.
• Графічно організувати структурну інформацію за допомогою пірамід, дерев і мап даних допоможе метафорична візуалізація, яскравим прикладом якої є мапа метро.
• Комбінована візуалізація дозволяє об’єднати кілька складних графіків в одну схему, як в мапі з прогнозом погоди.
Навіщо використовувати візуалізацію даних?
Візуальна інформація краще сприймається і дозволяє швидко і ефективно донести до глядача власні думки та ідеї. Фізіологічно, сприйняття візуальної інформації є основною для людини. Є численні дослідження, які підтверджують, що:
• 90% інформації людина сприймає через зір
• 70% сенсорних рецепторів знаходяться в очах
• близько половини нейронів головного мозку людини задіяні в обробці візуальної інформації
• на 19% менше при роботі з візуальними даними використовується когнітивна функція мозку, що відповідає за обробку та аналіз інформації
• на 17% вище продуктивність людини, що працює з візуальною інформацією
• на 4,5% краще згадуються докладні деталі візуальної інформації
• в 60 000 разів швидше сприймається візуальна інформація в порівнянні з текстовою

На графіку читач швидше знайде мінімальне і максимальне значення
• 10% людина запам’ятовує з почутого, 20% – з прочитаного, і 80% – з побаченого і зробленого
• на 323% краще людина виконує інструкцію, якщо вона містить ілюстрації

Інструкцію знизу набагато легше і швидше зрозуміти і виконати
Детальніше про факти та дослідженнях можна подивитися у цікавій інфографіці тут.
Очевидно, що людина схильна обробляти саме візуальну інформацію. Крім прекрасної обробки нашим мозком, візуалізація даних має кілька переваг:
• Акцентування уваги на різних аспектах даних
• Аналіз великого набору даних зі складною структурою
• Зменшення інформаційного перевантаження людини і утримування його уваги
• Однозначність і ясність виведених даних
• Виділення взаємозв’язків і відносин, що містяться в інформації

На графіку легко можна помітити важливі дані
• Естетична привабливість

Естетично привабливі графіки роблять подачу даних ефектною і такою, що запам’ятовується
Едвард Тафті, автор одних з найкращих книг по візуалізації, описує її як інструмент для показу даних; спонукання глядача замислитися про суть, а не методології; уникнення спотворення того, що повинні сказати дані; відображення багатьох чисел на невеликому просторі; показу великого набору даних зв’язковим і єдиним цілим; спонукання глядача порівнювати фрагменти даних; служіння досить чітким цілям: опису, дослідженню, упорядкуванню або прикрашанню (“The Visual Display of Quantitative Information”, Edward Tufte).
Як правильно використовувати візуалізацію даних?
Успіх візуалізації безпосередньо залежить від правильності її застосування, а саме від вибору типу графіка, його вірного використання та оформлення.
60% успіху візуалізації залежить від вибору типу графіка, 30% – від його правильного використання та 10% – від його вірного оформлення.
Правильний тип графіка
Графік дозволяє висловити ідею, яку несуть дані, найбільш повно і точно, тому дуже важливо вибрати відповідний тип діаграми. Вибір можна здійснити за алгоритмом:

Цілі візуалізації – це реалізація основної ідеї інформації, це те, заради чого потрібно показати вибрані дані, якого ефекту потрібно досягнути – виявлення взаємозв’язків в інформації, відображення розподілу даних, композиції або порівняння даних.
У першому ряду показані графіки з цілями відображені співвідношення даних і їх розподіл, а в другому рядку цілями є відображення композиції і порівняння даних
Співвідношення в даних – це те, як вони залежать один від одного, зв’язок між ними. За допомогою співвідношень можна виявити наявність або відсутність залежностей між змінними. Якщо основна ідея інформації містить фрази “відноситься до”, “знижується / підвищується при”, то потрібно прагнути показати саме співвідношення в даних.
Розподіл даних – це те, як вони розташовуються відносно чого-небудь, скільки об’єктів потрапляє в певні послідовні області числових значень. Основна ідея при цьому буде містити фрази “в діапазоні від x до y”, “концентрація”, “частотність”, “розподіл”.
Композиція даних – об’єднання даних з метою аналізу загальної картини в цілому, порівняння компонентів, що складають відсоток від якогось цілого. Ключовими фразами для композиції є “склало x%”, “частка”, “відсоток від цілого”.
Порівняння даних – об’єднання даних, з метою порівняння деяких показників, виявлення того, як об’єкти співвідносяться один з одним. Також це порівняння компонентів, що змінюються з часом. Ключові фрази для ідеї при порівнянні – “більше / менше ніж”, “дорівнює”, “змінюється”, “підвищується / знижується”.
Після визначення мети візуалізації потрібно визначити тип даних. Вони можуть за своїм типом і структурою бути дуже різнорідними, але в самому простому випадку виділяють безперервні числові і тимчасові дані, дискретні дані, географічні та логічні дані. Безперервні числові дані містять в собі інформацію залежності однієї числової величини від іншої, наприклад графіки функцій, такий як y = 2x. Безперервні тимчасові містять в собі дані про події, що відбуваються на якомусь проміжку часу, як графік температури, вимірюваної кожен день. Дискретні дані можуть містити в собі залежності категорійних величин, наприклад графік кількості продажів товарів у різних магазинах. Географічні дані містять в собі різну інформацію, пов’язану з місцем розташування, геологією та іншими географічними показниками, яскравий приклад – це звичайна географічна карта. Логічні дані показують логічне розташування компонентів відносно один одного, наприклад генеалогічне древо сім’ї.
Графіки неперервних числових і часових даних, дискретних даних, географічних і логічних даних
Залежно від мети і даних можна вибрати найбільш підходящий їм графік. Найкраще уникати різноманітності заради різноманітності і вибирати за принципом “чим простіше, тим краще”. Тільки для специфічних даних використовувати специфічні типи діаграм, в інших же випадках добре підійдуть найпоширеніші графіки:
• лінійний (line)
• з областями (area)
• колонки і гістограми (bar)
• кругова діаграма (pie, doughnut)
• полярний графік (radar)
• точковий графік (scatter, bubble)
• карти (map)
• дерева (tree, mental map, tree map)
• тимчасові діаграми (time line, gantt, waterfall).
Лінійні діаграми, графіки з областями і гістограми можуть містити в одному аргументі для однієї категорії кілька значень, які можуть бути як абсолютними (тоді до таких видів графіками додається приставка stacked), так і відносними (full stacked).
Графік зі stacked значеннями і з full stacked
При виборі відповідного графіка можна керуватися наступною таблицею, складеної на основі цієї діаграми і книги “Говори мовою діаграм” Джина Желязни:
Діаграма Желязни виглядає наступним чином:
Правильне використання графіка
Важливо не тільки вірно вибрати тип графіка, але і правильно його використовувати:
• Не потрібно навантажувати графік великою кількістю інформації. Оптимальна кількість різних типів даних, категорій – це не більше 4-5, інакше ж доцільніше розділити таку діаграму на кілька штук.

Такий графік можна порівняти зі спагеті і краще розділити на кілька діаграм
• Вірно вибрати шкалу і її масштаб для графіка. Для гістограм і графіків з областями потрібно починати шкалу значень з нуля. Постаратися не використовувати інвертовані шкали – це дуже часто вводить глядача в оману щодо даних.

Невірна шкала негативно впливає на сприйняття даних. У першому випадку некоректно обраний масштаб, у другому шкала інвертована
• Для кругових діаграм і графіків, де показаний відсоток від загальної частки, сума значень завжди повинна становити 100%.
• Для кращого сприйняття даних інформацію на осі краще впорядкувати – або за значеннями, або за алфавітом, або по логічному змістом.
Правильне оформлення графіка
Ніщо так не радує око, як правильно оформлені графіки, і ніщо так не псує діаграми, як наявність графічного “сміття”. Основні принципи оформлення:
• використовувати палітри схоже, не яскравих кольорів, і постаратися обмежитися набором із шести штук
• допоміжні та другорядні лінії повинні бути простими і не кидаються в очі

Допоміжні лінії на графіку не повинні відволікати увагу від основної ідеї даних
• там, де можливо, використовувати тільки горизонтальні написи на осях
• для графіків з областями варто використовувати колір з прозорістю
• для кожної категорії на графіку використовувати свій колір
Висновки
Візуалізація – потужний інструмент донесення думок та ідей до кінцевого споживача, помічник для сприйняття та аналізу даних. Але як і всі інструменти, її потрібно застосовувати в свій час і в своєму місці. В іншому випадку інформація може сприйматися повільно, а то і некоректно.
На графіках зображені одні й ті ж дані, зліва показано основні помилки візуалізації, а праворуч вони виправлені
При вмілому застосуванні візуалізація даних дозволяє зробити матеріал вражаючим, ненудним і незабутнім.
P.S. Дана стаття є передруком статті з порталу habrahabr.ru (DevExpress). Графіки для статті були зроблені за допомогою DevExtreme.
Переклад Тарнай Володимир
















