Огляд кожного курсу візуалізації даних в Інтернеті

Рік тому я кинув одну з найкращих програм інформатики в Канаді. Я почав створювати власну магістерську програму з даних, використовуючи Інтернет-ресурси. Я зрозумів, що можу навчитися всього, що мені потрібно, за допомогою edX, Coursera та Udacity. І я міг би навчитися цього швидше, ефективніше і за частку вартості.

Зараз я майже закінчив. Я пройшов багато курсів, пов'язаних з наукою про дані, та перевірив багато інших. Я знаю, які там варіанти, і які навички потрібні учням, які готуються до роботи аналітика даних або науковця. Кілька місяців тому я почав створювати оглядовий посібник, який рекомендує найкращі курси для кожного предмета в галузі науки про дані.

Для першого посібника з серії я порекомендував кілька класів кодування для початківця дослідника даних. Тоді це була статистика та класи ймовірності. Тоді це було введення в саму науку даних.

Тепер на візуалізацію даних.

Для цього посібника я витратив 10+ годин, намагаючись ідентифікувати кожен онлайн-курс візуалізації даних, запропонований станом на березень 2017 року, витягуючи ключові фрагменти інформації з їх програм та оглядів, та складаючи їх рейтинги. Для цього я звернувся до не кого іншого, як спільноти Class Central з відкритим кодом та її бази даних про тисячі рейтингів та оглядів курсів.

З 2011 року засновник Class Central Дхавал Шах пильніше стежив за онлайн-курсами, ніж будь-хто інший у світі. Дхавал особисто допоміг мені скласти цей список ресурсів.

Як ми обирали курси для розгляду

Кожен курс повинен відповідати трьом критеріям:

  1. Більша частина курсу повинна бути зосереджена на візуалізації пояснювальних даних. Наприклад, висвітлення підготовки даних дозволяється, оскільки це є важливою частиною процесу візуалізації даних. Курси, що охоплюють менш відповідні теми (статистичне моделювання, наприклад), виключаються. Детальніше про пояснювальну різницю нижче.
  2. Його потрібно замовляти на замовлення або пропонувати кожні кілька місяців.
  3. Це має бути інтерактивний онлайн-курс, тому жодних книг чи навчальних посібників лише для читання . Хоча це життєздатні способи навчання, цей посібник зосереджений на курсах.

Ми вважаємо, що ми охопили кожен помітний курс, який відповідає вищезазначеним критеріям. Оскільки, здається, сотні курсів на Udemy, ми вирішили розглянути лише найбільш перевірені та найвищі рейтинги. Однак завжди є шанс, що ми щось пропустили, тому, будь ласка, повідомте нас у розділі коментарів, якщо ми залишили хороший курс.

Як ми оцінювали курси

Ми склали середній рейтинг та кількість оглядів від Class Central та інших оглядових сайтів, щоб розрахувати середньозважену оцінку для кожного курсу. Ми читали текстові огляди та використовували цей відгук, щоб доповнити числові рейтинги.

Ми зробили суб’єктивні навчальні програми на основі двох факторів, причому першому надали перевагу над другим:

  1. Висвітлення теорії візуалізації даних. Чи пояснено мотивацію вибору візуалізації? Курс навчає лише інструменту? Докладніше про це у наступному розділі.
  2. Висвітлення вибраних засобів візуалізації даних. Чи ефективно навчає курс загальних інструментів візуалізації (Tableau, ggplot2, Seaborn тощо)? Чи є у студентів можливість відпрацювати ці навички? Не надається перевага вибору інструменту.

Навіщо надавати пріоритет теорії візуалізації

Володіння певним інструментом марнотратне без знання основ ефективної візуалізації. Крім того, інструменти часто взаємозамінні залежно від налаштування.

Що ще важливіше, якісна візуалізація даних є більш складною, ніж думає більшість людей. Необхідна ретельна думка від етапів планування до виконання. Вибір правильної діаграми, збалансування складності та безладу, використання попереджувальних властивостей тощо, візуалізація даних - це і мистецтво, і наука. Помилитися легко, а іноді і жахливо (див. Нижче).

Дослідницька та пояснювальна візуалізація

Як описав професор Університету Індіани Йонг-Еол Ан, метою візуалізації пояснювальних даних є передача інформації та повідомлень, тоді як метою дослідницької візуалізації є виявлення прихованих закономірностей.

Ця стаття зосереджена на пояснювальних курсах візуалізації даних. Тому такі курси, як Аналіз даних Udacity за допомогою R (виключно дослідницький курс), виключені з цієї статті. Тема важлива; просто недостатньо курсів, щоб виправдати окрему статтю. Це буде коротко висвітлено в короткій статті цієї серії.

Іноді потрібен досвід кодування

Деякі перелічені нижче курси вимагають базових навичок кодування мовою викладання курсу. Якщо у вас дуже мало досвіду програмування, наші рекомендації з першої статті цієї серії - найкращого вступу до курсів програмування з інформатики - будуть чудовим початком. Охоплюються курси Python та R.

Даних огляду бракує

Порівняно з іншими статтями цієї серії, недостатньо даних для огляду курсів візуалізації даних, які відповідають вищезазначеним критеріям. Також поки не існує чіткого курсу найкращої візуалізації даних. Отже, наведені нижче рекомендації не є такими переконливими, як минулі статті. Як завжди, але особливо тут, спробуйте вибрати той курс, який найбільше відповідає вашим потребам.

Наш вибір найкращого курсу візуалізації даних - це ...

  • Візуалізація даних за спеціалізацією Tableau від Каліфорнійського університету в Девісі на Coursera

... який містить наступні п’ять курсів:

  • Основи візуалізації за допомогою Табло
  • Основні принципи дизайну для таблиці
  • Візуальна аналітика з таблицею
  • Створення інформаційних панелей та розповідання історій за допомогою Tableau
  • Візуалізація даних за допомогою проекту Tableau

Університет Каліфорнії, штат Девіс, Візуалізація даних із спеціалізацією Tableau має найкраще поєднання теорії та охоплення інструментів на основі критеріїв оцінки цієї статті. Це занурення глибоко в теорію, як і деякі інші курси. Є можливості практикувати Tableau через покрокові інструкції та остаточний проект, хоча освоєння Tableau не є головним акцентом. Це досить нова спеціалізація (кінець 2016 р.), І курси мають лише один 4- зірковий рейтинг на сайтах огляду, що використовуються для цього аналізу.

Інструкторами є Говінд Ачарія, Хантер Уітні та Сук Брар. Ачар'я - головний аналітик UC Davis. Уітні та Брар - поважні професіонали галузі. Між ними є десятиліття досвіду візуалізації даних, який чітко передається через зміст курсу. Відео зроблено добре.

Орієнтовний графік спеціалізації на Coursera становить 22 тижні, а щотижневі зобов’язання становлять від трьох до восьми годин на тиждень. Ці оцінки, безумовно, занадто високі, як зазначають кілька рецензентів та мій досвід роботи з Coursera. Наразі доступні безкоштовні (аудит кожного курсу окремо) та платні (оплата за спеціалізацію).

Кілька видатних рецензентів Coursera відзначили наступне:

Вони не тільки розповідають вам, як зробити дизайн візуалізації, але й розповідають, чому (фізіологія, принципи). Я б настійно рекомендував цей клас. Чудовий курс - захищає від деяких тонких підводних каменів у підготовці до візуалізації. Хоча цей базовий вступ до використання Таблиці, цей курс пропонує широкий та цікавий фон, який повинен виявитися корисним для тих, хто прагне покращити своє розуміння основи візуалізації.

Теорія візуалізації та R, вивчені на практиці

  • Візуалізація даних за допомогою ggplot2 від DataCamp

... для яких є три частини:

  • Візуалізація даних за допомогою ggplot2 (частина 1)
  • Візуалізація даних за допомогою ggplot2 (частина 2)
  • Візуалізація даних за допомогою ggplot2 (частина 3)

Ще одним чудовим варіантом є візуалізація даних DataCamp із серією ggplot2, особливо якщо ви хочете вивчити R та, точніше, ggplot2. Висвітлено значну кількість теорії, що підходить, враховуючи те, що ggplot2 натхненний Граматикою графіки. Висвітлення інструментів та практика також вражають - ви добре знатимете R та його химерний синтаксис, залишаючи ці курси. На сайтах оглядів, що використовуються для цього аналізу, немає відгуків про ці курси.

Викладачем усіх трьох курсів є Рік Скаветта, який є біологом, тренером семінару, позаштатним вченим з даних та співзасновником Science Craft. Гібридний стиль викладання DataCamp використовує відео (в головній ролі Scavetta) та текстові інструкції з безліччю прикладів через редактор коду в браузері. Вміст відео, тексту та коду добре відполіровано.

Разом орієнтовний графік усіх трьох курсів становить 16 годин. Перша глава кожного курсу доступна безкоштовно. Для повного доступу потрібна підписка на DataCamp, яка зараз становить 29 доларів на місяць або 300 доларів на рік.

Наступне схвалення від Хадлі Вікхема, головного наукового співробітника RStudio та розробника ggplot2:

Я наполегливо рекомендую “Візуалізацію даних за допомогою ggplot2” від Ріка Скаветти. Це дає вам чудове введення в ggplot2. Ви вивчите як основну теорію, так і отримаєте практику в середовищі онлайн-навчання DataCamp.

Практичне вступ до Табло з прекрасним інструктором

Таблиця 10 серії Кирила Єременка та команди SuperDataScience на Udemy, яка включає:

  • Таблиця 10 АЗ: практичний тренінг з вивчення даних!
  • Таблиця 10 Підвищення кваліфікації: Майстер-таблиця з науки про дані

Викладений Кирилом Єременком, SuperDataScience's Tableau 10 Series є ефективним практичним вступом. Він зосереджений в основному на висвітленні інструментів (Таблиця), а не на теорії візуалізації даних. Єременко - один з найбільш відомих викладачів у цих посібниках, який постійно отримує позитивні відгуки про всі курси. Курс AZ є обов'язковою умовою курсу підвищення кваліфікації. Разом курси серії мають 4,6-зірковий середньозважений рейтинг понад 3724 відгуки.

Серіал має сімнадцять годин відеоконтенту. Вартість кожного курсу варіюється залежно від знижок Udemy, але вони є частими і їх можна придбати всього за 10 доларів.

Кілька відомих рецензентів відзначили наступне:

Це було чудово. Я використовую Tableau щодня, але це було чудове оновлення деяких предметів, якими я не користуюсь, і чудовий навчальний посібник для складання сертифікованого іспиту на професійний досвід. Гарної роботи Кирилу та Команда!

Кирило є чудовим викладачем, і студенти, які навчаються на цьому курсі, чітко зрозуміють, чому він має десятки курсів і тисячі студентів - він здатний викладати складні навички в реальному бізнес-контексті і робить це поступово, поєднуючи часто складні завдання викладання як основи та конкретні контекстні програми одночасно.

Змагання

Давайте розглянемо інші варіанти, відсортовані за спаданням.

Інтерактивна візуалізація даних за допомогою Python & Bokeh (Ardit Sulce / Udemy): фокус на інструменті (Python та Bokeh). Включає розділ про створення веб-додатків. Сім годин відео. Вартість варіюється залежно від частих знижок Udemy. Він має 4,6- зірковий середньозважений рейтинг за 103 відгуки.

Візуалізація інформації (IVMOOC) (Університет Індіани / Незалежна): Технічно охоплює теорію та різні інструменти. Вражаючий проект із реального життя. Реєстрація не спрацювала при спробі, незважаючи на електронні листи адміністраторам курсу. Повний дванадцятитижневий аспірантський курс. Безкоштовно Він має 4,5- зірковий середньозважений рейтинг за 2 відгуки.

Таблиця для початківців - Сертифікуйте прискорення своєї кар’єри (Лукас Халім / Удемі): фокус на інструментах (Таблиця). Чотири години відео. Вартість варіюється залежно від частих знижок Udemy. Він має 4,5- зірковий середньозважений рейтинг за 649 відгуків.

Аналіз та візуалізація даних за допомогою Power BI (Microsoft / edX): фокус на інструменті (Power BI). Спеціально для бізнес-користувачів, які інвестують в екосистему Microsoft. Частина сертифікату Microsoft Professional Program в галузі науки про дані. Приблизний графік від двох до чотирьох годин на тиждень протягом шести тижнів. Безкоштовно із підтвердженим сертифікатом, який можна придбати. Він має 4,5- зірковий середньозважений рейтинг за 117 відгуків.

Аналіз та візуалізація даних за допомогою Excel (Microsoft / edX): фокус на інструменті (Excel). Спеціально для бізнес-користувачів, які інвестують в екосистему Microsoft. Частина сертифікату Microsoft Professional Program в галузі науки про дані. Приблизний графік від двох до чотирьох годин на тиждень протягом шести тижнів. Безкоштовно із підтвердженим сертифікатом, який можна придбати. Він має 4,5- зірковий середньозважений рейтинг за 972 відгуки.

Дані візуалізують дані за допомогою D3.js Легкий шлях (Нескінченні навички / Udemy): фокус на інструменті (D3.js). Чотири години відео. Вартість варіюється залежно від частих знижок Udemy. Він має 4,4- зірковий середньозважений рейтинг за 262 відгуки.

Візуалізація даних за допомогою Python та Matplotlib (Електронне навчання Stone River / Udemy): фокус на інструменті (Python та Matplotlib). Шість годин відео. Вартість варіюється залежно від частих знижок Udemy. Він має 4,4- зірковий середньозважений рейтинг за 92 відгуки.

Аналіз даних: Візуалізація та дизайн інформаційної панелі (Технологічний університет Делфт / edX): Інструмент (Excel) та бізнес-фокус. Приблизний графік від чотирьох до шести годин на тиждень протягом шести тижнів. Безкоштовно із підтвердженим сертифікатом, який можна придбати. Він має 4,2- зірковий середньозважений рейтинг за 5 відгуків.

Великі дані: Візуалізація даних (Квінслендський технологічний університет / FutureLearn): збалансована теорія / фокус. Вплив різноманітних інструментів. Починається в серпні 2017 року. Розрахунковий графік - дві години на тиждень протягом трьох тижнів. Безкоштовно з можливістю придбати оновлення. Він має 4- зірковий рейтинг за 1 відгук.

Візуалізація даних та комунікація з Tableau (Університет Дьюка / Coursera): Інструмент (Tableau) та фокус бізнесу. Частина програми Excel to MySQL: Аналітичні прийоми для спеціалізації бізнесу. Приблизний графік - від шести до восьми годин на тиждень протягом п’яти тижнів. Доступні безкоштовні та платні варіанти. Він має 3,67- зірковий середньозважений рейтинг за 9 відгуків.

Візуалізація даних (Університет Іллінойсу в Урбана-Шампейн / Курсра): Теоретична спрямованість. Частина спеціалізації з видобутку даних. Приблизний графік від чотирьох до шести годин на тиждень протягом чотирьох тижнів. Доступні безкоштовні та платні варіанти. Він має 3,14- зірковий середньозважений рейтинг за 22 відгуки.

Візуалізація даних та D3.js (Udacity): Збалансований фокус теорії / інструменту. Інструкція D3.js здається "неповною" та "недоречною". Орієнтовний графік - сім тижнів. Безкоштовно Він має 2,83- зірковий середньозважений рейтинг за 6 відгуків.

Управління даними та візуалізація (Університет Уесліана / Курсер): Збалансована теорія / фокус. Охоплює кілька інструментів (Python та SAS). Частина спеціалізації Весліана з аналізу та інтерпретації даних. Приблизний графік - чотири-п’ять годин на тиждень протягом чотирьох тижнів. Доступні безкоштовні та платні варіанти. Він має 2,67- зірковий середньозважений рейтинг за 6 відгуків.

Прикладні графіки, графіки та представлення даних у Python (Мічиганський університет / Курсер): збалансована теорія та фокус на інструментах. Доступні безкоштовні та платні варіанти. Він має 2- зірковий середньозважений рейтинг за 4 відгуки.

Станом на березень 2017 р. Наступні курси не мали оглядів.

Візуалізація даних у Tableau (Udacity): Теорія фокусується з чудовим покриттям. Короткий виклад інструменту (Таблиця). Насамперед текстові інструкції з тестами з декількома варіантами вибору. Частина аналітиків даних Udacity Nanodegree та Predictive Analytics для бізнесу Nanodegree. Цей курс, ймовірно, буде посідати першу трійку, коли його оновлять відео, щоб доповнити текст. Приблизний графік три тижні. Безкоштовно

Створення інструментів візуалізації даних (Університет Джона Хопкінса / Курсер): Фокус на інструменті (R та ggplot2). Частина освоєння JHU розробки програмного забезпечення в галузі спеціалізації. Розрахунковий графік - дві години на тиждень протягом чотирьох тижнів. Доступні безкоштовні та платні варіанти.

Візуалізація даних для всіх (Trinity College / edX): Теорія. Приблизний графік три години на тиждень протягом шести тижнів. Безкоштовно із підтвердженим сертифікатом, який можна придбати.

Візуалізація даних за допомогою Advanced Excel (PwC / Coursera): фокус на інструменті (Excel). Частина навичок аналізу даних та презентації PwC: спеціалізація підходу PwC. Приблизний графік три-чотири години на тиждень протягом чотирьох тижнів. Доступні безкоштовні та платні варіанти.

Повідомлення результатів бізнес-аналітики (Університет Колорадо, Боулдер / Курсра): Теорія та фокус бізнесу. Частина аналізу даних Колорадо Боулдера для спеціалізації бізнес-буткемпів. Орієнтовний графік - чотири тижні. Доступні безкоштовні та платні варіанти.

Розповідь сюжетів за допомогою візуалізації даних (Dataquest): Переважно фокус на інструментах (Python, Matplotlib та Seaborn). Приблизна шкала часу незрозуміла. Переважно безкоштовна, але для повного доступу потрібна передплата.

Навчальний шлях до візуалізації даних (О'Рейлі): Збалансований фокус інструменту / теорії. Обкладинки D3.js. Кілька інструкторів. П'ятнадцять годин вмісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Візуалізація даних для розробників (Dan Appleman / Pluralsight): Теоретичний фокус. Спеціально для розробників. Дві години змісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Наступні чотири курси створені Біллом Шендером з Beehive Media та пропонуються на Lynda. Вони вказані в хронологічному порядку за датою випуску.

Основи візуалізації даних (Білл Шендер / Лінда): Теорія. Чотири години змісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Проектування візуалізації даних (Білл Шендер / Лінда): фокус теорії. Охоплює створення конкретного проекту від концепції до аналізу даних до проектування та виконання. Чотири години змісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Візуалізація даних для аналітиків даних (Білл Шендер / Лінда): фокус теорії. Спеціально для аналітиків даних. Дві години змісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Основи розповіді про візуалізацію даних (Білл Шендер / Лінда): Теорія. Дві години змісту. Безкоштовно з десятиденною безкоштовною пробною версією.

Візуалізація в R, від початківця до просунутого (Nathan Yau / FlowingData): чотиритижневий курс. Потрібна передплата.

Наступні чотири курси пропонує DataCamp. Як зазначалося вище, гібридний стиль викладання DataCamp використовує відео та текстові інструкції з безліччю прикладів через редактор коду в браузері.

Візуалізація даних у R (DataCamp): Збалансований фокус теорії / інструменту. Охоплює базову графіку R. Орієнтовний графік - чотири години. Для повного доступу потрібна передплата.

Вступ до візуалізації даних за допомогою Python (DataCamp): фокус на інструменті (Python, Matplotlib та Seaborn). Орієнтовний графік - чотири години. Для повного доступу потрібна передплата.

Інтерактивна візуалізація даних за допомогою Bokeh (DataCamp): фокус на інструменті (Python та Bokeh). Орієнтовний графік - чотири години. Для повного доступу потрібна передплата.

Візуалізація даних у R за допомогою ggvis (DataCamp): Збалансований фокус теорії / інструменту. Охоплює R і ggvis. Орієнтовний графік - чотири години. Для повного доступу потрібна передплата.

Загортаючи його

Це четверта із шести частин серії, яка охоплює найкращі онлайн-курси для початку роботи в галузі науки про дані. У першій статті ми розглянули програмування, у другій - статистику та ймовірність, а в третій - вступ до науки про дані. Інша частина серії охоплюватиме інші основні компетенції в галузі науки про дані. Далі йде машинне навчання.

Якщо ви хочете вивчити Data Science, почніть з одного з цих класів програмування

medium.freecodecamp.com Якщо ви хочете вивчити Data Science, пройдіть кілька із цих класів статистики

medium.freecodecamp.com Я класифікував кожен курс «Введення в науку даних» в Інтернеті на основі тисяч точок даних

medium.freecodecamp.com

Останній підсумок буде підсумком цих статей, а також найкращими онлайн-курсами з інших ключових тем, таких як переміщення даних, бази даних та навіть програмна інженерія.

Якщо ви шукаєте повний перелік онлайн-курсів Data Science, ви можете знайти їх на сторінці предмету Data Science та Big Data Class Central.

Якщо вам сподобалось читати це, перегляньте деякі інші твори Class Central:

Ось 250 курсів Ліги Плюща, які Ви можете пройти онлайн прямо зараз безкоштовно

250 MOOC з Брауна, Колумбії, Корнелла, Дартмута, Гарварда, Пенсільванії, Прінстона та Єлу. medium.freecodecamp.com 50 найкращих безкоштовних онлайн-курсів університету за даними

Коли я запустив Class Central у листопаді 2011 року, було близько 18-ти безкоштовних онлайн-курсів і майже всі… medium.freecodecamp.com

Якщо у вас є пропозиції щодо пропущених курсів, повідомте мені про це у відповідях!

Якщо ви знайшли це корисним, натисніть на? тому більше людей побачать це тут, на Середньому.

Це стисла версія моєї оригінальної статті, опублікованої на Class Central, де я включив подальші описи курсів, навчальні програми та кілька оглядів.