Огляд: Програма наноградусів аналітика даних Udacity

Програма Udacity Data Analyst Nanodegree була однією з перших онлайн-програм з обробки даних в революції в галузі онлайн-освіти. Вона має на меті "забезпечити оволодіння точними навичками, необхідними для побудови кар'єри в галузі науки про дані". Чи досягає це своєї мети? Це найкращий доступний варіант?

Я завершив програму восени 2016 року. Використовуючи натхнення з шаблону огляду з відкритим кодом Class Central, ось мій огляд програми Udacity Data Analyst Nanodegree.

ОНОВЛЕННЯ: Програма Data Analyst Nanodegree була оновлена ​​новими змістом та послугами для студентів у вересні 2017 року. Детальніше тут. Мене також привезли на борт, щоб допомогти відтворити частину цього нового змісту. Більшість цього огляду не змінилася. Фактичні оновлення позначаються курсивом.

Довідкова інформація

Що змусило мене взяти участь у цій програмі?

На початку 2016 року я почав створювати власну магістерську програму з використання даних Інтернету за допомогою Інтернет-ресурсів. (Ви можете прочитати про це тут.) Я вступив до програми Data Analyst Nanodegree з кількох причин:

  • Мені потрібен посібник для мого вступу в науку даних.
  • Я хотів згуртовану програму замість індивідуальних курсів від різних постачальників.
  • Він отримав зоряні відгуки.
  • Раніше я ходив на кілька курсів Udacity, і я любив їхній стиль викладання.

Якими були мої цілі?

Хоча програма може виступати мостом до роботи (про це далі), я хотів використати програму як вступ до більш просунутих матеріалів. Цей "більш досконалий матеріал" стосується як предметів, які охоплюються програмою, так і предметів, які не є такими.

Що таке програма Udacity Nanodegree?

Udacity є одним з провідних постачальників онлайн-освіти. Себастьян Трен, колишній професор Стенфорда та засновник Google X, заснував компанію та зосереджується на інноваціях в Udacity як президент та голова. Віш Макхіані - генеральний директор.

Наноградусні програми - це облікові дані, що надаються Udacity. Вони являють собою збірники курсів Udacity (деякі доступні безкоштовно, інші ні), до яких додані проекти, які переглядаються платними рецензентами проектів Udacity. Вони також приходять з купою студентських служб.

Slack використовується як інструмент спільноти, де студенти Udacity можуть взаємодіяти з іншими студентами, а також викладачами своїх програм та іншим персоналом Udacity. У більшості програм студенти призначили наставників та спілкуються з ними через приватний канал чату, який завжди доступний у класі Udacity.

Програма Data Analyst Nanodegree була спочатку випущена в 2014 році. Це була друга програма Nanodegree Udacity. Незважаючи на те, що вона зазнала певних змін протягом багатьох років, ядро ​​програми є цілим.

Хто такі викладачі та яке їхнє походження?

Оскільки програма Data Analyst Nanodegree є компіляцією курсів Udacity (знову ж таки, деякі безкоштовні, інші ні), існує кілька викладачів. Їх резюме часто включає престижні ролі у великих технологічних компаніях та дипломи провідних шкіл США.

Вони самі по собі не є "інструкторами", але рецензенти проектів, наставники та співробітники студентського досвіду (які стежать за Slack разом з інструкторами) - серед людей, з якими ви найбільше спілкуєтесь. Вони такі, дуже корисні. Про це далі.

Вартість

Програма розділена на два терміни. Перший термін коштує 499 доларів США. Другий термін коштує 699 доларів США. Якщо ви добре розумієтеся на навичках, викладених на першому курсі, ви можете пропустити його, пройти лише другий термін і все одно отримати облікові дані.

Рекомендовані передумови

Для терміну 1 Udacity рекомендує студентам ознайомитися з описовою статистикою та мати певний досвід роботи з даними в електронних таблицях або SQL.

Щодо терміну 2, студенти повинні мати досвід аналізу даних за допомогою Python, а також глибоке розуміння висновку статистики та її застосувань.

Мій досвід / навички вступу в програму

Я розпочав програму в травні 2016 року, коли мав кілька місяців досвіду програмування, переважно на C та Python. Переважна більшість цього досвіду була пов’язана з модулем мостів для моєї магістерської програми з науки даних, де я взяв Гарвардський CS50: Вступ до комп’ютерних наук та Udacity Intro to Programming Nanodegree.

Я також закінчив бакалаврську програму хімічної інженерії та мав 24 місяці досвіду роботи, пов'язаного з кількістю. Це означало, що я пройшов кілька курсів статистики і мав задоволення від даних.

Програма

Структура

Програма Data Analyst Nanodegree розділена на два терміни. Кожен термін має три курси та чотири проекти (додатковий проект - це вступний проект, який допоможе вам звикнути до навчального середовища Udacity). Мет Леонард, керівник навчальної програми на момент оновлення, присутній у всій програмі, коли він вводить кожен курс, його мету в програмі та його викладачів.

Зміст курсу складається з поєднання відео, тексту та вікторини. Відео, як правило, варіюється від 30 секунд до п’яти хвилин, відповідно до стилю Udacity. Автоматично оцінювані вікторини часто слідують за цими короткими відео. Ці вікторини, як правило, є завданнями із множинним вибором, заповненням чи невеликим завданням програмування. Після придбання CloudLabs ці завдання програмування тепер виконуються в середовищі кодування Jupyter Notebook та SQL у класі Udacity.

Знову ж таки, кожен розділ має оціночний проект. Ці проекти та відгуки рецензентів платних проектів Udacity - це місце, де велика цінність для студентів.

Навчальний план

Моє видання програми мало сім частин:

  • P1: Описова та довідкова статистика
  • P2: Вступ до аналізу даних (з NumPy та пандами)
  • P3: Переміщення даних за допомогою MongoDB (або SQL)
  • P4: Аналіз дослідницьких даних (з R)
  • P5: Вступ до машинного навчання
  • P6: Візуалізація даних за допомогою D3.js
  • P7: Складіть A / B тест

Перший термін нової програми називається Аналіз даних за допомогою Python та SQL . Курси та проекти включають:

  • Вступний проект: Дослідіть тенденції погоди. SQL та електронні таблиці (або Python / R, якщо ви вже знайомі) використовуються для аналізу та візуалізації даних про температуру.
  • Курс: Вступ до Python. Проект: Дослідіть американські дані про Bikeshare.
  • Курс: Вступ до аналізу даних, який включає процес аналізу даних та SQL для аналізу даних. Проект: Дослідження набору даних.
  • Курс: Практична статистика. Проект: Аналіз результатів A / B тесту.

Другий термін називається Розширений аналіз даних . Курси та проекти включають:

  • Вступний проект: Випробування перцептивного феномену. Обчисліть описову статистику та проведіть статистичний тест на наборі даних, заснованому на психологічному явищі, яке називається Ефектом Штропа.
  • Курс: Перебіг даних (за допомогою Python). Проект: Суперечка та аналіз даних. Це курс і проект, який я створив. ?
  • Курс: Дослідницький аналіз даних (за допомогою R). Проект: Дослідження та узагальнення даних.
  • Курс: Розповідання даних (з Таблицею). Проект: Створення історії на таблиці.

Великі зміни, з повними деталями, описаними в цьому дописі в блозі:

  • Зараз програму вивчають Python.
  • Машинне навчання та A / B тестування тепер включені як факультативний матеріал і більше не є вимогами для закінчення програми. Міркування: «Основною метою цієї програми є підготовка вас до роботи аналітика даних. Наші дослідження показують, що машинне навчання не є вимогою для переважної більшості посад аналітиків даних ". Основи тестування A / B тепер висвітлено в новому курсі практичної статистики, що дає студентам уявлення, яке їм буде потрібно на роботі.
  • Нові курси та проекти. Зокрема, Вступ до аналізу даних (що включає Python для аналізу даних та SQL для аналізу даних), Практична статистика (викладач Себастьян Трун) та Перебіг даних.

Класифікація

Проекти оцінюються на основі проходження / відмови (офіційно, "відповідає вимогам" і "вимагає змін") відповідно до унікальної рубрики. Ваш проект повинен відповідати всім розділам рубрики. Якщо всі ваші проекти відповідають специфікаціям, ви закінчуєте навчання. Це означає, що автоматично оцінювані вікторини не враховуються у вашій оцінці.

Якщо подання проекту вимагає змін, рецензент проекту надішле вам дієвий відгук. Після того, як ви внесете ці зміни, ви зможете надіслати їх повторно. Немає обмежень для подання.

Мій досвід

Часова шкала

Орієнтовний графік програми Udacity для наноградусів Data Analyst становив 378 годин, коли я розпочав роботу, що означало, що студентам потрібно в середньому 6–7 місяців для її завершення. За словами Toggl (додаток для відстеження часу), ця програма зайняла у мене 369 годин протягом п’яти місяців. Ця хронологія включала присвячення серйозного часу для створення портфоліо якості моїх проектів, на відміну від вироблення мінімуму для задоволення рубрики проходження / відмови.

Програма була згорнута під час оновлення восени 2017 року. Нові розрахункові терміни становлять 260 годин . Кожен курс триває 10 годин на тиждень протягом 13 тижнів, хоча студентам дається 19 тижнів, щоб закінчити кожен термін.

Як склався зміст курсу?

Для мого видання програми вміст курсу з P1 (Статистика), P2 (Вступ до аналізу даних), P4 (Аналіз дослідницьких даних), P5 (Машинне навчання) та P7 (Тестування A / B) отримує п’ять зірок із п’ять від мене. P3 (Data Wrangling) і P6 отримують три з половиною зірки.

Вміст дослідницького аналізу даних із працівниками Facebook (P4) був настільки яскравим. Початковий курс машинного навчання із Себастьяном Трун та Кеті Малоун (P5) був найцікавішим, що я мав на будь-якому онлайн-курсі. Вміст тестування A / B із працівниками Google (P7) такий унікальний. Я б дав цим трьом курсам шість зірок, якби міг.

Вміст SQL та переміщення даних (P3) не був вражаючим. Те саме з вмістом візуалізації даних (P6), хоча це, мабуть, було тому, що D3.js дуже важко навчити початківців JavaScript. Ці думки не рідкість, згідно з оглядами Class Central для цих курсів. Перевірте їх тут і тут.

Цей "не дивовижний" вміст зі старої програми було видалено під час оновлення восени 2017 року. Тепер включено оновлений вміст для вступу до аналізу даних, SQL, статистики, переміщення даних та візуалізації даних. Зміст "Практична статистика" зосереджується на статистичній статистиці, де описова статистика є обов'язковою умовою та викладається в програмі Data Foundations Nanodegree. Курс візуалізації даних тепер викладається з Tableau замість D3.js.

Як проходили проекти?

Знову ж таки, проекти - це те, що Udacity виділяє себе серед решти освітніх онлайн-платформ. Вони інвестують у процес розгляду своїх проектів, і це окупається. Програма Data Analyst Nanodegree не стала винятком.

Усі проекти підкріплюють зміст, про який ви дізналися у відео. Рецензенти проекту знають свої речі. Вони повідомляють вам, де ви досягли успіху та де ваші помилки та / або упущення. Навчання під контролем шляхом виконання. Це працює.

Форуми та наставники форуму особливо корисні, коли ви застряєте. Шукайте на форумах, щоб перевірити, чи є ваша проблема загальною (як правило, це є). Не вдалося? Опублікуйте нове питання самостійно. Є один наставник форуму Майлз Каллан, який, здається, знає все про все і відповідає за кілька годин. Я сумніваюся, що він спить.

Незважаючи на те, що форуми все ще існують і працюють, наставники Slack та в класі зараз рекомендуються напрямками підтримки. Студенти можуть розміщувати запитання, і відповіді надаються з однаковим або більшим рівнем безпосередності (протягом декількох годин і часто раніше). Спільнота Slack контролюється викладачами Udacity, а також їх студентським досвідом, які забезпечують своєчасне звернення до студентських питань, коментарів тощо. Відомий Майлз Каллан зараз наставник.

Якщо вам цікаво побачити, як виглядають ці проекти, перегляньте це сховище Github.

Наскільки важко це було?

Зміст статистики був для мене легким, тому що я пройшов кілька курсів статистики в нижчих класах. Це, мабуть, було б справедливим для кожної теми програми Nanodegree, якби у вас був попередній досвід роботи в ній.

Більшу частину програми я класифікую як середню складність. Зміст лекцій, у якому не так багато вікторин (хоча вони часто бувають), може бути легким диханням, що не обов’язково погано. Проекти вправляють ваш мозок. Кожен, мабуть, займе у вас більше двадцяти годин, якщо ви хочете бути ретельним.

Проект дослідницького аналізу даних був найскладнішим для прийняття. Мені знадобилося 3,5 подання. Перегляньте цю тему Twitter, щоб дізнатися більше.

Чи можете ви подати заявку на роботу відразу після закінчення університету?

Ти можеш. Програма повинна забезпечити вас необхідними навичками для роботи аналітика даних початкового рівня, якщо ви ставитеся до цього серйозно. Елі Кастелайн - прекрасний приклад тому. Детальніше про його історію ви можете прочитати нижче.

Як побудувати кар’єру в галузі техніки без ступеня CS

Навесні 2014 року я був новим відсівом коледжу в автобусі «Грейхаунд», який нікуди не прямував. medium.com

Ви також можете перейти на більш просунуті курси як для предметів, що охоплюються програмою, так і для інших предметів. Це те, що я вирішив зробити.

Заключні думки

Чи взяв би я програму знову, знаючи те, що знаю зараз?

Десь наприкінці програми я почав створювати Посібник з кар'єри Data Science від Class Central. Це призвело до дослідження кожного окремого онлайн-курсу, що пропонується для кожного предмета в галузі науки про дані.

Хоча мені сподобалася більшість курсів в рамках програми Nanodegree (оновлення: нові курси замінили курси, які мені не сподобались) , є курси інших постачальників, які отримують кращі відгуки з певних предметів. Наприклад, статистика. Якби я мав доступ до свого гіда ще на початку, я б розглянув окремий маршрут для кожного предмета. Однак студентські служби та процес розгляду проектів Udacity настільки ефективні для навчання, що я б взяв програму Data Analyst Nanodegree незалежно.

Якщо ви така людина, яка бажає 100% власного досвіду онлайн-освіти, але хоче скористатися перевагами проектів та послуг Udacity, досліджуючи ваші улюблені курси з кожного предмету (я рекомендую використовувати Class Central), а потім вступити до програми Nanodegree, щоб закінчити над проектами варто щось розглянути.

Альтернативи

Ось п’ять альтернативних програм, які я розглядав, коли вступав до програми Data Analyst Nanodegree:

  • Спеціалізація науки про дані Coursera в Університеті Джона Хопкінса
  • Сертифікат професійної програми Майкрософт з науки про дані на edX
  • Спеціалізація аналізу та інтерпретації даних Університету Весліана на Coursera
  • Доріжки Python та R DataCamp
  • Шляхи аналітиків даних та дослідника даних Dataquest

Примітка: Я видалив свої коментарі щодо цих програм через політику Udacity щодо коментування інших постачальників.

Висновок

Програма Udacity Data Analyst Nanodegree дає вам основні навички, необхідні для кар'єри в галузі даних. Після закінчення ви зможете орієнтуватися на свої сильні та слабкі сторони та доповнювати своє навчання там, де це необхідно. Крім того, ви поїдете з декількома готовими до портфоліо проектами.

Я любив це, як і інші.

★★★★ ¾