Weka Tutorial - Машинне навчання на основі графічного інтерфейсу з Java

На сьогоднішній день мови програмування, такі як Python та R, безсумнівно, є одними з найбільш затребуваних мов у науці даних та машинному навчанні.

Але чи можливо також виконувати загальні завдання машинного навчання та науки про дані, не обов’язково володіючи кодуванням?

Звичайно, це так! Weka - це пакет із відкритим вихідним кодом на основі графічного інтерфейсу користувача. Він може бути використаний для виконання загальних завдань Data Science лише за допомогою графічного інтерфейсу.

Основи

Weka можна легко встановити на будь-який тип платформи, дотримуючись інструкцій за таким посиланням. Єдиною необхідною умовою є встановлення Java 8.0 на вашому локальному комп'ютері.

Після встановлення Weka у вас буде набір стандартних методів обробки даних та виведення, таких як:

  • Попередня обробка даних : після завантаження набору даних Weka дозволяє швидко досліджувати його атрибути та екземпляри. Крім того, доступні різні методи фільтрації для того, щоб, наприклад, перетворити категоріальні дані в числові або виконати вибір функцій, щоб зменшити розмірність нашого набору даних (наприклад, щоб пришвидшити час навчання та продуктивність).
  • Алгоритми класифікації та регресії:колекція різних алгоритмів, таких як Гауссова наївна Баєса, дерева рішень, K-найближчий сусід, техніка ансамблів та різні варіанти лінійної регресії.
  • Кластеризація: цю техніку можна використовувати для того, щоб визначити основні категорії в наших даних без нагляду. Деякі приклади алгоритмів, доступних у колекції Weka, - це кластеризація K-Means та максимізація очікувань.
  • Виявлення асоціацій: виявлення правил у нашому наборі даних для легшого виявлення закономірностей та зв’язків між різними функціями.
  • Візуалізація даних:набір інтегрованих методів візуалізації даних для швидкої візуалізації кореляцій між функціями та представлення вивчених моделей машинного навчання, таких як дерева рішень та кластеризація K-Means.

Ще однією цікавою особливістю Weka є можливість встановлювати нові пакунки у міру їх створення.

Одним із прикладів додаткового пакету, який можна встановити, є AutoML. Насправді AutoML може бути особливо корисним для початківців, яким може бути важко визначити, яку модель машинного навчання найкраще використовувати для конкретного завдання.

Використовуючи пакет Weka AutoML, ви можете легко перевірити різні моделі машинного навчання на льоту. Це також дозволяє автоматично налаштовувати їх гіперпараметри для підвищення продуктивності.

Нарешті, для більш досвідчених користувачів Weka також пропонує інтерфейс командного рядка для використання коду Java. Це може бути особливо корисно, особливо якщо ви працюєте з великими обсягами даних.

Приклад

Зараз ми розглянемо простий приклад, щоб продемонструвати, як розпочати роботу з Weka.

Перш за все, ми можемо розпочати наш аналіз з відкриття Weka Explorer і відкриття нашого набору даних (у цьому прикладі Iris Dataset).

Виберіть вкладку «Класифікація», виберіть «Наїв Байєс» як наш класифікатор та натисніть «Пуск» Ви побачите, що ми можемо швидко досягти 96% точності класифікації без необхідності писати будь-який код!

Висновок

Якщо ви шукаєте додаткову інформацію про те, як розпочати роботу з Weka, ця серія YouTube від розробників Google - чудове місце для початку.

Зв'яжіться зі мною

Якщо ви хочете бути в курсі останніх моїх статей та проектів, слідкуйте за мною на Medium та підпишіться на мій список розсилки. Ось деякі мої контактні дані:

  • Linkedin
  • Особистий блог
  • Персональний веб-сайт
  • Середній профіль
  • GitHub
  • Каггл

Фото обкладинки з цієї статті.