Як обчислити середнє значення списку - детально пояснені статистичні дані та середня функція Python

Математика та програмування йдуть рука об руку. Якщо ви програміст, то в якийсь момент вам доведеться використовувати математику.

Наука про дані, машинне навчання, штучний інтелект та криптовалюти засновані на складних основних математичних принципах.

Однак використання математичних функцій не повинно бути складним! Python абстрагує все, тому, як тільки ви зрозумієте поняття, вам не потрібно буде розуміти всі деталі реалізації.

Математика не повинна бути страшною

Є багато математичних функцій, з якими ви зіткнетесь. Якщо ви працюєте з даними або аналітикою, важливо розуміти деякі математичні принципи та функції.

Однією з таких функцій, яку ви повинні розуміти, є meanфункція.

Нехай вас не бентежить назва - у meanфункції Python немає нічого підлого (каламбур) .

Ця публікація є самодостатньою, але я сподіваюся, у вас є певний досвід роботи з Python і ви знаєте, що таке список Python. Якщо ні, ознайомтесь із цією статтею, перш ніж рухатись далі.

Закінчивши, поверніться і приєднуйся до мене, щоб глибоко зануритися у цю meanфункцію.

Статистика

Тож ви хочете дізнатись про meanфункцію. Це чудово! Але перш ніж ми розглянемо цю функцію, важливо поглянути на дисципліну, з якої вона походить: статистика.

На зображенні вище ми бачимо графік. Графік - це графічне зображення, яке показує зв'язок однієї змінної щодо іншої.

Графіки корисні, оскільки вони дозволяють нам упорядкувати дані, щоб ми могли швидко бачити тенденції та взаємозв'язки між даними. Графік - це лише один інструмент, який ми можемо використовувати для візуалізації та аналізу даних.

Статистика - це розділ математики, який дозволяє нам систематично класифікувати, аналізувати та інтерпретувати дані. Це важливо, оскільки, маючи статистичні дані, ми маємо набір готових інструментів для виконання кожної з цих речей.

Уявіть, якщо вам потрібно було винаходити пилку кожного разу, коли вам потрібно було вирізати шматок дерева. Ми б багато людей називали пилки різними іменами, хоча вони роблять одне і те ж. Щоб уникнути цієї проблеми, ми дали пилі ім’я, за яким кожен може на нього посилатися.

Те саме відбувається у статистиці - у нас є інструменти, добре відомі, знайомі всім. Одним з таких інструментів є середнє значення.

Режим, серединний та середній

Хоча середнє цілком здатне стояти самостійно, воно, як правило, викладається як частина тріо, яке включає режим, медіану та середнє значення.

Давайте розглянемо групу цифр, щоб ви зрозуміли, що тут відбувається. Уявіть, що у вас є цифри нижче:

1, 2, 3, 3, 4, 6, 9

Скажімо, ми хотіли висловити, яке число зустрічається найбільше разів. Було б 3, і ім’я, яке ми даємо цій властивості, - режим. Режим - це число, яке є найчастішим у наборі, який ми вивчаємо.

Число в середині впорядкованого набору називається медіаною. Щоб знайти медіану числового набору, упорядкуйте числа від найменшого до найбільшого, а потім подивіться на число в середині. Набір чисел вище вже впорядкований від найменшого до найбільшого, тому середнє число також дорівнює 3.

Нарешті, середнє значення - це ще один спосіб посилання на середнє значення набору. Щоб знайти середнє значення, просто додайте всі числа разом і розділіть його на загальну кількість елементів у наборі. У випадку наведених вище чисел, якщо ми складемо їх усі разом, то отримаємо 28. Загальна кількість предметів у наборі 7, отже наше середнє значення 4.

Навіщо нам потрібні середні?

Тож у цей момент ви можете задатися питанням, чому нам все одно потрібно знаходити середнє значення числа.

Річ у тім, що навіть сама статистика поділяється на кілька груп. Подібно до того, як у вас є інструменти, які використовуються для роботи з деревом, а інші для роботи з металом, деякі інструменти в статистиці згруповані в класи, оскільки вони використовуються для подібних цілей.

Одну таку групу в статистиці називають зведеною статистикою. Однією з речей, для якої використовується статистика, є опис даних, а зведена статистика - це сукупність інструментів, що використовуються для цієї мети. Одним з предметів цього класу інструментів є середнє значення.

Середнє значення є важливим для того, щоб допомогти нам проаналізувати те, що називається розподілом. У статистиці розподіл - це метод, який ми використовуємо для розгляду змінної, про яку хочемо отримати інформацію. Використовуючи розподіл, ми розглянемо значення цієї змінної та як часто це відбувається.

Якщо ми збираємо дані, загальним типом розподілу, який ми бачимо, є звичайний розподіл, який приймає форму кривої дзвоника:

Тобто змінна матиме загальне значення, до якого вона прагне, а також початкову і кінцеву точки.

Що означає середнє, це те, що це дозволяє нам взяти такий розподіл і поглянути на центральну тенденцію змінної, яка є точкою, в якій значення змінної мають тенденцію до кластеризації.

Таким чином, можна сказати, що середнє значення описує центральну тенденцію розподілу.

Обчислення середнього значення в Python

Ми можемо вручну розрахувати середнє значення, якщо у нас є невеликий числовий набір даних, то у нас є кілька значень, з якими можна працювати. Однак, коли ми маємо сотні або тисячі значень у наборі даних, стає неможливо обчислити його вручну.

Оскільки Python є мовою "з батареями", ми можемо це зробити, використовуючи meanфункцію модуля статистики в Python.

Давайте використаємо meanфункцію для обчислення середнього набору числових даних, який ми мали раніше у дописі:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Безкодові структури даних та алгоритми - вивчіть DSA, не пишучи єдиного рядка коду | Армстронг Суберо | Apress Ця книга пропонує вам новий погляд на алгоритми та структури даних, повністю без коду. Дізнайтеся про алгоритми структури даних (DSA) без необхідності відкривати редактор коду, використовувати компілятор або переглядати інтегроване середовище розробки (IDE) .... Армстронг Суберо Меню пошуку Кошик V Ваш кошик порожній. Вхід в акаунтКнижка для входу Apress Access