TR | RU | KK | BE | EN |

Коефіцієнт кореляції рангу Кендала


У статистиці коефіцієнт кореляції рангу Кендала, як правило, називають τ {\displaystyle \tau } -коефіцієнт (тау-коефіцієнт) Кендла. Він використовується у статистиці для вимірювання зв'язку між двома величинами. τ {\displaystyle \tau } -тест — це непараметричний тест статистичних гіпотез залежності на основі τ {\displaystyle \tau } -коефіцієнта. Зокрема, він є мірою рангової кореляції, тобто подібності упорядкування даних, коли вони упорядкуванні за своєю величиною. Цей коефіцієнт названий в честь Моріса Кендала, який розробив теорію, в якій використовував цей коефіцієнт, в 1938 році, хоча Густав Фехнер запропонував аналогічну міру в контексті часових рядів ще в 1897 році.

Зміст

  • 1 Означення
  • 2 Перевірка гіпотези
  • 3 Облік зв'язків
  • 4 Приклад
  • 5 Посилання

Означення

Нехай ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n ) {\displaystyle (x_{1},y_{1}),(x_{2},y_{2}),\dots ,(x_{n},y_{n})}  — набір спостережень спільних випадкових величин X і Y відповідно, так що всі значення (xк) і (yк) не є однаковими для будь якого k=1..n. Будь-яка пара спостережень (xi, yi) і (xj, yj) називається узгодженою, якщо узгоджені ряди для обох елементів: тобто, якщо xi> xj та yi> yj або якщо xi <xj та yi <yj . Вони називаються неузгодженими (або дисонуючими), якщо xi> xj та yi< yj або якщо xi <xj та yi >yj. Якщо xi =xj або yi = yj, то пара не є ні узгодженою ні неузгодженою.

τ {\displaystyle \tau }  — коефіцієнт Кендалла визначається наступним чином:

τ = s 1 − s 2 1 2 n ( n − 1 ) {\displaystyle \tau ={\frac {s_{1}-s_{2}}{{\frac {1}{2}}n(n-1)}}}

Де s 1 {\displaystyle s_{1}}  — кількість узгоджених пар, s 2 {\displaystyle s_{2}}  — кількість неузгоджених пар.
Властивості
Знаменник — це загальна кількість пар, таким чином коефіцієнт знаходить в діапазоні − 1 ⩽ τ ⩽ 1 {\displaystyle -1\leqslant \tau \leqslant 1} . Якщо узгодженість між двома величинами X та Y є ідеальною (тобто дві величини збігаються), то коефіцієнт має значення 1. Якщо розбіжність між двома величинами X та Y є ідеальною (тобто вони мають різні порядки зростання), то коефіцієнт дорівнює −1. Якщо X та Y незалежні, то коефіцієнт буде прямувати до нуля.

Перевірка гіпотези


Коефіцієнт рангу Кендала часто використовується для статистичної оцінки в перевірці статистичних гіпотез для визначення чи можуть дві змінні розглядатись як статистично залежні. Цей тест є непараметричний, так як він не залежить від будь-яких припущень про розподіл X або Y або розподіл (x, y). При нульовій гіпотезі незалежності X і Y, вибірковий розподіл τ має очікуване значення -нуль. Точний розподіл не може бути охарактеризований з точки зору спільних розподілів, але може вираховуватись для малих вибірок; для більших вибірок, поширеним є використання наближення для нормального розподілу з математичним сподіванням рівним нулю і дисперсією випадкової величини.

Облік зв'язків

Пара {(xi, yi), (xj, yj)}, як кажуть, зв'язані, якщо xi = xi або yi=yj; зв'язні пари не є ні узгодженими ні неузгодженими. Якщо пов'язанні пари виникають в даних, коефіцієнт може бути змінений декількома способами, щоб тримати його в діапазоні :

τ {\displaystyle \tau } -a

Статистична величина τ {\displaystyle \tau } -a перевіряє міру узгодженості таблиці всіх пар (xi, yi),. Обидві змінні повинні бути порядковим.

τ {\displaystyle \tau } -b

Статистична величина τ {\displaystyle \tau } -b, на відміну від τ {\displaystyle \tau } -a, вносить зміни в зв'язки. Значення τ {\displaystyle \tau } -b знаходяться в діапазоні від −1 до +1. Нульове значення свідчить про відсутність узгодженості. τ {\displaystyle \tau } -b коефіцієнт визначається таким чином:

τ B = n c − n d ( n 0 − n 1 ) ( n 0 − n 2 ) {\displaystyle \tau _{B}={\frac {n_{c}-n_{d}}{\sqrt {(n_{0}-n_{1})(n_{0}-n_{2})}}}}

Де:

n 0 = n ( n − 1 ) / 2 n 1 = ∑ i t i ( t i − 1 ) / 2 n 2 = ∑ j u j ( u j − 1 ) / 2 {\displaystyle {\begin{aligned}n_{0}&=n(n-1)/2\\n_{1}&=\sum _{i}t_{i}(t_{i}-1)/2\\n_{2}&=\sum _{j}u_{j}(u_{j}-1)/2\end{aligned}}}

n c {\displaystyle n_{c}} = кількість узгоджених пар
n d {\displaystyle n_{d}} = кількість неузгоджених пар
t i {\displaystyle t_{i}} = кількість зв'язків величин в i — тій групі зв'язків першої величини
u j {\displaystyle u_{j}} = зв'язків величин в j- тій групі зв'язків другої величини

τ {\displaystyle \tau } -c

τ {\displaystyle \tau } -c відрізняється від τ {\displaystyle \tau } -b тим, що більш підходить для прямокутних ніж для квадратних таблиць.

Приклад


Коли дві величини є статистично незалежними, то розподіл τ {\displaystyle \tau } не можна легко описати виходячи з відомих розподілів. Проте, для τ A {\displaystyle \tau _{A}} наступна величина — Z A {\displaystyle \mathrm {Z} _{A}}  — наближено розподілена у вигляді нормального розподілу, якщо зміні є статистично незалежними: z A = 3 ( n c − n d ) n ( n − 1 ) ( 2 n + 5 ) / 2 {\displaystyle z_{A}={\frac {3(n_{c}-n_{d})}{\sqrt {n(n-1)(2n+5)/2}}}}


Таким чином, щоб перевірити чи є дві змінні залежними, обчислюють Z A {\displaystyle \mathrm {Z} _{A}} та знаходять кумулятивну ймовірність для стандартного нормального розподілу на -| Z A {\displaystyle \mathrm {Z} _{A}} |.

Z B {\displaystyle \mathrm {Z} _{B}} має той самий розподіл, що й τ B {\displaystyle \tau _{B}} розподіл і приблизно дорівнює стандартному нормальному розподілу, коли величини статистично незалежні:

Z B = n c − n d v {\displaystyle \mathbb {Z} _{B}={\frac {n_{c}-n_{d}}{\sqrt {v}}}\,}


Де

v = ( v 0 − v t − v u ) / 18 + v 1 + v 2 v 0 = n ( n − 1 ) ( 2 n + 5 ) v t = ∑ i t i ( t i − 1 ) ( 2 t i + 5 ) v u = ∑ j u j ( u j − 1 ) ( 2 u j + 5 ) v 1 = ∑ i t i ( t i − 1 ) ∑ j u j ( u j − 1 ) / ( 2 n ( n − 1 ) ) v 2 = ∑ i t i ( t i − 1 ) ( t i − 2 ) ∑ j u j ( u j − 1 ) ( u j − 2 ) / ( 9 n ( n − 1 ) ( n − 2 ) ) {\displaystyle {\begin{array}{ccl}v&=&(v_{0}-v_{t}-v_{u})/18+v_{1}+v_{2}\\v_{0}&=&n(n-1)(2n+5)\\v_{t}&=&\sum _{i}t_{i}(t_{i}-1)(2t_{i}+5)\\v_{u}&=&\sum _{j}u_{j}(u_{j}-1)(2u_{j}+5)\\v_{1}&=&\sum _{i}t_{i}(t_{i}-1)\sum _{j}u_{j}(u_{j}-1)/(2n(n-1))\\v_{2}&=&\sum _{i}t_{i}(t_{i}-1)(t_{i}-2)\sum _{j}u_{j}(u_{j}-1)(u_{j}-2)/(9n(n-1)(n-2))\end{array}}}

Посилання


Коефіцієнт кореляції рангу Кендала Інформацію Про

Коефіцієнт кореляції рангу Кендала


  • user icon

    Коефіцієнт кореляції рангу Кендала beatiful post thanks!

    29.10.2014


Коефіцієнт кореляції рангу Кендала
Коефіцієнт кореляції рангу Кендала
Коефіцієнт кореляції рангу Кендала Ви переглядаєте суб єкт.
Коефіцієнт кореляції рангу Кендала що, Коефіцієнт кореляції рангу Кендала хто, Коефіцієнт кореляції рангу Кендала опис

There are excerpts from wikipedia on this article and video

Випадкові Статті

Мале Ситно

Мале Ситно

село Мале Ситно біл Малое Сітна Основні дані 55°41′39″ пн ш 29°21′23″ с...
Бабуняк Ярослав Іларіонович

Бабуняк Ярослав Іларіонович

Бабуняк Ярослав Іларіонович (2 січня 1924, село Вербів, нині Бережанського району Тернопільської...
Пелагія Каленикович

Пелагія Каленикович

Пелагія Ничипорівна Каленикович д/н —1699 — перша дружина Івана Скоропадського до отриманн...
Альмонасід-дель-Маркесадо

Альмонасід-дель-Маркесадо

Альмонасід-дель-Маркесадо ісп Almonacid del Marquesado — муніципалітет в Іспанії, у складі авто...