TR | RU | KK | BE | EN |

Коррелограмма


Коррелограмма

На малюнку — графік, що показує 100 випадкових чисел з «прихованою» функцією синус, автокореляція (коррелограмма) рядів на дні. Приклад коррелограми

В аналізі даних коррелограммою називається зображення статистики кореляції. Наприклад, в аналізі часових рядів, коррелограмма, також відома як автокореляційна діаграма, являє собою графік зразка автокореляцій r h {\displaystyle r_{h}\,} , в порівнянні з h {\displaystyle h\,} , (тимчасові затримки).

Якщо використовується взаємно-кореляційна функція, результат називають поперечною коррелограммою. Коррелограмми є широко використовуваним інструментом для перевірки випадковості в наборі даних. Випадковість знаходиться шляхом обчислення автокореляції для значень даних при різних часових затримках. Якщо випадково, такі автокореляцій будуть близькі до нуля для будь-яких і всіх розділень часових затримок. Якщо невипадкове, то один або більше з автокореляції буде істотно відмінна від нуля.

Крім того, коррелограмми використовують в ідентифікації системи для Box-Jenkins моделі авторегресії ковзного середнього часового ряду. Автокореляція повинна бути близькою до нуль-випадковості, якщо аналітик не перевіряє випадковість, то справедливість багатьох з статистичних висновків попадає під сумнів. Коррелограмми є чудовим способом перевірки такої випадковості.

Зміст

  • 1 Застосування
  • 2 Значення
  • 3 Оцінка автокореляцій
  • 4 Альтернативні оцінки
  • 5 Статистичні висновки
  • 6 Програмне забезпечення

Застосування

Коррелограми допомагають знайти відповіді на такі питання:

  • Чи дані насправді випадкові?
  • Чи спостереження пов'язані з суміжними спостереженнями?
  • Чи пов'язані спостереження з двічі зсунутим спостереженням?
  • Чи є спостережуваний часовий ряд — білим шумом?
  • Чи є спостережуваний часовий ряд — синусоїдою?
  • Чи є спостережуваний часовий ряд — авторегресивним?
  • Якою є модель, що підходить для спостереження за часовим рядом?
  • Чи є модель : Y = c o n s t a n t + e r r o r {\displaystyle Y=\mathrm {constant} +\mathrm {error} } дійсною та достатньою?
  • Чи є значення s Y ¯ = s / N {\displaystyle s_{\bar {Y}}=s/{\sqrt {N}}} дійсним?

Значення

Випадковість (разом з фіксованою моделлю, фіксованими змінними та фіксованим розподілом) є одним з чотирьох припущень, які лежать в основі всіх процесів вимірювань. Припущення випадковості дуже важливе з таких причин:

  • Більшість стандартних статистичних тестів залежать від випадковості. Валідність результатів тесту прямо пов'язане з тим, чи є дійсною припущена випадковість.
  • Багато формул в статистиці залежать від випадковості припущення, найбільш поширеною є формула для визначення стандартного відхилення:

s Y ¯ = s / N {\displaystyle s_{\bar {Y}}=s/{\sqrt {N}}} , Де S — це стандартне відхилення даних. Не зважаючи на те, що ця формула дуже поширення, її результати не мають цінності, якщо не притримуватись припущеної випадковості.

  • Для одновимірних даних, за замовчуванням: Y = c o n s t a n t + e r r o r {\displaystyle Y=\mathrm {constant} +\mathrm {error} }

Якщо дані не є випадковими, ця модель — некоректна та не є дійсною, тому оцінки параметрів стають безглуздими.

Оцінка автокореляцій

Коефіцієнт автокореляції:

r h = c h / c 0 {\displaystyle r_{h}=c_{h}/c_{0}\,} ,

де ch — автоковаріаційна функція.

c h = 1 N ∑ t = 1 N − h ( Y t − Y ¯ ) ( Y t + h − Y ¯ ) {\displaystyle c_{h}={\frac {1}{N}}\sum _{t=1}^{N-h}\left(Y_{t}-{\bar {Y}}\right)\left(Y_{t+h}-{\bar {Y}}\right)}

c0 — дисперсія функції

c 0 = 1 N ∑ t = 1 N ( Y t − Y ¯ ) 2 {\displaystyle c_{0}={\frac {1}{N}}\sum _{t=1}^{N}\left(Y_{t}-{\bar {Y}}\right)^{2}}

Отримане значення rh буде в діапазоні від −1 до 1.

Альтернативні оцінки

Інколи використовують наступну формулу для автоваріації функції:

c h = 1 N − h ∑ t = 1 N − h ( Y t − Y ¯ ) ( Y t + h − Y ¯ ) {\displaystyle c_{h}={\frac {1}{N-h}}\sum _{t=1}^{N-h}\left(Y_{t}-{\bar {Y}}\right)\left(Y_{t+h}-{\bar {Y}}\right)}

Хоча це визначення має менший відхил, (1/N) має деякі бажані статистичні властивості. Цю формулу часто використовують в літературі про статистику.

Статистичні висновки

В один графік можна провести верхню та нижню межі для автокореляції за рівнем значущості: B = ± z 1 − α / 2 S E ( r h ) {\displaystyle B=\pm z_{1-\alpha /2}SE(r_{h})\,} , з r h {\displaystyle r_{h}\,} як передбачувана автокореляція для запізнення h {\displaystyle h\,} . Якщо автокореляція вище (нижче), ніж ця верхня (нижня) межа, то нульова гіпотеза, тобто що немає автокореляції в самій затримці та за її межами відкидається на рівні значущості. Цей тест є наближеним і припускає, що часовий ряд є гаусовим. У наведеній вище z1-α/2 квантиль нормального розподілу; SE — стандартна помилка, яка може бути обчислена за формулою Бартлетта:

S E ( r 1 ) = 1 N {\displaystyle SE(r_{1})={\frac {1}{\sqrt {N}}}} S E ( r h ) = 1 + 2 ∑ i = 1 h − 1 r i 2 N {\displaystyle SE(r_{h})={\sqrt {\frac {1+2\sum _{i=1}^{h-1}r_{i}^{2}}{N}}}} for h > 1. {\displaystyle h>1.\,}

На картинці вище ми можемо відкинути нульову гіпотезу про те, що немає автокореляції між часовими точками, які є суміжними (запізнення = 1). Для інших періодів ніхто не може відкинути нульову гіпотезу про відсутність автокореляції.

Слід зазначити, що існують дві різні формули для генерації області впевненості:
1. Якщо коррелограмми використовується для перевірки випадковості (тобто не має часової залежності між даними), то краще використати наступну формулу: ± z 1 − α / 2 N {\displaystyle \pm {\frac {z_{1-\alpha /2}}{\sqrt {N}}}} де N є розмір вибірки, Z є квантиль функція стандартного нормального розподілу і α є рівень значущості. У цьому випадку, довірчі інтервали мають фіксовану довжину, яка залежить від розміру вибірки.
2. Коррелограмми також використовуються на стадії ідентифікації моделі для установки моделей типу ARIMA. У цьому випадку модель ковзного середнього значення визначений для даних і наступні області впевненості повинні бути сформовані: ± z 1 − α / 2 1 N ( 1 + 2 ∑ i = 1 k y i 2 ) {\displaystyle \pm z_{1-\alpha /2}{\sqrt {{\frac {1}{N}}\left(1+2\sum _{i=1}^{k}y_{i}^{2}\right)}}} де к-запізнення. У цьому випадку довірчі інтервали зростають в міру збільшення затримки.

Програмне забезпечення

Коррелограми доступні у більшості статистичного програмного забезпечення загального призначення. Для створення такого типу графіка в R можна використовувати функції ACF і PACF.



Коррелограмма Інформацію Про

Коррелограмма


  • user icon

    Коррелограмма beatiful post thanks!

    29.10.2014


Коррелограмма
Коррелограмма
Коррелограмма Ви переглядаєте суб єкт.
Коррелограмма що, Коррелограмма хто, Коррелограмма опис

There are excerpts from wikipedia on this article and video

Випадкові Статті

Дамар (місто)

Дамар (місто)

Координати 14°33′00″ пн. ш. 44°24′06″ сх. д. / 14.55000° пн. ш. 44.4...
Порту-Тромбетас

Порту-Тромбетас

Порту-Тромбетас — гігінтське латеритне родовище гібситових бокситів в Бразилії. Характеристика ...
Зимова Універсіада 2017

Зимова Універсіада 2017

Зимова Універсіада 2017 — XXVIІI зимова Універсіада, що проходила з 29 січня по 8 лютого 2017 р...
Сістеля

Сістеля

Сістеля (кат. Cistella) - муніципалітет, розташований в Автономній області Каталонія, в Іспанії. Зна...