Kaj kaže korelacijski koeficient v statistiki. Korelacijska analiza

Korelacijski koeficient (ali linearni korelacijski koeficient) je označen kot "r" (v redkih primerih kot "ρ") in označuje linearno korelacijo (to je razmerje, ki je podano z neko vrednostjo in smerjo) dveh ali več spremenljivk. Vrednost koeficienta je med -1 in +1, kar pomeni, da je korelacija lahko tako pozitivna kot negativna. Če je korelacijski koeficient -1, obstaja popolna negativna korelacija; če je korelacijski koeficient +1, obstaja popolna pozitivna korelacija. V drugih primerih obstaja pozitivna korelacija, negativna korelacija ali pa ni korelacije med obema spremenljivkama. Korelacijski koeficient lahko izračunate ročno, z brezplačnimi spletnimi kalkulatorji ali z dobrim grafičnim kalkulatorjem.

Koraki

Ročno izračunavanje korelacijskega koeficienta

    Zberi podatke. Preden začnete z izračunom korelacijskega koeficienta, preglejte podani par števil. Bolje jih je zapisati v tabelo, ki je lahko razporejena navpično ali vodoravno. Vsako vrstico ali stolpec označite z "x" in "y".

    • Na primer, podani so štirje pari vrednosti (števil) spremenljivk "x" in "y". Ustvarite lahko naslednjo tabelo:
      • x || l
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Izračunajte aritmetično sredino "x".Če želite to narediti, seštejte vse vrednosti "x" in nato rezultat delite s številom vrednosti.

    Poiščite aritmetično sredino "y".Če želite to narediti, sledite istim korakom, to je, da seštejete vse vrednosti "y" in nato razdelite vsoto s številom vrednosti.

    Izračunajte standardno odstopanje "x". Ko ste izračunali povprečja x in y, poiščite standardna odstopanja teh spremenljivk. Standardni odklon se izračuna po naslednji formuli:

    Izračunajte standardno odstopanje "y". Sledite korakom v prejšnjem koraku. Uporabite isto formulo, vendar vanjo nadomestite vrednosti "y".

    Zapišite osnovno formulo za izračun korelacijskega koeficienta. Ta formula vključuje povprečja, standardne odklone in število (n) parov števil obeh spremenljivk. Korelacijski koeficient je označen z "r" (v redkih primerih kot "ρ"). Ta članek uporablja formulo za izračun Pearsonovega korelacijskega koeficienta.

    Izračunali ste srednje vrednosti in standardne deviacije obeh spremenljivk, tako da lahko uporabite formulo za izračun korelacijskega koeficienta. Spomnimo se, da je "n" število parov vrednosti obeh spremenljivk. Vrednost ostalih količin je bila predhodno izračunana.

    • V našem primeru bodo izračuni zapisani na naslednji način:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right)\Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _( y))(\ sigma_(y)))\desno))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\desno)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)(1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2 -3)(1,83))\desno)*\levo((\frac (3-4)(2,58))\desno))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3)(1,83))\right)*\left((\frac (5-4)(2,58))\right)+\left((\ frac (5-3)(1,83))\desno)*\levo((\frac (7-4)(2,58))\desno))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\levo((\frac (1)(3))\desno)*\levo((\frac (6+1+1+6)(4,721))\desno))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\levo((\frac (1)(3))\desno)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\desno))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  2. Analizirajte rezultat. V našem primeru je korelacijski koeficient 0,988. Ta vrednost na nek način označuje dani niz parov števil. Bodite pozorni na predznak in velikost vrednosti.

    • Ker je vrednost korelacijskega koeficienta pozitivna, obstaja pozitivna korelacija med spremenljivkama "x" in "y". To pomeni, da ko se poveča vrednost "x", se poveča tudi vrednost "y".
    • Ker je vrednost korelacijskega koeficienta zelo blizu +1, sta vrednosti spremenljivk x in y močno povezani. Če postavite točke na koordinatno ravnino, se bodo nahajale blizu neke ravne črte.

    Uporaba spletnih kalkulatorjev za izračun korelacijskega koeficienta

    1. Na internetu poiščite kalkulator za izračun korelacijskega koeficienta. Ta koeficient se pogosto izračuna v statistiki. Če je parov števil veliko, je praktično nemogoče ročno izračunati korelacijski koeficient. Zato obstajajo spletni kalkulatorji za izračun korelacijskega koeficienta. V iskalnik vpišite "kalkulator korelacijskega koeficienta" (brez narekovajev).

      Vnesite podatke. Preberite navodila na strani za pravilen vnos podatkov (pari številk). Zelo pomembno je, da vnesete ustrezne pare številk; drugače boste dobili napačen rezultat. Ne pozabite, da imajo različna spletna mesta različne oblike vnosa podatkov.

      • Na primer, na spletnem mestu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm so vrednosti spremenljivk "x" in "y" vnesene v dveh vodoravnih vrsticah. Vrednosti so ločene z vejicami. To pomeni, da so v našem primeru vrednosti "x" vnesene takole: 1,2,4,5, vrednosti "y" pa so takole: 1,3,5,7.
      • Na drugi strani, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , se podatki vnašajo navpično; v tem primeru ne zamenjujte ustreznih parov številk.
    2. Izračunajte korelacijski koeficient. Po vnosu podatkov preprosto kliknite gumb »Izračunaj«, »Izračunaj« ali podoben gumb, da dobite rezultat.

    Uporaba grafičnega kalkulatorja

    1. Vnesite podatke. Vzemite grafični kalkulator, preklopite v način statističnega izračuna in izberite ukaz Uredi.

      • Na različnih kalkulatorjih morate pritisniti različne tipke. Ta članek se osredotoča na kalkulator Texas Instruments TI-86.
      • Za preklop v način statističnega izračuna pritisnite - Stat (nad tipko "+"). Nato pritisnite F2 - Uredi (Uredi).
    2. Izbrišite prejšnje shranjene podatke. Večina kalkulatorjev hrani vaše vnesene statistike, dokler jih ne počistite. Če želite preprečiti zamenjavo starih podatkov z novimi podatki, najprej izbrišite vse shranjene informacije.

      • S puščičnimi tipkami premaknite kazalec in označite naslov "xStat". Nato pritisnite Clear in Enter, da počistite vse vrednosti, vnesene v stolpec xStat.
      • S puščičnimi tipkami označite naslov "yStat". Nato pritisnite Clear in Enter, da počistite vse vrednosti, vnesene v stolpec yStat.
    3. Vnesite začetne podatke. S puščičnimi tipkami premaknite kazalec v prvo celico pod naslovom "xStat". Vnesite prvo vrednost in pritisnite Enter. Na dnu zaslona se izpiše "xStat (1) = __" z vpisano vrednostjo namesto presledka. Ko pritisnete Enter, se vnesena vrednost prikaže v tabeli, kazalec pa se premakne v naslednjo vrstico; to bo prikazalo "xStat(2) = __" na dnu zaslona.

      • Vnesite vse vrednosti spremenljivke "x".
      • Ko vnesete vse vrednosti za spremenljivko x, se s puščičnimi tipkami pomaknite do stolpca yStat in vnesite vrednosti za spremenljivko y.
      • Ko vnesete vse pare številk, pritisnite Izhod, da počistite zaslon in zapustite način združevanja.

Povezane so lahko različne lastnosti.

Med njima sta dve vrsti povezave:

  • delujoč;
  • korelacija.

Korelacija prevedeno v ruščino - nič drugega kot povezava.
V primeru korelacije obstaja ujemanje več vrednosti enega atributa z več vrednostmi drugega atributa. Kot primere lahko upoštevamo ugotovljene korelacije med:

  • dolžina tac, vratu, kljuna pri pticah, kot so čaplje, žerjavi, štorklje;
  • indikatorji telesne temperature in srčnega utripa.

Za večino biomedicinskih procesov je prisotnost tovrstne povezave statistično dokazana.

Statistične metode omogočajo ugotavljanje dejstva obstoja soodvisnosti lastnosti. Uporaba posebnih izračunov za to vodi do določitve korelacijskih koeficientov (mer povezljivosti).

Takšni izračuni se imenujejo korelacijsko analizo. Izvaja se za potrditev odvisnosti 2 spremenljivk (naključnih spremenljivk) ena od druge, kar je izraženo s korelacijskim koeficientom.

Uporaba korelacijske metode nam omogoča reševanje več problemov:

  • ugotoviti razmerje med analiziranimi parametri;
  • poznavanje prisotnosti korelacije omogoča reševanje problemov napovedovanja. Tako obstaja realna možnost napovedovanja obnašanja parametra na podlagi analize obnašanja drugega koreliranega parametra;
  • razvrstitev, ki temelji na izbiri lastnosti, neodvisnih ena od druge.

Za spremenljivke:

  • glede na ordinalno lestvico se izračuna Spearmanov koeficient;
  • povezan z intervalno lestvico – Pearsonov koeficient.

To so najpogosteje uporabljeni parametri, obstajajo pa tudi drugi.

Vrednost koeficienta je lahko izražena tako pozitivno kot negativno.

V prvem primeru s povečanjem vrednosti ene spremenljivke opazimo povečanje druge. Pri negativnem koeficientu je vzorec obrnjen.

Za kaj je korelacijski koeficient?

Naključne spremenljivke, povezane med seboj, imajo lahko popolnoma drugačno naravo te povezave. Ni nujno, da bo funkcionalen, če obstaja neposredna povezava med količinami. Najpogosteje na obe količini vpliva cel niz različnih dejavnikov, v primerih, ko so skupni obema količinama, opazimo nastanek povezanih vzorcev.

To pomeni, da statistično dokazano dejstvo o obstoju povezave med količinami ni potrditev, da je vzrok za opažene spremembe ugotovljen. Praviloma raziskovalec sklepa, da gre za dve med seboj povezani posledici.

Lastnosti korelacijskega koeficienta

Ta statistika ima naslednje lastnosti:

  • vrednost koeficienta se giblje od -1 do +1. Bližje kot so skrajne vrednosti, močnejša je pozitivna ali negativna povezava med linearnimi parametri. V primeru ničelne vrednosti govorimo o odsotnosti korelacije med značilnostmi;
  • pozitivna vrednost koeficienta pomeni, da se v primeru povečanja vrednosti enega atributa opazi povečanje drugega (pozitivna korelacija);
  • negativna vrednost - v primeru povečanja vrednosti enega atributa opazimo zmanjšanje drugega (negativna korelacija);
  • približevanje vrednosti kazalnika skrajnim točkam (bodisi -1 ali +1) kaže na prisotnost zelo močne linearne povezave;
  • indikatorji lastnosti se lahko spreminjajo s konstantno vrednostjo koeficienta;
  • korelacijski koeficient je brezdimenzijska količina;
  • prisotnost korelacije ni obvezna potrditev vzročne zveze.

Vrednosti korelacijskih koeficientov

Moč korelacije je mogoče označiti s pomočjo Cheldokove lestvice, v kateri kvalitativna značilnost ustreza določeni numerični vrednosti.

V primeru pozitivne korelacije pri vrednosti:

  • 0-0,3 - korelacija je zelo šibka;
  • 0,3-0,5 - šibka;
  • 0,5-0,7 - srednja moč;
  • 0,7-0,9 - visoko;
  • 0,9-1 - zelo visoka korelacijska moč.

Lestvica se lahko uporablja tudi za negativno korelacijo. V tem primeru se kvalitativne značilnosti nadomestijo z nasprotnimi.

Uporabite lahko poenostavljeno lestvico Cheldok, v kateri se razlikujejo le 3 stopnje jakosti korelacije:

  • zelo močna - kazalniki ± 0,7 - ± 1;
  • povprečje - kazalniki ± 0,3 - ± 0,699;
  • zelo šibka - indikatorji 0 - ± 0,299.

Ta statistični kazalnik omogoča ne le preverjanje predpostavke o obstoju linearne povezave med značilnostmi, temveč tudi ugotavljanje njene moči.

Vrste korelacijskih koeficientov

Korelacijske koeficiente lahko razvrstimo po predznaku in vrednosti:

  • pozitivno;
  • nič;
  • negativno.

Odvisno od analiziranih vrednosti se izračuna koeficient:

  • Pearson;
  • kopjenik;
  • Kendala;
  • Fechnerjevi znaki;
  • skladnost ali večkratna korelacija.

Pearsonov korelacijski koeficient se uporablja za vzpostavitev neposrednih povezav med absolutnimi vrednostmi spremenljivk. V tem primeru bi se morali porazdelitvi obeh nizov spremenljivk približati normalni. Spremenljivke, ki jih primerjamo, se morajo razlikovati po enakem številu različnih lastnosti. Lestvica, ki predstavlja spremenljivke, mora biti intervalna ali razmerna.

  • natančna vzpostavitev korelacijske jakosti;
  • primerjava kvantitativnih značilnosti.

Uporaba Pearsonovega linearnega korelacijskega koeficienta ima nekaj slabosti:

  • metoda je nestabilna v primeru izstopov numeričnih vrednosti;
  • s to metodo je mogoče določiti korelacijsko moč le za linearno zvezo, za druge vrste medsebojnih razmerij spremenljivk pa je treba uporabiti metode regresijske analize.

Rang korelacijo določa Spearmanova metoda, ki omogoča statistično preučevanje razmerja med pojavi. Zahvaljujoč temu koeficientu se izračuna dejanska stopnja vzporednosti dveh kvantitativno izraženih nizov značilnosti, prav tako pa se oceni tesnost ugotovljenega odnosa.

  • ne zahteva natančne opredelitve vrednosti korelacijske jakosti;
  • primerjani kazalniki imajo kvantitativno in atributivno vrednost;
  • primerjava vrstic funkcij z odprtimi različicami vrednosti.

Spearmanova metoda se nanaša na metode neparametrične analize, zato ni potrebe po preverjanju normalnosti porazdelitve lastnosti. Poleg tega vam omogoča primerjavo kazalnikov, izraženih v različnih lestvicah. Na primer, primerjava vrednosti števila rdečih krvničk v določenem volumnu krvi (zvezna lestvica) in strokovne ocene, izražene v točkah (vrstna lestvica).

Na učinkovitost metode negativno vpliva velika razlika med vrednostmi primerjanih vrednosti. Metoda je neučinkovita tudi v primerih, ko je za izmerjeno vrednost značilna neenakomerna porazdelitev vrednosti.

Postopni izračun korelacijskega koeficienta v Excelu

Izračun korelacijskega koeficienta vključuje zaporedno izvajanje številnih matematičnih operacij.

Zgornja formula za izračun Pearsonovega koeficienta kaže, kako težaven je ta postopek, če se izvaja ročno.
Uporaba zmogljivosti Excella včasih pospeši postopek iskanja koeficienta.

Dovolj je slediti preprostemu algoritmu dejanj:

  • uvedba osnovnih informacij - stolpec vrednosti x in stolpec vrednosti y;
  • v orodjih se izbere in odpre zavihek Formule;
  • v zavihku, ki se odpre, izberite "Vstavi fx funkcijo";
  • v pogovornem oknu, ki se odpre, je izbrana statistična funkcija "Correl", ki omogoča izračun korelacijskega koeficienta med 2 nizoma podatkov;
  • podatki se vnesejo v okno, ki se odpre: matrika 1 - obseg vrednosti stolpca x (podatki morajo biti izbrani), matrika 2 - obseg vrednosti stolpca y;
  • pritisnete tipko "OK", rezultat izračuna koeficienta se prikaže v vrstici "vrednost";
  • sklep o prisotnosti korelacije med dvema nizoma podatkov in njeno močjo.

Korelacijski koeficient je stopnja povezanosti med dvema spremenljivkama. Njegov izračun daje idejo o tem, ali obstaja razmerje med dvema nizoma podatkov. Za razliko od regresije korelacija ne omogoča napovedovanja vrednosti. Vendar pa je izračun koeficienta pomemben korak v predhodni statistični analizi. Ugotovili smo na primer, da je korelacijski koeficient med stopnjo neposrednih tujih naložb in rastjo BDP visok. To nam daje idejo, da je za zagotovitev blaginje treba ustvariti ugodno klimo posebej za tuje podjetnike. Na prvi pogled ne tako očiten zaključek!

Korelacija in vzročna zveza

Morda ni niti enega področja statistike, ki bi bilo tako trdno uveljavljeno v našem življenju. Korelacijski koeficient se uporablja na vseh področjih javnega znanja. Njegova glavna nevarnost je v tem, da se o njegovih visokih vrednostih pogosto špekulira, da bi prepričali ljudi in jih prepričali v neke zaključke. Vendar pa v resnici močna korelacija sploh ne kaže na vzročno zvezo med količinami.

Korelacijski koeficient: Pearsonova in Spearmanova formula

Obstaja več glavnih indikatorjev, ki označujejo razmerje med dvema spremenljivkama. Zgodovinsko gledano je prvi Pearsonov linearni korelacijski koeficient. V šoli se ga opravi. Razvila sta ga K. Pearson in J. Yule na podlagi dela Fr. Galton. Ta koeficient vam omogoča, da vidite razmerje med racionalnimi števili, ki se racionalno spreminjajo. Vedno je večje od -1 in manjše od 1. Negativno število označuje obratno sorazmerno razmerje. Če je koeficient enak nič, potem med spremenljivkama ni povezave. Enako pozitivno število - med proučevanimi količinami obstaja neposredno sorazmerno razmerje. Spearmanov korelacijski koeficient ranga omogoča poenostavitev izračunov z izgradnjo hierarhije vrednosti spremenljivk.

Odnosi med spremenljivkami

Korelacija pomaga odgovoriti na dve vprašanji. Prvič, ali je razmerje med spremenljivkami pozitivno ali negativno. Drugič, kako močna je zasvojenost. Korelacijska analiza je močno orodje za pridobivanje teh pomembnih informacij. Preprosto je videti, da dohodki in izdatki gospodinjstev sorazmerno naraščajo in padajo. Takšno razmerje velja za pozitivno. Nasprotno, ko cena izdelka naraste, povpraševanje po njem upade. Tak odnos imenujemo negativen. Vrednosti korelacijskega koeficienta so med -1 in 1. Nič pomeni, da med proučevanimi vrednostmi ni povezave. Bližje kot je indikator skrajnim vrednostim, močnejša je povezava (negativna ali pozitivna). Odsotnost odvisnosti dokazuje koeficient od -0,1 do 0,1. Treba je razumeti, da taka vrednost samo kaže na odsotnost linearne povezave.

Lastnosti aplikacije

Uporaba obeh indikatorjev je odvisna od določenih predpostavk. Prvič, prisotnost močnega odnosa ne določa dejstva, da ena vrednota določa drugo. Morda obstaja še tretja količina, ki definira vsakega od njih. Drugič, visok Pearsonov korelacijski koeficient ne kaže na vzročno zvezo med preučevanimi spremenljivkami. Tretjič, kaže izključno linearno razmerje. Korelacijo je mogoče uporabiti za ovrednotenje pomembnih kvantitativnih podatkov (npr. zračnega tlaka, temperature zraka) namesto kategorij, kot sta spol ali najljubša barva.

Večkratni korelacijski koeficient

Pearson in Spearman sta raziskovala razmerje med dvema spremenljivkama. A kaj storiti, če so trije ali celo več. Tu pride na vrsto multipli korelacijski koeficient. Na primer, na bruto nacionalni proizvod ne vplivajo le neposredne tuje naložbe, temveč tudi denarna in fiskalna politika države ter raven izvoza. Stopnja rasti in obseg BDP sta posledica medsebojnega delovanja številnih dejavnikov. Vendar je treba razumeti, da model večkratne korelacije temelji na številnih poenostavitvah in predpostavkah. Prvič, multikolinearnost med količinami je izključena. Drugič, predpostavlja se, da je razmerje med odvisno spremenljivko in spremenljivkami, ki nanjo vplivajo, linearno.

Področja uporabe korelacijske in regresijske analize

Ta metoda iskanja razmerja med količinami se pogosto uporablja v statistiki. Najpogosteje se uporablja v treh glavnih primerih:

  1. Za testiranje vzročnih povezav med vrednostma dveh spremenljivk. Posledično raziskovalec upa, da bo našel linearno razmerje in izpeljal formulo, ki opisuje ta razmerja med količinami. Njihove merske enote so lahko različne.
  2. Za preverjanje razmerja med vrednostmi. V tem primeru nihče ne določa, katera spremenljivka je odvisna. Lahko se izkaže, da vrednost obeh količin določa kakšen drug dejavnik.
  3. Za izpeljavo enačbe. V tem primeru lahko preprosto nadomestite številke in ugotovite vrednosti neznane spremenljivke.

Človek v iskanju vzročne zveze

Zavest je urejena tako, da moramo vsekakor razložiti dogodke, ki se dogajajo okoli. Človek vedno išče povezavo med sliko sveta, v katerem živi, ​​in informacijami, ki jih prejema. Pogosto možgani ustvarijo red iz kaosa. Z lahkoto vidi vzročno zvezo tam, kjer je ni. Znanstveniki se morajo posebej naučiti premagati ta trend. Sposobnost vrednotenja odnosov med podatki je objektivno bistvenega pomena v akademski karieri.

Medijska pristranskost

Razmislite, kako se lahko napačno razlaga prisotnost korelacije. Skupino nevzgojenih britanskih študentov so vprašali, ali njihovi starši kadijo. Nato je bil test objavljen v časopisu. Rezultat je pokazal močno povezavo med kajenjem staršev in prestopništvom njihovih otrok. Profesor, ki je izvedel to študijo, je celo predlagal, da bi opozorilo o tem dali na škatlice cigaret. Vendar pa obstajajo številne težave s tem sklepom. Prvič, korelacija ne kaže, katera od količin je neodvisna. Zato je povsem mogoče domnevati, da je škodljiva navada staršev posledica neposlušnosti otrok. Drugič, ni mogoče z gotovostjo trditi, da obe težavi nista nastali zaradi nekega tretjega dejavnika. Na primer družine z nizkimi dohodki. Opozoriti je treba na čustveni vidik začetnih zaključkov profesorja, ki je izvedel študijo. Bil je goreč nasprotnik kajenja. Zato ne preseneča, da je rezultate svoje študije interpretiral na tak način.

zaključki

Napačna razlaga korelacije kot vzročne zveze med dvema spremenljivkama lahko vodi do neprijetnih raziskovalnih napak. Težava je v tem, da leži v samem jedru človeške zavesti. Na tej funkciji temeljijo številni marketinški triki. Razumevanje razlike med vzročno zvezo in korelacijo vam omogoča racionalno analizo informacij tako v vsakdanjem življenju kot v vaši poklicni karieri.

7.3.1. Koeficienti korelacije in determinacije. Lahko se kvantificira tesnost komunikacije med dejavniki in orientacija(neposredno ali obratno) z izračunom:

1) če je treba določiti linearno razmerje med dvema faktorjema, - parni koeficient korelacije: v 7.3.2 in 7.3.3 operacije izračuna seznanjenega linearnega Bravais–Pearsonovega korelacijskega koeficienta ( r) in Spearmanov korelacijski koeficient parnega ranga ( r);

2) če želimo določiti odnos med dvema faktorjema, vendar je ta odnos očitno nelinearen, potem korelacijsko razmerje ;

3) če želimo ugotoviti razmerje med enim faktorjem in nekim nizom drugih faktorjev – potem (ali enakovredno "koeficient večkratne korelacije");

4) če želimo izolirano identificirati razmerje enega dejavnika samo z določenim drugim, ki je del skupine dejavnikov, ki vplivajo na prvega, pri čemer moramo upoštevati vpliv vseh drugih dejavnikov nespremenjen, potem privatni (delni) korelacijski koeficient .

Noben korelacijski koeficient (r, r) ne sme presegati 1 v absolutni vrednosti, tj. –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Predznak pri korelacijskem koeficientu določa smer povezave: znak "+" (ali odsotnost predznaka) pomeni, da je povezava naravnost (pozitivno), znak “–” - da je povezava vzvratno (negativno). Znak nima nobene zveze s tesnostjo povezave.

Korelacijski koeficient označuje statistično razmerje. Pogosto pa je treba ugotoviti še eno vrsto odvisnosti, in sicer: kakšen je prispevek določenega dejavnika k nastanku drugega sorodnega dejavnika. Za to vrsto odvisnosti je z določeno mero konvencionalnosti značilno determinacijski koeficient (D ) določeno s formulo D = r 2 ´100 % (kjer je r Bravais-Pearsonov korelacijski koeficient, glej 7.3.2). Če bi bile meritve opravljene v vrstna lestvica (razredna lestvica), potem lahko z nekaj izgube zanesljivosti namesto vrednosti r v formulo nadomestimo vrednost r (Spearmanov korelacijski koeficient, glej 7.3.3).

Na primer, če smo kot karakteristiko odvisnosti faktorja B od faktorja A dobili korelacijski koeficient r = 0,8 ali r = –0,8, potem je D = 0,8 2 ´100% = 64%, to je približno 2 ½ 3. Prispevek faktorja A in njegovih sprememb k nastanku faktorja B je torej približno 2 ½ 3 od skupnega prispevka vseh dejavnikov na splošno.

7.3.2. Bravais-Pearsonov korelacijski koeficient. Postopek za izračun Bravais–Pearsonovega korelacijskega koeficienta ( r ) se lahko uporablja samo v tistih primerih, ko se povezava obravnava na podlagi vzorcev z normalno frekvenčno porazdelitvijo ( normalna porazdelitev ) in dobljeno z meritvami v lestvicah intervalov ali razmerij. Formula za izračun tega korelacijskega koeficienta je:



å ( x jaz - )( l jaz-)

r = .

n×sx×sy

Kaj kaže korelacijski koeficient? Prvič, predznak pri korelacijskem koeficientu kaže smer razmerja, in sicer: predznak »–« pomeni, da je razmerje vzvratno, oz negativno(obstaja trend: ko se vrednosti enega faktorja znižujejo, se ustrezne vrednosti drugega faktorja povečujejo, z naraščanjem pa se znižujejo), odsotnost znaka ali znaka "+" pa kaže naravnost, oz pozitivno povezave (obstaja trend: s povečanjem vrednosti enega faktorja se vrednosti drugega povečajo, z zmanjšanjem pa zmanjšajo). Drugič, absolutna (od predznaka neodvisna) vrednost korelacijskega koeficienta kaže na tesnost (moč) povezave. Običajno se domneva (precej konvencionalno): za vrednosti r< 0,3 корреляция zelo slabo, pogosto preprosto ni upoštevan, za 0,3 £ r< 5 корреляция šibka, za 0,5 £ r< 0,7) - povprečje, pri 0,7 £ r 0,9 £) - močan in končno za r > 0,9 - zelo močno. V našem primeru (r » 0,83) je zveza obratna (negativna) in močna.

Spomnimo se, da so lahko vrednosti korelacijskega koeficienta v območju od -1 do +1. Če vrednost r presega te meje, to pomeni, da je v izračunih prišlo je do napake . če r= 1, to pomeni, da povezava ni statistična, ampak funkcionalna – kar se v športu, biologiji, medicini praktično ne dogaja. Čeprav je pri majhnem številu meritev možna naključna izbira vrednosti, ki daje sliko funkcionalnega razmerja, je tak primer manj verjeten, čim večji je obseg primerjanih vzorcev (n), to je število parov primerjanih meritev.

Tabela za izračun (tabela 7.1) je zgrajena po formuli.

Tabela 7.1.

Računska tabela za Bravais-Pearsonov izračun

x i y i (x jaz-) (x i – ) 2 (l jaz-) (l i – ) 2 (x jaz - )( l jaz-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i \u003d 137 \u003d 13.00 åy i =56,1 =5,1 å( x i - ) 2 \u003d \u003d 1,78 å( l i – ) 2 = = 1,015 å( x jaz - )( l i – )= = –1,24

Zaradi s x = ï ï = ï ï» 0,42, a

s y= ï ï» 0,32, r" –1,24ï (11´0,42´0,32) » –1,24ï 1,48 » –0,83 .

Z drugimi besedami, zelo dobro morate vedeti, da je korelacijski koeficient ne morem presega 1,0 v absolutni vrednosti. To pogosto omogoča, da se izognemo hudim napakam ali bolje rečeno, najdemo in popravimo napake v izračunih.

7.3.3. Spearmanov korelacijski koeficient. Kot je bilo že omenjeno, se Bravais-Pearsonov korelacijski koeficient (r) lahko uporabi samo v primerih, ko so analizirani dejavniki glede na frekvenčno porazdelitev blizu normalni in so variantne vrednosti nujno pridobljene z meritvami na lestvici razmerij ali na lestvici intervalov, kar se zgodi, če so izražene v fizičnih enotah. V drugih primerih se ugotovi Spearmanov korelacijski koeficient ( r). Vendar pa to razmerje Lahko velja tudi v primerih, ko je to dovoljeno (in zaželeno ! ) uporabite Bravais-Pearsonov korelacijski koeficient. Vendar je treba upoštevati, da ima postopek za določanje Bravais-Pearsonovega koeficienta več moči ("razreševanje sposobnost"), Zato r bolj informativen kot r. Tudi z velikim n odstopanje r je lahko reda ±10 %.

Tabela 7.2 Formula za izračun koeficienta

x i y i R x R y |d R | d R 2 Spearmanov korelacijski koeficient

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 uporabljamo naš primer

12,7 5,10 4,5 6,5 2,0 4,00 za izračun r, ampak gradimo

12,5 5,40 3,0 9,0 6,0 36,00 druga miza (tabela 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Zamenjajte vrednosti:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Vidimo: r izkazalo se je za malo

12,4 5,60 2,0 11,0 9,0 81,00 več kot r, ampak to je drugače

12,3 5,50 1,0 10,0 9,0 81,00 ni zelo velik. Konec koncev pri

12,7 5,20 4,5 8,0 3,5 12,25 tako majhen n vrednote r in r

åd R 2 = 423 so zelo približne, premalo zanesljive, njihova dejanska vrednost lahko močno niha, zato razlika r in r v 0,1 nepomemben. Običajnorobravnavati kot analogr , vendar manj natančno. Znaki pri r in r prikazuje smer povezave.

7.3.4. Uporaba in validacija korelacijskih koeficientov. Ugotavljanje stopnje korelacije med dejavniki je potrebno za nadzor nad razvojem dejavnika, ki ga potrebujemo: za to moramo vplivati ​​na druge dejavnike, ki pomembno vplivajo nanj, in poznati moramo mero njihove učinkovitosti. Za razvoj ali izbiro že pripravljenih testov je potrebno vedeti o razmerju dejavnikov: informacijska vsebina testa je določena s korelacijo njegovih rezultatov z manifestacijami lastnosti ali lastnosti, ki nas zanimajo. Brez poznavanja korelacije je kakršna koli oblika selekcije nemogoča.

Zgoraj je bilo omenjeno, da je v športu in v splošni pedagoški, medicinski in celo ekonomski in sociološki praksi zelo zanimivo ugotoviti, ali prispevek , ki en dejavnik prispeva k nastanku drugega. To je posledica dejstva, da poleg obravnavanih dejavnikov-vzrokov na tarča(za nas zanimivo) faktorsko dejanje, pri čemer vsak tako ali drugače prispeva k njemu, in drugi.

Menijo, da je lahko merilo prispevka vsakega dejavnika-vzroka koeficient determinacije D i = r 2 ´100 %. Torej, na primer, če je r = 0,6, tj. razmerje med faktorjema A in B je povprečno, potem je D = 0,6 2 ´100 % = 36 %. Vedeti torej, da je prispevek faktorja A k tvorbi faktorja B približno 1 ½ 3, je mogoče na primer nameniti približno 1 ½ 3 ur treninga. Če je korelacijski koeficient r \u003d 0,4, potem je D \u003d r 2 100% \u003d 16% ali približno 1 ½ 6 - več kot dvakrat manj, in po tej logiki je treba njegovemu razvoju dati samo 1 ½ 6 del časa treninga.

Vrednosti D i za različne pomembne dejavnike dajejo približno predstavo o kvantitativnem razmerju njihovih vplivov na ciljni dejavnik, ki nas zanima, zaradi izboljšanja katerega pravzaprav delamo na drugih dejavnikih (na primer, tekaški skakalec v daljino si prizadeva povečati hitrost svojega sprinta, saj je dejavnik, ki najbolj pomembno prispeva k oblikovanju rezultata v skokih).

Spomnimo se tega z opredelitvijo D namesto r postaviti r, čeprav je seveda natančnost določitve manjša.

Temelji selektivno(izračunano iz vzorčnih podatkov) korelacijskega koeficienta ni mogoče sklepati, da je dejstvo obstoja povezave med obravnavanimi dejavniki na splošno zanesljivo. Če želite narediti tak sklep z različnimi stopnjami veljavnosti, uporabite standard merila korelacijske pomembnosti. Njihova uporaba predpostavlja linearno razmerje med faktorji in normalna porazdelitev frekvence v vsakem od njih (kar pomeni ne selektivno, ampak njihovo splošno zastopanost).

Uporabite lahko na primer Studentove t-teste. Njegova rasa

enakomerna formula: tp= –2 , kjer je k korelacijski koeficient proučevanega vzorca, a n- količino primerjanih vzorcev. Dobljeno izračunano vrednost t-kriterija (t p) primerjamo z vrednostjo tabele na ravni pomembnosti, ki smo jo izbrali, in številom prostostnih stopenj n = n - 2. Da se znebite računskega dela, lahko uporabite posebno tabelo kritične vrednosti vzorčnih korelacijskih koeficientov(glej zgoraj), kar ustreza prisotnosti pomembne povezave med dejavniki (ob upoštevanju n in a).

Tabela 7.3.

Mejne vrednosti zanesljivosti vzorčnega korelacijskega koeficienta

Število stopenj svobode pri določanju korelacijskih koeficientov je enako 2 (tj. n= 2) Navedeno v tabeli. Vrednosti 7.3 imajo spodnjo mejo intervala zaupanja prav korelacijski koeficient je 0, to pomeni, da s takšnimi vrednostmi ni mogoče trditi, da korelacija sploh obstaja. Če je vrednost vzorčnega korelacijskega koeficienta višja od navedene v tabeli, se na ustrezni stopnji pomembnosti lahko šteje, da pravi korelacijski koeficient ni enak nič.

Toda odgovor na vprašanje, ali obstaja resnična povezava med obravnavanimi dejavniki, pušča prostor za drugo vprašanje: v kakšnem intervalu se prava vrednost korelacijski koeficient, kot je lahko dejansko, z neskončno velikim n? Ta interval za katero koli posebno vrednost r in n primerjalne faktorje je mogoče izračunati, vendar je bolj priročno uporabiti sistem grafov ( nomogram), kjer je vsak par krivulj konstruiran za nekatere, navedene nad njimi n, ustreza mejam intervala.

riž. 7.4. Meje zaupanja vzorčnega korelacijskega koeficienta (a = 0,05). Vsaka krivulja ustreza tisti nad njo. n.

Glede na nomogram na sl. 7.4 je mogoče določiti interval vrednosti pravega korelacijskega koeficienta za izračunane vrednosti vzorčnega korelacijskega koeficienta pri a = 0,05.

7.3.5. korelacijski odnosi.Če je parna korelacija nelinearni, je nemogoče izračunati korelacijski koeficient, določiti korelacijski odnosi . Obvezna zahteva: značilnosti morajo biti izmerjene na razmerni lestvici ali na intervalni lestvici. Izračunate lahko korelacijsko odvisnost faktorja X od faktorja Y in korelacijsko odvisnost faktorja Y od faktorja X- so drugačni. Z majhno prostornino n obravnavane vzorce, ki predstavljajo faktorje, lahko za izračun korelacijskih razmerij uporabite formule:

korelacijsko razmerje h x ½ y= ;

korelacijsko razmerje h y ½ x= .

Tukaj in so aritmetične sredine vzorcev X in Y ter - znotraj razreda aritmetična povprečja. To je aritmetična sredina tistih vrednosti v vzorcu faktorja X, s katerimi konjugirane enake vrednosti v vzorcu faktorja Y (na primer, če ima faktor X vrednosti 4, 6 in 5, s katerimi so v vzorcu faktorja Y povezane 3 možnosti z enako vrednostjo 9, potem = (4+6+5) ½ 3 = 5). V skladu s tem - aritmetična sredina tistih vrednosti v vzorcu faktorja Y, ki so povezane z enakimi vrednostmi v vzorcu faktorja X. Dajmo primer in izračunajmo:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabela 7.4

Tabela za izračun

x i y i x y x i – x (x i – x) 2 x i - x y (x ix y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Zato h y ½ x= » 0,63.

7.3.6. Parcialni in multipli korelacijski koeficienti. Za ovrednotenje razmerja med 2 faktorjema z izračunom korelacijskih koeficientov privzeto predpostavimo, da noben drug dejavnik ne vpliva na to razmerje. V resnici temu ni tako. Torej na razmerje med težo in višino zelo pomembno vpliva vnos kalorij, količina sistematične telesne dejavnosti, dednost itd. Kadar je to potrebno pri ocenjevanju razmerja med 2 faktorjema upoštevati pomemben vpliv druge dejavnike in hkrati kako se od njih izolirati, jih smatramo za nespremenjene, izračunaj zasebno (sicer - delno ) korelacijski koeficienti.

Primer: ovrednotiti morate seznanjene odvisnosti med 3 bistvenimi faktorji X, Y in Z. Označite r XY (Z) zasebni (delni) korelacijski koeficient med faktorjema X in Y (v tem primeru se vrednost faktorja Z šteje za nespremenjeno), r ZX (Y) - delni korelacijski koeficient med faktorjema Z in X (s konstantno vrednostjo faktorja Y), r YZ (X) - delni korelacijski koeficient med faktorjema Y in Z (s konstantno vrednostjo faktorja X). Uporaba izračunanih enostavnih parnih (po Bravais-Pearsonovih) korelacijskih koeficientov r xy, r XZ in r YZ, m

Zasebne (delne) korelacijske koeficiente lahko izračunate z uporabo formul:

rXY- r XZ´ r YZ r XZ- r XY' r ZY r ZY –r ZX ´ r YZ

r XY (Z) = ; r XZ (Y) = ; r ZY (X) =

Ö(1– r 2XZ)(1– r 2 YZ) Ö(1– r 2XY)(1– r 2 ZY) Ö(1– r 2ZX)(1– r 2YX)

In delni korelacijski koeficienti lahko sprejmejo vrednosti od -1 do +1. Če jih kvadriramo, dobimo ustrezne količnike determinacijski koeficienti imenovan tudi zasebne mere gotovosti(množenje s 100 izrazimo v %%). Parcialni korelacijski koeficienti se bolj ali manj razlikujejo od enostavnih (polnih) parnih koeficientov, kar je odvisno od jakosti vpliva 3. faktorja nanje (kot nespremenjeni). Preverja se ničelna hipoteza (H 0), to je hipoteza, da med faktorjema X in Y ni povezave (odvisnosti) (s skupnim številom lastnosti). k) z izračunom t-testa po formuli: t P = r XY (Z)´ ( n–k) 1 ½ 2 ´ (1– r 2XY(Z)) –1 ½ 2 .

če t R< t a n , je hipoteza sprejeta (predpostavljamo, da odvisnosti ni), če t P ³ t a n - hipoteza je ovržena, to pomeni, da se verjame, da odvisnost res obstaja. t a n je vzet iz tabele t-Študentov kriterij, in k- število upoštevanih dejavnikov (v našem primeru 3), število stopenj svobode n= n - 3. Druge delne korelacijske koeficiente preverimo podobno (v formulo namesto r XY (Z) se ustrezno nadomestijo r XZ (Y) oz r ZY(X)).

Tabela 7.5

Začetni podatki

Ö (1 – 0,71 2) (1 – 0,71 2) Ö (1 – 0,5) (1 – 0,5)

Če želite oceniti odvisnost faktorja X od kombiniranega delovanja več dejavnikov (tukaj faktorja Y in Z), izračunajte vrednosti enostavnih parnih korelacijskih koeficientov in z njihovo uporabo izračunajte večkratni korelacijski koeficient r X (YZ) :

Ö r 2XY+ r 2XZ - 2 r XY' r XZ´ r YZ

r X (YZ) = .

Ö 1 - r 2 YZ

7.2.7. asociacijski koeficient. Pogosto je treba količinsko opredeliti razmerje med kakovosti znamenja, tj. taka znamenja, ki jih ni mogoče kvantitativno predstaviti (okarakterizirati), ki neizmerljivo. Naloga je na primer ugotoviti, ali obstaja povezava med športno specializacijo udeležencev in osebnimi lastnostmi, kot sta introvertnost (osebnostna osredotočenost na pojave lastnega subjektivnega sveta) in ekstravertiranost (osebnostna osredotočenost na svet zunanjih predmetov). Simboli so predstavljeni v tabeli. 7.6.

Tabela 7.6.

X (leta) Y (krat) Z (krat) X (leta) Y (krat) Z (krat)
1. funkcija 2. funkcija zaprtost vase Ekstravertnost
Športne igre A b
Gimnastika z d

Očitno so lahko številke, s katerimi razpolagamo, samo distribucijske frekvence. V tem primeru izračunajte asociacijski koeficient (drugo ime " kontingenčni koeficient "). Razmislite o najpreprostejšem primeru: razmerje med dvema paroma lastnosti, medtem ko se izračunani kontingenčni koeficient imenuje tetrahorični (glej tabelo).

Tabela 7.7.

a = 20 b = 15 a + b = 35
c =15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Izračune izvajamo po formuli:

ad-bc 100-225-123

Izračun asociacijskih koeficientov (konjugacijskih koeficientov) z večjim številom značilnosti je povezan z izračuni z uporabo podobne matrike ustreznega reda.