Šta pokazuje koeficijent korelacije u statistici? Korelaciona analiza

Koeficijent korelacije (ili linearni koeficijent korelacije) označava se kao "r" (u rijetkim slučajevima kao "ρ") i karakterizira linearnu korelaciju (tj. odnos koji je dat nekom vrijednošću i smjerom) dvije ili više varijabli. Vrijednost koeficijenta je između -1 i +1, odnosno korelacija može biti i pozitivna i negativna. Ako je koeficijent korelacije -1, postoji savršena negativna korelacija; ako je koeficijent korelacije +1, postoji savršena pozitivna korelacija. U drugim slučajevima postoji pozitivna korelacija, negativna korelacija ili ne postoji korelacija između dvije varijable. Koeficijent korelacije može se izračunati ručno, korištenjem besplatnih online kalkulatora ili pomoću dobrog grafičkog kalkulatora.

Koraci

Ručno izračunavanje koeficijenta korelacije

    Prikupite podatke. Prije nego počnete računati koeficijent korelacije, proučite dati par brojeva. Bolje ih je zapisati u tablicu koja se može postaviti okomito ili horizontalno. Označite svaki red ili kolonu kao "x" i "y".

    • Na primjer, data su četiri para vrijednosti (brojeva) varijabli "x" i "y". Možete kreirati sljedeću tabelu:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Izračunajte aritmetičku sredinu "x". Da biste to učinili, zbrojite sve vrijednosti "x", a zatim podijelite rezultirajući rezultat s brojem vrijednosti.

    Pronađite aritmetičku sredinu "y". Da biste to učinili, slijedite slične korake, odnosno zbrojite sve vrijednosti "y", a zatim podijelite zbroj s brojem vrijednosti.

    Izračunajte standardnu ​​devijaciju "x". Nakon izračunavanja srednjih vrijednosti za x i y, pronađite standardne devijacije ovih varijabli. Standardna devijacija se izračunava pomoću sljedeće formule:

    Izračunajte standardnu ​​devijaciju "y". Slijedite korake opisane u prethodnom koraku. Koristite istu formulu, ali u nju zamijenite vrijednosti "y".

    Zapišite osnovnu formulu za izračunavanje koeficijenta korelacije. Ova formula uključuje srednje vrijednosti, standardne devijacije i broj (n) parova brojeva za obje varijable. Koeficijent korelacije se označava kao "r" (u rijetkim slučajevima kao "ρ"). Ovaj članak koristi formulu za izračunavanje Pearsonovog koeficijenta korelacije.

    Izračunali ste srednje vrijednosti i standardne devijacije obje varijable, tako da možete koristiti formulu za izračunavanje koeficijenta korelacije. Podsjetimo da je "n" broj parova vrijednosti za obje varijable. Vrijednosti ostalih veličina izračunate su ranije.

    • U našem primjeru, proračuni će biti napisani ovako:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\desno) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\desno))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ frac (3-4)(2.58))\desno))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\desno)*\left((\frac (5-4)(2,58))\desno)+\left((\frac (5-3)(1,83))\ desno)*\left( (\frac (7-4)(2.58))\right))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4,721))\desno))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\right))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  2. Analizirajte rezultat. U našem primjeru koeficijent korelacije je 0,988. Ova vrijednost na neki način karakterizira ovaj skup parova brojeva. Obratite pažnju na znak i veličinu vrijednosti.

    • Pošto je vrijednost koeficijenta korelacije pozitivna, postoji pozitivna korelacija između varijabli “x” i “y”. To jest, kako se vrijednost “x” povećava, povećava se i vrijednost “y”.
    • Budući da je vrijednost koeficijenta korelacije vrlo blizu +1, vrijednosti varijabli "x" i "y" su međusobno jako povezane. Ako iscrtate tačke na koordinatnoj ravni, one će se nalaziti blizu određene prave linije.

    Korištenje online kalkulatora za izračunavanje koeficijenta korelacije

    1. Pronađite kalkulator na internetu da izračunate koeficijent korelacije. Ovaj koeficijent se prilično često izračunava u statistici. Ako postoji mnogo parova brojeva, gotovo je nemoguće ručno izračunati koeficijent korelacije. Stoga postoje online kalkulatori za izračunavanje koeficijenta korelacije. U tražilicu unesite "kalkulator koeficijenta korelacije" (bez navodnika).

      Unesite podatke. Molimo pregledajte upute na web stranici kako biste bili sigurni da ste ispravno unijeli podatke (parove brojeva). Izuzetno je važno uneti odgovarajuće parove brojeva; inače ćete dobiti netačan rezultat. Zapamtite da različite web stranice imaju različite formate unosa podataka.

      • Na primjer, na web stranici http://ncalculators.com/statistics/correlation-coefficient-calculator.htm vrijednosti varijabli “x” i “y” se unose u dvije horizontalne linije. Vrijednosti su odvojene zarezima. Odnosno, u našem primjeru vrijednosti "x" se unose ovako: 1,2,4,5, a vrijednosti "y" ovako: 1,3,5,7.
      • Na drugom sajtu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, podaci se unose okomito; u ovom slučaju nemojte brkati odgovarajuće parove brojeva.
    2. Izračunajte koeficijent korelacije. Nakon unosa podataka, jednostavno kliknite na dugme “Izračunaj”, “Izračunaj” ili slično da dobijete rezultat.

    Korištenje grafičkog kalkulatora

    1. Unesite podatke. Uzmite grafički kalkulator, uđite u statistički način rada i odaberite naredbu Uredi.

      • Različiti kalkulatori zahtijevaju različite tipke da se pritisnu. Ovaj članak govori o kalkulatoru Texas Instruments TI-86.
      • Da biste prešli na režim statističkog izračunavanja, pritisnite – Stat (iznad tastera „+“). Zatim pritisnite F2 – Uredi.
    2. Izbrišite prethodno sačuvane podatke. Većina kalkulatora pohranjuje statistiku koju unesete dok je ne obrišete. Kako biste izbjegli brkanje starih podataka s novim podacima, prvo izbrišite sve pohranjene informacije.

      • Koristite tipke sa strelicama da pomjerite kursor i označite naslov "xStat". Zatim pritisnite Clear i Enter da uklonite sve vrijednosti unesene u kolonu xStat.
      • Koristite tipke sa strelicama da označite naslov "yStat". Zatim pritisnite Clear i Enter da obrišete sve vrijednosti unesene u kolonu yStat.
    3. Unesite početne podatke. Koristite tipke sa strelicama da pomaknete kursor na prvu ćeliju ispod naslova "xStat". Unesite prvu vrijednost i pritisnite Enter. “xStat (1) = __” će biti prikazano na dnu ekrana, gdje će se umjesto razmaka pojaviti unesena vrijednost. Nakon što pritisnete Enter, unesena vrijednost će se pojaviti u tabeli i kursor će se pomaknuti na sljedeći red; ovo će prikazati “xStat (2) = __” na dnu ekrana.

      • Unesite sve vrijednosti za varijablu "x".
      • Nakon što unesete sve vrijednosti za varijablu x, koristite tipke sa strelicama da se pomaknete na kolonu yStat i unesite vrijednosti za varijablu y.
      • Kada unesete sve parove brojeva, pritisnite Exit da obrišete ekran i izađete iz režima statističkog izračunavanja.

Različiti znakovi mogu biti povezani jedni s drugima.

Postoje 2 vrste veza između njih:

  • funkcionalan;
  • korelacija.

Korelacija prevedeno na ruski nije ništa više od veze.
U slučaju korelacijske veze, može se pratiti korespondencija nekoliko vrijednosti jedne karakteristike s nekoliko vrijednosti druge karakteristike. Kao primjere možemo uzeti u obzir utvrđene korelacije između:

  • dužina šapa, vrata i kljunova ptica kao što su čaplje, ždralovi i rode;
  • indikatori telesne temperature i otkucaja srca.

Za većinu biomedicinskih procesa prisustvo ove vrste povezanosti je statistički dokazano.

Statističke metode omogućavaju utvrđivanje činjenice postojanja međuzavisnosti karakteristika. Upotreba posebnih proračuna za to dovodi do uspostavljanja koeficijenata korelacije (mjere povezanosti).

Takvi proračuni se nazivaju korelacione analize. Provodi se kako bi se potvrdila zavisnost 2 varijable (slučajne varijable) jedna o drugoj, što je izraženo koeficijentom korelacije.

Korištenje metode korelacije omogućava vam da riješite nekoliko problema:

  • identificirati postojanje veze između analiziranih parametara;
  • poznavanje prisutnosti korelacije nam omogućava da riješimo probleme predviđanja. Dakle, postoji stvarna prilika da se predvidi ponašanje parametra na osnovu analize ponašanja drugog korelirajućeg parametra;
  • vršenje klasifikacije zasnovane na izboru osobina nezavisnih jedna od druge.

Za varijable:

  • u odnosu na ordinalnu skalu, izračunava se Spearmanov koeficijent;
  • vezano za intervalnu skalu – Pirsonov koeficijent.

Ovo su najčešće korišteni parametri, osim njih postoje i drugi.

Vrijednost koeficijenta može se izraziti pozitivno ili negativno.

U prvom slučaju, kako se povećava vrijednost jedne varijable, uočava se povećanje druge. Ako je koeficijent negativan, obrazac je obrnut.

Čemu služi koeficijent korelacije?

Slučajne varijable povezane jedna s drugom mogu imati potpuno različite prirode ove veze. Neće nužno biti funkcionalan, u slučaju kada se može pratiti direktan odnos između količina. Najčešće na obje veličine utječe čitav niz različitih faktora, a u slučajevima kada su one zajedničke za obje veličine, uočava se formiranje povezanih obrazaca.

To znači da statistički dokazana činjenica postojanja veze između veličina ne potvrđuje da je uzrok uočenih promjena utvrđen. Po pravilu, istraživač zaključuje da postoje dvije međusobno povezane posljedice.

Svojstva koeficijenta korelacije

Ova statistička karakteristika ima sljedeća svojstva:

  • vrijednost koeficijenta se kreće od -1 do +1. Što je bliže ekstremnim vrijednostima, to je jača pozitivna ili negativna veza između linearnih parametara. U slučaju nulte vrijednosti, govorimo o odsustvu korelacije između karakteristika;
  • pozitivna vrijednost koeficijenta pokazuje da ako se vrijednost jedne karakteristike povećava, uočava se povećanje druge (pozitivna korelacija);
  • negativna vrijednost – u slučaju povećanja vrijednosti jedne karakteristike, uočava se smanjenje druge (negativna korelacija);
  • približavanje vrijednosti indikatora ekstremnim tačkama (bilo -1 ili +1) ukazuje na prisustvo vrlo jake linearne veze;
  • indikatori karakteristike se mogu mijenjati dok vrijednost koeficijenta ostaje nepromijenjena;
  • koeficijent korelacije je bezdimenzionalna veličina;
  • prisustvo korelacije ne potvrđuje nužno uzročno-posledičnu vezu.

Vrijednosti koeficijenta korelacije

Jačina korelacije može se okarakterizirati pribjegavanjem Cheldock skali, u kojoj određena brojčana vrijednost odgovara kvalitativnoj karakteristici.

U slučaju pozitivne korelacije sa vrijednošću:

  • 0-0,3 – korelacija je vrlo slaba;
  • 0,3-0,5 – slabo;
  • 0,5-0,7 – srednja čvrstoća;
  • 0,7-0,9 – visoka;
  • 0,9-1 – vrlo visoka snaga korelacije.

Skala se može koristiti i za negativnu korelaciju. U ovom slučaju, kvalitativne karakteristike zamjenjuju se suprotnim.

Možete koristiti pojednostavljenu Cheldock skalu, koja razlikuje samo 3 gradacije korelacijske snage:

  • veoma jak - indikatori ±0,7 - ±1;
  • prosjek - pokazatelji ±0,3 - ±0,699;
  • vrlo slab - indikatori 0 - ±0,299.

Ovaj statistički indikator omogućava ne samo testiranje pretpostavke o postojanju linearne veze između karakteristika, već i utvrđivanje njene snage.

Vrste koeficijenata korelacije

Koeficijenti korelacije se mogu klasificirati prema predznaku i vrijednosti:

  • pozitivno;
  • null;
  • negativan.

U zavisnosti od analiziranih vrednosti, izračunava se koeficijent:

  • Pearson;
  • Spearman;
  • Kendal;
  • Fechner znakovi;
  • podudarnost ili korelacija višestrukog ranga.

Pearsonov koeficijent korelacije koristi se za uspostavljanje direktnih veza između apsolutnih vrijednosti varijabli. U ovom slučaju, distribucije obje serije varijabli trebale bi se približiti normalnoj. Upoređene varijable moraju se razlikovati u istom broju različitih karakteristika. Skala koja predstavlja varijable mora biti skala intervala ili omjera.

  • precizno uspostavljanje snage korelacije;
  • poređenje kvantitativnih karakteristika.

Postoji nekoliko nedostataka korištenja linearnog Pearsonovog koeficijenta korelacije:

  • metoda je nestabilna u slučaju odstupanja numeričkih vrijednosti;
  • Koristeći ovu metodu, moguće je odrediti jačinu korelacije samo za linearni odnos, a za druge vrste međusobnih odnosa varijabli treba koristiti metode regresione analize.

Korelacija ranga određena je Spearmanovom metodom, koja omogućava statističko proučavanje odnosa između pojava. Zahvaljujući ovom koeficijentu izračunava se stvarni stepen paralelizma dve kvantitativno izražene serije karakteristika, a takođe se procenjuje nepropusnost identifikovane veze.

  • ne zahteva precizno određivanje vrednosti korelacione sile;
  • upoređeni indikatori imaju i kvantitativno i atributivno značenje;
  • poređenje serija karakteristika sa otvorenim varijantama vrednosti.

Spearmanova metoda je metoda neparametarske analize, tako da nema potrebe provjeravati normalnost distribucije neke karakteristike. Osim toga, omogućava vam da uporedite indikatore izražene na različitim skalama. Na primjer, poređenje broja crvenih krvnih zrnaca u određenom volumenu krvi (kontinuirana skala) i stručna procjena izražena u bodovima (redna skala).

Na efikasnost metode negativno utiče velika razlika između vrednosti upoređenih veličina. Metoda takođe nije efikasna u slučajevima kada je izmjerena vrijednost karakterizirana neravnomjernom raspodjelom vrijednosti.

Korak po korak izračunavanje koeficijenta korelacije u Excel-u

Izračunavanje koeficijenta korelacije uključuje sekvencijalno izvođenje niza matematičkih operacija.

Gornja formula za izračunavanje Pearsonovog koeficijenta pokazuje koliko je ovaj proces radno intenzivan ako se radi ručno.
Upotreba Excelovih mogućnosti značajno ubrzava proces pronalaženja koeficijenta.

Dovoljno je slijediti jednostavan algoritam radnji:

  • unos osnovnih informacija - kolona od x vrijednosti i kolona od y vrijednosti;
  • u alatima odaberite i otvorite karticu "Formule";
  • na kartici koja se otvori odaberite "Insert fx function";
  • u dijaloškom okviru koji se otvori odaberite statističku funkciju “Corel” koja vam omogućava da izračunate koeficijent korelacije između 2 skupa podataka;
  • prozor koji se otvori, unesite podatke: niz 1 – raspon vrijednosti kolone x (podaci moraju biti odabrani), niz 2 – raspon vrijednosti kolone y;
  • pritisnete tipku „ok“, rezultat izračuna koeficijenta se pojavljuje u redu „vrijednost“;
  • zaključak o postojanju korelacije između 2 skupa podataka i njegove snage.

Koeficijent korelacije je stepen veze između dvije varijable. Njegov proračun daje ideju da li postoji veza između dva skupa podataka. Za razliku od regresije, korelacija ne predviđa vrijednosti količina. Međutim, izračunavanje koeficijenta je važan korak u preliminarnoj statističkoj analizi. Na primjer, utvrdili smo da je koeficijent korelacije između nivoa stranih direktnih investicija i stope rasta BDP-a visok. To nam daje ideju da je za osiguranje prosperiteta potrebno stvoriti povoljnu klimu posebno za strane poduzetnike. Na prvi pogled nije tako očigledan zaključak!

Korelacija i uzročnost

Možda ne postoji niti jedno područje statistike koje se tako čvrsto ustalilo u našim životima. Koeficijent korelacije se koristi u svim oblastima društvenog znanja. Njegova glavna opasnost je da se o njegovim visokim vrijednostima često spekuliše kako bi se ljudi uvjerili i natjerali da povjeruju u neke zaključke. Međutim, u stvari, jaka korelacija uopće ne ukazuje na uzročno-posljedičnu vezu između količina.

Koeficijent korelacije: Pirsonova i Spirmanova formula

Postoji nekoliko osnovnih indikatora koji karakterišu odnos između dve varijable. Istorijski gledano, prvi je Pearsonov koeficijent linearne korelacije. Uči se u školi. Razvili su ga K. Pearson i J. Yule na osnovu rada Fr. Galton. Ovaj koeficijent vam omogućava da vidite odnos između racionalnih brojeva koji se racionalno mijenjaju. Uvijek je veći od -1 i manji od 1. Negativan broj ukazuje na obrnuto proporcionalnu vezu. Ako je koeficijent jednak nuli, onda nema veze između varijabli. Jednako pozitivnom broju - postoji direktno proporcionalna veza između količina koje se proučavaju. Spearmanov koeficijent korelacije ranga omogućava vam da pojednostavite proračune izgradnjom hijerarhije varijabilnih vrijednosti.

Odnosi između varijabli

Korelacija pomaže da se odgovori na dva pitanja. Prvo, da li je odnos između varijabli pozitivan ili negativan. Drugo, koliko je jaka ovisnost. Korelaciona analiza je moćan alat koji može pružiti ove važne informacije. Lako je uočiti da porodični prihodi i rashodi padaju i rastu proporcionalno. Ovaj odnos se smatra pozitivnim. Naprotiv, kada cijena proizvoda raste, potražnja za njim opada. Ovaj odnos se naziva negativnim. Vrijednosti koeficijenta korelacije kreću se između -1 i 1. Nula znači da ne postoji veza između vrijednosti koje se proučavaju. Što je dobijeni indikator bliži ekstremnim vrijednostima, to je veza jača (negativna ili pozitivna). Odsustvo zavisnosti je označeno koeficijentom od -0,1 do 0,1. Morate shvatiti da takva vrijednost samo ukazuje na odsustvo linearnog odnosa.

Karakteristike primjene

Upotreba oba indikatora uključuje određene pretpostavke. Prvo, prisustvo jake veze ne određuje činjenicu da jedna veličina određuje drugu. Možda postoji treća veličina koja definira svaku od njih. Drugo, visok Pearsonov koeficijent korelacije ne ukazuje na uzročno-posledičnu vezu između proučavanih varijabli. Treće, pokazuje isključivo linearan odnos. Korelacija se može koristiti za procjenu značajnih kvantitativnih podataka (npr. barometarski pritisak, temperatura zraka) umjesto kategorija kao što su spol ili omiljena boja.

Višestruki koeficijent korelacije

Pearson i Spearman su ispitivali odnos između dvije varijable. Ali šta učiniti ako ih ima tri ili čak više. Tu u pomoć dolazi koeficijent višestruke korelacije. Na primjer, na bruto nacionalni proizvod utiču ne samo direktne strane investicije, već i vladina monetarna i fiskalna politika, kao i nivo izvoza. Stopa rasta i obim BDP-a rezultat su interakcije brojnih faktora. Međutim, mora se shvatiti da je model višestruke korelacije zasnovan na brojnim pojednostavljenjima i pretpostavkama. Prvo, isključena je multikolinearnost između vrijednosti. Drugo, odnos između zavisne i varijabli koje utječu na nju smatra se linearnim.

Oblasti upotrebe korelacione i regresione analize

Ova metoda pronalaženja odnosa između veličina se široko koristi u statistici. Najčešće se pribjegava u tri glavna slučaja:

  1. Testirati uzročno-posljedične veze između vrijednosti dvije varijable. Kao rezultat toga, istraživač se nada da će otkriti linearnu vezu i izvesti formulu koja opisuje ove odnose između veličina. Njihove mjerne jedinice mogu biti različite.
  2. Za provjeru odnosa između količina. U ovom slučaju, niko ne određuje koja je varijabla zavisna varijabla. Može se ispostaviti da neki drugi faktor određuje vrijednost obje veličine.
  3. Da bi se izvela jednadžba. U ovom slučaju, možete jednostavno zamijeniti brojeve u njega i saznati vrijednosti nepoznate varijable.

Muškarac u potrazi za uzročno-posledičnom vezom

Svijest je osmišljena na način da svakako moramo objasniti događaje koji se dešavaju oko nas. Čovjek uvijek traži vezu između slike svijeta u kojem živi i informacija koje prima. Mozak često stvara red iz haosa. Lako može uočiti uzročno-posledičnu vezu tamo gde je nema. Naučnici moraju posebno naučiti da prevladaju ovu tendenciju. Sposobnost objektivne procjene odnosa između podataka je od suštinskog značaja u akademskoj karijeri.

Medijska pristrasnost

Hajde da razmotrimo kako se prisustvo korelacije može pogrešno protumačiti. Grupa britanskih studenata lošeg ponašanja upitana je da li njihovi roditelji puše. Zatim je test objavljen u novinama. Rezultat je pokazao snažnu korelaciju između pušenja roditelja i delinkvencije njihove djece. Profesor koji je vodio ovu studiju čak je predložio da se o tome stavi upozorenje na kutijama cigareta. Međutim, postoji niz problema s ovim zaključkom. Prvo, korelacija ne pokazuje koja je od veličina nezavisna. Stoga je sasvim moguće pretpostaviti da je štetna navika roditelja uzrokovana neposlušnošću djece. Drugo, ne može se sa sigurnošću reći da oba problema nisu nastala zbog nekog trećeg faktora. Na primjer, porodice sa niskim primanjima. Vrijedi napomenuti emocionalni aspekt početnih nalaza profesora koji je vodio studiju. Bio je vatreni protivnik pušenja. Stoga ne čudi što je na ovaj način tumačio rezultate svog istraživanja.

zaključci

Pogrešno tumačenje korelacije kao uzročno-posljedične veze između dvije varijable može uzrokovati sramotne greške u istraživanju. Problem je što leži u samoj osnovi ljudske svijesti. Mnogi marketinški trikovi temelje se na ovoj osobini. Razumijevanje razlike između uzroka i posljedice i korelacije omogućava vam da racionalno analizirate informacije kako u svakodnevnom životu tako iu profesionalnoj karijeri.

7.3.1. Koeficijenti korelacije i determinacije. Može se kvantificirati bliskost komunikacije između faktora i njegovih fokus(direktno ili inverzno), računajući:

1) ako je potrebno utvrditi linearni odnos između dva faktora, - koeficijent para korelacije: u 7.3.2 i 7.3.3 operacije izračunavanja uparenog koeficijenta linearne korelacije prema Bravais–Pearsonu ( r) i koeficijent korelacije ranga Spearman u paru ( r);

2) ako želimo da utvrdimo odnos između dva faktora, ali je taj odnos očigledno nelinearan, onda korelacioni odnos ;

3) ako želimo da utvrdimo odnos između jednog faktora i određenog skupa drugih faktora, onda (ili, što je isto, “višestruki koeficijent korelacije”);

4) ako želimo izolovano da identifikujemo povezanost samo jednog faktora sa određenim drugim, uključenim u grupu faktora koji utiču na prvi, za šta moramo da smatramo da je uticaj svih ostalih faktora nepromenjen – onda parcijalni koeficijent korelacije .

Bilo koji koeficijent korelacije (r, r) ne može biti veći od 1 u apsolutnoj vrijednosti, odnosno –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Znak koeficijenta korelacije određuje smjer odnosa: znak “+” (ili bez znaka) znači da je odnos ravno (pozitivno), znak “–” znači da je veza obrnuto (negativan). Znak nema nikakve veze sa bliskošću veze

Koeficijent korelacije karakteriše statistički odnos. Ali često je potrebno odrediti drugu vrstu zavisnosti, odnosno: koliki je doprinos određenog faktora formiranju drugog faktora koji je povezan s njim. Ova vrsta zavisnosti je, uz određeni stepen konvencije, okarakterisana koeficijent odlučnosti (D ), određena formulom D = r 2 ´100% (gdje je r Bravais–Pearsonov koeficijent korelacije, vidjeti 7.3.2). Ako su mjerenja obavljena u ljestvica poretka (skala ranga), onda uz određeno oštećenje pouzdanosti, umjesto vrijednosti r, možete zamijeniti vrijednost r (Spearmanov koeficijent korelacije, vidjeti 7.3.3) u formulu.

Na primjer, ako smo kao karakteristiku zavisnosti faktora B od faktora A dobili koeficijent korelacije r = 0,8 ili r = –0,8, onda je D = 0,8 2 ´100% = 64%, odnosno oko 2 ½ 3. Shodno tome, doprinos faktora A i njegovih promena formiranju faktora B je približno 2 ½ 3 od ukupnog doprinosa svih faktora uopšte.

7.3.2. Bravais-Pearson koeficijent korelacije. Postupak za izračunavanje Bravais–Pearsonovog koeficijenta korelacije ( r ) može se koristiti samo u slučajevima kada se odnos razmatra na osnovu uzoraka koji imaju normalnu distribuciju frekvencija ( normalna distribucija ) i dobijeni mjerenjima na skali intervala ili omjera. Formula za izračunavanje ovog koeficijenta korelacije je:



å ( x i – )( y i – )

r = .

n×s x ×s y

Šta pokazuje koeficijent korelacije? Prvo, znak koeficijenta korelacije pokazuje smjer odnosa, odnosno: znak “–” označava da je odnos obrnuto, ili negativan(postoji tendencija: sa smanjenjem vrijednosti jednog faktora, odgovarajuće vrijednosti drugog faktora se povećavaju, a s povećanjem se smanjuju), a odsustvo znaka ili znaka "+" ukazuje ravno, ili pozitivno veze (postoji tendencija: s povećanjem vrijednosti jednog faktora, vrijednosti drugog se povećavaju, a sa smanjenjem se smanjuju). Drugo, apsolutna (znak nezavisna) vrijednost koeficijenta korelacije ukazuje na bliskost (snagu) veze. Općenito je prihvaćeno (prilično proizvoljno): za vrijednosti r< 0,3 корреляция vrlo slaba, često se jednostavno ne uzima u obzir, na 0,3 £ r< 5 корреляция slab, po 0,5 £ r< 0,7) - prosjek, po 0,7 £ r 0,9 £) - jaka i konačno, za r > 0,9 - vrlo jak. U našem slučaju (r » 0,83) veza je inverzna (negativna) i jaka.

Podsjetimo: vrijednosti koeficijenta korelacije mogu biti u rasponu od –1 do +1. Ako vrijednost r prelazi ove granice, to ukazuje na to u proračunima napravljena je greška . Ako r= 1, to znači da veza nije statistička, već funkcionalna - što se praktično nikada ne dešava u sportu, biologiji ili medicini. Iako je uz mali broj mjerenja moguć slučajni odabir vrijednosti koji daje sliku funkcionalne veze, takav slučaj je manje vjerojatan, što je veći volumen uspoređenih uzoraka (n), odnosno broj parova upoređenih mjerenja.

Tabela proračuna (Tabela 7.1) je konstruisana prema formuli.

Tabela 7.1.

Tablica proračuna za Bravais–Pearsonove proračune

x i y i (x i – ) (x i – ) 2 (y i – ) (y i – ) 2 (x i – )( y i – )
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i =137 =13,00 åy i =56,1 =5,1 å( x i – ) 2 = =1,78 å( y i – ) 2 = = 1,015 å( x i – )( y i – )= = –1,24

Zbog s x = ï ï = ï ï» 0,42, a

s y = ï ï» 0,32, r" –1,24ï (11´0,42´0,32) » –1,24ï 1,48 » –0,83 .

Drugim riječima, morate vrlo čvrsto znati da je koeficijent korelacije ne mogu premašuju 1,0 u apsolutnoj vrijednosti. Ovo vam često omogućava da izbjegnete grube greške, tačnije da pronađete i ispravite greške napravljene tokom proračuna.

7.3.3. Spearmanov koeficijent korelacije. Kao što je već spomenuto, Bravais-Pearsonov koeficijent korelacije (r) može se koristiti samo u slučajevima kada su analizirani faktori u distribuciji frekvencije blizu normalne, a vrijednosti varijanti se dobijaju mjerenjima nužno na skali omjera ili na skali intervala , što se dešava ako su izražene fizičke jedinice. U drugim slučajevima se nalazi Spearmanov koeficijent korelacije ( r). Međutim, ovaj koeficijent Može primjenjivati ​​u slučajevima kada je to dozvoljeno (i poželjno ! ) primijeniti Bravais-Pearson koeficijent korelacije. Ali treba imati na umu da postupak za određivanje koeficijenta prema Bravais-Pearsonu ima veća snaga („razrješavanje sposobnost"), Zbog toga r informativniji od r. Čak i sa odličnim n odstupanje r može biti reda veličine ±10%.

Tabela 7.2 Formula za izračunavanje koeficijenta

x i y i R x R y |d R | d R 2 Spearmanova korelacija

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 koristimo naš primjer

12,7 5,10 4,5 6,5 2,0 4,00 za obračun r, ali mi ćemo izgraditi

12,5 5,40 3,0 9,0 6,0 36,00 drugi sto (tabela 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Zamijenimo vrijednosti:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Vidimo: r ispalo je malo

12,4 5,60 2,0 11,0 9,0 81,00 više od r, ali ovo je drugačije

12,3 5,50 1,0 10,0 9,0 81,00 što nije baš veliko. Na kraju krajeva, kada

12,7 5,20 4,5 8,0 3,5 12,25 tako mali n vrijednosti r I r

åd R 2 = 423 su vrlo približne, nisu baš pouzdane, njihova stvarna vrijednost može znatno varirati, tako da razlika r I r na 0,1 je beznačajan. Običnorsmatra se analognimr , ali samo manje tačan. Znakovi kada r I r pokazuje smjer veze.

7.3.4. Primjena i provjera pouzdanosti koeficijenata korelacije. Utvrđivanje stepena korelacije između faktora neophodno je da bismo kontrolisali razvoj faktora koji nam je potreban: da bismo to uradili, moramo uticati na druge faktore koji značajno utiču na to i moramo znati stepen njihove efikasnosti. Neophodno je znati o odnosu između faktora kako bi se razvili ili odabrali gotovi testovi: informativni sadržaj testa određen je korelacijom njegovih rezultata s manifestacijama karakteristike ili svojstva koje nas zanima. Bez poznavanja korelacija, bilo koji oblik selekcije je nemoguć.

Iznad je napomenuto da se u sportskoj i općenito pedagoškoj, medicinskoj, pa i ekonomskoj i sociološkoj praksi utvrđuje šta doprinos , koji jedan faktor doprinosi formiranju drugog. To je zbog činjenice da, pored faktora-uzroka koji se razmatra, cilj(faktor koji nas zanima) djeluju, dajući svaki jedan ili drugi doprinos tome, i drugi.

Vjeruje se da mjera doprinosa svakog faktora-uzroka može biti koeficijent odlučnosti D i = r 2 ´100%. Tako, na primjer, ako je r = 0,6, tj. odnos između faktora A i B je prosječan, tada je D = 0,6 2 ´100% = 36%. Znajući, dakle, da je doprinos faktora A formiranju faktora B otprilike 1 ½ 3, možete, na primjer, posvetiti približno 1 ciljanom razvoju ovog faktora ½ 3 treninga. Ako je koeficijent korelacije r = 0,4, tada je D = r 2 100% = 16%, ili približno 1 ½ 6 je više od dva puta manje, a po ovoj logici, prema ovoj logici, samo 1 treba posvetiti njegovom razvoju ½ 6. dio vremena treninga.

Vrijednosti D i za različite značajne faktore daju približnu predstavu o kvantitativnom odnosu njihovih utjecaja na ciljni faktor koji nas zanima, radi poboljšanja kojeg, zapravo, radimo na drugim faktorima (npr. skakač u dalj u dalj radi na povećanju brzine svog sprinta, pa kako je to faktor koji daje najznačajniji doprinos formiranju rezultata u skokovima).

Prisjetite se tog definiranja D možda umjesto toga r staviti r, iako se, naravno, ispostavlja da je tačnost određivanja manja.

Na osnovu selektivno koeficijent korelacije (izračunat iz podataka uzorka), ne može se izvesti zaključak o pouzdanosti činjenice da postoji veza između faktora koji se razmatraju uopšte. Da bi se doneo takav zaključak sa različitim stepenom valjanosti, standard kriterijumi značajnosti korelacije. Njihova upotreba pretpostavlja linearnu vezu između faktora i normalna distribucija frekvencije u svakom od njih (što znači ne selektivnu, već njihovu opštu reprezentaciju).

Možete, na primjer, koristiti Studentove t-testove. Njegova dis-

ravnomjerna formula: tp= –2 , gdje je k koeficijent korelacije uzorka koji se proučava, a n- volumen upoređenih uzoraka. Rezultirajuća izračunata vrijednost t-kriterijuma (t p) se upoređuje sa tabelom na nivou značajnosti koji smo odabrali i broju stupnjeva slobode n = n – 2. Da biste se riješili proračunskog rada, možete koristiti poseban sto kritične vrijednosti koeficijenata korelacije uzorka(vidi gore), što odgovara prisutnosti pouzdane veze između faktora (uzimajući u obzir n I a).

Tabela 7.3.

Granične vrijednosti za pouzdanost koeficijenta korelacije uzorka

Broj stepeni slobode pri određivanju koeficijenata korelacije uzima se jednakim 2 (tj. n= 2) Navedeno u tabeli. Vrijednosti 7.3 imaju donju granicu intervala povjerenja istinito koeficijent korelacije je 0, odnosno s takvim vrijednostima ne može se tvrditi da korelacija uopće postoji. Ako je vrijednost koeficijenta korelacije uzorka veća od one naznačene u tabeli, može se pretpostaviti, na odgovarajućem nivou značajnosti, da pravi koeficijent korelacije nije jednak nuli.

Ali odgovor na pitanje da li postoji stvarna veza između faktora koji se razmatraju ostavlja prostor za još jedno pitanje: u kom intervalu se pravo značenje koeficijent korelacije, kakav zapravo može biti, za beskonačno veliko n? Ovaj interval za bilo koju određenu vrijednost r I n mogu se izračunati uporedivi faktori, ali je zgodnije koristiti sistem grafova ( nomogram), gdje je svaki par krivulja konstruiran za neke navedene iznad njih n, odgovara granicama intervala.

Rice. 7.4. Granice pouzdanosti koeficijenta korelacije uzorka (a = 0,05). Svaka kriva odgovara onoj iznad nje n.

Pozivajući se na nomogram na sl. 7.4, moguće je odrediti interval vrijednosti pravog koeficijenta korelacije za izračunate vrijednosti koeficijenta korelacije uzorka na a = 0,05.

7.3.5. Korelacioni odnosi. Ako je parna korelacija nelinearni, nemoguće je izračunati koeficijent korelacije, odrediti korelacioni odnosi . Obavezni zahtjev: karakteristike se moraju mjeriti na skali omjera ili na skali intervala. Možete izračunati korelaciju ovisnosti faktora X od faktora Y i korelacione zavisnosti faktora Y od faktora X- razlikuju se. Za mali volumen n od razmatranih uzoraka koji predstavljaju faktore, za izračunavanje korelacionih odnosa možete koristiti formule:

odnos korelacije h x½y= ;

korelacioni odnos h y ½ x= .

Ovdje su i aritmetičke sredine uzoraka X i Y, i - unutar klase aritmetički proseci. Odnosno, aritmetička sredina tih vrijednosti u uzorku faktora X sa kojim identične vrijednosti su konjugirane u uzorku faktora Y (na primjer, ako u faktoru X postoje vrijednosti 4, 6 i 5, s kojima su u uzorku faktora Y povezane 3 opcije sa istom vrijednošću 9, tada je = (4+ 6+5) ½ 3 = 5). U skladu s tim, to je aritmetička sredina onih vrijednosti u uzorku faktora Y, koje su povezane s istim vrijednostima u uzorku faktora X. Dajemo primjer i izvršimo proračun:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabela 7.4

Tablica proračuna

x i y i x y x i – x (x i – x) 2 x i – x y (x ix y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Stoga, h y ½ x= "0,63.

7.3.6. Parcijalni i višestruki koeficijenti korelacije. Za procjenu zavisnosti između 2 faktora, prilikom izračunavanja koeficijenata korelacije, podrazumevano pretpostavljamo da nijedan drugi faktor nema nikakav uticaj na ovu zavisnost. U stvarnosti to nije slučaj. Dakle, na odnos između težine i visine veoma značajno utiču kalorijski unos, količina sistematske fizičke aktivnosti, nasljedstvo itd. Kada je potrebno kada se procjenjuje odnos između 2 faktora uzeti u obzir značajan uticaj druge faktore i istovremeno se, takoreći, izolovati od njih, smatrajući ih nepromenjenim, izračunati privatni (inače - djelomično ) koeficijenti korelacije.

Primjer: trebamo procijeniti uparene zavisnosti između 3 značajno aktivna faktora X, Y i Z. Označimo r XY (Z) parcijalni koeficijent korelacije između faktora X i Y (u ovom slučaju, vrijednost faktora Z se smatra nepromijenjenom), r ZX (Y) - parcijalni koeficijent korelacije između faktora Z i X (sa konstantnom vrijednošću faktora Y), r YZ (X) - parcijalni koeficijent korelacije između faktora Y i Z (sa konstantnom vrijednošću faktora X). Korištenje izračunatih koeficijenata korelacije jednostavnih parova (Bravais-Pearson). r XY, r XZ and r YZ, m

Možete izračunati parcijalne koeficijente korelacije koristeći formule:

r XY – r XZ´ r YZ r XZ – r XY´ r ZY r ZY –r ZX ´ r YZ

r XY(Z) = ; r XZ(Y) = ; r ZY(X) =

Ö(1– r 2 XZ)(1– r 2 YZ) Ö(1– r 2 XY)(1– r 2 ZY) Ö(1– r 2 ZX)(1– r 2 YX)

A parcijalni koeficijenti korelacije mogu imati vrijednosti od –1 do +1. Kvadrirajući ih, dobijamo odgovarajuće količnike koeficijenti determinacije , također se zove privatne mjere sigurnosti(pomnožite sa 100 i izrazite kao %%). Parcijalni koeficijenti korelacije se manje-više razlikuju od koeficijenata prostih (punih) para, što zavisi od jačine uticaja 3. faktora (kao da je nepromenjen) na njih. Testira se nulta hipoteza (H 0), odnosno hipoteza o nepostojanju veze (zavisnosti) između faktora X i Y (sa ukupnim brojem znakova). k) izračunavanjem t-testa pomoću formule: t P = r XY (Z) ´ ( n–k) 1 ½ 2 ´ (1– r 2 XY (Z)) –1 ½ 2 .

Ako t R< t a n , hipoteza je prihvaćena (pretpostavljamo da nema zavisnosti), ali ako tt a n - hipoteza je opovrgnuta, odnosno vjeruje se da se ovisnost zaista događa. t a n se uzima iz tabele t-Učenički test, i k- broj faktora koji se uzimaju u obzir (u našem primjeru 3), broj stupnjeva slobode n= n – 3. Ostali parcijalni koeficijenti korelacije se provjeravaju na sličan način (u formuli umjesto toga r XY (Z) je zamijenjen u skladu s tim r XZ(Y) ili r ZY(X)).

Tabela 7.5

Početni podaci

Ö (1 – 0,71 2) (1 – 0,71 2) Ö (1 – 0,5) (1 – 0,5)

Da biste procijenili ovisnost faktora X od kombiniranog djelovanja nekoliko faktora (ovdje faktori Y i Z), izračunajte vrijednosti koeficijenata korelacije jednostavnih parova i pomoću njih izračunajte koeficijent višestruke korelacije r X (YZ) :

Ö r 2XY+ r 2 XZ – 2 r XY´ r XZ´ r YZ

r X(YZ) = .

Ö 1 – r 2 YZ

7.2.7. Koeficijent asocijacije.Često je potrebno kvantificirati odnos između kvaliteta znakovi, tj. takve karakteristike koje se ne mogu kvantitativno predstaviti (okarakterisati), koje nemerljivo. Na primjer, zadatak je otkriti postoji li veza između sportske specijalizacije uključenih i takvih ličnih svojstava kao što su introverzija (fokus ličnosti na fenomene vlastitog subjektivnog svijeta) i ekstrovertnost (fokus ličnosti na svijet spoljni objekti). Predstavljamo simbole u tabeli. 7.6.

Tabela 7.6.

X (godine) Y (puta) Z (puta) X (godine) Y (puta) Z (puta)
Znak 1 Znak 2 Introverzija Ekstroverzija
Sportske igre A b
gimnastika With d

Očigledno, brojevi kojima ovdje raspolažemo mogu biti samo frekvencije distribucije. U ovom slučaju izračunajte koeficijent asocijacije (drugi naziv " koeficijent kontingencije "). Razmotrimo najjednostavniji slučaj: odnos između dva para karakteristika i izračunati koeficijent kontingencije naziva se tetrahoric (vidi tabelu).

Tabela 7.7.

a =20 b = 15 a + b = 35
s =15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Izračunavamo koristeći formulu:

ad – pr 100 – 225 –123

Proračun koeficijenata asocijacije (koeficijenata konjugacije) sa većim brojem karakteristika uključuje proračune pomoću slične matrice odgovarajućeg reda.