Što pokazuje koeficijent korelacije u statistici? Korelacijska analiza

Koeficijent korelacije (ili linearni koeficijent korelacije) označava se kao "r" (u rijetkim slučajevima kao "ρ") i karakterizira linearnu korelaciju (odnosno odnos koji je zadan nekom vrijednošću i smjerom) dviju ili više varijabli. Vrijednost koeficijenta je između -1 i +1, odnosno korelacija može biti pozitivna i negativna. Ako je koeficijent korelacije -1, postoji savršena negativna korelacija; ako je koeficijent korelacije +1, postoji savršena pozitivna korelacija. U drugim slučajevima postoji pozitivna korelacija, negativna korelacija ili nema korelacije između dvije varijable. Koeficijent korelacije može se izračunati ručno, pomoću besplatnih online kalkulatora ili pomoću dobrog grafičkog kalkulatora.

Koraci

Ručno izračunavanje koeficijenta korelacije

    Prikupiti podatke. Prije nego počnete izračunavati koeficijent korelacije, proučite zadani par brojeva. Bolje ih je zapisati u tablicu koja se može postaviti okomito ili vodoravno. Označite svaki redak ili stupac kao "x" i "y".

    • Na primjer, dana su četiri para vrijednosti (brojeva) varijabli "x" i "y". Možete izraditi sljedeću tablicu:
      • x || g
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Izračunajte aritmetičku sredinu "x". Da biste to učinili, zbrojite sve vrijednosti "x", a zatim podijelite rezultat s brojem vrijednosti.

    Pronađite aritmetičku sredinu "y". Da biste to učinili, slijedite slične korake, odnosno zbrojite sve vrijednosti "y", a zatim podijelite zbroj s brojem vrijednosti.

    Izračunajte standardnu ​​devijaciju "x". Nakon izračunavanja srednjih vrijednosti x i y, pronađite standardna odstupanja ovih varijabli. Standardna devijacija izračunava se pomoću sljedeće formule:

    Izračunajte standardnu ​​devijaciju "y". Slijedite korake opisane u prethodnom koraku. Upotrijebite istu formulu, ali u nju zamijenite vrijednosti "y".

    Zapiši osnovnu formulu za izračun koeficijenta korelacije. Ova formula uključuje srednje vrijednosti, standardna odstupanja i broj (n) parova brojeva za obje varijable. Koeficijent korelacije je označen kao "r" (u rijetkim slučajevima kao "ρ"). Ovaj članak koristi formulu za izračunavanje Pearsonovog koeficijenta korelacije.

    Izračunali ste srednje vrijednosti i standardne devijacije obiju varijabli, tako da možete koristiti formulu za izračun koeficijenta korelacije. Podsjetimo da je "n" broj parova vrijednosti za obje varijable. Vrijednosti ostalih veličina izračunate su ranije.

    • U našem primjeru, izračuni će biti napisani ovako:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\lijevo((\frac (1)(n-1))\desno) \Sigma \lijevo((\frac (x-\mu _(x))(\sigma _(x)))\desno)*\lijevo((\frac (y-\mu _(y))(\sigma _(y)))\desno))
    • ρ = (1 3) ∗ (\displaystyle \rho =\lijevo((\frac (1)(3))\desno)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\desno)*\lijevo((\frac (1-4)(2,58))\desno)+\lijevo((\frac (2-3)(1,83))\desno) *\lijevo((\ frac (3-4)(2.58))\desno))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\desno)*\lijevo((\frac (5-4)(2,58))\desno)+\lijevo((\frac (5-3)(1,83))\ desno)*\lijevo( (\frac (7-4)(2,58))\desno))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4,721))\desno))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\lijevo((\frac (1)(3))\desno)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\lijevo((\frac (2,965)(3))\desno))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  2. Analizirajte rezultat. U našem primjeru koeficijent korelacije je 0,988. Ova vrijednost na neki način karakterizira ovaj skup parova brojeva. Obratite pozornost na predznak i veličinu vrijednosti.

    • Budući da je vrijednost koeficijenta korelacije pozitivna, postoji pozitivna korelacija između varijabli “x” i “y”. To jest, kako se vrijednost "x" povećava, vrijednost "y" također raste.
    • Budući da je vrijednost koeficijenta korelacije vrlo blizu +1, vrijednosti varijabli "x" i "y" su međusobno visoko povezane. Ako iscrtate točke na koordinatnoj ravnini, one će se nalaziti blizu određene ravne crte.

    Korištenje online kalkulatora za izračun koeficijenta korelacije

    1. Pronađite na internetu kalkulator za izračun koeficijenta korelacije. Ovaj koeficijent se često računa u statistici. Ako postoji mnogo parova brojeva, gotovo je nemoguće ručno izračunati koeficijent korelacije. Stoga postoje online kalkulatori za izračun koeficijenta korelacije. U tražilicu upišite “kalkulator koeficijenta korelacije” (bez navodnika).

      Unesite podatke. Pregledajte upute na web stranici kako biste bili sigurni da ste ispravno unijeli podatke (parove brojeva). Iznimno je važno unijeti odgovarajuće parove brojeva; inače ćete dobiti netočan rezultat. Zapamtite da različite web stranice imaju različite formate unosa podataka.

      • Na primjer, na web stranici http://ncalculators.com/statistics/correlation-coefficient-calculator.htm vrijednosti varijabli "x" i "y" unose se u dva vodoravna retka. Vrijednosti su odvojene zarezima. To jest, u našem primjeru, vrijednosti "x" se unose ovako: 1,2,4,5, a vrijednosti "y" ovako: 1,3,5,7.
      • Na drugom mjestu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, podaci se unose okomito; u ovom slučaju nemojte brkati odgovarajuće parove brojeva.
    2. Izračunajte koeficijent korelacije. Nakon unosa podataka jednostavno kliknite gumb “Izračunaj”, “Izračunaj” ili sličan gumb kako biste dobili rezultat.

    Korištenje grafičkog kalkulatora

    1. Unesite podatke. Uzmite grafički kalkulator, idite u statistički mod i odaberite naredbu Uredi.

      • Različiti kalkulatori zahtijevaju različite pritiske na tipke. Ovaj članak govori o kalkulatoru Texas Instruments TI-86.
      • Za prebacivanje na način statističkog izračuna pritisnite – Stat (iznad tipke “+”). Zatim pritisnite F2 – Uredi.
    2. Izbrišite prethodno spremljene podatke. Većina kalkulatora pohranjuje statistike koje unesete dok ih ne izbrišete. Kako biste izbjegli brkanje starih podataka s novim podacima, prvo izbrišite sve pohranjene podatke.

      • Koristite tipke sa strelicama za pomicanje kursora i označavanje naslova "xStat". Zatim pritisnite Clear i Enter kako biste uklonili sve vrijednosti unesene u stupac xStat.
      • Pomoću tipki sa strelicama označite naslov "yStat". Zatim pritisnite Clear i Enter za brisanje svih vrijednosti unesenih u stupac yStat.
    3. Unesite početne podatke. Pomoću tipki sa strelicama pomaknite kursor na prvu ćeliju pod naslovom "xStat". Unesite prvu vrijednost i pritisnite Enter. Na dnu ekrana će se prikazati “xStat (1) = __” gdje će se umjesto razmaka pojaviti unesena vrijednost. Nakon što pritisnete Enter, unesena vrijednost će se pojaviti u tablici, a kursor će se pomaknuti u sljedeći redak; ovo će prikazati "xStat (2) = __" na dnu ekrana.

      • Unesite sve vrijednosti za varijablu "x".
      • Nakon što unesete sve vrijednosti za varijablu x, koristite tipke sa strelicama za pomicanje na stupac yStat i unesite vrijednosti za varijablu y.
      • Nakon što ste unijeli sve parove brojeva, pritisnite Exit za brisanje zaslona i izlaz iz moda statističkog izračuna.

Različiti znakovi mogu biti povezani jedni s drugima.

Između njih postoje 2 vrste veza:

  • funkcionalan;
  • poveznica.

Poveznica prevedeno na ruski nije ništa drugo nego veza.
U slučaju korelacijske veze, može se pratiti korespondencija nekoliko vrijednosti jedne karakteristike s nekoliko vrijednosti druge karakteristike. Kao primjere možemo uzeti u obzir utvrđene korelacije između:

  • duljina šapa, vrata i kljunova ptica kao što su čaplje, ždralovi i rode;
  • pokazatelji tjelesne temperature i otkucaja srca.

Za većinu biomedicinskih procesa prisutnost ove vrste veze je statistički dokazana.

Statističke metode omogućuju utvrđivanje činjenice postojanja međuovisnosti karakteristika. Korištenje posebnih izračuna za to dovodi do utvrđivanja korelacijskih koeficijenata (mjera povezanosti).

Takvi izračuni nazivaju se korelacijska analiza. Provodi se kako bi se potvrdila međusobna ovisnost 2 varijable (slučajne varijable), koja se izražava koeficijentom korelacije.

Korištenje metode korelacije omogućuje vam rješavanje nekoliko problema:

  • utvrditi postojanje odnosa između analiziranih parametara;
  • znanje o prisutnosti korelacije omogućuje nam rješavanje problema predviđanja. Dakle, postoji stvarna prilika da se predvidi ponašanje parametra na temelju analize ponašanja drugog korelirajućeg parametra;
  • provođenje klasifikacije na temelju odabira značajki neovisnih jedna o drugoj.

Za varijable:

  • u odnosu na ordinalnu ljestvicu izračunava se Spearmanov koeficijent;
  • vezan uz intervalnu ljestvicu – Pearsonov koeficijent.

Ovo su najčešće korišteni parametri, osim njih postoje i drugi.

Vrijednost koeficijenta može biti izražena pozitivno ili negativno.

U prvom slučaju, kako se povećava vrijednost jedne varijable, uočava se porast druge. Ako je koeficijent negativan, obrazac je obrnut.

Čemu služi koeficijent korelacije?

Slučajne varijable povezane jedna s drugom mogu imati potpuno različite prirode te veze. Neće nužno biti funkcionalan, u slučaju kada se može pratiti izravan odnos između količina. Najčešće na obje veličine utječe čitav niz različitih čimbenika; u slučajevima kada su zajednički objema veličinama, uočava se stvaranje povezanih obrazaca.

To znači da statistički dokazana činjenica o postojanju odnosa između veličina ne potvrđuje da je utvrđen uzrok uočenih promjena. U pravilu, istraživač zaključuje da postoje dvije međusobno povezane posljedice.

Svojstva koeficijenta korelacije

Ova statistička karakteristika ima sljedeća svojstva:

  • vrijednost koeficijenta se kreće od -1 do +1. Što su bliže ekstremnim vrijednostima, jača je pozitivna ili negativna veza između linearnih parametara. U slučaju nulte vrijednosti, govorimo o nepostojanju korelacije između obilježja;
  • pozitivna vrijednost koeficijenta pokazuje da ako se poveća vrijednost jednog obilježja, uočava se porast drugog (pozitivna korelacija);
  • negativna vrijednost – u slučaju porasta vrijednosti jednog obilježja uočava se pad drugog (negativna korelacija);
  • približavanje vrijednosti indikatora ekstremnim točkama (bilo -1 ili +1) ukazuje na prisutnost vrlo snažnog linearnog odnosa;
  • pokazatelji karakteristike mogu se mijenjati dok vrijednost koeficijenta ostaje nepromijenjena;
  • koeficijent korelacije je bezdimenzijska veličina;
  • prisutnost korelacije ne mora nužno potvrditi uzročno-posljedičnu vezu.

Vrijednosti koeficijenata korelacije

Snaga korelacije može se okarakterizirati pribjegavanjem Cheldockovoj ljestvici, u kojoj određena numerička vrijednost odgovara kvalitativnoj karakteristici.

U slučaju pozitivne korelacije s vrijednošću:

  • 0-0,3 – korelacija je vrlo slaba;
  • 0,3-0,5 – slabo;
  • 0,5-0,7 – srednja čvrstoća;
  • 0,7-0,9 – visoka;
  • 0,9-1 – vrlo visoka snaga korelacije.

Ljestvica se također može koristiti za negativnu korelaciju. U ovom slučaju, kvalitativne karakteristike zamjenjuju se suprotnim.

Možete koristiti pojednostavljenu Cheldockovu ljestvicu koja razlikuje samo 3 stupnja jakosti korelacije:

  • vrlo jaki - pokazatelji ±0,7 - ±1;
  • prosjek - pokazatelji ±0,3 - ±0,699;
  • vrlo slab - pokazatelji 0 - ±0,299.

Ovaj statistički pokazatelj omogućuje ne samo testiranje pretpostavke o postojanju linearnog odnosa između karakteristika, već i utvrđivanje njegove snage.

Vrste koeficijenata korelacije

Koeficijenti korelacije mogu se klasificirati prema predznaku i vrijednosti:

  • pozitivan;
  • ništavan;
  • negativan.

Ovisno o analiziranim vrijednostima izračunava se koeficijent:

  • Pearson;
  • Kopljanik;
  • Kendal;
  • Fechnerovi znakovi;
  • podudarnost ili višestruka korelacija ranga.

Pearsonov koeficijent korelacije koristi se za uspostavljanje izravnih odnosa između apsolutnih vrijednosti varijabli. U tom slučaju, distribucije obje serije varijabli trebale bi se približiti normalnim. Uspoređivane varijable moraju se razlikovati u istom broju različitih karakteristika. Ljestvica koja predstavlja varijable mora biti skala intervala ili omjera.

  • točno utvrđivanje snage korelacije;
  • usporedba kvantitativnih karakteristika.

Korištenje linearnog Pearsonovog koeficijenta korelacije ima nekoliko nedostataka:

  • metoda je nestabilna u slučaju ekstremnih brojčanih vrijednosti;
  • Ovom metodom moguće je odrediti snagu korelacije samo za linearni odnos, a za ostale vrste međusobnih odnosa varijabli treba koristiti metode regresijske analize.

Korelacija ranga određena je Spearmanovom metodom, koja omogućuje statističko proučavanje odnosa između pojava. Zahvaljujući ovom koeficijentu izračunava se stvarni stupanj paralelnosti dva kvantitativno izražena niza obilježja, te procjenjuje čvrstoća identificirane povezanosti.

  • ne zahtijevaju precizno određivanje vrijednosti korelacijske sile;
  • uspoređeni pokazatelji imaju i kvantitativno i atributivno značenje;
  • usporedba nizova karakteristika s otvorenim varijantama vrijednosti.

Spearmanova metoda je neparametarska metoda analize, tako da nema potrebe provjeravati normalnost distribucije neke karakteristike. Osim toga, omogućuje vam usporedbu pokazatelja izraženih u različitim ljestvicama. Primjerice, usporedba broja crvenih krvnih zrnaca u određenom volumenu krvi (kontinuirana ljestvica) i stručne ocjene izražene u bodovima (redna ljestvica).

Na učinkovitost metode negativno utječe velika razlika između vrijednosti uspoređivanih veličina. Metoda također nije učinkovita u slučajevima kada izmjerenu vrijednost karakterizira neravnomjerna raspodjela vrijednosti.

Korak po korak izračunavanje koeficijenta korelacije u Excelu

Izračunavanje koeficijenta korelacije uključuje sekvencijalno izvođenje niza matematičkih operacija.

Gornja formula za izračun Pearsonovog koeficijenta pokazuje koliko je ovaj proces zahtjevan ako se izvodi ručno.
Korištenje mogućnosti Excela značajno ubrzava proces pronalaženja koeficijenta.

Dovoljno je slijediti jednostavan algoritam radnji:

  • unos osnovnih podataka - stupac od x vrijednosti i stupac od y vrijednosti;
  • u alatima odaberite i otvorite karticu "Formule";
  • na kartici koja se otvori odaberite "Umetni fx funkciju";
  • u dijaloškom okviru koji se otvori odaberite statističku funkciju “Corel” koja vam omogućuje izračun koeficijenta korelacije između 2 skupa podataka;
  • u prozor koji se otvori unesite podatke: niz 1 – raspon vrijednosti stupca x (podaci moraju biti odabrani), niz 2 – raspon vrijednosti stupca y;
  • pritisne se tipka "ok", rezultat izračuna koeficijenta pojavljuje se u retku "vrijednost";
  • zaključak o prisutnosti korelacije između 2 skupa podataka i njezine snage.

Koeficijent korelacije je stupanj povezanosti između dvije varijable. Njegov izračun daje ideju o tome postoji li odnos između dva skupa podataka. Za razliku od regresije, korelacija ne predviđa vrijednosti količina. Međutim, izračun koeficijenta važan je korak u preliminarnoj statističkoj analizi. Na primjer, utvrdili smo da je korelacijski koeficijent između razine izravnih stranih ulaganja i stope rasta BDP-a visok. To nam daje ideju da je za osiguranje prosperiteta potrebno stvoriti povoljnu klimu upravo za strane poduzetnike. Na prvi pogled nije tako očit zaključak!

Korelacija i uzročnost

Možda ne postoji niti jedno područje statistike koje je postalo tako čvrsto utemeljeno u našim životima. Koeficijent korelacije koristi se u svim područjima društvenog znanja. Njegova glavna opasnost je što se o njegovim visokim vrijednostima često špekulira kako bi se ljudi uvjerili i natjerali da vjeruju u neke zaključke. Međutim, zapravo, jaka korelacija uopće ne ukazuje na uzročno-posljedičnu vezu između količina.

Koeficijent korelacije: Pearsonova i Spearmanova formula

Postoji nekoliko osnovnih pokazatelja koji karakteriziraju odnos između dviju varijabli. Povijesno gledano, prvi je Pearsonov koeficijent linearne korelacije. To se uči u školi. Razvili su ga K. Pearson i J. Yule na temelju djela Fr. Galton. Ovaj koeficijent vam omogućuje da vidite odnos između racionalnih brojeva koji se racionalno mijenjaju. Uvijek je veći od -1 i manji od 1. Negativan broj označava obrnuto proporcionalni odnos. Ako je koeficijent nula, tada nema veze između varijabli. Jednak pozitivnom broju - postoji izravno proporcionalan odnos između količina koje se proučavaju. Spearmanov koeficijent korelacije ranga omogućuje vam da pojednostavite izračune izgradnjom hijerarhije vrijednosti varijabli.

Odnosi između varijabli

Korelacija pomaže odgovoriti na dva pitanja. Prvo, je li odnos između varijabli pozitivan ili negativan. Drugo, koliko je jaka ovisnost. Korelacijska analiza moćan je alat koji može pružiti ove važne informacije. Lako je vidjeti da obiteljski prihodi i rashodi proporcionalno padaju i rastu. Ovaj odnos se smatra pozitivnim. Naprotiv, kada cijena nekog proizvoda raste, potražnja za njim pada. Taj se odnos naziva negativnim. Vrijednosti koeficijenta korelacije kreću se između -1 i 1. Nula znači da ne postoji odnos između vrijednosti koje se proučavaju. Što je dobiveni pokazatelj bliži ekstremnim vrijednostima, odnos je jači (negativan ili pozitivan). Odsutnost ovisnosti označava se koeficijentom od -0,1 do 0,1. Morate razumjeti da takva vrijednost samo ukazuje na odsutnost linearnog odnosa.

Značajke primjene

Korištenje obaju pokazatelja uključuje određene pretpostavke. Prvo, prisutnost jake veze ne određuje činjenicu da jedna količina određuje drugu. Moguće je da postoji treća veličina koja definira svaku od njih. Drugo, visok Pearsonov koeficijent korelacije ne ukazuje na uzročno-posljedičnu vezu između proučavanih varijabli. Treće, pokazuje isključivo linearan odnos. Korelacija se može koristiti za procjenu značajnih kvantitativnih podataka (npr. barometarski tlak, temperatura zraka) umjesto kategorija kao što su spol ili omiljena boja.

Koeficijent višestruke korelacije

Pearson i Spearman ispitivali su odnos između dviju varijabli. Ali što učiniti ako ih je troje ili čak više. Tu u pomoć dolazi višestruki koeficijent korelacije. Na primjer, na bruto nacionalni proizvod utječu ne samo izravna strana ulaganja, već i monetarna i fiskalna politika vlade, kao i razina izvoza. Stopa rasta i obujam BDP-a rezultat su međudjelovanja niza čimbenika. Međutim, mora se razumjeti da se model višestruke korelacije temelji na nizu pojednostavljenja i pretpostavki. Prvo, multikolinearnost između vrijednosti je isključena. Drugo, odnos između ovisne i varijabli koje utječu na nju smatra se linearnom.

Područja primjene korelacijske i regresijske analize

Ova metoda pronalaženja odnosa između veličina široko se koristi u statistici. Najčešće se pribjegava u tri glavna slučaja:

  1. Za testiranje uzročno-posljedičnih odnosa između vrijednosti dviju varijabli. Kao rezultat toga, istraživač se nada otkriti linearni odnos i izvesti formulu koja opisuje te odnose između količina. Njihove mjerne jedinice mogu biti različite.
  2. Za provjeru odnosa između količina. U ovom slučaju nitko ne određuje koja je varijabla zavisna varijabla. Može se pokazati da neki drugi faktor određuje vrijednost obiju veličina.
  3. Za izvođenje jednadžbe U ovom slučaju možete jednostavno zamijeniti brojeve u njega i saznati vrijednosti nepoznate varijable.

Čovjek u potrazi za uzročno-posljedičnom vezom

Svijest je dizajnirana na takav način da svakako trebamo objasniti događaje koji se događaju oko nas. Čovjek uvijek traži vezu između slike svijeta u kojem živi i informacija koje prima. Mozak često stvara red iz kaosa. On lako vidi uzročno-posljedičnu vezu tamo gdje je nema. Znanstvenici moraju posebno naučiti prevladati ovu tendenciju. Sposobnost objektivne procjene odnosa između podataka ključna je u akademskoj karijeri.

Medijska pristranost

Razmotrimo kako se prisutnost korelacije može pogrešno protumačiti. Skupinu britanskih učenika s lošim ponašanjem upitali su puše li im roditelji. Zatim je test objavljen u novinama. Rezultati su pokazali jaku korelaciju između pušenja roditelja i delinkvencije njihove djece. Profesor koji je proveo ovu studiju čak je predložio da se na kutije cigareta stavi upozorenje o tome. Međutim, postoji niz problema s ovim zaključkom. Prvo, korelacija ne pokazuje koja je od veličina nezavisna. Stoga je sasvim moguće pretpostaviti da je štetna navika roditelja uzrokovana neposlušnošću djece. Drugo, ne može se sa sigurnošću reći da oba problema nisu nastala zbog nekog trećeg faktora. Na primjer, obitelji s niskim primanjima. Vrijedno je istaknuti emocionalni aspekt prvih nalaza profesora koji je proveo istraživanje. Bio je gorljivi protivnik pušenja. Stoga ne čudi što je rezultate svojih istraživanja tumačio na ovaj način.

zaključke

Pogrešno tumačenje korelacije kao uzročno-posljedične veze između dviju varijabli može uzrokovati sramotne pogreške u istraživanju. Problem je u tome što leži u samoj osnovi ljudske svijesti. Mnogi marketinški trikovi temelje se na ovoj značajci. Razumijevanje razlike između uzroka i posljedice te korelacije omogućuje vam racionalnu analizu informacija kako u svakodnevnom životu tako iu profesionalnoj karijeri.

7.3.1. Koeficijenti korelacije i determinacije. Može se kvantificirati bliskost komunikacije između faktora i njegovih usredotočenost(izravno ili obrnuto), računajući:

1) ako je potrebno utvrditi linearni odnos između dva faktora, - parni koeficijent korelacije: u 7.3.2 i 7.3.3 operacije izračuna uparenog linearnog koeficijenta korelacije prema Bravais–Pearsonu ( r) i upareni Spearmanov koeficijent korelacije ranga ( r);

2) ako želimo odrediti odnos između dva faktora, ali je taj odnos očito nelinearan, tada korelacijski odnos ;

3) ako želimo utvrditi odnos između jednog faktora i određenog skupa drugih faktora, tada (ili, što je isto, "koeficijent višestruke korelacije");

4) ako želimo identificirati izolirano vezu samo jednog čimbenika s određenim drugim, uključenim u skupinu čimbenika koji utječu na prvi, za što moramo smatrati utjecaj svih ostalih čimbenika nepromijenjenim - tada parcijalni koeficijent korelacije .

Bilo koji koeficijent korelacije (r, r) ne može premašiti 1 u apsolutnoj vrijednosti, odnosno –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Predznak koeficijenta korelacije određuje smjer odnosa: znak “+” (ili bez znaka) znači da je odnos ravno (pozitivan), znak “–” znači da je veza obrnuti (negativan). Znak nema nikakve veze s blizinom veze

Koeficijent korelacije karakterizira statistički odnos. Ali često je potrebno utvrditi drugu vrstu ovisnosti, naime: koliki je doprinos određenog faktora formiranju drugog faktora koji je s njim povezan. Ova vrsta ovisnosti je, uz određeni stupanj konvencije, karakterizirana koeficijent odlučnosti (D ), određeno formulom D = r 2 ´100% (gdje je r Bravais–Pearsonov koeficijent korelacije, vidi 7.3.2). Ako su mjerenja obavljena u ljestvica reda (ljestvica poretka), tada uz određenu štetu pouzdanosti, umjesto vrijednosti r, možete zamijeniti vrijednost r (Spearmanov koeficijent korelacije, vidi 7.3.3) u formulu.

Na primjer, ako smo kao karakteristiku ovisnosti faktora B o faktoru A dobili korelacijski koeficijent r = 0,8 ili r = –0,8, tada je D = 0,8 2 ´100% = 64%, odnosno oko 2 ½ 3. Prema tome, doprinos faktora A i njegovih promjena stvaranju faktora B je približno 2 ½ 3 od ukupnog doprinosa svih faktora općenito.

7.3.2. Bravais-Pearsonov koeficijent korelacije. Postupak za izračunavanje Bravais–Pearson koeficijenta korelacije ( r ) može se koristiti samo u slučajevima kada se odnos razmatra na temelju uzoraka koji imaju normalnu distribuciju frekvencije ( normalna distribucija ) i dobivena mjerenjima na intervalnim ili omjernim ljestvicama. Formula za izračun ovog korelacijskog koeficijenta je:



å ( x ja – )( g ja – )

r = .

n×s x ×s y

Što pokazuje koeficijent korelacije? Prvo, predznak koeficijenta korelacije pokazuje smjer odnosa, i to: znak “–” označava da je odnos obrnuti, ili negativan(postoji tendencija: s smanjenjem vrijednosti jednog faktora, odgovarajuće vrijednosti drugog faktora rastu, a s porastom se smanjuju), a nepostojanje znaka ili znaka "+" označava ravno, ili pozitivan veze (postoji tendencija: porastom vrijednosti jednog faktora rastu vrijednosti drugog, a smanjenjem se smanjuju). Drugo, apsolutna (o predznaku neovisna) vrijednost koeficijenta korelacije ukazuje na bliskost (snagu) veze. Općenito je prihvaćeno (prilično proizvoljno): za vrijednosti r< 0,3 корреляция vrlo slaba, često se jednostavno ne uzima u obzir, na 0,3 £ r< 5 корреляция slab, po 0,5 £ r< 0,7) - prosjek, po 0,7 £ r 0,9 £) - snažna i konačno, za r > 0,9 - vrlo jak. U našem slučaju (r » 0,83) odnos je inverzan (negativan) i jak.

Podsjetimo: vrijednosti koeficijenta korelacije mogu biti u rasponu od –1 do +1. Ako vrijednost r prelazi ove granice, to znači da u izračunima napravljena je greška . Ako r= 1, to znači da povezanost nije statistička, već funkcionalna - što se praktički nikad ne događa u sportu, biologiji ili medicini. Iako je uz mali broj mjerenja moguć slučajni odabir vrijednosti koji daje sliku funkcionalne povezanosti, takav je slučaj manje vjerojatan, što je veći volumen uspoređivanih uzoraka (n), odnosno broj parova uspoređivanih mjerenja.

Tablica za izračun (tablica 7.1) konstruirana je prema formuli.

Tablica 7.1.

Tablica izračuna za Bravais–Pearson izračune

x i y i (x ja – ) (x i – ) 2 (g ja – ) (g i – ) 2 (x ja – )( g ja – )
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i =137 =13,00 åy i =56,1 =5,1 å( x i – ) 2 = =1,78 å( g i – ) 2 = = 1,015 å( x ja – )( g i – )= = –1.24

Jer s x = ï ï = ï ï» 0,42, a

s y = ï ï» 0,32, r" –1,24ï (11´0,42´0,32) » –1,24ï 1,48 » –0,83 .

Drugim riječima, morate vrlo čvrsto znati da je koeficijent korelacije Ne možete prelazi 1,0 u apsolutnoj vrijednosti. To vam često omogućuje da izbjegnete grube pogreške, ili točnije, da pronađete i ispravite pogreške nastale tijekom izračuna.

7.3.3. Spearmanov koeficijent korelacije. Kao što je već spomenuto, Bravais-Pearsonov koeficijent korelacije (r) može se koristiti samo u slučajevima kada su analizirani čimbenici blizu normalne raspodjele frekvencije, a varijantne vrijednosti dobivene su mjerenjima nužno na skali omjera ili na intervalnoj skali , što se događa ako su izražene fizičke jedinice. U drugim slučajevima nalazi se Spearmanov koeficijent korelacije ( r). Međutim, ovaj koeficijent Limenka primijeniti u slučajevima kada je to dopušteno (i poželjno ! ) primijeniti Bravais-Pearsonov koeficijent korelacije. Ali treba imati na umu da postupak određivanja koeficijenta po Bravais-Pearsonu ima viša sila (“razrješavanje sposobnost"), Zato r informativniji od r. Čak i s velikim n odstupanje r može biti reda veličine ±10%.

Tablica 7.2 Formula za izračun koeficijenta

x i y i R x R y |d R | d R 2 Spearmanova korelacija

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 koristimo se našim primjerom

12,7 5,10 4,5 6,5 2,0 4,00 za izračun r, ali mi ćemo graditi

12,5 5,40 3,0 9,0 6,0 36,00 drugi stol (tablica 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Zamijenimo vrijednosti:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Vidimo: r pokazalo se malo

12,4 5,60 2,0 11,0 9,0 81,00 više od r, ali ovo je drugačije

12,3 5,50 1,0 10,0 9,0 81,00 što nije jako veliko. Uostalom, kada

12,7 5,20 4,5 8,0 3,5 12,25 tako mali n vrijednosti r I r

åd R 2 = 423 vrlo su približne, nisu baš pouzdane, njihova stvarna vrijednost može jako varirati, tako da razlika r I r na 0,1 je beznačajno. Običnorsmatrati analognimr , ali samo manje točne. Znakovi kada r I r pokazuje smjer veze.

7.3.4. Primjena i provjera pouzdanosti korelacijskih koeficijenata. Utvrđivanje stupnja korelacije između čimbenika nužno je za kontrolu razvoja čimbenika koji nam je potreban: da bismo to učinili, moramo utjecati na druge čimbenike koji značajno utječu na njega, a moramo znati i opseg njihove učinkovitosti. Potrebno je znati o odnosu između čimbenika kako bi se razvili ili odabrali gotovi testovi: informacijski sadržaj testa određen je korelacijom njegovih rezultata s manifestacijama karakteristike ili svojstva koje nas zanima. Bez poznavanja korelacija nemoguć je svaki oblik selekcije.

Gore je navedeno da je u sportu i općenito u pedagoškoj, medicinskoj, pa i ekonomskoj i sociološkoj praksi određivanje onoga što doprinos , koji jedan faktor doprinosi formiranju drugog. To je zbog činjenice da, pored faktora-uzroka koji se razmatra, cilj(čimbenik koji nas zanima) djelovati, dajući svaki tome jedan ili onaj doprinos, i drugi.

Smatra se da mjera doprinosa svakog čimbenika-uzroka može biti koeficijent odlučnosti D i = r 2 ´100%. Tako, na primjer, ako je r = 0,6, tj. odnos između faktora A i B je prosječan, tada je D = 0,6 2 ´100% = 36%. Znajući, dakle, da je doprinos faktora A stvaranju faktora B približno 1 ½ 3, možete, na primjer, posvetiti približno 1 ciljanom razvoju ovog faktora ½ 3 puta treninga. Ako je koeficijent korelacije r = 0,4, tada je D = r 2 100% = 16%, odnosno približno 1 ½ 6 je više od dva puta manje, i prema ovoj logici, prema ovoj logici, samo 1 treba posvetiti njegovom razvoju ½ 6. dio vremena treninga.

Vrijednosti D i za različite značajne čimbenike daju približnu predodžbu o kvantitativnom odnosu njihovih utjecaja na ciljni čimbenik koji nas zanima, radi čijeg poboljšanja, zapravo, radimo na drugim čimbenicima (npr. trčeći skakač u dalj radi na povećanju brzine svog sprinta, pa kako je to faktor koji daje najznačajniji doprinos formiranju rezultata u skoku).

Prisjetite se tog definiranja D možda umjesto toga r staviti r, iako se, naravno, ispostavlja da je točnost određivanja manja.

Na temelju selektivno koeficijent korelacije (izračunat iz uzorka podataka), ne može se izvući zaključak o pouzdanosti činjenice da općenito postoji povezanost između faktora koji se razmatraju. Da bi se napravio takav zaključak s različitim stupnjevima valjanosti, standard kriteriji značajnosti korelacije. Njihova uporaba pretpostavlja linearni odnos između faktora i normalna distribucija frekvencije u svakoj od njih (što znači ne selektivnu, već njihovu opću zastupljenost).

Možete, na primjer, koristiti Studentove t-testove. Njegov dis-

čak formula: tp= –2 , gdje je k koeficijent korelacije uzorka koji se proučava, a n- volumen uspoređivanih uzoraka. Rezultirajuća izračunata vrijednost t-kriterija (t p) uspoređuje se s tablicom na razini značajnosti koju smo odabrali i broju stupnjeva slobode n = n – 2. Da biste se riješili računskog rada, možete koristiti poseban stol kritične vrijednosti koeficijenata korelacije uzorka(vidi gore), što odgovara prisutnosti pouzdane veze između čimbenika (uzimajući u obzir n I a).

Tablica 7.3.

Granične vrijednosti za pouzdanost koeficijenta korelacije uzorka

Broj stupnjeva slobode pri određivanju korelacijskih koeficijenata uzima se jednak 2 (tj. n= 2) Navedeno u tablici. 7.3 vrijednosti imaju donju granicu intervala pouzdanosti pravi koeficijent korelacije je 0, odnosno s takvim vrijednostima ne može se tvrditi da korelacija uopće postoji. Ako je vrijednost koeficijenta korelacije uzorka veća od one navedene u tablici, može se na odgovarajućoj razini značajnosti pretpostaviti da pravi koeficijent korelacije nije jednak nuli.

Ali odgovor na pitanje postoji li stvarna povezanost između razmatranih čimbenika ostavlja prostora za drugo pitanje: u kojem se intervalu pravo značenje koeficijent korelacije, kakav zapravo može biti, za beskonačno velik n? Ovaj interval za bilo koju određenu vrijednost r I n mogu se izračunati usporedivi faktori, ali je praktičnije koristiti sustav grafikona ( nomogram), gdje je svaki par krivulja konstruiran za neke navedene iznad njih n, odgovara granicama intervala.

Riža. 7.4. Granice pouzdanosti koeficijenta korelacije uzorka (a = 0,05). Svaka krivulja odgovara onoj naznačenoj iznad nje n.

Pozivajući se na nomogram na sl. 7.4, moguće je odrediti interval vrijednosti stvarnog koeficijenta korelacije za izračunate vrijednosti koeficijenta korelacije uzorka pri a = 0,05.

7.3.5. Korelacijski odnosi. Ako je korelacija u paru nelinearni, nemoguće je izračunati koeficijent korelacije, odrediti korelacijski odnosi . Obavezni zahtjev: karakteristike se moraju mjeriti na skali omjera ili na intervalnoj skali. Možete izračunati korelacijsku ovisnost faktora x od faktora Y i korelacijske ovisnosti faktora Y od faktora x- razlikuju se. Za mali volumen n razmatranih uzoraka koji predstavljaju faktore, za izračun korelacijskih odnosa možete koristiti formule:

omjer korelacije h x½y= ;

korelacijski odnos h y ½ x= .

Ovdje i su aritmetičke sredine uzoraka X i Y, i - unutarrazredni aritmetički prosjeci. Odnosno, aritmetička sredina onih vrijednosti u uzorku faktora X s kojima identične vrijednosti su konjugirane u uzorku faktora Y (na primjer, ako u faktoru X postoje vrijednosti 4, 6 i 5, s kojima su u uzorku faktora Y povezane 3 opcije s istom vrijednošću 9, tada = (4+ 6+5) ½ 3 = 5). Sukladno tome, to je aritmetička sredina onih vrijednosti u uzorku faktora Y, koje su povezane s istim vrijednostima u uzorku faktora X. Navedimo primjer i izvršimo izračun:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tablica 7.4

Tablica za izračun

x i y i x y x i – x (x i – x) 2 x i – x y (x ix y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Stoga je h y ½ x= "0,63.

7.3.6. Parcijalni i višestruki koeficijenti korelacije. Za procjenu ovisnosti između 2 čimbenika, pri izračunavanju koeficijenata korelacije, prema zadanim postavkama pretpostavljamo da nijedan drugi čimbenik nema utjecaja na ovu ovisnost. U stvarnosti to nije slučaj. Dakle, na odnos između težine i visine vrlo značajno utječu kalorijski unos, količina sustavne tjelesne aktivnosti, nasljeđe itd. Kada je potrebno pri procjeni odnosa između 2 faktora uzeti u obzir značajan utjecaj druge čimbenike i istovremeno se, tako reći, izolirati od njih, smatrajući ih nepromijenjenima, izračunati privatna (inače - djelomičan ) korelacijski koeficijenti.

Primjer: trebamo procijeniti uparene ovisnosti između 3 značajno aktivna faktora X, Y i Z. Označimo r XY (Z) parcijalni koeficijent korelacije između faktora X i Y (u ovom slučaju se vrijednost faktora Z smatra nepromijenjenom), r ZX (Y) - parcijalni koeficijent korelacije između faktora Z i X (uz konstantnu vrijednost faktora Y), r YZ (X) - parcijalni koeficijent korelacije između faktora Y i Z (uz konstantnu vrijednost faktora X). Korištenje izračunatih jednostavnih uparenih (Bravais-Pearson) koeficijenata korelacije r XY, r XZ i r YZ, m

Parcijalne koeficijente korelacije možete izračunati pomoću formula:

r XY – r XZ´ r YZ r XZ – r XY´ r ZY r ZY –r ZX ´ r YZ

r XY(Z) = ; r XZ(Y) = ; r ZY(X) =

Ö(1– r 2 XZ) (1– r 2 YZ) Ö(1– r 2 XY)(1– r 2 ZY) Ö(1– r 2 ZX)(1– r 2 YX)

A parcijalni koeficijenti korelacije mogu imati vrijednosti od –1 do +1. Njihovim kvadriranjem dobivamo odgovarajuće kvocijente koeficijenti determinacije , također zvan privatne mjere izvjesnosti(pomnožite sa 100 i izrazite kao %%). Parcijalni koeficijenti korelacije razlikuju se više ili manje od koeficijenata jednostavnog (punog) para, što ovisi o jačini utjecaja 3. faktora (kao nepromijenjenog) na njih. Testira se nulta hipoteza (H 0), odnosno hipoteza o nepostojanju veze (ovisnosti) faktora X i Y (s ukupnim brojem predznaka k) izračunavanjem t-testa pomoću formule: t P = r XY (Z) ´ ( n–k) 1 ½ 2 ´ (1– r 2 XY (Z)) –1 ½ 2 .

Ako t R< t a n , hipoteza je prihvaćena (pretpostavljamo da ne postoji ovisnost), ali ako tt a n - hipoteza je opovrgnuta, odnosno vjeruje se da ovisnost stvarno postoji. t a n se uzima iz tablice t-Studentski test, i k- broj čimbenika koji se uzimaju u obzir (u našem primjeru 3), broj stupnjeva slobode n= n – 3. Ostali parcijalni koeficijenti korelacije provjeravaju se na sličan način (u formuli umjesto r XY (Z) je supstituiran u skladu s tim r XZ(Y) ili r ZY(X)).

Tablica 7.5

Početni podaci

Ö (1 – 0,71 2) (1 – 0,71 2) Ö (1 – 0,5) (1 – 0,5)

Za procjenu ovisnosti faktora X o kombiniranom djelovanju nekoliko čimbenika (ovdje faktora Y i Z), izračunajte vrijednosti koeficijenata korelacije jednostavnih parova i pomoću njih izračunajte višestruki koeficijent korelacije r X (YZ) :

Ö r 2XY+ r 2 XZ – 2 r XY´ r XZ´ r YZ

r X(YZ) = .

Ö 1 – r 2 YZ

7.2.7. Koeficijent asocijacije.Često je potrebno kvantificirati odnos između kvaliteta znakovi, tj. takve karakteristike koje se ne mogu kvantitativno prikazati (okarakterizirati), koje neizmjeran. Na primjer, zadatak je otkriti postoji li odnos između sportske specijalizacije uključenih i takvih osobnih svojstava kao što su introvertiranost (fokusiranost ličnosti na fenomene vlastitog subjektivnog svijeta) i ekstrovertnost (fokusiranost ličnosti na svijet vanjski predmeti). Predstavljamo simbole u tablici. 7.6.

Tablica 7.6.

X (godine) Y (puta) Z (puta) X (godine) Y (puta) Z (puta)
Znak 1 Znak 2 Introvertnost Ekstrovertnost
Sportske igre A b
Gimnastika S d

Očito, brojevi kojima ovdje raspolažemo mogu biti samo frekvencije distribucije. U ovom slučaju izračunajte koeficijent asocijacije (drugo ime " koeficijent kontingencije "). Razmotrimo najjednostavniji slučaj: odnos između dva para obilježja, a izračunati koeficijent kontingencije naziva se tetrakorični (vidi tablicu).

Tablica 7.7.

a =20 b = 15 a + b = 35
s =15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Izračune vršimo pomoću formule:

ad – prije Krista 100 – 225 –123

Izračun koeficijenata asocijacije (kojugacijskih koeficijenata) s većim brojem karakteristika uključuje izračune pomoću slične matrice odgovarajućeg reda.