Coefficient of Determination (R²) | Betekenis & Voorbeelden (2024)

Vertaald op 5 juli 2022 door Veronique Scharwächter. Oorspronkelijk gepubliceerd door Shaun Turney

De determinatiecoëfficiënt (coefficient of determination) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen.

Determinatiecoëfficiënt (R²)Interpretatie
0Het model voorspelt de uitkomst niet.
Tussen 0 en 1Het model voorspelt de uitkomst gedeeltelijk.
1Het model voorspelt de uitkomst volledig.

De determinatiecoëfficiënt wordt meestal aangeduid met R², wat wordt uitgesproken als “r-kwadraat”. Bij een enkelvoudige lineaire regressie wordt in plaats van R² vaak een kleine letter r gebruikt (r²).

Inhoudsopgave

  1. Wat is de determinatiecoëfficiënt?
  2. De determinatiecoëfficiënt berekenen
  3. Determinatiecoëfficiënt interpreteren
  4. Determinatiecoëfficiënt rapporteren
  5. Valkuil van de determinatiecoëfficiënt
  6. Oefenvragen over de coefficient of determination
  7. Veelgestelde vragen over de coefficient of determination

Wat is de determinatiecoëfficiënt?

De determinatiecoëfficiënt of coefficient of determination (R²) meet in hoeverre een statistisch model in staat is een bepaalde uitkomst te voorspellen. De uitkomst wordt gerepresenteerd door de afhankelijke variabele van het model.

De laagst mogelijke waarde van R² is 0 en de hoogst mogelijke waarde is 1. In het kort gezegd: hoe beter een model is in het maken van voorspellingen, hoe dichter de determinatiecoëfficiënt bij het getal 1 zal liggen.

R² is een maatstaf voor de aansluiting van het model bij de daadwerkelijke uitkomst (goodness of fit). Het is de proportie (het deel) van variantie in de afhankelijke variabele die wordt verklaard door het model.

Stel je voor dat je een enkelvoudige lineaire regressie uitvoert die de examencijfers van studenten voorspelt (de afhankelijke variabele) op basis van de tijd die ze studeren voor het examen (de onafhankelijke variabele).
  • Als de R² gelijk is aan 0, dan is het lineaire regressiemodel niet in staat om de examencijfers beter te voorspellen dan simpelweg te schatten dat iedereen een gemiddeld examencijfer heeft behaald.
  • Als de R² tussen de 0 en 1 ligt, kan het model de examencijfers gedeeltelijk voorspellen. De voorspellingen van het model zijn niet perfect, maar in ieder geval beter dan wanneer je enkel het gemiddelde examencijfer zou gebruiken.
  • Als de R² gelijk is aan 1, kun je het model gebruiken om de examencijfers van iedereen perfect te voorspellen.

Als je de data van je lineaire regressie in een grafiek zet, kun je hieruit meestal afleiden of de R² hoog of laag is. De onderstaande grafieken zijn gebaseerd op voorbeelddata:

  • De observaties worden weergegeven als stippen.
  • De voorspellingen van het model (de lijn van de beste pasvorm) worden getoond als een zwarte lijn.
  • De afstand tussen de daadwerkelijke observaties en hun voorspelde waarde (de residuen) worden weergegeven als paarse lijnen.

Je kunt in de eerste dataset zien dat R² hoog is, en dat de observaties dan dicht bij de voorspellingen van het model liggen. In andere woorden: de meeste stippen liggen dicht bij de zwarte lijn:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (1)

De determinatiecoëfficiënt is altijd positief, zelfs als de correlatie negatief is.

Bij de tweede dataset kun je zien dat de R² laag is, en dat de observaties ver van de voorspellingen van het model verwijderd zijn. In andere woorden: de meeste stippen liggen ver van de zwarte lijn af:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (2)

Wie helpt jou met nakijken?

Betrouwbare hulptroepen vinden is niet makkelijk...

  • Familie
  • Vrienden
  • Studiegenoten
  • Scribbr

We staan altijd voor je klaar

Coefficient of Determination (R²) | Betekenis & Voorbeelden (3)

De determinatiecoëfficiënt berekenen

Je kunt kiezen tussen twee formules om de determinatiecoëfficiënt (R²) van een enkelvoudige lineaire regressie te berekenen.

  • De eerste formule is specifiek voor eenvoudige lineaire regressies
  • De tweede formule kan worden gebruikt om de R² van veel verschillende typen statistische modellen te berekenen.

Formule 1: De correlatiecoëfficiënt gebruiken

Coefficient of Determination (R²) | Betekenis & Voorbeelden (4)

Waarbij Coefficient of Determination (R²) | Betekenis & Voorbeelden (5) = de Pearson correlatiecoëfficiënt.

Je onderzoekt de relatie tussen de hartslag en leeftijd bij kinderen, en je ontdekt dat de twee variabelen een negatieve Pearson correlatie hebben:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (6)

Deze waarde kan worden gebruikt om aan de hand van Formule 1 de determinatiecoëfficiënt (R²) te berekenen:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (7)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (8)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (9)

Formule 2: De regressieresultaten gebruiken

Coefficient of Determination (R²) | Betekenis & Voorbeelden (10)

Waarbij:

  • RSS = som van de gekwadrateerde residuen (residual sum of squares)
  • TSS = totale kwadratensom (total sum of squares)
Als onderdeel van een enkelvoudige lineaire regressieanalyse waarin de examencijfers van studenten (afhankelijke variabele) worden voorspeld op basis van hun studietijd (onafhankelijke variabele), bereken je dat:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (11)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (12)

Deze waarden kunnen worden gebruikt om aan de hand van Formule 2 de determinatiecoëfficiënt (R²) te berekenen:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (13)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (14)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (15)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (16)

Determinatiecoëfficiënt interpreteren

Je kunt de determinatiecoëfficiënt (R²) interpreteren als de proportie van de variantie in de afhankelijke variabele die het statistisch model voorspelt.

Een andere manier om erover na te denken is dat de R² het deel van de variantie is dat de afhankelijke en onafhankelijke variabelen met elkaar delen.

Je kunt ook zeggen dat de R² de proportie van de variantie is die wordt “verklaard” of “verantwoord” door het statistisch model. Het deel dat overblijft (1 – R²) is dan de variantie die niet wordt verklaard door het model.

Als je wilt, kun je er ook voor kiezen om de R² te noteren als een percentage in plaats van een proportie. Dit doe je door de proportie te vermenigvuldigen met 100.

R² als effectgrootte

Als laatste zou je de R² ook kunnen interpreteren als een effectgrootte: dit is een maat voor de sterkte van de relatie tussen de afhankelijke en onafhankelijke variabelen. Psycholoog en statisticus Jacob Cohen (1988) heeft de volgende vuistregels opgesteld voor enkelvoudige lineaire regressies:

Minimale waarde van determinatiecoëfficiënt (R²)Interpretatie effectgrootte
.01Klein
.09Medium of middelgroot
.25Groot

Let op: de R² op zichzelf zegt niets over een oorzakelijk verband.

Een enkelvoudige lineaire regressie die de examencijfers van studenten (afhankelijke variabele) voorspelt aan de hand van de studietijd (onafhankelijke variabele) heeft een R² van .71. Deze R²-waarde vertelt ons dat:
  • 71% van de variantie in de examencijfers van de studenten kan worden voorspeld op basis van hun studietijd.
  • 29% van de variantie in de examencijfers van de studenten wordt niet verklaard door het model.
  • De tijd die de studenten studeren voor het examen heeft een groot effect op hun examencijfers.

Langer studeren kan mogelijk de oorzaak zijn van een verbetering in de cijfers van de studenten. Hoewel een causale relatie hier erg aannemelijk is, is de R² alleen niet in staat om ons te vertellen waarom er een relatie bestaat tussen de studietijd en de examencijfers van de studenten.

Studenten zouden studeren bijvoorbeeld ook minder frustrerend kunnen vinden als ze het lesmateriaal beter begrijpen, en daarom langer studeren.

Determinatiecoëfficiënt rapporteren

Als je besluit om de determinatiecoëfficiënt (R²) te gebruiken in je paper of scriptie, dien je deze te rapporteren in je onderzoeksresultaten. Je kunt de volgende regels gebruiken om statistieken te rapporteren in APA-stijl:

  • Gebruik “r²” voor statistische modellen met één onafhankelijke variabele (zoals enkelvoudige lineaire regressies). Gebruik “R²” voor statistische modellen met meerdere onafhankelijke variabelen.
  • Het is niet nodig om een referentie of formule toe te voegen, aangezien de determinatiecoëfficiënt een veelgebruikte statistiek is.
  • Cursiveer r² en R² wanneer je hun waarden rapporteert (maar cursiveer de 2 niet).
  • Voeg nooit een voorloopnul toe (een nul voor de decimale punt), want de determinatiecoëfficiënt kan niet groter zijn dan 1.
  • Achter de decimale punt dienen twee significante getallen te staan.
  • De determinatiecoëfficiënt wordt meestal gerapporteerd in combinatie met gerelateerde statistische resultaten, zoals de F-waarde, de vrijheidsgraden, en de p-waarde.
De examencijfers van studenten zijn voorspeld aan de hand van hun studietijd, r² = .71, F(1,32) = 7.33, p = .003

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Coefficient of Determination (R²) | Betekenis & Voorbeelden (17)Coefficient of Determination (R²) | Betekenis & Voorbeelden (18)

Scriptie nakijken op taal

Valkuil van de determinatiecoëfficiënt

Een belangrijke valkuil van de determinatiecoëfficiënt (R²) is dat een hoge of lage R² lijkt te bepalen of een model goed of slecht is. Dit is echter niet waar.

Als je in een lineaire regressieanalyse meer onafhankelijke variabelen toevoegt om de afhankelijke variabele te verklaren, zal de determinatiecoëfficiënt (R²) altijd toenemen, ook als de onafhankelijke variabelen helemaal geen verband houden met de afhankelijke variabele.

Dit komt doordat de determinatiecoëfficiënt het deel van de variantie in de afhankelijke variabele weergeeft dat wordt voorspeld door het model. Hoe meer onafhankelijke variabelen je toevoegt, hoe meer variantie er verklaard lijkt te worden.

Hierdoor kan de mate van verklaarbaarheid van het model overschat worden.

Daarom is de aangepaste determinatiecoëfficiënt (R2) ontwikkeld, die aantoont welk deel van de variantie in de afhankelijke variabele door alle onafhankelijke variabelen gezamenlijk wordt voorspeld door het model.

Oefenvragen over de coefficient of determination

Veelgestelde vragen over de coefficient of determination

Wat is de definitie van de determinatiecoëfficiënt (R²)?

De determinatiecoëfficiënt (R²) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen. Je kunt de R² interpreteren als de proportie (het deel) van de variantie in de afhankelijke variabele die wordt voorspeld door het statistisch model.

Wat is de formule voor de determinatiecoëfficiënt?

Er zijn twee formules die je kan gebruiken om de determinatiecoëfficiënt (R²) van een enkelvoudige lineaire regressie te berekenen.

Formule 1: Coefficient of Determination (R²) | Betekenis & Voorbeelden (19)

Formule 2: Coefficient of Determination (R²) | Betekenis & Voorbeelden (20)

Hoe bereken ik de determinatiecoëfficiënt (R²) in softwareprogramma R?

Je kunt de samenvattingsfunctie() (ook wel summary () function) gebruiken om R² (coefficient of determination) van een lineair model weer te geven in R. Onderaan de output zie je “R-kwadraat” (“R-squared”) staan.

Hoe bereken ik de determinatiecoëfficiënt (R²) in Excel?

Je kunt de RSQ() functie gebruiken om R² (coefficient of determination) in Excel te berekenen. Als je afhankelijke variabele in kolom A staat, en je onafhankelijke variabele in kolom B, klik je op een willekeurige lege cel en typ je: “RSQ(A:A,B:B)”.

Wat is de coefficient of determination?

Decoefficient of determinationis de Engelse term voor de determinatiecoëfficiënt.

Dedeterminatiecoëfficiënt (R²) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Scharwächter, V. (2022, 05 juli). Coefficient of Determination (R²) | Betekenis & Voorbeelden. Scribbr. Geraadpleegd op 29 augustus 2024, van https://www.scribbr.nl/statistiek/determinatiecoefficient/

Citeer dit artikel

Wat vind jij van dit artikel?

Je hebt al gestemd op dit artikel. Bedankt :-) Je stem is doorgevoerd :-) Bezig met het verwerken van je stem...

Coefficient of Determination (R²) | Betekenis & Voorbeelden (21)

Veronique Scharwächter

Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.

Coefficient of Determination (R²) | Betekenis & Voorbeelden (2024)
Top Articles
Scholastic News Answer Key 2022
Carlsen Funeral Home Rhinelander Obituaries
Srtc Tifton Ga
Custom Screensaver On The Non-touch Kindle 4
Yogabella Babysitter
J & D E-Gitarre 905 HSS Bat Mark Goth Black bei uns günstig einkaufen
Aadya Bazaar
Linkvertise Bypass 2023
Craigslist Furniture Bedroom Set
Sprague Brook Park Camping Reservations
Fototour verlassener Fliegerhorst Schönwald [Lost Place Brandenburg]
Bank Of America Appointments Near Me
Fcs Teamehub
Nj Scratch Off Remaining Prizes
Craigslist Malone New York
800-695-2780
Busby, FM - Demu 1-3 - The Demu Trilogy - PDF Free Download
Pricelinerewardsvisa Com Activate
NBA 2k23 MyTEAM guide: Every Trophy Case Agenda for all 30 teams
Zack Fairhurst Snapchat
Hollywood Bowl Section H
Christina Steele And Nathaniel Hadley Novel
Masterkyngmash
Baja Boats For Sale On Craigslist
What Is The Lineup For Nascar Race Today
Soul Eater Resonance Wavelength Tier List
The Eight of Cups Tarot Card Meaning - The Ultimate Guide
Tamil Movies - Ogomovies
Cinema | Düsseldorfer Filmkunstkinos
Restored Republic
Stubhub Elton John Dodger Stadium
Obsidian Guard's Skullsplitter
Haunted Mansion Showtimes Near Cinemark Tinseltown Usa And Imax
Wcostream Attack On Titan
Fridley Tsa Precheck
Jay Gould co*ck
Tributes flow for Soundgarden singer Chris Cornell as cause of death revealed
Marine Forecast Sandy Hook To Manasquan Inlet
Orangetheory Northville Michigan
The Mad Merchant Wow
Craigslist Summersville West Virginia
KM to M (Kilometer to Meter) Converter, 1 km is 1000 m
Streameast.xy2
Trivago Myrtle Beach Hotels
Nancy Pazelt Obituary
Citizens Bank Park - Clio
Jeep Forum Cj
Is My Sister Toxic Quiz
Lira Galore Age, Wikipedia, Height, Husband, Boyfriend, Family, Biography, Net Worth
Is Chanel West Coast Pregnant Due Date
Sml Wikia
Loss Payee And Lienholder Addresses And Contact Information Updated Daily Free List Bank Of America
Latest Posts
Article information

Author: Domingo Moore

Last Updated:

Views: 6025

Rating: 4.2 / 5 (73 voted)

Reviews: 80% of readers found this page helpful

Author information

Name: Domingo Moore

Birthday: 1997-05-20

Address: 6485 Kohler Route, Antonioton, VT 77375-0299

Phone: +3213869077934

Job: Sales Analyst

Hobby: Kayaking, Roller skating, Cabaret, Rugby, Homebrewing, Creative writing, amateur radio

Introduction: My name is Domingo Moore, I am a attractive, gorgeous, funny, jolly, spotless, nice, fantastic person who loves writing and wants to share my knowledge and understanding with you.