Gemiddelde & variantie
- 20/07/2008
Voorbeeldbestanden bij dit artikel: | |
Inleiding
We zitten middenin een verlengd weekend voor de Nationale feestdag - voor de Belgen althans -, dus hier is nog eens een nieuwe pagina op mijn site. Het gaat over het berekenen van het gemiddelde en de variantie van een reeks getallen in Excel. Nu, super lastig is dat niet, aangezien Excel een hele hoop functies ter beschikking stelt, waaronder de functies GEMIDDELDE en VARIANTIE. De variantie zegt iets over hoe dichtbij de getallen rond het gemiddelde hangen.
Ik hoor jullie al zeggen: als die functies beschikbaar zijn in Excel, waarom schrijf je er dan over?
- We gaan de functies zelf eens manueel berekenen en checken;
- Niet iedereen weet wat een variantie of een standaardafwijking is (zie hier op Wikipedia), of kan dit toepassen in Excel
- Dit artikel is een aanloopartikel voor Gemiddelde & variantie in een samengevatte layout, dat nog een stuk verder gaat. Wie de formules daar snapt, mag zich een Excel kenner noemen ;-)
Uitleg
Ik zal de uitleg doen aan de hand van de gegevens en berekeningen in het voorbeeldbestand:
- We starten met de observaties, die staan in kolom A te beginnen vanaf cel A3. Ik heb dat bereik een naam gegeven, nl. data. Die naam zal terugkomen in andere formules.
- Het aantal observaties staat in cel C3 met een AANTAL functie. Het gemiddelde van de observaties komt in cel C6 met een GEMIDDELDE functie.
- Zoals je kan zien in C7 is het gemiddelde simpel te checken: neem de SOM van de observaties, en deel door het aantal. De gele cellen komen dus al overeen.
- De variantie kan je berekenen met de VAR functie. Die staat in het groen in C10.
- Hoe wordt de variantie berekend? En kunnen we checken of Excel het wel goed doet? Trek daarvoor van elke observatie het gemiddelde af (zie kolom E). Dan neem je daarvan telkens het kwadraat (kolom F). Al die kwadraten tel je op (cel F1), en dat getal deel je door het aantal observaties min 1 (groene cel H3).
- We merken dus dat we hetzelfde resultaat verkrijgen als in de groene cel C10. Oef!
- Cel C1 laat nu toe om (nogmaals) het gemiddelde te checken: de som van telkens de observatie min het gemiddelde, moet uiteraard 0 opleveren.
- In de blauwe cellen wordt de standaardafwijking berekend met behulp van de STDEV functie.
- Je had de berekeningen in kolom F achterwege kunnen laten als je gebruik maakt van de KWADRATENSOM functie in Excel. Ik ken die functie, maar eerlijk gezegd, ik denk niet dat ik ze al veel gebruikt heb… Zie cel G4 dat hetzelfde resultaat geeft als in cel F1. Ik vermoed dus dat deze functies nieuw zijn voor velen van jullie. Nog alternatieven die je kan gebruiken, zijn SOM.X2MINY2 en SOM.XMINY.2. Zie de Excel helpfiles voor meer uitleg.
Iets moeilijker nu
Niet echt moeilijk dus. Je bent klaar voor het echte werk op Gemiddelde & variantie in een samengevatte layout!