Samenvatting testgebruik - Wat is een eerste omschrijving van een test? Bij een test gaat het om een - Studeersnel (2024)

Samenvatting testgebruik

Vak

Testgebruik 1: vragenlijstgebruik (TPVP15PTV)

18Documenten

Studenten deelden 18 documenten in dit vak

Universiteit

Hanzehogeschool Groningen

Studiejaar: 2021/2022

Geüpload door:

Rijksuniversiteit Groningen

0volgers

9Uploads1upvotes

Aanbevolen voor jou

  • 3Testgebruik SamenvattingTestgebruik 1: vragenlijstgebruikSamenvattingen83% (6)
  • 11Samenvatting Contextuele Hulpverlening Systeemtheorie, contextuele benadering en oplossingsgericht werkenSamenvattingen100% (34)
  • 34Samenvatting Basisboek Systeemgericht Werken Maria NabuursSysteemtheorie, contextuele benadering en oplossingsgericht werkenSamenvattingen100% (28)
  • 22Samenvatting Psychologie een Inleiding Philip George Zimbardo; Robert Lee Johnson; Vivian McCann; Sylvia G. BirnieInleiding in de PsychologieSamenvattingen100% (20)

Reacties

inloggen of registreren om een reactie te plaatsen.

Andere studenten bekeken ook

  • veiligheidsmanagementsysteem hoofdstuk 5
  • Testgebruik Samenvatting
  • Casus nadia deel 1
  • Testgebruik Samenvatting
  • Practicum 6 deel 2 werken met alle testen verwerken scores en resultaten
  • Stuvia 269359 inleiding in testleer klinimetrie logopedie

Gerelateerde documenten

  • Testgebruik 1 vragenlijstgebruik toegepaste psychologie jaar 1
  • Aantekeningen WC testgebruik
  • Hoorcolleges Testgebruik 1: Vragenlijstgebruik
  • Thuiswerkopdracht - Nadia deel 1
  • Aantekeningen hoorcollege 8 maart
  • Algemeen Stappenplan Testgebruik

Preview tekst

Wat is een eerste omschrijving van een test?

Bij een test gaat het om een systematisch onderzoek met een bepaald doel. Het doel kanzijn het voorspellen, classificeren of beschrijven van een individu in vergelijking metandere mensen.

Welke kenmerken heeft een test waardoor het onderscheiden kan worden vanhet voorwetenschappelijk oordeel?

Een psychologische test is een systematisch onderzoek van gedrag met behulp vanspeciaal geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in eenkenmerk van de onderzochte in vergelijking met anderen. Men heeft niet altijd een testnodig om zich een oordeel te vormen over menselijk gedrag. Een psychologische testgebruiken is pas dan gerechtvaardigd als het een juister beeld oplevert dan hetvoorwetenschappelijk oordeel, of als het een verbetering of een aanvulling hierop kanbetekenen en als de kosten of ethische bezwaren niet onoverkomelijk zijn. Het gebruikenvan een psychologische test heeft zes voordelen (kenmerken) boven hetvoorwetenschappelijk oordeel: (1) efficiëntie, (2) standaardisatie, (3) normering van detestresultaten, (4) het principe van objectiviteit, (5) de eis van betrouwbaarheid en (6)validiteit en de betekenis van een test.

»

 Wat is een test? Hoe kunnen eigenschappen gemeten worden door middel van tests? Wat is de definitie van een test? Welke toepassingsmogelijkheden zijn er?

H2 Wat is een test?

Welke onderdelen bevat een test?

Een verantwoorde en gepubliceerde test bestaat doorgaans uit drieonderdelen: testmateriaal, testformulieren en een testhandleiding.

Testmateriaal

Het testmateriaal is afhankelijk van de soort test. Het testmateriaal bij een schriftelijkeintelligentietest zal bijvoorbeeld bestaan uit een boekje met opgaven die opgelostmoeten worden. Als de individuele prestaties van een persoon getest moeten worden,kunnen er legpuzzels, tekenpapier of bouwstenen als testmateriaal gebruikt worden.Soms is het geen materiaal in de strikte zin van het woord, zoals een onderwerp vooreen vrije discussie.

Testformulieren

Testformulieren worden gebruikt om de resultaten van de test op te schrijven om hieruitconclusies of interpretaties te kunnen trekken. Ze kunnen worden ingevuld door detestleider (bij observatietests) of door de geteste persoon zelf (bij vragenlijsten).

Testhandleiding

Een testhandleiding geeft aan hoe de test gebruikt dient te worden. Een goedetesthandleiding moet aan de volgende vier eisen voldoen:

  1. Een goede testinstructie. Er moet duidelijkheid zijn over de gang van zaken tijdens de test. Dit wordt bereikt door de testprocedure, uitleg, proefopgaven etc.

  2. De verwerkingsprocedure. Dit zijn de instructies over hoe de test (numeriek) gescoord en verwerkt dient te worden. Daarvoor zijn de sleutels van de opgaven nodig: aanwijzingen welke antwoorden (on)juist zijn of (contra)indicatief voor een bepaald verschijnsel en hoe deze antwoorden van scores voorzien moeten worden.

  3. Normtabellen. Hiermee worden de scores vergeleken met die van de representatieve normgroep. Dat is een voorwaarde voor nadere interpretatie en evaluatie van de testprestatie.

  4. De wetenschappelijke kwaliteit van de test. Hierbij gaat het om de betrouwbaarheid van de test, wat de test betekent en wat het voorspelt.

Wat is een eerste omschrijving van een test?

Bij een test gaat het om een systematisch onderzoek met een bepaald doel. Het doel kanzijn het voorspellen, classificeren of beschrijven van een individu in vergelijking metandere mensen.

Welke kenmerken heeft een test waardoor het onderscheiden kan worden vanhet voorwetenschappelijk oordeel?

Een psychologische test is een systematisch onderzoek van gedrag met behulp vanspeciaal geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in eenkenmerk van de onderzochte in vergelijking met anderen. Men heeft niet altijd een testnodig om zich een oordeel te vormen over menselijk gedrag. Een psychologische testgebruiken is pas dan gerechtvaardigd als het een juister beeld oplevert dan hetvoorwetenschappelijk oordeel, of als het een verbetering of een aanvulling hierop kanbetekenen en als de kosten of ethische bezwaren niet onoverkomelijk zijn. Het gebruikenvan een psychologische test heeft zes voordelen (kenmerken) boven hetvoorwetenschappelijk oordeel: (1) efficiëntie, (2) standaardisatie, (3) normering van detestresultaten, (4) het principe van objectiviteit, (5) de eis van betrouwbaarheid en (6)validiteit en de betekenis van een test.

Efficiëntie

In het dagelijks leven zijn veel situaties die een oordeel kunnen verschaffen overbijvoorbeeld de intelligentie van een persoon. Het probleem is echter dat men moetwachten tot deze situaties zich voordoen. Daarnaast is intelligentie in het alledaagsecontact tussen mensen een ‘bijproduct’ en komt daarmee niet tot z'n recht (men is erniet zo mee bezig). Intelligentietests daarentegen zijn speciaal samengesteld, nietafhankelijk van toeval en storende invloeden kunnen geweerd worden binnen detestsituatie.

Standaardisatie

Bij een psychologische testafname streeft men ernaar de test op precies dezelfde manier,onder precies dezelfde condities bij iedereen af te nemen. Dit is het standaardiseren vande situatie en is nodig voor de vergelijkbaarheid van de resultaten. Een test kan meer ofminder beantwoorden aan de eis van standaardisatie. Als er geen standaardisatieaanwezig is er geen sprake van een test. Standaardisatie maakt een test betrouwbaar envergelijkbaar. In de praktijk is de inhoud en de situatie steeds verschillend.

Normering

Om de resultaten van personen te vergelijken, is het nodig om te weten hoe groot deafstand tussen de resultaten ongeveer is. Dat moet zo exact mogelijk worden geschat,want door exactheid kan men kleinere verschillen vaststellen. In de praktijk kunnen weeen schatting maken van wie intelligenter is dan wie, maar de vraag is hoeveelintelligenter. Bij grote verschillen maakt zo'n schatting niet zoveel uit, maar juist bijkleine verschillen is het nodig een exact instrument te hebben. De eenvoudigste vorm

 Objectiviteit als de grondhouding van de wetenschapsbeoefenaar. Dus geen invloeden van buitenaf, van bijvoorbeeld de maatschappij, de organisatie, de onderzoeker etc.

Betrouwbaarheid

Als we een meting nog eens doen op dezelfde manier, dan moet de uitkomst gelijk zijnaan de uitkomst van de eerste meting. Dit is beter mogelijk bij een lengtemeting dan bijeen intelligentiemeting. Eigenlijk is het niet mogelijk om twee onafhankelijke metingen teverkrijgen in de psychologie. Metingen moeten onder dezelfde condities plaatsvinden(standaardisatie), maar toevalsinvloeden zijn niet door standaardisatie te ondervangen.Betrouwbaarheid is wenselijk en zelfs noodzakelijk omdat meetresultaten herhaalbaarmoeten kunnen zijn; het moet niets of nauwelijks iets uitmaken wanneer iemand getestwordt.

Validiteit

Een goede test heeft een vaststaande psychologische betekenis. Dat wil zeggen dat debetekenis aan de praktijk getoetst is. Er is dus geen plaats voor fenomenologischebeschrijvingen en alternatieve verklaringen. Valide testen kunnen niet zomaar overaltoegepast worden; het moet altijd gebaseerd zijn op empirisch onderzoek waarin debedoelde samenhang is aangetoond.

Hoe kunnen eigenschappen gemeten worden door middel van

tests?

Welke meetniveaus en toegestane operaties zijn er?

In de praktijk gebruikt men de termen ‘testen’ en ‘meten’ door elkaar. Door middel vantests kunnen we allerlei eigenschappen meten. Van ‘meten’ is sprake zodra getallenvolgens een consistente procedure aan objecten worden toegekend. Dit leidt tot de vierbekende meetniveaus. De vier meetschalen, van laag naar hoog, zijn de nominale schaal,ordinale schaal, intervalschaal en de verhoudingsschaal.

De nominale schaal

Op deze schaal gebruikt men getallen om categorieën te onderscheiden en objecten in tedelen. Er is geen sprake van een rangorde, het gaat slechts om de verschillende getallen.Op de nominale schaal is geen enkele rekenkundige bewerking mogelijk. Er zijn welberekeningen die aangepast zijn aan het nominale niveau (bijvoorbeeld Cohen’s kappa).

De ordinale schaal

Bij deze schaal is er sprake van een rangorde, dus van meer of minder. Getallen wordengebruikt om categorieën of objecten te ordenen. Ook hier mogen niet alle rekenkundigebewerkingen uitgevoerd worden, maar het is wel mogelijk om een rangorde met eenandere rangorde te vergelijken: de rangcorrelatie.

De intervalschaal

Bij deze schaal is er niet alleen een rangorde van minder of meer, maar ook de afstandentussen de verschillende posities zijn belangrijk en hebben betekenis. De afstanden tussende verschillende posities zijn trouwens gelijk. Een intervalschaal heeft geen absoluutnulpunt, maar een arbitrair nulpunt (zoals bijvoorbeeld temperatuur); de verhoudingentussen de afstanden blijven gelijk als je het nulpunt verschuift. Er zijn wiskundigeberekeningen toegestaan; lineaire transformaties van het type Y = a + bX (ondanks dat

het nulpunt met factor a is verschoven en de eenheid met factor b is vermenigvuldigd,blijven de verhoudingen gelijk).

Men gaat er vaak te makkelijk vanuit dat testscores op intervalniveau worden gemeten,maar dat wordt vaak niet empirisch ondersteund. Maar het is wel handig omintervaleigenschappen te veronderstellen, omdat dan rekenkundige bewerkingen kunnenworden uitgevoerd. Een eenmaal gekozen schaal moet verder gehandhaafd blijvenworden om verwarring te voorkomen.

De verhoudingsschaal (ratioschaal)

Alle rekenkundige bewerkingen zijn hier toegestaan omdat er sprake is van een gelijkeafstand tussen de verschillende posities op de schaal en van een absoluut nulpunt.Voorbeelden hiervan zijn lengte en gewicht.

De genoemde schalen zijn de hoofdsoorten; ze geven aan welke numerieketransformaties zijn toegestaan – namelijk diegene die de betekenis van de vergelijkingvan meetwaarden behouden. Binnen de psychologie zijn er weinig metingen op eenverhoudingsschaal; hoogstens op een intervalschaal en meestal is de ordinale schaalvoldoende. Er zijn ook verschillende tussensoorten mogelijk, zoals de verschilschaal,waarop transformaties van het type Y = a + X zijn toegestaan: scores op de X-schaalmogen met constante a worden vermeerderd of verminderd (negatieve a).

Welke opvattingen zijn er over meten?

In de psychologie was lang het probleem dat men eigenschappen niet rechtstreeks kanmeten. In de 19e eeuw stond de fysica model voor het meten in de psychologie; hetideaal was psychologische eigenschappen meten zoals bijvoorbeeld het begrip ‘lengte’wordt gemeten. Maar dit ideaal was te hoog gegrepen en ging er ook aan voorbij dat ookveel fysische eigenschappen (net als psychologische) niet direct observeerbaar zijn. In defysica loste men dat op door middels experimenten de relaties tussen objecten teverhelderen, zodat men vervolgens voor die eigenschap een bruikbare schaal kon kiezen.Eenheden zoals Becquerel en Ohm zijn niet direct observeerbaar (radioactiviteit enweerstand), maar schalen die het resultaat zijn van theorievorming en experimenten. Inde psychologie zijn theorieën en begrippen altijd abstracter en diffuser gedefinieerd, enin experimenten is het gedrag van proefpersonen minder goed te manipuleren. Hierdoorkunnen hooguit zwakke of matige verbanden worden gevonden in experimenten, dievaak ook nog eens niet goed repliceerbaar zijn. Dus kunnen er hooguit arbitraire schalenworden gevonden.

De oplossing van Stevens hiervoor is het operationalisme: de meting als uitkomst van deprocedure. Hierdoor wordt de test gelijkgesteld aan de uitkomst en is bijvoorbeeldintelligentie datgene ‘wat de test meet’. Een testconstructie is dan pure technologie enstaat los van de psychologische theorievorming. Er was hierdoor minder aandacht voorpsychologische metingen; theorie- en kennisvorming bestonden nog nauwelijks.Operationalisme werd omarmd omdat men hiermee verlost was van het lastigeproblemen van ‘meten volgens het fysische model’. Maar dat is in feite ontkenning vanhet meetprobleem. Testontwikkeling werd zo een technologisch recept zonderwetenschappelijke bijdrage. Dat is onjuist: het meten van psychologische eigenschappenen het onderzoek naar de betekenis van testscores leveren juist een wetenschappelijkebijdrage.

De wetenschap kan niet zonder betrouwbare en valide metingen. Ondanks de kritiek ophet operationalisme, is de schaalindeling van Stevens erg bruikbaar. Het wijst erop datmen weliswaar alles met getallen kan doen, maar dat het de betekenis van getallen is,die bepaalt welke bewerkingen erop zijn toegestaan. Bovendien dwingt het ertoe goed nate denken over welke bewerkingen en conclusies wel of niet met de meetwaarden teverantwoorden zijn.

De uitkomsten van statistische analyse hebben gevolgen voor de theorie over degemeten uitkomst; het kan aanvullende ondersteuning geven voor deze theorie. Zo’ntheorie bestaat meestal uit een nomologisch netwerk: een theorie ter verklaring vanwaarneembare verschijnselen, waarbinnen de gemeten eigenschap een plaats heeft.

Deze procedure sluit aan bij de statistische methoden om tests te construeren enmeeteigenschappen vast te stellen.

  1. Klassieke testtheorie: nadruk op betrouwbaarheid.

  2. Item-responstheorie: nadruk op hoe de testprestatie tot stand komt.

Er is ook een derde opvatting over meten:

  1. Representational measurement: er is alleen sprake van een meting als de formele relaties tussen de testscores overeenkomen met de relaties die in de empirie bestaan.

Voorbeeld: als Jan een hogere testscore heeft dan Piet op een test die pretendeertruimtelijk inzicht te meten, dan moet er dus een aantoonbare relatie bestaan tussen hetruimtelijk inzicht van Jan en Piet, dat zo duidelijk is dat je kunt concluderen dat Jan eenhoger niveau heeft dan Piet. Helaas zijn veel psychologische eigenschappen nietwaarneembaar; ruimtelijk inzicht is niet direct waarneembaar, behalve met een test.Representational measurement is dus geen geschikte methode voor het meten vanpsychologische (hypothetische) eigenschappen. Toch heeft het wel tot belangrijkeinzichten geleid over het meten in de psychologie.

Wat is de definitie van een test?

Een test wordt als volgt gedefinieerd: 'Een test is een systematische classificatie- ofmeetprocedure, waarbij het mogelijk wordt een uitspraak te doen over één of meerempirisch-theoretisch gefundeerde eigenschappen van de onderzochte of over specifiekniet-testgedrag, door uit te gaan van een objectieve verwerking van reacties vanhem/haar, in vergelijking tot die van anderen, op een aantal gestandaardiseerde,zorgvuldig gekozen stimuli'. Een test is dus een systematische meetprocedure omuitspraken te doen over een individu, die reageert op gestandaardiseerde stimuli invergelijking met de reactie van anderen.

Welke toepassingsmogelijkheden zijn er?

Er zijn drie toepassingsmogelijkheden van de psychologische test, namelijk (1) debeoordeling van individuen, (2) de beoordeling van groepen en (3) de beoordeling vansituaties en methoden.

Beoordeling van individuen

De beoordeling van individuen kan op zes verschillende manieren, afhankelijk van hetdoel van het onderzoek:

1. Criterium

Als er sprake is van een criterium waaraan het individu wel of niet kan voldoen. De testcorreleert met het criterium. Bijvoorbeeld wel of niet een bepaalde opleiding volgen.

2. Meerdere criteria

Als er een keuze gemaakt moet worden uit meerdere criteria die verschillen qua niveauen/of kwaliteit. Bijvoorbeeld het kiezen van een studierichting. De test moet niet alleencorreleren met het criterium, differentiatie moet dan ook mogelijk zijn.

3. Onderlinge verhoudingen van testscores bij één persoon (ipsatieve scores)

Als men iemands zwakke en sterke punten en zijn interesses wil weten, is de onderlingeverhouding van de verschillende scores in een testserie belangrijk, niet hun hoogte. Metipsatieve scores wordt bedoeld dat de testscores van één persoon met elkaar vergelekenworden en niet met een externe standaard.

4. Ontwikkelingen van een persoon

Als men de ontwikkeling van een persoon wil volgen wordt hetzelfde onderzoek methetzelfde individu herhaald op een ander tijdstip. Het doel is om erachter te komen of depersoon zich op een bepaald gebied ontwikkeld heeft. Bijvoorbeeld een longitudinaalonderzoek. Het gaat hier ook om interne vergelijking.

5. Beschrijving van het onderzochte

Als er een beschrijving van de onderzochte gegeven moet worden, bijvoorbeeld in dehypothesevormende fase van een individueel onderzoek. Er zijn verschillende mogelijkevormen van beschrijvingen:

 Een intern rapport: de psycholoog geeft een subjectieve beschrijving van het gedrag van de onderzochte of een beschrijving van de testprestaties. Een extern rapport: een verklarende beschrijving aan bijvoorbeeld de ouders van de onderzochte, het kan ook pedagogische adviezen en psychologische uitspraken bevatten.

6. Counseling

Counseling is een niet-directieve vorm van therapie. Het testonderzoek wordt gebruiktals startpunt (stand van zaken) en van daaruit gaat de hulpverlener samen met de cliëntde problemen van de cliënt analyseren, bewust maken en herformuleren.

Hoe kunnen groepen beoordeeld worden?

Bij de beoordeling van groepen worden de verschillen tussen de groepen onderzocht. Hetgaat hier voornamelijk om vergelijkend onderzoek. Men is geïnteresseerd in de groottevan het verschil van een bepaalde eigenschap tussen groepen. Dit is vaak eenvoorstadium voor het individuele onderzoek. Eigenlijk is individueel onderzoek altijdgebaseerd op onderzoek tussen groepen (vanwege de normen).

Hoe kan de invloed van situaties en methoden beoordeeld worden?

Met methoden bedoelt men bijvoorbeeld behandeling, opleiding en beïnvloeding en metsituaties bijvoorbeeld stress of participatief leiderschap. Een manier is om bij groependezelfde methoden in verschillende situaties te gebruiken en dan te kijken naar deresultaten. Of men gebruikt in de dezelfde situatie andere methoden. Het gaat dan nietzozeer om groepsverschillen maar om de situaties en de methoden. Voorbeeld: eenschoolvorderingstoets is zowel een evaluatie van het kennisniveau van individueleleerlingen als van het functioneren van de docent.

Averechtse diagnostiek (Hofstee, 1969) is dat als een test een bepaalde correlatie heeftmet een criterium, men dit kan gebruiken om voorspellingen te doen over de kansen opcriteriumsucces, maar deze correlatie zegt ook heel veel over het criterium zelf.

niet verkregen door de prestatie op de test; het is belangrijk hoe iemand iets doet en opwelke wijze de prestatie of reactie plaatsvindt.

Welk onderscheid is er te maken bij tests voor prestatieniveau?

ENKELVOUDIGE ALGEMENENIVEAUTESTS

VEELVOUDIGE ALGEMENENIVEAUTESTS SPECIALE NIVEAUTESTS VORDERINGENTES

Individueleontwikkelingstests

Testbatterijen voorintelligentiefactoren

Tests voor specialeintelligentiefactoren ‘Achievement’ tes

Individueleontwikkelingstests voorvolwassenen

Testbatterijen voorgeschiktheden

Tests voor specialegeschiktheden ‘Proficiency’ tests

Algemene collectieveintelligentietests

Tests voor speciale niet-intelligentiefactoren

Bij de tests voor prestatieniveau zijn vier tests te onderscheiden, namelijk:

  1. Enkelvoudige algemene niveautests
  2. Veelvoudige algemene niveautests
  3. Speciale niveautests
  4. Vorderingstests

1. Enkelvoudige algemene niveautests

Enkelvoudige algemene niveautests zijn de grootste en belangrijkste tests. Bij deze testsgaat het om een niveaubepaling van de intelligentie; het gaat dus niet om deverschillende intelligentiegebieden. Er zijn drie enkelvoudige algemene niveautests. Deeerste twee zijn individuele tests en de derde is een groepstest:

  1. Individuele intelligentietests voor volwassenen:  het intelligentieniveau wordt vastgesteld nadat intelligentie min of meer alsvolgroeid mag worden beschouwd (vanaf 15 à 17 jaar). Voorbeelden zijn de WAIS,GIT en Terman-Merrill. Deze tests hebben intelligentienormen voor alle leeftijd,inclusief de ouderdom.
  2. Individuele ontwikkelingstests voor kinderen :  het doel van deze tests is het meten van de intelligentie tijdens deontwikkeling. De intelligentiescore van het kind wordt vergeleken met detestprestaties van leeftijdsgenoten. Soms wordt het vergeleken met dechronologische leeftijd om te bepalen hoe snel of hoe langzaam de intelligentie-ontwikkeling heeft plaatsgevonden. Voorbeelden zijn de WISC-R en Rakit.
  3. Algemene collectieve intelligentietests :  deze tests gebeuren vaak schriftelijk en groepsgewijs. Ze zijn breed engevarieerd samengesteld. Er zijn collectieve intelligentietests voor volwassenen envoor kinderen, en collectieve non-verbale intelligentietests. Deze laatste hebbenmeestal niet een maximale brede samenstelling, omdat er geen verbaal materiaalgebruikt wordt. Ze zijn nuttig bij het testen van niet-geletterden en bij populatiesmet een verschillende culturele en taalkundige achtergrond.

2. Veelvoudige algemene niveautests

Bij veelvoudige algemene niveautests is differentiatie wel belangrijk. Een verschil metbovenstaande tests is dat deze tests afzonderlijk gezien voldoende betrouwbaar zijn enonderling voldoende afhankelijk zijn. Er zijn twee categorieën van veelvoudige algemeneniveautests:

  1. Testbatterijen voor intelligentiefactoren :  de verschillende items in een test worden samengevoegd tot enkelefactoren. De meest bekende factoren zijn die van Thurnstone (Verbal, Number,Spatial, Word fluency, Memory, Reasoning). De PMA, een testbatterijsamengesteld door Thurstone, probeert deze factoren 'zuiver' te meten. Eenvoorbeeld in Nederland is de testserie voor 'hoger niveau' van Drenth. Eenalternatief voor de factoren van Thurnstone is het factoranalytische systeem vanGuilford. Hij leidde uit de praktijk een aantal factoren af en noemde het de'structure of intellect theory'.
  2. Testbatterijen voor geschiktheid oftewel 'multiple aptitude' tests :  het gaat om het meten van vermogens waarmee iemand zich voor eenmaatschappelijke taak of schoolopleidingseisen kan bekwamen (geschiktheden).Eigenlijk gaat het om leergeschiktheid. Leerfactoren kunnen soms hetzelfde, maarook iets heel anders zijn dan intelligentiefactoren, zoals bijvoorbeeld motorischevaardigheden. Voorbeelden van dergelijke tests zijn de leerpotentiaaltests, DAT(Differential Aptitude Testbattery) en GATB (General Aptitude Test Battery).

3. Speciale niveautests

Speciale niveautests richten zich op een bepaald segment van begaafdheid, bijvoorbeeldeen intelligentie-aspect, geschiktheid of een vaardigheid. Ze vallen vaak niet onderintelligentie maar ze zijn wel belangrijk. Er zijn drie categorieën van speciale niveautests:

  1. Tests voor speciale intelligentiefactoren :  dit kunnen bijvoorbeeld tests zijn die zich alleen richten op ruimtelijkinzicht, woordkennis etc. Op basis van de theorie van Guilford komen we tot driegebieden. De eerste is die van het divergent denken (creativiteit). De onderzochtemoet oplossingen bedenken voor een probleem waarvoor er vele oplossingenmogelijk zijn. De antwoorden worden aan de hand van drie criteria beoordeeld;hoeveelheid oplossingen, aantal verschillende principes en originaliteit. Het tweedegebied is die van de behavorial-dimensie (sociale intelligentie). Uit onderzoekblijkt dat het moeilijk te onderscheiden is van andere intelligentiefactoren. Hetlaatste gebied is kritisch denken. Ook dit is moeilijk te onderscheiden. Eigenlijk isde vraag of iets wel of niet onder intelligentie valt afhankelijk van de definitie dieje aanhoudt.
  2. Tests voor speciale geschiktheden oftewel 'special aptitude tests' :  er zijn twee soorten, de eerste soort zijn tests voor leergeschiktheden diezich richten op leercondities bijvoorbeeld geheugentests, tempotests enconcentratietests. Bijvoorbeeld de Bourdon-Wiersma test, Grünbaumtest en hetonderdeel ‘snelheid en nauwkeurigheid uit de DAT. Ook tests die gericht zijn opspecifieke leergeschiktheden vallen hieronder. De tweede soort zijn tests voorwerkgeschiktheid die zich richten op typische vaardigheden die nodig zijn voormaatschappelijke functies, bijvoorbeeld geschiktheid als piloot of chauffeur.
  3. Tests voor speciale niet-intelligentiefactoren : deze tests richten zich op vaardigheden of capaciteiten die belangrijk zijnvoor een maatschappelijke functie of klinische diagnostiek. Er zijn drie soorten,namelijk (1) motoriektests (tests voor reactiesnelheden, lichaamsbeheersing encoördinatie; het gaat hierbij om de beeldvorming van de motoriek), (2) artistieketests (men probeert een esthetisch oordeel te geven) en (3) sensorische tests

 Metingen van prestatieniveau zijn eenvoudig generaliseerbaar naar het praktische functioneren, maar gedrag in een testsituatie is niet altijd hetzelfde als gedrag in het dagelijks leven.2. Geen objectief criterium. Er is geen objectief criterium waarmee testprestaties kunnen wordenvergeleken, dus er is sprake van weinig objectiviteit en betrouwbaarheid bij hetvergelijken van testprestaties.3. Minder stabiliteit van persoonlijkheidstrekken. Persoonlijkheidstrekken zijn vaak minder stabiel en kunnen per situatieverschillen en hebben een minder gelijkmatige invloed op gedrag.

Maar onderzoek naar persoonlijkheid is praktisch en psychologisch wel van belang en erzijn veel testen om de persoonlijkheid te meten. Er zijn vier verschillende test voorgedragswijze, die zullen hieronder worden besproken, namelijk (1) observatietests, (2)somato-fysiologische tests, (3) zelfbeoordelingen en (4) kwalitatieve prestatietests.

1. Observatietests

In vergelijking met andere tests voor gedragswijze is een observatietest een indirectetest omdat het om observaties en interpretaties van de psycholoog gaat. Er zijn tweesoorten observatietests:

  1. Individuele observatietests :  Een persoon wordt geobserveerd. Er wordt gelet op werkgedrag, houding,mimiek, uiterlijk gedrag en sociaal contact. De observator kan neutraal of geheelbetrokken zijn. Meestal weet de onderzochte dat hij/zij geobserveerd wordt. Bijhet gebruik van een one-way screen hoeft dat niet het geval te zijn.
  2. Groepsobservatietests :  Een groep mensen dat gezamenlijk aan een opdracht bezig is, wordtgeobserveerd. Dit soort tests komen voor in zogenaamde ‘assessment centers’voor de selectie van managers. Een andere vorm is een vorm waarbij deelnemerselkaar beoordelen en de psycholoog de beoordelingen verder verwerkt. Dit noemtmen ‘peer rating’ of ‘buddy rating’. Een voorbeeld is een sociogram: iedergroepslid moet aangeven wie sympathiek is, wie leider is etc. Op basis van dezekeuzes wordt een patroon van relaties in de interacties zichtbaar.

2. Somato-fysiologische methoden

Men gaat er vanuit dat er een verband is tussen fysieke/fysiologische aspecten engedragskenmerken. Door middel van metingen van lichamelijke kenmerken of processenprobeert men uitspraken te doen over de psychologische kwaliteiten van de onderzochte.Er zijn twee soorten methoden.

  1. Morfologisch onderzoek :  Met behulp van somatische kenmerken (hele lichaam, hoofd of gezicht)probeert men iets te zeggen over persoonlijkheidskenmerken. De validiteit is erglaag.
  2. Fysiologisch onderzoek:  Voorbeelden van fysiologisch onderzoek zijn: biochemische indices,elektro-encefalogram (EEG), elektrocardiogram, bloeddruk en bloedvolume,oogbewegingen, oogposities en pupildiameter, elektrodermale verschijnselen.Deze fysiologische maten blijken een verband te hebben met psychologischevariabelen die belangrijk zijn voor het persoonlijkheidsonderzoek. Sommigeverbanden zijn empirisch vastgesteld, maar onverklaard. Soms zijn er

theoretische verklaringen gegeven. Ontwikkelingen hierin worden steedsbelangrijker voor gedragsdiagnostiek.

3. Zelfbeoordelingen

Zelfbeoordelingen worden meestal afgenomen in de vorm van vragenlijsten. Ze zijn langgewantrouwd omdat ze niet echt objectief zouden zijn. Een andere vorm is via empirischonderzoek, er wordt dan gekeken of er een bepaald patroon is in de wijze vanbeantwoorden. Op basis daarvan kan men een psychologische interpretatie geven aanelke vraag. Deze methode levert meer valide conclusies op. Uit theoretische onderzoekenuit praktijkervaring blijkt de zelfbeoordeling toch een waardevolle methode te zijn. Er zijnvier soorten zelfbeoordelingen:

  1. Interessetests:D eze tests hebben betrekking op interesses en kunnen gebruikt worden bijhet bepalen van school- of beroepskeuzes.
  2. Waarde- en attitudetests:  Deze tests onderzoeken waarden en attitudes (houdingen). Bijvoorbeeld deCalifornia-F-Scale geeft aan in hoeverre iemand dogmatisch, conservatief enbevooroordeeld staat tegenover de politiek, cultuur en sociale factoren. Of deSchaal voor Interpersoonlijke Waarden, die meet zes waarden, namelijk socialesteun, erkenning, altruïsme, conformiteit, onafhankelijkheid en leiderschap.
  3. Biografische vragenlijsten:  Dit zijn systematische schriftelijke anamneses, oftewel vragenlijsten overbiografische gegevens. De te voorspellen criteria zijn vaak specifiek, en het aantalbiografische gegevens is groot en complex. Daarom wordt hiervoor meestal eenspecifieke vragenlijst gemaakt.
  4. Persoonlijkheidsvragenlijsten:  het gaat hier om persoonlijkheidstrekken, zoals neuroticisme, extraversieenzovoort. De proefpersoon krijgt eenvoudige vragen die met dezepersoonlijkheidstrekken samenhangen. Uitgaande vanpersoonlijkheidsvragenlijsten zijn er drie soorten constructies:a. Zuiver empirisch samengestelde vragenlijsten op basis van hunrelatie met een relevant geacht criterium. Bijvoorbeeld de PMT meet één trek;de MMPI meet een aantal trekken;b. Via factoranalyse of clusteranalyse. De items worden samengestelduit een groot aantal persoonlijkheidstests. Bijvoorbeeld 16PF en GZTS;c. Vanuit een theorie over persoonlijkheid of temperament.Bijvoorbeeld de Amsterdamse Biografische Vragenlijst, de NEO-PI-R of de NEO-FFI.

Er zijn ook zelfbeoordelingsmethoden die anders werken dan met vragenlijsten. Enkelevoorbeelden zijn:

  1. De Osgoodschalen of de methode van de semantische differentiaal:  De proefpersoon moet een aantal objecten, gebeurtenissen of een serieeigenschappen beoordelen op een aantal bipolaire dimensies, zoals mooi/lelijk,sterk/zwak of glad/ruw. Door factoranalyse kwamen de onderzoekers tot driesignificante dimensies waarop de antwoorden van de proefpersonen gescoordkunnen worden. Deze zijn: evaluatie (goed/slecht), activiteit (actief/passief) enpotentie (sterk/zwak). Deze dimensies bleken niet sterk cultuurgebonden te zijn.Door de beoordelingen van de respondenten over te brengen op deze 3 dimensies,krijgt men een indruk van hun beleving van bepaalde verschijnselen (zoalshuwelijk, liefde, rechtvaardigheid, hun beroep of zichzelf).

interpretatiecategorieën gebaseerd op kwalitatieve kenmerken van de reacties op detestopgaven. Er zijn zes categorieën projectietests of projectieve methoden.

  1. Perceptietests:  de onderzochte reageert op ongestructureerde (inkt)vlekken, elkezingeving en duiding wordt door de psycholoog geïnterpreteerd. Bijvoorbeeld deRorschachtest of Holtzman Inkblot Test.
  2. Interpretatietests:  men moet vanuit persoonlijke interpretatie de afgebeelde situatieinterpreteren of met elkaar in verband brengen. Bijvoorbeeld de ThematicApperception Test (TAT) of de Vier-Platen-Test.
  3. Expressietests:  bijvoorbeeld de boomtest of de grafologie.
  4. Constructietests:  ook wel speeltests, bijvoorbeeld de Scenotest.
  5. Associatietests:  bijvoorbeeld de zinaanvullingstest of de frustratietest.
  6. Keuzetests:  bijvoorbeeld de Szonditest.

Wat zijn voorbeelden van tests en voldoen ze aan de zes

kenmerken van tests?

RAKIT – algemene intelligentie (revisie Amsterdamse

KinderIntelligentieTest)

De test bestaat uit 12 deeltests die samen de algemene intelligentie meten van kinderenvan 4-11 jaar. De test heeft een lange en een korte versie (voor een gedifferentieerdbeeld of een globale indruk), en sluit aan bij Thurstone (zeven intelligentiefactoren) enGuilford (drie dimensies). Wordt door COTAN beoordeeld als een goede test.

De test voldoet aan de zes kenmerken van een test (zie H2) waardoor dezeonderscheiden wordt van het voorwetenschappelijk oordeel:

  1. Efficiëntie: door het groot aantal gevarieerde taken kan in relatief korte tijd een vrij volledig beeld gekregen worden van het complexe intelligentiebegrip. Observatie ‘in vivo’ zou veel meer tijd kosten.

  2. Standaardisatie : de test wordt individueel voorgelegd en duurt 2-2,5 uur. Heeft zeer gedetailleerde richtlijnen voor de proefleider, de handleiding bevat veel aanwijzingen over de procedure en gedetailleerde instructies per deeltest. Er wordt nadrukkelijk genoemd dat zich niet houden aan de aanwijzingen de testprestaties nadelig kan beïnvloeden.

  3. Normering: genormeerd op basis van zeven leeftijdsgroepen (4,5-11 jaar) van duizenden proefpersonen. Groepen zijn samengesteld op basis van regio, urbanisatiegraad, schoolgrootte, leeftijd en sekse. De ruwe testscores zijn omgezet naar een goed te interpreteren schaal. En er is een samenvattende score van de algemene intelligentie beschikbaar.

  4. Objectiviteit: over het algemeen objectief, maar soms ook een subjectieve beoordeling. De uiteindelijke testscore wordt verkregen met een goed omschreven (maar complexe) scoringsprocedure. Er kan niet worden uitgesloten dat verschillende beoordelaars tot verschillende scores komen.

  5. Betrouwbaarheid: de betrouwbaarheid is gegeven voor drie leeftijdsgroepen – wat voor de ene leeftijd betrouwbaar is, hoeft namelijk niet voor de andere leeftijd betrouwbaar te zijn. De deeltests zijn in alle leeftijdsgroepen redelijk tot voldoende betrouwbaar, de totaalscore is zelfs zeer betrouwbaar.

  6. Validiteit: de samenhang van de deeltests met externe variabelen is onderzocht om de betekenis vast te stellen. Vastgesteld kan worden dat de RAKIT een aantal relevante criteria (CITO-scores, vervolgonderwijs) behoorlijk goed kan voorspellen.

Test voor transitief redeneren – specifieke test (computertest

Bouwmeester)

Transitief redeneren is op basis van voorgaande kennis (premissen) een antwoord op eenprobleem af te leiden. Het kunnen afleiden van transitieve relaties is belangrijk voor hetonderwijs en dagelijks leven bij het nemen van rationele beslissingen (bijvoorbeeldbepalen in welke winkel een bepaald product het goedkoopst is). De test bestaat uit 16taken (via de computer); per taak krijgt men eerst de premissen te zien, waarbij het kindbijvoorbeeld moet aangeven welke stok het langst is. Daarna wordt gevraagd naar derelatie tussen twee stokken die nog niet als premissenpaar zijn gegeven, maar die wel afte leiden is uit de premissen.

Voldoet de test voor transitief redeneren aan de zes kenmerken van een test?

  1. Efficiëntie: diverse relevante aspecten van transitief redeneren komen in korte tijd aan bod.
  2. Standaardisatie : het kan afgenomen worden door een getrainde proefleider aan individuele kinderen; de kinderen krijgen uitleg en proeftaken. De proefleider reageert op vragen op een vooraf goed doordachte manier – zonder het oplossingsproces te sturen. Testtijd is ongeveer een half uur (varieert per leeftijd).
  3. Normering: het wordt alleen in wetenschappelijk onderzoek gebruikt. Er zijn geennormen voor individuele diagnostiek beschikbaar.
  4. Objectiviteit : de reacties worden via de computer geregistreerd, de uitleg isgestandaardiseerd. De objectiviteit was voldoende hoog.
  5. Betrouwbaarheid: betrouwbaarheid van de somscore op de items was ook voldoende hoog.
  6. Validiteit: volgens Piaget zijn er twee vaardigheden voor transitief redeneren, maar volgens Bouwmeester is er maar één (hooguit daarnaast nog verbale vaardigheid voor de verbale taken). De onderzoeken van Bouwmeester geven nauwkeurig weer wat de test meet.

NEO – meting van de Big-Five persoonlijkheidsstructuur

Deze test meet vijf dominante persoonlijkheidskenmerken:

  1. Neuroticisme : emotionele labiliteit versus emotionele stabiliteit: angst speelt een dominante rol.
  2. Extraversie: extraversie versus introversie: naar binnen of naar buiten gerichte energie, aandacht en oriëntatie.
  3. Openheid: openstaan voor ervaringen versus conventionaliteit en geslotenheid: intellectuele nieuwsgierigheid, voorkeur voor variatie en esthetiek.
  4. Altruïsme: altruïsme versus egoïsme: georiënteerd op de belangen van anderen, hulpvaardig, gericht op samenwerken.
  5. Consciëntieusheid: de mate van goed georganiseerd zijn, volhardend, ambitieus, betrouwbaar en gewetensvol handelen.

Individuele tests

Bij een individuele test is er sprake van een individuele testsituatie en individueleinstructie. Er is een individuele relatie tussen de testleider en de onderzochte, de vragenworden stuk voor stuk geformuleerd of aangeboden en reacties/prestaties wordenpersoonlijk vastgelegd. Is vooral in Europa populair. Voordelen aan deze test zijn (1) demogelijkheid om de onderzochte te stimuleren, (2) controle op de situatie en op deinhoud en (3) de mogelijkheid tot observatie van de onderzochte. Nadelen zijn degeringe efficiëntie en dat de informatie niet op een systematische wijze verkregen wordt.

Groepstests

Bij een groepstest geeft de testleider instructies aan een groep. Een voordeel isefficiëntie en de besparing van geld en tijd. Nadelen zijn problemen met de orde houdenen het risico op afkijken; zaken die invloed kunnen hebben op de testprestatie. Hoe grooteen groep mag zijn, hangt af van de aard van de test, het doel van het onderzoek en deleeftijd van de onderzochten. Bij patiënten, jonge kinderen en in ontwikkelingslanden isgroepsgewijs testen moeilijker en bij kinderen jonger dan 5 jaar helemaal onmogelijk.

Zowel individuele test als groepstest kunnen schriftelijk en via de computer wordenafgenomen. Individuele tests kunnen daarnaast ook mondeling worden afgenomen ofmiddels een verrichtingstest.

Wat is het verschil tussen een snelheidstest en een niveautest?

Een snelheidstest wordt ook wel speedtest genoemd. Een niveautest noemt men ook welpowertest. Uitgaande van een vaste periode kijkt men bij een snelheidstest hoe sneliemand een bepaalde opdracht af heeft.

Snelheidstest

 Veel opgaven, dus het is nooit binnen de toegestane tijd af. De opgaven zijn ongeveer even moeilijk. De opgaven zijn vaak bijzonder gemakkelijk. Bij de beoordeling worden fouten vaak niet meegerekend.

Niveautest

 Opgaven zijn niet even moeilijk. Opgaven lopen van makkelijk naar moeilijk. Iedereen kan de makkelijkste oefeningen maken en vrijwel niemand de moeilijkste. Geen tijdslimiet (hoewel in de praktijk vaak wel, maar dan ruim genomen). Beoordeling op basis van de correcte oplossingen.

Een interessante vraag is of tests, onder de verschillende voorwaarden van snelheid ofniveau, toch dezelfde eigenschap kunnen meten. Het lijkt dat snelheidstestssamenhangen met kwantiteit en niveautests met kwaliteit. Er is een positieve correlatiegevonden tussen de prestaties onder beperkte en onbeperkte tijd.

Meili kwam met twee hypothesen met betrekking tot de verhouding tussen snelheid enniveau:

  1. De snelheid waarmee gemakkelijk opgaven worden opgelost geeft geen aanwijzing voor het vermogen moeilijk opgaven op te lossen.
  2. De snelheid waarmee moeilijke opgaven worden beantwoord is wel een aanwijzing voor het vermogen als zodanig om deze problemen op te lossen, maar weer niet voor de snelheid waarmee eenvoudiger taken worden verricht.

Er is een gedeeltelijke bevestiging van beide hypothesen gevonden: de snelheid bijmakkelijke opgaven stond los van de intelligentie en de snelheid van werken bij moeilijkeopdrachten.

Model van Van der Ven: de precisiescore is de proportie goede antwoorden en desnelheidsscores is het aantal geprobeerde items. De correlatie tussen precisie en snelheidkan door deze twee scores worden verklaard – onder de aannamen dat precisie ensnelheid onafhankelijk van elkaar zijn. Maar dit model werd bekritiseerd door Van denWollenberg. Als alternatief voor de precisiescore stelde hij de persoonsscore uit hetRasch-model voor. Hij vond ook dat precisie en snelheid niet helemaal onafhankelijk zijnen dat er meer eigenschappen ten grondslag liggen aan de testprestatie dan deze tweealleen.

Bij het testen van woordenschat, kennisniveau en sensorische of artistieke vaardighedenis het snelheidselement niet belangrijk. Als het wel belangrijk is, moet de mate van desnelheid empirisch worden bepaald, afhankelijk van wat men wil weten of voorspellen.De optimale praktische uitvoering van een tijdslimiet (wel of niet, en hoe lang dan) hangtsamen met de betrouwbaarheid en betekenis van de test.

Welk onderscheid kan er gemaakt worden op basis

van testvragen?

De belangrijkste begrippen in verband met de onderscheidingen op basis van testvragenzijn: cultuurvrije en niet-cultuurvrije tests en directe en indirecte tests.

Wat is het verschil tussen cultuurvrije en niet-cultuurvrije tests?

Het gaat hier meer om een continuüm dan om een tegenstelling. Een zuivere cultuurvrijetest bestaat niet en men moet er ook niet naar streven. De mens wordt altijd beïnvloeddoor zijn omgeving. Ook non-verbale tests zijn niet helemaal cultuurvrij. Non-verbaletests blijken vaak laag te correleren met allerlei relevante criteria. Misschien komt ditomdat de taal eruit gehaald is, die mogelijk een wezenlijke bijdrage levert aan het begripintelligentie.

Het is beter om het complexe begrip ‘cultuur’ te vervangen voor een begrip dat beteromschreven kan worden, zoals het begrip ‘skill’. Om mee te kunnen doen aan een testheeft men bepaalde vaardigheden, 'skills', nodig, zoals het kunnen horen van instructies:vaardigheden die men met de test juist niet wil meten. Sommige skills zijn fysiologischbepaald (kunnen horen of zien), anderen worden beïnvloed door cultuur ofomgevingsinvloeden (kunnen lezen, schrijven etc.).

De invloed van skill-verschillen kan op drie manieren worden gereduceerd:

  1. Door het verkleinen van de skill-verschillen zelf, door bijvoorbeeld de instructie uit te breiden.
  2. Door interpretaties en testscores te beperken tot slechts dat deel van de populatie dat de vereiste skills bezit.
  3. Door het ontwikkelen van ‘skill reduced tests’, bijvoorbeeld de Design Construction Test van Ord, de SON (voor doven). Het doel is de groep te vergroten waarbinnen uit de testscores conclusies over de te meten capaciteit kunnen worden getrokken.

Wat is het verschil tussen directe en indirecte tests?

Een belangrijke vraag is of het doel van de test bekend is bij de onderzochte. Vrijwel alleprojectiemethoden en de meeste zelfbeoordelingen en persoonlijkheidsvragenlijstenvallen onder indirecte tests; de onderzochte weet het doel van de test niet. Bij directe

Samenvatting testgebruik - Wat is een eerste omschrijving van een test? Bij een test gaat het om een - Studeersnel (2024)

References

Top Articles
Latest Posts
Article information

Author: Rev. Porsche Oberbrunner

Last Updated:

Views: 5819

Rating: 4.2 / 5 (73 voted)

Reviews: 88% of readers found this page helpful

Author information

Name: Rev. Porsche Oberbrunner

Birthday: 1994-06-25

Address: Suite 153 582 Lubowitz Walks, Port Alfredoborough, IN 72879-2838

Phone: +128413562823324

Job: IT Strategist

Hobby: Video gaming, Basketball, Web surfing, Book restoration, Jogging, Shooting, Fishing

Introduction: My name is Rev. Porsche Oberbrunner, I am a zany, graceful, talented, witty, determined, shiny, enchanting person who loves writing and wants to share my knowledge and understanding with you.