Didaktické testy
Test obecně představuje zkoušku, jejíž podmínky jsou pro všechny testované jedince shodné a jejíž výsledky mají číselný charakter. Didaktický test je zvláštním druhem testu v oblasti ověřování výsledků vzdělávacího procesu.
Didaktický test vs. ústní zkouška
Nezbytnou součástí vzdělávacího procesu jsou zkoušky. Jejich forma a obsah se liší v závislosti na účelu, za kterým jsou použity. Nejběžnějším účelem zkoušek je průběžné nebo výstupní ověřování osvojených znalostí a dovedností žáků v určité oblasti a za určité časové období. Tyto zkoušky mohou mít formu didaktického testu nebo ústní zkoušky, případně jiné. Každá forma s sebou nese jisté výhody a nevýhody.
Didaktický test má obvykle písemnou formu. V porovnání s ústní zkouškou má didaktický test především tyto výhody:
- menší subjektivní vliv osobnosti učitele na zadání úkolů a hodnocení jejich řešení,
- srovnatelné podmínky (úkoly, čas, hodnotící kritéria) pro všechny žáky,
- snížená časová náročnost.
Vlastnosti didaktického testu
Prostřednictvím didaktických testů obvykle chceme zjišťovat úroveň znalostí a dovedností žáků v určité oblasti. Údaje, které na základě testu získáme, jsou však hodnotné pouze za předpokladu, že použitý test je kvalitním měřícím nástrojem. Kvalitní test musí vykazovat tyto vlastnosti: objektivita, validita a reliabilita.
Účelem didaktického testu je vyslovit na základě výsledků přesný závěr o úrovni znalostí a dovedností žáků. Tento závěr je možné učinit pouze při použití kvalitního didaktického testu, tj. testu, který splňuje následující charakteristiky:
- objektivita, srovnatelnost,
- validita,
- reliabilita,
- citlivost.
Objektivita a srovnatelnost
Výsledky některých druhů zkoušek jsou významně ovlivněny působením faktorů, které jsou pro účely dané zkoušky nepodstatné. Příkladem může být subjektivní vliv vyučujících při kladení otázek a hodnocení žákovských odpovědí v rámci ústní zkoušky. Správně konstruovaný didaktický test je schopný poskytnout objektivní a tedy srovnatelné výsledky, které závisí pouze na znalostech a dovednostech jednotlivých žáků. V testu jsou žákům předloženy shodné úlohy s předem určeným správným řešením a se stejným časovým limitem. Žáci tak mají shodné výchozí podmínky při ověřování svých znalostí a dovedností. Tyto shodné podmínky současně umožňují porovnávat výsledky dosažené jednotlivými žáky.
Objektivita a srovnatelnost nejsou vlastností každého testu, ale pouze testu kvalitního a konstrukčně správného. Objektivita může být snížena například nejednoznačně formulovanými úlohami.
Validita
Validita představuje shodu mezi funkčností testu a účelem, pro který byl test vytvářen. Test je validní, pokud ověřuje ty znalosti a dovednosti, pro které byl zkonstruován. Zjednodušeně řečeno – test z dějepisu není validní, jestliže do něj zahrneme úlohy z matematiky. Nízká validita testu znemožňuje interpretaci výsledků, a tedy jejich další využití v pedagogické praxi. Validita testu může být ohrožena nesprávným postupem při konstrukci úloh nebo chybným výběrem učiva, které má být testem ověřováno.
Konstrukční chyby vedoucí ke snížení validity se týkají zejména toho, že k vyřešení úlohy je nutné provést několik myšlenkových operací, z nichž některé nemusí být žákům známé. Autoři úloh mohou předpokládat určitou operaci jako samozřejmou, nepovažují ji proto za cíl úlohy. Pro žáky však právě tato operace může být překážkou k úspěšnému vyřešení úlohy. Příkladem by mohl být test z dějepisu, jehož součástí jsou úlohy s výchozími texty. Pokud by texty byly příliš dlouhé a jazykově komplikované, mohou vést k neúspěchu žáka, jehož historické znalosti a dovednosti jsou na vysoké úrovni.
Zdrojem nízké validity může být také formulace testové úlohy. V důsledku použité slovní zásoby či větné stavby mohou žáci pochopit úlohu odlišným způsobem, než jak byla původně zamýšlena autory. V takovém případě má úloha pro žáky zcela jiný význam a jejich odpověď je reakcí na jiný podnět, než který v úloze spatřují autoři. Zdrojem zavádějících výsledků může být také test, který ověřuje chybně vybrané učivo. Výsledky nejsou validní, pokud test ověřuje znalosti a dovednosti, které žáci neměli možnost si ve škole osvojit (buď proto, že jej ještě neprobírali, nebo proto, že se jedná znalosti a dovednosti získávané v mimoškolních aktivitách). Na základě takového testu bychom se mohli dopustit nespravedlivého závěru, že např. určitý žák má slabé znalosti a dovednosti v moderní literatuře, ačkoliv se toto téma v dané škole dosud nevyučovalo.
Reliabilita
Reliabilita představuje míru přesnosti a spolehlivosti testu. Pouze test, který měří přesně a spolehlivě, poskytuje směrodatné informace o úrovni znalostí a dovedností žáků. Přesné měření znamená, že výsledek v testu vypovídá o skutečných znalostech a dovednostech žáků. Představme si žáka s jeho znalostmi a dovednostmi. Tyto znalosti a dovednosti chceme změřit a vytvoříme za tím účelem didaktický test, který zadáme žákovi. Jeho výsledek v testu však nevypovídá přímo a pouze o jeho znalostech a dovednostech, nýbrž obsahuje také jisté zkreslení. Toto zkreslení má původ v kvalitě testu, v porozumění úlohám, v podmínkách, za kterých je test zadáván atd. Pokud je test dostatečně kvalitní, tj. reliabilní, je zkreslení velmi malé a výsledek v testu je téměř totožný se žákovými skutečnými znalostmi a dovednostmi. Spolehlivé měření znamená, že test poskytuje stabilní, opakovatelné výsledky. V ideálním případě by měl stejný žák při opakovaném zadání testu dosáhnout shodného výsledku. Pokud test neměří spolehlivě, znamená to, že do výsledků interferuje řada vnějších, náhodných vlivů. Na základě takových výsledků není možné činit závěry o žácích.
Citlivost
Citlivost neboli diskriminace vypovídá o schopnosti testu rozlišovat mezi žáky s různými skutečnými znalostmi a dovednostmi. Je-li test citlivý, měly by být výsledky žáků přiměřeně rozprostřeny po celé bodové škále. Pokud je například možné v testu získat maximálně 30 bodů a 90 % žáků získalo 25 bodů a více, není test citlivý. Optimální míra citlivosti se liší v závislosti na účelu testu. Test, jehož cílem je rozhodnout, kteří žáci mají být přijati na vysokou školu, musí být citlivý. Naopak pro test, jehož prostřednictvím chceme ověřit, zda si každý jednotlivý žák osvojil určité učivo, není vysoká míra citlivosti nutnou podmínkou jeho úspěšného použití.
Druhy didaktických testů
Didaktické testy se liší podle cíle, pro který jsou vytvářeny, a podle podmínek, za kterých jsou zadávány. Obvykle se didaktické testy rozlišují podle ověřovaného výsledku učení, podle měřené charakteristiky výkonu, podle formy zadání a podle interpretace testových výsledků.
Didaktické testy jsou využívány v různých podmínkách a k různým účelům, které určují koncepci a obsah testu. Testy je možné roztřídit podle řady kritérií. Nejběžněji se používá klasifikace testů podle formy zadání, ověřovaného výsledku učení, měřené charakteristiky výkonu a interpretace výsledků. Toto třídění však není úplné ani jednoznačné.
Z hlediska konstrukce didaktického testu je klíčovým třídícím kritériem způsob interpretace testových výsledků. Způsob interpretace výsledků není podstatný pouze v závěrečných fázích používání didaktického testu, ale určuje také postup při konstrukci testu včetně výběru obsahu a typů testových úloh. V pedagogické praxi jsou často funkce rozlišujících a ověřujících testů kombinovány.
Testy rozlišující (neboli testy relativního výkonu, NR-testy)
- Cíl testu: vzájemné porovnání žáků
- Interpretace výsledků: pořadí žáků podle skóre
- Požadované vlastnosti testu: vysoká citlivost
- Postup při konstrukci testu: obtížnější úlohy s vysokou citlivostí
- Použití testu: např. přijímací zkoušky
Testy ověřující (neboli testy absolutního výkonu, CR-testy)
- Cíl testu: ověřit, zda výkony konkrétního žáka splňují předem daná kritéria
- Interpretace výsledků: míra splnění předem daných požadavků, porovnání výkonu žáka s "ideálním žákem"
- Požadované vlastnosti testu: validita vůči ověřovanému učivu
- Postup při konstrukci testu: úlohy různých obtížností, obsahové zastoupení všech předem vymezených požadavků
- Použití testu: např. test v autoškole
Konstrukce didaktického testu
Tvorba didaktického testu zahrnuje několik fází, v jejichž rámci dochází k plánování, sestavování a ověřování testu. Splnění každé z dílčích fází je nezbytné pro sestavení kvalitního testu. Pokud není některé fázi věnována dostatečná pozornost, může být ohrožena objektivita, validita či reliabilita testu. Na základě výsledků takového testu pak není možné vyslovit přesný závěr o úrovni znalostí a dovedností žáků.
Vytvořit kvalitní didaktický test je náročný proces, na němž spolupracuje řada odborníků (předmětoví specialisté, autoři úloh, recenzenti, analytici atd.). Tvorba celého testu probíhá v několika základních fázích. Pokud nejsou úkoly jednotlivých fází řádně splněny, zvyšuje se riziko, že vytvořený test nebude kvalitním nástrojem měření žákovských znalostí a dovedností.
Fáze tvorby didaktického testu
a) Plánování testu:
- definování cíle testu, tj. k čemu mají sloužit testové výsledky
- vymezení obsahu testu, tj. jaké učivo má být prostřednictvím testu ověřováno
- vypracování specifikační tabulky, která obsahuje závazný počet úloh určitého typu a obsahu zařazených následně do testu
b) Sestavování testu:
- výběr testových úloh podle pravidel stanovených specifikační tabulkou
- řazení úloh tak, aby podporovalo správné strategie řešení testu
- odhad časové náročnosti testu
- volba způsobu hodnocení jednotlivých úloh a celého testu
- sestavení záznamového archu, do něhož žáci zapisují řešení úloh
c) Ověřování testu:
- posouzení obsahové a konstrukční kvality testu odbornými recenzenty
- ověření kvality testu prostřednictvím zadání žákům (try-outy, pilotáže)
d) Použití testu
Výše uvedený postup obsahuje riziko prozrazení znění testu před jeho zadáním. Ve fázi ověřování je test obvykle zadán určité skupině žáků a na základě jejich výsledků se posuzuje, zda je test dostatečně kvalitní. Tento způsob ověřování klade velké nároky na bezpečnostní zajištění. V případě, že dojde k úniku informací z pilotně testované skupiny žáků, je celý test znehodnocen a nemůže být použit, neboť výsledky v něm by již nebyly objektivní a spravedlivé. Pokud je ověřován přímo celý test, je riziko prozrazení považováno za neúměrně vysoké. Z toho důvodu se častěji než celé testy ověřují pouze jednotlivé úlohy. Pořadí fází sestavování a ověřování jsou v takovém případě zaměněny. Test je sestavován z úloh, které samostatně prošly ověřením a byly shledány obsahově a konstrukčně vhodnými.