NOVÁ MATURITA

SPOLEČNÉ MENU

Slovníček pojmů

Alternativy

představují všechny nabízené odpovědi (správné i nesprávné) v úlohách s výběrem odpovědi. Nesprávné odpovědi jsou označovány pojmem distraktory.

Distraktory

představují nesprávné nabízené odpovědi v úlohách s výběrem odpovědi. Všechny odpovědi (správné i nesprávné) se označují pojmem alternativy.

Úspěšnost žáků v testové úloze

vyjadřuje v procentech podíl žáků, kteří úlohu úspěšně vyřešili, a všech testovaných žáků. Pokud je například úspěšnost žáků v testové úloze 80 %, znamená to, že úlohu vyřešilo správně 80 % žáků z celkového počtu testovaných žáků.
V případě, že úloha připouští částečně správné řešení, upravuje se počet žáků podle četnosti jednotlivých bodových ohodnocení úlohy. Pokud je například testová úloha hodnocena 2 body za zcela správné řešení a 1 bodem za částečně správné řešení a pokud 40 % žáků dalo zcela správnou odpověď a 40 % žáků částečně správnou odpověď, celková úspěšnost žáků v dané testové úloze je 60 % (z žáků, kteří dali částečně správnou odpověď za 1 bod, do výpočtu vstoupí pouze polovina).
Pojem úspěšnost se používá ve vztahu k řešitelům, kteří řešili danou úlohu, zatímco pojem obtížnost se používá ve vztahu k dané testové úloze. Pro úplnost se mohou rozlišovat tři druhy úspěšností žáků v testové úloze:

  • čistá úspěšnost – podíl žáků, kteří úlohu vyřešili správně (respektive částečně správně), a všech testovaných žáků;
  • korigovaná úspěšnost – podíl žáků, kteří úlohu vyřešili úspěšně, a všech testovaných žáků, kteří se k úloze dostali (z výpočtu jsou vyloučeni žáci, kteří se k řešení úlohy nedostali za předpokladu, že řešili úlohy v tom pořadí, v jakém byly uvedeny v testovém sešitu);
  • hrubá úspěšnost – podíl žáků, kteří úlohu vyřešili zcela správně, a všech testovaných žáků (v případě, že úloha umožňuje částečně správné řešení, jsou do výpočtu zařazeni pouze ti žáci, kteří odpověděli zcela správně a získali plný počet bodů).

Obtížnost testové úlohy

je odvozena od počtu žáků, kteří dali správnou odpověď na danou úlohu, je vyjádřena desetinným číslem. Pokud je například obtížnost úlohy 0,65, znamená to, že ze všech získaných odpovědí na danou úlohu bylo 65 % správných. Pojem obtížnost úlohy se používá jako jedna z charakteristik testové úlohy. Využívá se k celkovému posouzení vhodnosti zařazení úlohy do testu.

Diskriminační schopnost testové úlohy (citlivost testové úlohy)

vypovídá o schopnosti úlohy rozlišovat mezi žáky s většími znalostmi a dovednostmi a žáky s menšími znalostmi a dovednostmi. K rozlišení žáků na „lepší“ a „slabší“ se většinou používá jejich celkový výsledek v testu. Vysokou citlivost má taková úloha, kterou řeší „lepší“ žáci podstatně úspěšněji než žáci „slabší“. V případě, že jsou v řešení úlohy úspěšnější „slabší“ žáci, obsahuje úloha pravděpodobně nějakou konstrukční chybu.
Diskriminační schopnost souvisí s ostatními charakteristikami testové úlohy, například s obtížností. Při interpretaci je proto nutné vzít v úvahu všechny psychometrické charakteristiky úlohy.

Diskriminační schopnost úlohy se nejčastěji vyjadřuje následujícími třemi způsoby:

  • Diskriminace RIR,
  • Diskriminace,
  • Grafické vyjádření diskriminace.

Diskriminace RIR

se vypočítá jako Pearsonův lineární korelační koeficient mezi dosaženým výsledkem v dané testové úloze a výsledkem celkovým (při vyloučení dané úlohy). Nabývá hodnot od -1 do 1. Čím blíže je hodnota krajním pólům intervalu <-1;1>, tím silnější je vzájemný vztah mezi úspěšností v dané úloze a úspěšností ve zbytku testu. Záporné hodnoty znamenají, že žáci, kteří správně řešili danou testovou úlohu, dosáhli spíše nízkého celkového výsledku ve zbytku testu, a naopak. Kladné hodnoty svědčí o tom, že žáci úspěšní v řešení dané úlohy byli rovněž úspěšní při řešení ostatních úloh, tj. celého testu. Aby bylo možné označit úlohu za přiměřeně citlivou, měla by diskriminace RIR dosahovat nejméně hodnoty 0,25–0,3.

Diskriminace

je rozdíl úspěšnosti skupiny nejlepších žáků a nejhorších žáků při řešení úlohy. Při výpočtu se postupuje následujícím způsobem: žáci se seřadí podle celkového výsledku do pořadí od nejlepších po nejhorší, rozdělí se na pět stejně početných skupin, pro každou skupinu se vypočítá úspěšnost žáků v řešení dané testové úlohy a následně se odečte úspěšnost nejhorší skupiny od úspěšnosti skupiny nejlepší. Je žádoucí, aby každá z úloh měla diskriminaci s co nejvyšší kladnou hodnotou. Úlohy s diskriminací rovnou nule či dokonce zápornou se považují za nevhodné.

Grafické znázornění diskriminace

znázorňuje úspěšnost žáků v testové úloze v závislosti na jejich celkovém výsledku. Při vytváření grafu se postupuje následujícím způsobem: žáci se seřadí podle celkového výsledku do pořadí od nejlepších po nejhorší, rozdělí se na pět stejně početných skupin, pro každou skupinu se vypočítá úspěšnost žáků v řešení dané testové úlohy a úspěšnosti se zanesou do grafu. Propojením bodů vyjadřujících úspěšnosti žáků jednotlivých skupin v řešení úlohy vznikne diskriminační křivka.

Průměrný výsledek

vyjadřuje průměrný počet dosažených bodů v testu / souboru testových úloh. Za každou správně vyřešenou úlohu v testu získává žák určité bodové ohodnocení. Součet všech bodů, které je možné v testu získat, označujeme jako maximální (nejvyšší možný) dosažitelný výsledek. Pro každého žáka je vypočten individuální výsledek (součet dosažených bodů). Průměrný výsledek se pak vypočítá jako součet výsledků jednotlivých žáků dělený jejich počtem (tedy jako aritmetický průměr).

Průměrná úspěšnost

vyjadřuje v procentech poměr průměrného výsledku a maximálního (nejvyššího možného) dosažitelného výsledku. Pokud je například průměrný výsledek 25 a nejvyšší možný 50, pak je průměrná úspěšnost žáků v testu / souboru testových úloh rovna 50 %.

Reliabilita testu / souboru testových úloh

představuje míru přesnosti a spolehlivosti testu. Pouze test, který měří přesně a spolehlivě, poskytuje směrodatné informace o úrovni znalostí a dovedností žáků. Test je přesný tehdy, jestliže při jeho použití nedochází k velkým chybám v měření. Spolehlivost testu spočívá v tom, že za týchž podmínek poskytuje test stejné výsledky. K výpočtu reliability se nejčastěji používají vzorce KR-20, L2 nebo Cronbachovo alfa. Čím je reliabilita vyšší, tím menší vliv má na výsledek testu náhoda. Při reliabilitě 0 by šlo o výsledky zcela náhodné, při reliabilitě 1 by naopak šlo o zcela přesné výsledky. V praxi se reliabilita pohybuje nejčastěji mezi 0,5 a 0,95. Většinou se požaduje koeficient reliability minimálně 0,8.

Validita testu

vyjadřuje míru shody (zjišťovanou na základě posudků expertů nebo empiricky zjištěných údajů) mezi výsledky testu a účelem, pro který byl test vytvořen. Aby byl test dostatečně validní, musí mít vysokou reliabilitu. Vysoká reliabilita didaktického testu však ještě není zárukou toho, že test bude validní.

Objektivita testu

je vlastnost, která se vztahuje k testovému skóre. Aby byl test objektivní, nesmí být jeho výsledky ovlivněny subjektivními názory či postoji hodnotitelů testu. To znamená vyhodnocování výsledků buď automaticky pomocí speciálního počítačového softwaru nebo více nezávislými posuzovateli, kteří dojdou ke stejnému výsledku. Je zřejmé, že nízká objektivita testu snižuje i jeho reliabilitu.