Основные показатели эффективности теста. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Основные показатели эффективности теста.



Для того, чтобы психолого-педагогический эксперимент был достаточно надежным средством исследования, необходимо, чтобы используемые в нем психодиагностические методы отвечали следующим критериям: валидность, надежность, однозначность и точность.

Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании.

В психометрике термин надежность имеет два значения. На одном из них — на дежности по внутренней согласованности Если некоторая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют нечто другое. Существует несколько способов определения надежности.

Надежность ретестовая — предполагает повторное предъявление того же самого теста тем же испытуемым и примерно в тех же условиях, что первоначальное, а затем установление корреляции между двумя рядами данных. При использовании этого способа определения надежности нужно отдавать себе отчет в том, что испыту­емые могут запомнить свои ответы и воспроизвести их во второй раз, поэтому по­вторное тестирование должно быть отделено от первого более-менее значительным временным интервалом, обычно не менее месяца. Наименьшим удовлетворительным значением для ретестовой надежности яв­ляется коэффициент корреляции, равный 0,7. Правда, для некоторых тестов этот показатель может быть несколько ниже.

Надежность параллельных форм предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами. Основная пробле­ма, препятствующая широкому распространению этого способа определения надежности, — необходимость подготовки двух наборов заданий, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности.

Надежность частей теста определяется путем деления опросника на две час­ти (обычно на четные и нечетные задания), после чего и рассчитывается корреля­ция между этими частями. Обычно к этому способу определения надежности рекомендуется прибегать только в тех случаях, когда необходимо быстро получить результаты.

Для определения ретестовой надежности и надежности параллельных форм корреляции подсчитывается на основе коэффициента произведения моментов Пирсона. Все исследования надежности должны выполняться на достаточно больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надежность — важная характеристика теста, но сама по себе ценности не представляет. Она необходима для достижения валидности.

Валидность теста

Существует достаточно много разных способов доказательства валидности теста. О них и пойдет речь далее.

Тест называется валидным, если он измеряет то, для измерения чего предназначен.

Очевидная валидность — описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности, чем-то схожий с вызывающим уважение и в какой-то ме­ре трепет медицинским диагностическим инструментарием. Очевидная валид­ность приобретает особое значение в современных условиях, когда представление о тестах в общественном сознании формируется многочисленными публикация­ми в популярных газетах и журналах того, что можно назвать квазитестами, с по­мощью которых читателю предлагается определить все, что угодно: от интеллек­та до совместимости с будущим супругом.

Конкурентная валидность оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена. П. Клайн отмечает, что данные о конкурентной валидности полезны тогда, когда есть неудовлетворительно работающие тесты для измерения некоторых пе­ременных, а новые создаются для того, чтобы улучшить качество измерения. В са­мом деле, если уже существует эффективный тест, то для чего нужен такой же новый?

Прогностическая валидность устанавливается с помощью корреляции между показателями теста и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время. Например, прогностическая валидность какого-либо теста интеллекта может быть показана корреляцией его показателей, полу­ченных у испытуемого в возрасте 10 лет, с академической успеваемостью в пери­од окончания средней школы.

Инкрементная валидность имеет ограниченное значение и относится к случаю, когда один тест из батареи тестов может иметь низкую корреляцию с крите­рием, но не перекрываться другими тестами из этой батареи. В этом случае дан­ный тест обладает инкрементной валидностью. Это может быть полезно при про­ведении профотбора с помощью психологических тестов.

Дифференциальная валидность может быть проиллюстрирована на примере тестов интересов. Тесты интересов обычно коррелируют с академической успева­емостью, но по-разному для разных дисциплин. Значение дифференциальной валидности, так же как и инкрементной, ограничено.

Содержательная валидность определяется через подтверждение того, что задания теста отражают все аспекты изучаемой области поведения. Обычно она определяется у тестов достижений (смысл измеряемого параметра полностью ясен!), которые, как уже указывалось, тестами собственно психологическими не являются. На практике для определения содержательной валидности подбирают­ся эксперты, которые указывают, какая область (области) поведения наиболее важна, например, для музыкальных способностей, а затем, исходя из этого, гене­рируются задания теста, которые вновь оценивают эксперты.

Конструктная валидность теста демонстрируется полным, насколько это воз­можно, описанием переменной, для измерения которой предназначается тест. По сути дела, конструктная валидность включает в себя все подходы к определению валидности, которые были перечислены выше.

Точность методики отражает ее способность тонко реагировать на малейшие изменения оцениваемого свойства, происхо­дящие в ходе психодиагностического эксперимента. Чем точнее психодиагностическая методика, тем тоньше с ее помощью можно оценивать градации и выявлять оттенки изме­ряемого качества. Однако в практической психодиагностике да­леко не всегда требуется очень высокая степень точности оценок. Ее необходимая практическая мера определяется задачей диф­ференциации, или разделения испытуемых на группы.

Однозначность методики характеризуется тем, в какой сте­пени получаемые с ее помощью данные отражают изменения именно и только того свойства,для оценивания которого данная методика применяется. Если наряду с этим свойством в получае­мых показателях отражаются и другие, никак не связанные с дан­ной методикой, выходящие за пределы ее валидности, то считается, что методика не соответствует критерию однозначности, хотя при этом частично может оставаться валидной.

Если измерительный инструмент не соответствует критериям валидности и надежности, то его вообще нельзя использовать как средство психодиагностики. Если же методика не вполне точна и не полностью однозначна, то ее тем не менее можно применять с определенными оговорками.



Поделиться:


Последнее изменение этой страницы: 2021-02-07; просмотров: 378; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.216.229 (0.005 с.)