|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Психометрическое обоснование диагностических методикПсихометрическое обоснование диагностических методикКонтрольная работа по психодиагностике ПСИХОМЕТРИЧЕСКОЕ ОБОСНОВАНИЕ ДИАГНОСТИЧЕСКИХ МЕТОДИК 1. ТРУДНОСТЬ ТЕСТОВЫХ ЗАДАНИЙ Теоретическая справка Определение степени трудности тестовых заданий является обязательной процедурой, с которой начинается анализ качества разрабатываемого теста. Основная цель анализа трудности заданий сводится к выбору оптимальных по сложности заданий, которые затем можно было бы упорядочить по нарастанию сложности. Тест не должен включать слишком легкие и слишком трудные задания. Обычно, если задачу решает большинство, ее помещают (как легкую) в начале теста. Если задачу решает незначительный процент испытуемых, то ее (как трудную) помещают в конце теста. Трудность задания определяется числом правильных ответов на данное задание в сравнении с общим объемом выборки по формуле: , где - количество испытуемых, давших правильный ответ, - общее количество испытуемых. Чем легче задание, тем выше этот показатель (А. Анастази,1982). Для большинства тестов принято, что задания с от 0,8 до 0,2 считаются удовлетворительными. То есть задачи, с которыми не справилось более 80% и менее 20% испытуемых, в тест не включают как мало полезные. Анастази считает, что уровень трудности должен иметь некоторый разброс, но в среднем он должен составлять 0,5. Именно в этом случае, тест обеспечивает лучшую дифференциацию результатов (см. ниже о дискриминативности теста). Если при составлении теста необходимо расположить его задания в порядке возрастания трудности, то тогда необходимо сравнить насколько одна задача трудней другой. Для этого используют статистические критерии, специально предназначенные для оценки значимости различий. В данном случае, чаще используют критерий хи-квадрат Мак-Немары: ([b - c]-1) = , где b + c где b - количество решивших первую задачу, но не решивших вторую,c - количество решивших вторую задачу, но не решивших первую. При ?2 > 6,63 6,63 - это критическое значение критеря хи-квадрат с 1 степенью свободы и при ? = 1%. различия в индексах трудности двух задач следует считать достоверными. Задание 1. Расчет индекса трудности заданий Цель задания: овладение приемами расчета индекса трудности заданий и их сравнения. Оснащение: микрокалькулятор, таблица первичных результатов (таблица №1). Таблица №1 Первичные результаты исследования с помощью теста Равена
Порядок работы: Рассчитываем индексы трудности всех 12 задач. По формуле ,
U1=20/20=1 U2=16/20=0,8 U3=19/20=0,95 U4=20/20=0,55 U5=11/20=0,55 U6=15/20=0,75 U7=11/20=0,55 U8=8/20=0,4 U9=13/20=0,65 U10=18/20=0,9 U11=16/20=0,8 U12=17/20=0,85 Выделяем задачи, индекс трудности которых оказался оптимальным или близким к оптимальному для данной выборки испытуемых. : № 2,№ 5,№ 6,№ 7,№ 8,№ 9,№ 11 Форма протокола
Проранжировать задания по принципу возрастающей трудности.
Сравнить индексы трудности самой трудной и самой легкой задачи, используя критерий Мак-Немары. Самые легкие задачи № 1 и № 4,так как их решили все. Самая трудная задача № 8,решили восемь человек. Сравним индексы трудности ([b - c]-1)2 ([12 - 0]-1) = = = 10,083 b + c 12 + 0 Оформить протокол и сделать выводы о том, индекс трудности каких заданий оказался оптимальным для данной выборки испытуемых; какие задачи были самой легкой и самой трудной для них; какова достоверность различий между самой трудной и легкой задачей. Вывод:10,083 больше, чем 6,63 значит, различия в индексах трудности следует считать достоверным. 2. ДИСКРИМИНАТИВНОСТЬ ТЕСТОВЫХ ЗАДАНИЙТеоретическая справкаПри разработке теста необходимо стремиться к тому, чтобы его задания как можно тоньше измеряли тестируемое свойство. Например, если в результате обследования почти все испытуемые получают примерно одинаковые результаты, то это означает, что тест измеряет очень грубо. Чем большее количество градаций результатов можно получить при помощи теста, тем выше его разрешающая способность. Мера тонкости измерения (или степень диффиренцируемости результатов) теста называется в психометрике дискриминативностью. Дискриминативность теста измеряется показателем дельта Фергюсона:,где N - количество испытуемых , n - количество заданий, fi - частота встречаемости каждого показателя.Наименьшая дискриминативность теста при ? = 0, наибольшая при ? = 1.Задание 2. Расчет индекса дискриминативности заданий.Цель задания: овладение навыком расчета индекса дискриминативности.Оснащение: микрокалькулятор, таблица первичных результатов (таблица №2).Первичные результаты исследования по субтесту «Арифметические задачи», которые выполняли 122 испытуемых.Таблица №2
Теоретическая справка Под надежностью теста понимается степень точности, с которой тест измеряет определенное свойство или качество. Надежность теста - это характеристика точности его как измерительного инструмента, его устойчивость к действию помех (как внешних, так и внутренних). Эмпирическое определение надежности теста является обязательным условием его допуска для использования в практической деятельности психолога. Задание 3. Расчет коэффициентов надежности Цель задания: овладение приемами расчета коэффициентов надежности заданий при помощи расщепления теста на две части (надежность частей теста). Оснащение: микрокалькулятор, таблица первичных результатов (таблица №3). Таблица №3 Первичные результаты исследования с помощью теста Равена (n=36, N=80).
Порядок работы: 1. Разделить задачи из Таблицы №3 на две части - нечетные (X) и четные (Y). 2. Вычислить средние арифметические для каждой части (). Результаты вычислений занесите в следующую таблицу: Вычисляем средние арифметические для каждой части ().
= 955/18=53 = 864/18= 48; 3. Вычислить стандартные отклонения для каждой части (, ) по формуле: , где- разность между значениями варианты и средней арифметической величиной нечетной и четной частей теста, - количество задач в нечетной и четной частях теста. Вычисляем стандартные отклонения для каждой части (, ) по формуле: , n - количество задач в нечетной и четной частях теста = 18 (для нечетной части теста)= ,22,5 ( для четной части) = = = 24,1624,2 4. Вычислить коэффициент полной корреляции между частями теста используя формулу Пирсона: , где- разность между значениями варианты и средней арифметической величиной нечетной части теста, - разность между значениями варианты и средней арифметической величиной четной части теста. Вычисляем коэффициент полной корреляции между частями теста используя формулу Пирсона: , == = 0,7950,8 0,8 коэффициент полной корреляции между частями теста. 5. Вычислить коэффициенты надежности, используя следующие формулы: а) Спирмана - Брауна: где - коэффициент корреляции по Пирсону, - стандартные отклонения нечетных и четных задач, - общее количество задач в тесте. 6. Сделайте вывод о надежности теста Равена. а) Спирмана - Брауна: = = 0,88 0,9 б) Фланагана: = = = Вывод: тест Равенна можно считать надежным, так как коэффициенты надежности приближаются к единице. 4. СТАНДАРТИЗАЦИЯ ТЕСТОВЫХ ШКАЛТеоретическая справкаСтандартизация тестовых шкал - это создание таких критериев (таблиц), по которым можно будет преобразовывать первичные результаты выполнения теста в относительные оценки.Например, испытуемый выполнил 16 заданий теста математических достижений из 32 и получил за это 16 баллов из 32 максимально возможных. Таким образом, получается, что он выполнил половину всех заданий, - 50% . Значит ли это, что его достижения можно оценить как СРЕДНИЙ УРОВЕНЬ? Ответ на этот вопрос будет зависеть от того, с чем именно мы будем сравнивать полученный испытуемым результат, с чем будем его соотносить. Если соотносить с максимально возможным баллом, то действительно можно будет сказать, что у испытуемого средний уровень математических достижений. Ну, а сели сравнить с результатами других испытуемых? Например, одинаковых с ним по возрасту, полу, социальному положению и т.п.? Вполне может оказаться, что в этом случае наш испытуемый имеет низкий или высокий уровень достижений. Все будет зависеть от того, сколько еще людей из сравниваемой выборки набрали такие же результаты, сколько - набрали ниже, сколько - набрали выше. Таким образом, во-первых, необходимо иметь данные о результативности выполнения теста определенной выборкой испытуемых, с которой мы будем соотносить наши результаты. А во-вторых, эти данные о результативности мы должны как-то разделить на равные уровни по степени результативности. При этом количество уровней может быть разным - 5 уровней результативности, 9, 10 или 100. И затем, сравнив полученные конкретным испытуемым баллы, мы можем определить его место в той выборке, с которой его соотносим. В данной работе предлагается познакомиться с методами разделения распределения результативности выполнения теста на отдельные уровни.1.Наиболее простым способом нормирования (разделения распределения на уровни) является шкала процентилей. Процентиль - это точка на числовой шкале, состоящей из 100 уровней. Ранг показателя в процентилях определяется процентным отношением в нормативной группе тех испытуемых, которые получили более низкий показатель. Например, 15 процентиль (Р15)означает, что 15% из нормативной выборки получили показатели ниже данного. Вычисление процентиля немногим сложнее, чем его определение. Оно выражается следующей формулой:Pp = L + ,где Pp - искомая величина на шкале процентилей, L - фактическая нижняя граница интервала оценок, содержащего частоту n, pn - произведение общего количества данных n на относительную частоту (т.е.p/100), f cum - накопленная к L частота, f - частота оценок в интервале, содержащем оценку n.Расчет рекомендуется проводить по следующему алгоритму:а) Упорядочить полученные результаты по возрастанию.б) Каждому первичному результату приравнять его частоту, т.е.количество испытуемых получивших такой же результат;в) Произвести накопление частотг) Подставить значения в формулу.ПРИМЕРПреподаватель предложил 125 учащимся контрольное задание, состоящее из 40 вопросов. В качестве оценки теста выбиралось количество вопросов, на которые были получены правильные ответы. Распределение частот различных результатов приводится в таблице № 4. Необходимо определить каков 25-й процентиль в группе 125 оценок, т.е. чему равен Р5. Р5 - это точка, ниже которой лежат 25% 125 оценок.Таблица № 4.Оценки по тесту и их частоты.
|
РЕКЛАМА
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |