Что такое валидность теста. Надежность и валидность теста - это что такое? типа внешних критериев

100 р бонус за первый заказ

Выберите тип работы Дипломная работа Курсовая работа Реферат Магистерская диссертация Отчёт по практике Статья Доклад Рецензия Контрольная работа Монография Решение задач Бизнес-план Ответы на вопросы Творческая работа Эссе Чертёж Сочинения Перевод Презентации Набор текста Другое Повышение уникальности текста Кандидатская диссертация Лабораторная работа Помощь on-line

Узнать цену

К основным психометрическим характеристикам тестов относятся, в первую очередь, валидность и надежность.

Валидность - это свойство теста измерять именно то, для чего он предназначен.

Например, мы можем определить что «знание математики» соответствует высоким баллам, полученным по математическим тестам. Но если все задания состоят из простых арифметических задач, то тест будет определять, насколько человек быстро считает. Таким образом, важно понимание того насколько рабочее определение измеряемой величины соответствует концептуальному определению. Достичь абсолютной валидности нельзя. Можно лишь пытаться максимально улучшить валидность в каждом конкретном случае, исходя из критериев, значимых для этого случая.

Существуют разные типы и виды валидности:

Практическая валидность характеризует тест не столько со стороны его психологического содержания, сколько с точки зрения его ценности в отношении достижения определенной практической цели (прогнозирования, диагностики). Выделяют подтипы практической валидности : прогностическая и совпадающая . Тест с высокой прогностической валидностью позволяет сделать прогноз, насколько успешно испытуемый будет выполнять определенную деятельность впоследствии. Тест с высокой совпадающей валидностью позволяет ответить на вопрос: "Какова вероятность того, что индивид Х обладает свойством У в настоящий момент времени?" Валидность по объему отражает степень, в какой объем теста выборочно репрезентирует тот класс ситуаций или учебного материала, относительно которого должны быть сделаны выводы и показывает, в каком объеме, в какой мере знание чего-либо отражено в методике. Оценочная валидность выражает степень корреляции (соответствия) между показателями, полученными испытуемыми по данному методу, и оценками измерительного свойства со стороны экспертов. Например, при валидизации (проверке теста на валидность) тестов оценки знаний школьников в качестве экспертов обычно выступают учителя. Внешняя валидность означает, что впечатление, которое создается при знакомстве с сугубо внешней стороной тестирования, соответствует заявленному содержанию метода. Это наименее важный аспект валидности, так как требует дополнительной проверки валидности другими методами. В некоторых случаях исследователи специально ухудшают внешнюю валидность, например, для измерения социально нежелательных характеристик (таких как расизм). Внутренняя валидность - это необходимое условие возможности интерпретации результатов теста, она спрашивает: «Не изменились ли условия эксперимента в данном случае?» Факторы ухудшающие внутреннюю валидность : 1 . История: некое событие произошло между первым и вторым измерением в дополнение к экспериментальным переменным. 2. Развитие: процесс внутри испытуемых, как функция от времени (не специфический к частным событиям), например, взросление, усиление чувства голода, усталость и т.д. 3. Тестирование: эффект первого тестирования влияет на баллы второго. 4 . Инструменты: изменение в наблюдателях или способах получения баллов могут влиять на наблюдаемые величины.5. Статистическая регрессия: в случае, если работа идет с группами, отобранными на основе экстремальных значений балов.6. Выбор: смещение, возникающее в результате дифференцированного выбора респондентов в пары для сравнения.7. Выбывание: дифференциальная потеря респондентов из сравниваемых групп.Валидность генерализации (репрезентативность), задает вопрос о том, на кого мы можем распространить результаты эксперимента. Факторы ухудшающие репрезентативную валидность : 1. Реагирующий или взаимодействующий эффект тестирования: значения первого теста могут возрасти.2. Эффект взаимодействия смещения выбора и экспериментальных переменных.3. Эффект экспериментальной подготовки, который будет препятствовать распространению результата на людей, которые тестируются в не-экспериментальном окружении.4. Эффект многократной обработки, когда эффект предыдущих тестов не стирается. Валидность критерия состоит из двух частей :Совместная валидность : «Есть ли какая-либо связь между мерой и другими проявлениями свойства, которого этот тест должен измерить?».Предиктивная валидность : «Предсказывает ли тест уровень развития данной конкретной способности?»

Относительная валидность: важно знать насколько результаты данного теста соответствуют результатам аналогичных тестов, которые измеряют то же или близкое свойство. Дискриминантная валидность : важно показать, что мера не измерят то, что не предполагалось измерять, то есть дискриминантна. Например, можно говорить о дискриминантной валидности, если есть низкая корреляция между результатами теста на скорость чтения и теста на определяющие факторы мотивации, так как способность к чтению не имеет отношения к мотивации.

Источники плохой валидности: 1. Плохая надежность теста2. Ответы на вопросы = психологическая ориентация или предубеждения против данного ответа:2.1. Уступчивость: тенденция соглашаться, то есть говорить «Да». Следует составлять вопросы.2.2. Социальная желательность: тенденция показывать себя в лучшем свете. Следует составлять тесты, где социальная желательность не очень заметна.2.3. Ухудшение: намеренно говорить «Нет», если это принесет какую-нибудь «награду» (например, внимание, компенсацию, социальную помощь и т.д.).3. Смещение:1.1 Культурное смещение: имеет ли данное свойство одинаковое значение в разных культурах? Как различные вопросы интерпретируются людьми разных культур? Содержание теста (внешняя валидность) может быть разной для людей разных культур.1.2 Смещение по половому признаку также может быть возможным.1.3 Тестовое смещение:1.3.1 Смещение в измерениях возникает, если тест делает систематическую ошибку в измерении данного свойства. Например, считается, что многие тесты IQ хороши для основной средней массы населения, но не для представителей национальных меньшинств, ведущих отличный образ жизни. Если тест проводится методом интервью, то возникает смещение в направлении хорошо выглядящих экзаменуемых.1.3.2 Смещение в предпосылках возникает, когда тест делает систематическую ошибку в предсказании некоторого значения или критерия. Также тест может быть хорош только для некоторых групп людей. Например, тест, составленный мужчинами, может не очень хорошо оценивать значение данной характеристики у женщин.

Высокая надежность теста это необходимое, но недостаточное условие получения высококачественного теста. Тест еще должен быть валидным. Валидность – это важнейшая характеристика теста, без указания которой, его нельзя считать измерительным инструментом.

Анализируя сложную ситуацию с валидностью педагогических тестов, Е.Михайлычев 16 отмечает, что педагогу, заинтересовавшемуся валидностью, трудно будет разобраться в том, что же это такое.

Ниже мы приведем несколько определений валидности теста.

ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование (В.Аванесов) 17 .

ВАЛИДНОСТЬ - это характеристика способности теста служить поставленной цели измерения (М.Челышкова) 7 .

ВАЛИДНОСТЬ - определяет, насколько тест отражает то, что он должен оценивать (А.Майоров) 18 .

Приведенные определения в целом перекликаются и являются практически равноценными. Мы несколько уточним определение, сделав акцент на цель тестирования. Тестирование как измерительная процедура, дает информацию, на основе которой в дальнейшем должно быть принято то или иное управленческое решение. Обоснованность этих решений, зачастую сильно влияющих на судьбу испытуемых, определяется надежностью и валидностью теста.

ВАЛИДНОСТЬ – это характеристика теста, отражающая его способность получать результаты, соответствующие поставленной цели и обосновывающая адекватность принимаемых решений.

После создания теста начинается процесс его валидизации. Приведем определение:

ВАЛИДИЗАЦИЯ – процесс накопления подтверждений для доказательства валидности теста 19 .

По нашему мнению ВАЛИДИЗАЦИЯ – это не столько сбор доказательств валидности теста, сколько процесс выполнения действий, повышающих его валидность. Вследствие этого будет расти и доказательная база валидности теста.

Выделяют три вида валидности – содержательную, критериальную и конструктную 20 . А.Майоров приводит следующую диаграмму видов валидности 18:

Рис.3.9.1. Виды валидности.

КОНСТРУКТНАЯ ВАЛИДНОСТЬ (концептуальная валидность) определяется в случаях, когда представление об измеряемом свойстве существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ (эмпирическая валидность) предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста.

Имеется два вида критериальной валидности – текущая и прогностическая.

Текущая критериальная валидность (concurrent validity) характеризует способность теста измерять некоторые качества личности. Валидность теста подтверждается корреляцией с некоторым внешним критерием, существующим в данное время. Допустим, тест показал для некоторого испытуемого отличные знания по предмету, а школьные отметки, выставленные учителем – неудовлетворительные. Если мы в качестве внешнего, независимого и достоверного критерия выберем школьные отметки, то критериальная валидность теста – низкая, даже если он имеет высокую надежность.

Прогностическая критериальная валидность (predictive validity) характеризует способность теста предсказывать будущие качества, формирующихся в результате воздействия внешних обстоятельств или целенаправленной собственной деятельности. Этот тип валидности характеризует корреляцию результатов тестирования с внешним критерием, который появится в будущем.

Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения. Такая процедура валидизации обычно применяется для тестов достижений 20 .

Содержательная валидность необязятельно означает полноту отображения изучаемой дисциплины. Например, для нормативно-ориентированного теста, полнота охвата всех тем может быть меньше, чем для критериально-ориентированного. Здесь важнее глубина проработки отдельных подтем, вопросов. Это позволит с большей эффективность дифференцировать обучаемых. Под содержанием понимается не только совокупность фактов, понятий, терминов, но и умение применять имеющиеся знания, оценивать информацию, выполнять действия, соответствующие верхним уровням таксономии Блума.

Для обеспечения содержательной валидности необходим детальный анализ учебных программ, на основании чего составляетсяспецификация теста. Спецификация содержит перечень учебных тем, их важность, количество и тип тестовых заданий. Оценка содержательной валидности выполняется экспертом в данной предметной области.

Согласно П.Клайну содержательная валидность определяется следующим образом:

1) указать категорию лиц, для которой предназначен тест;
2) составить список знаний, умений, навыков, подлежащих тестированию;
3) выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности;
4) на основе списка составить перечень заданий;
5) выполнить внешнюю экспертизу полученных заданий;
6) после проверки преобразовать их в задания в тестовой форме. В дальнейшем, на этой основе создать тестовые задания, образующие тест, который будет содержательно валидным.

Проблема валидизации педагогического теста является, видимо, самой сложной в процедуре создания высококачественного измерительного инструмента.

По определению американского текстолога А.Анастази, «валидность теста - понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Валидность свидетельствует о том, пригодна ли методика для измерения определённых качеств, особенностей и насколько эффективно она это делает. Наиболее распространённым способом нахождения теоретической валидности теста (методики) является конвергентная валидность, то есть сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними.

Сопоставление с методиками, имеющими другое теоретическое основание, и констанция отсутствия значимых связей с ними называется дискриминантной валидностью. Другой вид валидности - прагматическая валидность - проверка методики с точки зрения её практической значимости, эффективности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии, то есть используется независимый от теста, внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемого психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если например, методика измеряет особенности развития профессионально важных качеств, то для критерия необходимо найти такую деятельность или отдельные операции, где именно эти качества реализуются.

Для проверки валидности теса можно использовать метод известных групп, когда приглашаются люди, про которых известно, к какой группе по критерию они относятся (например, группа «высокоуспешных, дисциплинированных студентов» - высокий критерий и группа «неуспевающих, недисциплинированных студентов» - низкий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.

Валидность (происходит от англ. valid - имеющий силу) теста - психометрическая характеристика, представляющая собой действительную способность теста измерять тот психологический конструкт, для диагностики которого он заявлен [Гильбух Ю.З., 1978, № 5. С.108-117; Гильбух Ю.З., 1982, № 1. С. 29-39; Гильбух Ю.З., № 4, т. 8. С. 117-125]. Валидность теста определяет, что должен измерять тест по предположению разработчиков и в какой степени хорошо он это делает.

Чаще всего для определения валидности личностного опросника требуется внешний критерий, использующийся независимо от самого опросника, для оценки того психологического качества, которое должно измеряться. Среди них выделяют объективные и субъективные критерии.

В качестве объективных критериев валидизации обычно используются:

· объективные социально-демографические и биографические данные (стаж, образование, профессия, прием или увольнение с работы);

· показатели успеваемости, чаще всего являющиеся внешним критерием для тестов способностей к обучению, достижений в отдельных дисциплинах, тестов интеллекта;

· производственные показатели эффективности отдельных видов профессиональной деятельности, выступающие внешним критерием при валидизации методик, используемых в профотборе и профориентации;

· результаты реальной деятельности (рисование, моделирование, музыка, составление рассказа и т.д.), используемые обычно при конструировании тестов общих и специальных способностей, личностных тестов;

· врачебный диагноз или другие заключения специалиста;

· контрольные испытания знаний и умений;

· данные других методик и тестов, валидность которых считается установленной.

К субъективным критериям относятся оценки, суждения, заключения об объекте исследования, сделанные экспертом (специалистом, педагогом, руководителем, психологом). При этом эксперт дает заключение по стандартизированной оценочной шкале, предложенной ему разработчиками теста. Объективность достигается за счет увеличения числа экспертов и соблюдения единообразия ситуаций оценивания.

При использовании экспертной оценки используют:

❑ метод коллективной оценки, когда достигается единство во мнениях всех экспертов относительно испытуемого, подвергаемого исследованию;

❑ метод средневзвешенной оценки, когда усредняются оценки, данные испытуемому независимыми экспертами;

❑ метод ранжирования, когда испытуемые распределяются по степени выраженности у них того или иного свойства;

❑ метод парного сравнения, когда испытуемые попарно сравниваются по степени выраженности свойства.

В качестве средства определения меры валидности чаще всего используют корреляционный анализ связи между индивидуальными оценками по тесту и оценками по критерию валидизации.

Надо иметь в виду, что сама процедура валидизации имеет принципиальные ограничения:

· условия валидности теста невозможно определить полностью, всегда остается множество неучтенных факторов;

· трудно обеспечить репрезентативность выборки;

· логика валидизации предполагает валидность самого критерия, но проверка этого оказывается достаточно сложной и часто осуществляется по наиболее доступному критерию.

Кроме того, критериальная валидность определяется, как правило, по внешним для психолога критериям, прежде всего социально-прагматическим (производительность, успеваемость, состояние здоровья, преступность и пр.). Всегда есть вероятность, что причиной отсутствия связи между методикой и критерием оказывается не низкая валидность методики (тестовый балл не отражает, например, стрессоустойчивость оператора), а исходное предположение, что должна быть подобная связь (например, предположение, что есть связь между стрессоустойчивостью оператора и процентом аварийных ситуаций).

Виды валидности. Выделяют следующие виды валидности:

· очевидную валидность;

· валидность по критерию (или эмпирическую, критериальную валидность);

· понятийную валидность (конструктивную, или конструктную валидность);

· прогностическую валидность и др.

Очевидная валидность. Очевидная валидность не является в собственном смысле психометрическим показателем теста, она характеризует лишь впечатление о тесте, как о чем-то понятном, «прозрачном». Это - способность теста не провоцировать со стороны испытуемого отвержения из-за непонятности процедуры тестирования. Если о тесте складывается впечатление (особенно с точки зрения испытуемого), что он измеряет именно то, что заявлено в инструкции и это действительно соответствует его содержанию, то такой тест обладает очевидной валидностью. Так, многие личностные опросники имеют в своем заголовке указание именно на те психологические особенности, которые они измеряют («Опросник переработки стресса», «Опросник психосоматических установок», «Опросник социальной компетентности» и т.д.).

Содержательная валидность. Содержательная валидность свойственна тестам, которые полноценно моделируют ту или иную деятельность, прежде всего в ее предметном аспекте. Т.е. в самом содержании теста отражены ключевые стороны изучаемого психологического явления. Если это явление сложно, то в тесте должны быть представлены все его составляющие элементы. Валидность по содержанию, определяемая путем систематического контроля содержания, должна показывать, насколько полно охватывает тест представленную выборку по совокупности измеряемых параметров. Поэтому необходима эмпирическая проверка теста в соответствии с заложенными в него гипотезами.

Содержательная валидность относится прежде всего к тестам достижения, а для тестов способностей и тестов личности этот тип валидности неадекватен и не применяется. Так, личностные опросники не имеют внутреннего сходства с исследуемыми областями поведения (т.е. ситуация самого ответа на пункт опросника обычно не есть ситуация, о которой идет речь в опроснике).

Критериальная валидность. Критериальная валидность определяется с единственной, крайне важной для практики, целью: оценить индивидуальную прогностичность теста. Для этого результаты выполнения теста сопоставляются с непосредственными и независимыми оценками (критериальными ключевыми признаками) того, что должен предсказывать тест.

Процедура обеспечения критериальной валидности заключается в том, что задания для шкал отбираются только тогда, когда они могут отделить релевантные, т.е. собственно критериальные, группы от контрольных. Для тестов такого типа основную роль играет их дискриминативность: важен сам факт, что тест или отдельное его задание является дискриминативным, а не причина, по которой это происходит.

Правда, в случае, когда группы отличаются друг от друга только по одной переменной, причина такой дифференциации более видна. Но, как правило, критериальная валидность используется в случае множества содержательно мало учитываемых признаков.

Часто задания, отобранные на основании того, что они могут разделять группы, вполне могут измерять и целый набор разных других переменных. Любая шкала, построенная таким образом, не будет однородной, т.е. показатели внутренней согласованности могут быть низкими.

Валидность теста

(от англ. valid - действительный, пригодный, действенный) - один из основных (наряду с надежностью , репрезентативностью, объективностью, достоверностью и эффективностью ) критериев оценки тестовых результатов. Понятие В. отражает прагматическую идею обязательной практической (применительно к науке, эмпирической) проверки качества измерения психологических свойств человека . Если раньше В. чаще других ассоциировалось с понятием «качество теста», то в последние годы все больше осознается роль интерпретации тестовых результатов. Таким образом, В. - это прежде всего адекватность интерпретации тестовых результатов по отношению к цели тестирования , содержанию основного понятия (содержанию диагносцируемого психического свойства) и применению результатов тестирования (в профотборе и других прикладных психологических обследованиях). В контексте прикладной задачи В. представляет собой не столько критерий качества теста, сколько показатель меры соответствия теста цели тестирования.

Краткий психологический словарь. - Ростов-на-Дону: «ФЕНИКС» . Л.А.Карпенко, А.В.Петровский, М. Г. Ярошевский . 1998 .

Валидность теста Этимология.

Происходит от англ. valid - имеющий силу и test - испытание.

Категория.

Психометрическая характеристика теста.

Специфика.

Действительная способность теста измерять ту психологическую характеристику, для диагностики которой он заявлен. Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с успешностью выполнения соответствующей деятельности.

Виды:

Валидность по критерию, или эмпирическая;

Понятийная, или конструктивная.

Психологический словарь . И.М. Кондаков . 2000 .

ВАЛИДНОСТЬ ТЕСТА

(англ. validity of test ) - важнейший критерий доброкачественности теста , характеризующий точность измерения исследуемого свойства; оценка адекватности теста исследуемой проблеме. В. т. определяется корреляцией его результатов с др. критериями измеряемого свойства (напр., В. т. способностей определяется корреляцией результатов по тесту с успешностью выполнения соответствующей деятельности). Проверка В. т. называется валидацией (валидизацией). Допускаются разные типы валидации и В. т.: 1) содержательная (content ); 2) по критерию (эмпирическая; criterion-related ): 3) понятийная (конструктная; construct ); 4) дискриминантная (discriminant ) и др. См. , . (В. И. Лубовский.)

Большой психологический словарь. - М.: Прайм-ЕВРОЗНАК . Под ред. Б.Г. Мещерякова, акад. В.П. Зинченко . 2003 .

Смотреть что такое "валидность теста" в других словарях:

Валидность Теста - действительная способность теста измерять ту психологическую характеристику, для диагностики которой он заявлен. Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями,… … Психологический словарь

Валидность теста - – адекватность и действенность теста, важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого свойства, а также насколько тест отражает то, что он должен оценивать, насколько отдельные составляющие его пробы… … Словарь-справочник по социальной работе

валидность теста - testo validumas statusas T sritis Kūno kultūra ir sportas apibrėžtis Svarbiausias kokybinis testo požymis, rodantis tiriamosios savybės matavimų tikslumą, testavimo rodiklių atitikimą norimai ypatybei, vyksmui įvertinti. atitikmenys: angl. test… … Sporto terminų žodynas

ВАЛИДНОСТЬ ТЕСТА - ВАЛИДНОСТЬ (от лат. validus – крепкий, здоровый) ТЕСТА. Адекватность и действенность теста. Критерий доброкачественности теста, характеризующий точность измерения исследуемого свойства, характеристики, а также позволяющий оценить, насколько… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

Словарь-справочник по педагогической психологии

- (отангл. valid действительный, пригодный, действенный) 1) адекватность и действенность теста важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого свойства, а также насколько тест отражает то, что он должен… … Словарь по педагогической психологии

валидность теста - (от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста. Различают несколько видов в.т.: в.т …

валидность теста по критерию - критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества… … Энциклопедический словарь по психологии и педагогике

валидность теста по содержанию - критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с… … Энциклопедический словарь по психологии и педагогике

валидность теста конструктивная - критерий качества теста, используемый при измерении какого либо сложного психического феномена, имеющего иерархическую структуру, измерить который из за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без… … Энциклопедический словарь по психологии и педагогике

Психометрика – область ПД, связанная с теорией, практикой и измерениями ПД.

Методологическая дисциплина (по отношению к ПД):

Обосновывает требования к…

Измерительным психодиагностическим методам;

Процедурам разработки теста;

Применению процедуры статистического анализа;

Адаптации методик к новым условиям их применения;

Интерпретации тестовых данных (пр: проблема критерия и т.п.).

Знание психометрики необходимо для критичности…:

В понимании ограниченности методик;

В понимании допущений, которые были сделаны при разработке;

В понимании валидности и надежности и т.д.

Основные психометрические характеристики :

Надежность;

Валидность.

ВАЛИДНОСТЬ – это характеристика, которая включает в себя сведения об области измеряемых свойств и репрезентативности диагностической процедуры по отношению к ним.

Валидность – это такая характеристика, которая показывает то, что измеряет данная методика и насколько хорошо она это делает.

Виды валидности:

Закладывается уже на стадии разработки теста.

Устанавливается экспертами.

Этапы валидизации теста :

1. Определяется круг измеряемых свойств и (или) видов деятельности. Происходит расчленение свойства/ деятельности на элементы.

2. Разрабатывается модель тестовой деятельности или модель свойства, содержание которой подбирается путем выделения наиболее важных элементов реальной деятельности.

3. Проводится анализ степени соответствия разработанной модели реальной деятельности/ свойству (степень соответствия результатов 1 и 2 этапов).

КРИТЕРИАЛЬНАЯ/ эмпирическая ВАЛИДНОСТЬ – включает в себя текущую и прогностическую валидность.

Отражает степень соответствия прогноза и диагноза определенному кругу критериев измеряемого свойства.

Текущая валидность – степень соответствия диагноза.

Прогностическая валидность – степень соответствия прогноза.

В качестве критерия может выступать уровень достижений в какой-либо другой деятельности (производственная, научная, учебные успехи; степень развития какой-либо способности; степень выраженности какого-либо свойства личности; социально-демографические и географические данные и т.п.).

Подсчитывается корреляция двух рядов значений: баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Пр: Разработка методики Экстра-Интраверсии.

Экстраверсия (1)/Интраверсия (2) → определение, свойства (1 и 2) → экспертная оценка участником эксперимента этих параметров + оценка экстра-интраверсии с помощью разрабатываемой методики → корреляция (чем выше, тем валидность больше).

КОНСТРУКТНАЯ ВАЛИДНОСТЬ – отражает степень представленности измеряемого психологического конструкта в результатах теста.

Для того, чтобы доказать валидность представленности измеряемого свойства, необходимо найти уже проверенную конструкцию, направленную на измерение того же самого.

Если такой конструкции нет, то привлекаются эксперты. При этом они работают не с тестом (как это было в случае с содержательной валидностью), а с испытуемыми из выборки стандартизации (наблюдают).

Если и это не удается, тогда прибегают к оценкам особого типа – субъективным, которые выносят испытуемому люди из его круга, имеющие опыт реального общения с ним.

Виды конструктной валидности :

- конвергентная валидность (схождение) – для доказательства надо выбрать какое-то психологическое свойство, которое связано (прямо или обратно) с измеряемым свойством.

- дискриминативная валидность – доказывается отсутствием связи между измеряемым свойством и каким-либо другим свойством.