Психометрические критерии тестов: валидность и ее типы.

ПСИХОМЕТРИЯ (психометрика) (греч.— Душа и— мера) — область психологии,связанная с теорией и практикой измерения психических явлений.

Понятие П. введено в 1734 г. Христианом Вольфом, впервые указавшим на возможность измерения в психологии. Одним из первых измерений в психологии было измерение времени реакции. Поэтому первоначально под П. понималось измерение временных характеристик психических процессов. Впоследствии, по мере развития психологического эксперимента, строящегося по образцу и подобию естественных наук, к П. начинают относить все то, что связано с количественным определением психических явлений. При таком понимании, весьма распространенном и сегодня, П. включает в себя весь спектр психологических измерений — от психофизических до личностных.

Создание любого психологического инструмента измерения требует соблюдения определенных требований. Эти требования касаются точности, достоверности и адекватности методики измерения, сопоставимости получаемых с ее помощью результатов. Соответствие этим требованиям устанавливается путем применения специальных математико-статистичес-ких процедур (см. Валидность, Надежность). Совершенствование математико-статистического аппарата, его разработка, в свою очередь, прежде всего связаны с конструированием психологических тестов. Подтверждением сказанного является то, что ряд современных статистических методов созданы в ходе решения психологических задач (см., напр., Факторный анализ). П., таким образом, получает преимущественное развитие в психологическом тестировании, поэтому неудивительно, что в некоторых работах они отождествляются. Т. о., во многом благодаря развитию тестирования, в 20-30-е гг. формируется особая область психометрии, которая имеет дело с индивидуальными психологическими различиями, — психометрия дифференциальная.

ПСИХОМЕТРИЯ ДИФФЕРЕНЦИАЛЬНАЯ (психометрика дифференциальная) — область психометрии, определяющая и обосновывающая требования к измерению индивидуально-психологических различий в психологической диагностике.

П. д., как особое направление психометрии, возникла в связи с появлением и развитием психологических тестов и окончательно оформилась в конце 20-х — начале 30-х гг. нашего века. Основными направлениями П. д. являются: общая теория измерения психологических феноменов, конструирование на ее основе средств измерения, их психометрическая адаптация к новым условиям пользования, а в связи с этим анализ задач тестовых, обеспечение их валидности, надежности и стандартизации.

ВАЛИДНОСТЬ (англ, valid — действительный, пригодный, .имеющий силу) — комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.

В наиболее простой и общей формулировке В. теста это «...понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» (А. Анастази, 1982). В стандартных требованиях к психологическим и образовательным тестам (Standarts..., 1974) В. определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы с помощью методики, а также о степени обоснованности выводов при использовании конкретных тестовых оценок или других форм оценивания. В психологической диагностике В. — обязательная и наиболее важная часть сведений о методике, включающая (наряду с указанными выше) данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретические ожидания, наблюдение, экспертные оценки, результаты других методик, достоверность которых установлена и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связь изучаемой области поведения или особенности личности с определенными психологическими конструктами. В. описывает также конкретную направленность методики (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений, характеризующих В. теста, содержится информация об адекватности применяемой модели деятельности с т. з. отражения в ней изучаемой психологической особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.

Важнейшая составляющая В. — определение области изучаемых свойств — имеет принципиальное теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных. Содержащаяся в названии теста информация, как правило, недостаточна для суждения о сфере его применения. Это лишь обозначение, «имя» конкретной процедуры исследования. В качестве примера можно привести широко известную корректурную пробу. Область изучаемых свойств личности включает устойчивость и концентрацию внимания, психомоторную подвижность. Данная методика позволяет получать оценки выраженности этих психологических качеств у испытуемого, хорошо согласуется с показателями, полученными другими методами и, следовательно, обладает высокой В. Наряду с этим результаты выполнения корректурной пробы подвержены влиянию большого количества других факторов (нейродинамические особенности, характеристики кратковременной и оперативной памяти, индивидуальная переносимость монотонии, развитие навыка чтения, особенности зрения и т. д.), по отношению к которым методика не является специфичной. В случае применения корректурной пробы для их измерения В. будет невелика или сомнительна.

Таким образом, очерчивая сферу применения методики, В. отражает и уровень обоснованности результатов измерения. Очевидно, чтр при небольшом количестве сопутствующих факторов, влияющих на результат исследования, а значит, при их незначительном воздействии на результат теста достоверность тестовых оценок будет выше. Еще в большей степени достоверность данных теста определяется набором измеряемых свойств, их значимостью для осуществления диагностируемой сложной деятельности, полнотой и существенностью отражения в материале теста предмета измерения. Так, чтобы удовлетворить требованиям В., диагностическая методика, предназначенная для профотбора, должна включать анализ широкого круга нередко различных по своей природе показателей, наиболее важных для достижения успеха в данной профессии (уровень внимания, особенности памяти, психомоторика, эмоциональная устойчивость, интересы, склонности и т. д.).

Как видно из вышеизложенного, в понятие В. входит большое количество самой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы В.

Диагностическая (конкурентная) В. отражает способность теста дифференцировать испытуемых по изучаемому признаку. Анализ диагностической В. имеет отношение к установлению соответствия показателей теста реальному состоянию психологических особенностей испытуемого в момент обследования (см. Валид-ность текущая). Примером определения этого типа В. может быть исследование по методу контрастных групп. Проведение теста интеллекта у нормально развивающихся детей и их сверстников с нарушениями в интеллектуальном развитии может выявить глубокие количественные и качественные различия в выполнении заданий сравниваемыми группами. Степень надежности дифференциации детей первой и второй групп по данным теста будет характеристикой диагностической В. оценки умственного развития, получаемой с'помощью данной методики.

Сведения, характеризующие степени обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют валидность прогностическую методики. Заключение об этом типе В. может быть получено, напр., путем сравнения тестовых оценок в одной и той же группе испытуемых спустя определенное время. Основой прогностической В. является определение того, насколько важен исследуемый признак с т. з. деятельности испытуемого в будущем с учетом закономерно изменяющихся обстоятельств, перехода на другой уровень развития.

Большинство методик, особенно тестов способностей и интеллекта, исследуется на предмет диагностической и прогностической В. Два этих типа В. нередко объединяют в понятие валидности эмпирической. Здесь подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации критерия (см. Валидность критериальная). Критерий В. выступает в качестве меры, показателя исследуемых психологических особенностей. Так, тесты специальных, способностей проверяются путем сопоставления с результатами обучения по другим предметам, достижениями в музыке, рисовании и т. д. Тесты общих интеллектуальных способностей валиди-зируются сравнением с еще более широкими характеристиками школьных достижений (общая успеваемость, овладение сложными системами знаний и навыков). Критерий В. является независимым от теста показателем, обладающим непосредственной ценностью для определенных областей практической деятельности. Напр., в области педагогической психологии это «успеваемость», в психологии труда — «производительность», в медицинской психологии — «состояние здоровья» и т. д. В качестве непосредственных критериев часто используются экспертные оценки и характеристики лиц, обследованных с помощью валидизируемого теста, данные педагогами, сотрудниками, руководителями.

Во многих случаях бывает сложно или невозможно подобрать адекватный критерий валидизации. При этом особую важность приобретает комплекс характеристик, входящих в тип теоретической В. При разработке и использовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим родственные или противоположные психологические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых свойствах как о психологическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности. Этот тип В. является наиболее сложным и комплексным. Для подтверждения соответствия получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям используется самая различная информация, в том числе и относящаяся к другим типам В.

Внимание!

Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы.

Расчет стоимости Гарантии Отзывы

Валидность содержательная (внутренняя, логическая) — комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации методики в этом направлении является отражение в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведения или особенность очень сложна, то содержательная В. требует представления в заданиях теста всех важнейших составных элементов исследуемого явления. Так, при разработке теста «вербального интеллекта» необходимо ввести группы заданий (субтестов) для проверки довольно разнородных по своему операциональному составу навыков письма и чтения.

Наряду с перечисленными основными типами В. (содержательной, критериальной и конструктной) на практике выделяют факторную, перекрестную (конвергентную) и дискриминантную В. (см. Валидность конструктная).

Классификация типов В. в достаточной мере условна, так как нередко для различных критериев В. применяются общие методы определения, а с другой стороны, одни и те же исходные данные могут интерпретироваться с т. з. различных типов В. На рис. 9 приведена примерная схема, отражающая виды и связи валидности.

В психологической диагностике не существует универсального подхода к характеристике В. Для валидизации каждого вида психодиагностических процедур и отдельных тестов могут применяться различные типы В. Сведения, входящие в комплекс В., можно оценить качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако в силу сложности, комплексности, ситуативности по отношению к конкретным условиям применения методики В. в целом невозможно измерить, о ней можно лишь судить.

Реальная В. раскрывается только в результате накопления значительного опыта работы с тестами. Получение новых, расширенных данных о В. может радикально изменить представление о сфере приложения и эффективности методики. Так, некоторые методики, разработанные для диагностики вербальных факторов интеллекта, с достаточной В. отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, расширена. В качестве примера можно привести Равена прогрессивные матрицы, которые были разработаны для изучения определенных сторон перцептивной деятельности, однако оказались в значительной степени насыщены фактором, общим для тестов интеллекта (см. Фактор G). Реальная В. ряда психодиагностических методик, особенно тестов интеллекта, достижений в обучении, профессиональной пригодности, опросников личностных изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением социальных норм и образцов поведения, методов обучения и содержания заданий, требований к профессиям. Данное обстоятельство создает необходимость периодического контроля В. методик.

Поможем написать любую работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Узнать стоимость

Психометрические критерии тестов: валидность и ее типы.

Воля. Основные характеристики. Волевая регуляция поведения.

Учебная деятельность и её структура. Знания, умения и навыки как результат учения.

Предмет, задачи и принципы психологии.

Психология толпы, ее виды и содержание.

Проективные методы, их направленность, цели и задачи.

Психология руководства и лидерства в малой группе.

Когнитивное направление в изучении личности и его характеристика (теории Дж.Келли, Дж.Роттера, А.Бандуры и др.).

Психика, ее природа, механизмы, функции и стадии развития.

Малая социальная группа: понимание, виды, структура.