Предыстория тестов уходит в глубину веков, она связана с испытаниями различных способностей, знаний, умений и навыков. Сообщается, что уже в середине III тысячелетия до н.э. в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготовленный писец, благодаря обширным по тем временам знаниям, был центральной фигурой месопотамской цивилизации. Он был обязан знать все четыре арифметических действия, уметь измерять поля, распределять рационы, делить имущество, владеть искусством пения и игры на музыкальных инструментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях (Дандамаев М.А.).
В Древнем Египте только того обучали искусству жреца, кто был способен выдержать систему определённых испытаний. Вначале кандидат в жрецы проходил собеседование, в процессе которого выяснялись его биографические данные, уровень образованности; кроме того, оценивалась внешность, умение вести беседу. Затем следовали проверки: умения трудиться, слушать и молчать, испытания огнём, водой, страхом преодоления мрачных подземелий в полном одиночестве и др. Все эти довольно жёсткие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому кандидату предлагалось ещё раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм - с внутренней или с внешней (Аванесов В.С.).
Сообщается, что эту суровую систему испытаний успешно преодолел знаменитый учёный древности Пифагор. Вернувшись в Грецию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники, Пифагор подчёркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого дерева можно выточить Меркурия», и потому, вероятно, придавал большое значение диагностике именно этих способностей. Для этого каждому давалось сравнительно трудная математическая задача. В случае её решения вопрос о приёме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где ученики, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпады, хорошо и достойно держать себя, его принимали в школу (Голицын Н.Н., Аванесов В.С.).
Особое значение Пифагор придавал смеху молодых людей, утверждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, вёл тщательное наблюдение за каждым новичком после того, как последнего приглашал свободно высказываться и не стесняться, смелее оспаривать мнения собеседников.
Сообщается, что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способностей лиц, желавших занять должности правительственных чиновников. Каждые три года чиновники повторно экзаменовались лично у императора по «шести искусствам»: музыке, стрельбе из лука, верховой езде, умению писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно способных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на административной службе (Dubois P.).
Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда даже служили для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать мудрость персов, прислал им шахматы. Предполагалось, что персы вряд ли сумеют разгадать суть этой игры, и потому они должны были по условию отослать в Индию подать. Сообщается, однако, что визирь Хо-срова Важургмихр понял правила шахматной игры и, в свою очередь, изобрёл игру, называемую сейчас нарды. Он послал с новой игрой гонца в Индию, где её, как выяснилось, разгадать не смогли (Орбели И.А.).
Другим свидетельством использования испытаний тестового характера являются материалы, излагающие основы религиозного учения чань-буддизма. Учителя чань-буддизма использовали загадки, вопросы-парадоксы с одновременным созданием ситуации психологического стресса. Отвечать на них необходимо было сразу, на раздумывание не отводилось ни секунды. Как отмечает Н.В.Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопросов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды) создавала драматическое напряжение, которое усиливалось всем образом действий наставника. Хватая своего оппонента и крича на него: «Говори! Говори! Отвечай немедленно!», он создавал ситуацию психического напряжения. Чаньские парадоксальные загадки использовались, по мнению этого же автора, в качестве тестов на определённый, «чаньский» ход мышления. В зависимости от того, как тестируемый отвечал на эти загадки, опытный наставник определял, на каком уровне «просветлённости» он находился и какие меры нужно принять для углубления его «чаньского опыта», а также выявлял людей, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н.В.).
В созданном чжурчжэнями государстве Цинь результаты экзаменов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие поступали на государственную службу в качестве практикующих врачей, преподавателей или исследователей, худшие получали разрешение заниматься частной практикой. Не выдержавшим экзамен рекомендовалось продолжить подготовку, либо сменить профессию (Воробъёв М.В.).
Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г., удалось провести переаттестацию всех военных и гражданских чиновников, что позволило организовать проверку государственного аппарата по всей стране. В результате этого Вьетнам вновь стал вильным и жизнеспособным феодальным государством; особое внимание было уделено созданию боеспособного офицерского корпуса (Берзин Э.О.).
В XV в. конкурсные испытания были упорядочены: они проводились по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты получали подарки от короля, их имена вносились в «золотой список», который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся высекали на специальных каменных стелах, установленных в Храме Литературы (Берзин Э.О.).
Интересные данные приводятся В.Н. Басиловым в отношении шаманства. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманству, но эти претензии отвергались в процессе испытаний. Проверка и, как результат её, признание были непременными условиями шаманской деятельности. У разных народов проверка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шаманом, то он по требованию народа должен был, ходить по снегу в трескучий мороз босиком и с обнажённой головой, лизать языком раскалённые докрасна железные предметы. У народностей ханты неудачного претендента объявляли сумасшедшим. У ульчей шаман подвергался испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В.Н.).
Приведённый краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жизни многих (если не всех) народов мира со времён древнейших цивилизаций и до наших дней. Однако можно ли, на основании приведённых данных, говорить о глубокой истории и широкой распространённости тестов? Если согласиться с наиболее известными сейчас определениями теста, даваемыми как перевод с английского слова «test» - испытание, проверка, проба, то на поставленный вопрос надо ответить утвердительно. Дело, однако, в том, можно ли в наше время так определять тест…
С течением времени обыденное представление о тесте и научное понимание теста всё больше удалялись друг от друга. Хотя всякий тест включает в себя элемент испытания, он не сводится только к нему, ибо сейчас это метод исследования, включающий в себя ряд чисто научных требований. На каждом этапе развития науки требования к тестам и они сами менялись. Игнорирование этого диалектического момента нередко приводит к упрощенчеству в оценках тестов.
Настоящая история тестов началась век назад, в канун периода ломки устаревшего общественного строя, революционного изменения общественного сознания, совпавшего по времени с научным кризисом, сразившим естествознание. Диалектика и материализм потрясли идеалистический фундамент психологии и стали основой новой методологии.
К началу XX в. практические потребности изучения преобладающих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта проблема и дала импульс к появлению первых тестов. Известный английский учёный Ф. Гальтон в течение 1884 – 1885 гг. провёл серию испытаний, в которых посетители лаборатории в возрасте от 5 до 80 лет могли за небольшую плату проверить свои физические качества (ситу, быстроту реакции и др.), а также ряд физиологических возможностей организма и психических свойств - всего по 17 показателям. В число последних вошли показатели роста, веса, жизненной ёмкости лёгких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной программе было обследовано 9337 человек. Ф. Гальтон писал, что практика вдумчивого и методичного тестирования - не фантазия; она требует рассмотрения и эксперимента.
Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Гальтона можно сравнить с тем, что сделал Галилей для физической науки своими остроумными экспериментами. Набиравший силу радикальный эмпиризм рассматривался рядом учёных конца XIX в. как вполне приемлемая альтернатива идеализму, а эксперимент - как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой. - писал Дж. Кеттелл, - когда она будет иметь своей основой эксперимент и измерения».
Кеттелл, по-видимому, первым увидел в тестах средство измерения, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список 50 лабораторных тестов, которые мы бы сейчас назвали не тестами, а контрольными заданиями. Эти тесты проводились с соблюдением только двух из известных сегодня требований: имелась инструкция по их применению и подчёркивался лабораторный (т.е. научный) характер испытаний.
Надо ли говорить, сколь непривычной казалось идея измерения для психологии XIX в. Измерение с помощью тестов казалось тогда, а многим кажется и по сей день, делом если не странным, то претенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматривало эти попытки математизации как чуждый для гуманитарной психологии уклон. Примерно с такими же трудностями сталкивалась психофизика.
Тем не менее, к концу 20-х годов нашего столетия всё больше стала ощущаться потребность в создании специфического направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии - биометрия, в экономике - эконометрия, в науке в целом - наукометрия. К ним следовало бы добавить и социометрию, но последнюю Дж . Морено и Г. Гурвич свели к элементарным методам оценки взаимодействия индивидов в малых группах.
С момента первых публикаций Ф. Гальтона и Дж. Кеттелла идея тестового метода сразу же привлекла к себе внимание учёных разных стран мира. Появились первые сторонники тестов и первые же их противники. В числе сторонников были: в Германии - Г. Мюнстерберг, С. Крепелин, В. Онри, во Франции - А. Бине, в США - Дж. Гилберт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремление к прикладным исследованиям в психологии прошлого расценивалось как отход от науки. Кеттелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 г., но публиковаться не мог из-за противодействия В.Вундта.
Итак, научный статус тестов не был определён, возможность измерений в психологии подвергалась сомнению. Психология переживала трудный период: она уже не могла развиваться на старой основе, но и не научилась ещё смотреть на мир по-новому. «Причина кризиса, - писал Л.С. Выготский, - лежит в развитии прикладной психологии, приведшей всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает её к разрыву на две науки». Общественная практика требовательно выдвигала одну проблему за другой, и ни одну из них старая психология решить не могла - у неё не было подходящих методов.
Появление в этой ситуации прикладной психологии не было случайностью. Ей было дано название «психотехника». Прикладное направление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном развитии ребёнка, а в тот период она была в основном прикладной педагогикой. Отвергнутые в традиционной науке - в психологии и в педагогике, тесты нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в древности: если какой-либо науке не находится места в храме, она начинает развиваться у его стен.
Цель, методы и результаты традиционной психологии лежали в области теоретических рассуждений. Различались производительная и познавательная функции этих направлений.
Размежевание стало заметным в конце 20-х – начале 30-х годов XX столетия. Вместо объединения усилий обе стороны приступили к взаимным обвинениям и затяжным дискуссиям.
Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии.
Начало 1930-х годов характеризуется широким использованием тестов во многих странах. Во Франции они стали применяться для дефектологических целей и для профориентации, В США тесты использовались при приёме на работу, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В России тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора - профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений как за, так и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его использования, породили во многих странах, в том числе и в России, письма в правительственные органы и в газеты с требованием запрета тестов.
В отечественной истории тестов начало 1930-х годов характеризуется интенсивным и неконтролируемым использованием тестов в системе народного образования и в промышленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подкреплялись серьёзной проверкой качества инструментария, решения о переводе некоторых учащихся в классы для умственно отсталых детей принимались на основе коротких тестов без учёта других факторов, влияющих на результаты проверки. В промышленности на основе таких же тестов делались попытки классифицировать работников по различным профессиям, без внимательного учёта личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извращениях в системе накромпросов» (1936), наложившее запрет на применение бессмысленных (как там отмечалось) тестов и анкет. Это постановление, по мнению А.Н. Леонтьева, А.Р. Лурия и А.А. Смирнова, получило в последующие годы неправомерно расширительное толкование и привело к отказу от разработки научно обоснованных методов психологической диагностики личности.
В те годы были, однако и другие выступления - в пользу тестов. Так, известный психолог М.Я. Басов говорил: «Я думаю всё же, что эта долгая, подчас острая критика тестовой методики… в конце концов приведёт не к ниспровержению, не к упразднению этой методики, а, напротив, к её упрочению и к её утверждению в определённых границах, в которых она, очевидно, имеет полное право на применение и существование».
Тем не менее, начиная с указанного периода критика тестов приобрела широкий размах и вышла за рамки чисто научных дискуссий.
В зарубежной литературе выделяется несколько источников критики тестов. Психолог С. Брим усматривает первый источник в личностном портрете критиков, в числе которых чаще других оказываются те, кто не склонен к самопознанию и интроспекции, авторитарен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и потому ориентация на этот принцип создаёт благоприятное отношение к тестам. Третий источник является, по мнению Р. Кеттелла, следствием эмоционального и сентиментального отношения людей эстетического и нарциссического типа, возражающих против всякой попытки представить «уникальную, художественную личность» в виде формул. Четвёртый источник критики является научным и касается недостатков тестового метода.
В 1930-е годы случилось так, что психотехника не оправдала возлагавшихся на неё надежд в смысле заметного повышения производительности труда. Она и не могла сделать, потому что на том, сравнительно низком уровне промышленного развития прогресс в значительной мере зависел от уровня индустриализации и автоматизации производства. При достижении необходимого уровня развития средств производства человеческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличиваться поток прикладных психологических исследований, нацеленных, в частности, на повышение эффективности человека-оператора в управлении сложными техническими системами. Соответственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной профориентации и профотбора. Вместе с этим опять возросло и значение тестов.
Хотя в 1930-е годы практическая работа по тестам затормозилось, научное изучение действительных возможностей этого метода в нашей стране не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний, и, наоборот, различные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названиях, а в принципиальных отличиях.
Первое отличие состоит в том, что тест является научно обоснованным методом эмпирического исследования в психологии и в ряде других наук.
Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследования в таких, например, направлениях психологии, как изучение личности, способностей. Здесь использование тестов позволило преодолеть методологический тупик, в котором оказались авторы многочисленных теорий, концепций, интуитивных догадок и иных умозрительных построений, не видевших способа обоснования истинности своих суждений. Непосредственное же обращение к практике как критерию истины нередко даёт противоречивые результаты, ибо действительно научная аргументация требует определённого структурирования, опосредования, абстрагирования и, кроме того, методической вооружённости исследователя.
Только в последние годы в психологии стала широко осознаваться задача согласования теоретических разработок с эмпирическими результатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являются сейчас, по-видимому, наиболее развитой в научном отношении частью методического арсенала, позволяющего адекватно скреплять теорию с эмпирией, в соответствии с некоторыми известными стандартами качества информации. Именно такое понимание тестов всё в большей мере начинает утверждаться в новейшей отечественной и зарубежной литературе (Анастази А., Бурлачук Л.Ф., Кабанов М.М., Личко А.Е., Смирнов В.М., Кулагин Б.В., Марищук В.Л., Мельников В.М., Ямпольский Л.Т., Шванцара Й. и др).
Концепция надёжности составляет одну из основ переосмысления сущности теста, а также одну из характеристик его качества. С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к определению надёжности теста. Это - повторное тестирование, использование параллельных форм одного и того же теста и, наконец, однократное тестирование с последующим разбиением матрицы исходных результатов (X) на две или большее число частей. За показатель принимается значение коэффициента корреляции.
Значительно позже появились попытки теоретического осмысления этой концепции. Исходным пунктом всех построений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множественности возможных причин искажения истинного результата измерения.
Как результат факторно-аналитического переосмысления концепции надёжности и гомогенности теста. Её появление надо рассматривать как реакцию на неприемлемость и искусственность ряда таких условий и ограничений, как, например, параллельность форм одного и того же теста, равенство дисперсий всех высказываний, одинаковая их коррелируемость друг с другом. Д. Армор использовал известный факт корреляции тестовых высказываний между собой и стал рассматривать её как аргумент, статистической функцией которого является надёжность теста.
Если все высказывания измеряют один и тот же признак (свойство), то для фиксированного их числа, чем больше корреляция между ними, тем более надёжен тест. С другой стороны, высокая корреляция обеспечивает хорошую факторизуемость корреляционной матрицы (R) и, следовательно, является залогом выделения такого одного фактора, который может объяснить связь большей части дисперсии в R. Следовательно, надёжность тестов должна быть связана с результатом факторного анализа.
Помимо надёжности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увеличения точности измерения неточно выделенных свойств, соотношение между надёжностью и валидностью можно образно представить в виде кучной стрельбы, но в центре мишени, т. е. стрельба ведётся из оружия вполне надёжного, но прицел выбрал не совсем точно.
Современный тест - это не только надёжный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надёжных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надёжности, начиналась с наивного предположения о тои, что метод «работает», т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Первые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. Привлечение известных учёных к созданию тестов было для научной общественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов.
Что же такое современный психологический тест? Это теоретически обоснованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств. Теоретическое обоснование предполагает всесторонний анализ теста и результатов его применения в свете известных достижений современной психологической науки. Эмпирическое же обоснование связано с обращением к опыту, измерениям и эксперименту.
В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, необходимость, системность, рациональность и др. Ключевым критерием является истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности знания, указывающего на степень его соотнесённости с познаваемым. Но всё это - область специального исследования, которое ещё предстоит провести в процессе дальнейшего развития теории и практики применения психологических тестов.
Поможем написать любую работу на аналогичную тему