Меню

Область применения психологического измерения



Область применения психологического измерения

Тема 5. Психологическое измерение

5.1. Элементы теории психологического измерения

Измерение может быть самостоятельным исследовательским методом, но может выступать и как компонент целостной процедуры эксперимента. Как самостоятельный метод измерение служит для выявления индивидуальных различий в поведении субъектов и отражения ими окружающего мира, а также для исследования адекватности отражения и структуры индивидуального опыта.

Измерение в процедуре эксперимента рассматривается как метод регистрации состояния объекта исследования и соответственно изменения этого состояния в ответ на экспериментальное воздействие.

На основе теории измерения строятся психологические тесты.

В психологии различают три основные процедуры психологического измерения. В основе различения лежит объект измерения.

1. Измерение особенностей поведения людей, определение различий между людьми с точки зрения выраженности тех или иных свойств, наличия того или иного психического состояния или для отнесения к определенному типу. Психологическое измерение заключается в измерении испытуемых.

2. Измерение как задача испытуемого, в ходе выполнения которой последний измеряет (классифицирует, ранжирует, оценивает и т. п.) внешние объекты: других людей, стимулы или предметы внешнего мира, собственные состояния. Психологическое измерение в этом случае является измерением стимулов. Под стимулом понимается любой шкалируемый объект.

3. Совместное измерение стимулов и испытуемых. При этом предполагается, что «стимулы» и «испытуемые» могут быть расположены на одной оси. Поведение испытуемого рассматривается как проявление взаимодействия личности и ситуации.

Внешне процедура психологического измерения испытуемых ничем не отличается от процедуры психологического эксперимента. Однако при проведении психологического эксперимента исследователя интересуют причинные связи между переменными, а результатом психологического измерения является лишь отнесение испытуемого либо оцениваемого им объекта к тому или иному классу, точке шкалы или пространству признаков.

Психологическое измерение стимулов является задачей, которую испытуемый решает в ходе психологического эксперимента. В этом случае измерение используется только как методический прием наряду с другими методами психологического исследования; испытуемый же «играет роль» измерительного прибора.

По сути психологическое измерение испытуемых и психологическое измерение стимулов являются качественно различными процедурами, но в психологии принято употреблять понятие «психологическое измерение» применительно к обоим этим случаям. Процедура психологического измерения состоит из ряда этапов, аналогичных этапам экспериментального исследования. Основой психологических измерений является математическая теория измерений – раздел математической психологии.

С математической точки зрения измерением называется операция установления взаимно однозначного соответствия множества объектов и символов (как частный случай – чисел). Правила, на основании которых числа приписываются объектам, определяют шкалу измерения. Шкала (от лат. scala – лестница) в буквальном значении есть измерительный инструмент.

Понятие измерительной шкалы введено в психологию американским ученым С. Стивенсом.[70] Его трактовка шкалы и сегодня используется в научной литературе.

Операции, способы измерения объектов задают тип шкалы. Различают несколько типов шкал (см. 5.2). Шкала, в свою очередь, характеризуется видом преобразований, которые могут быть применены к результатам измерения. Если не соблюдать это правило, то структура шкалы нарушится, а данные измерения нельзя будет осмысленно интерпретировать. Тип шкалы однозначно определяет совокупность статистических методов, которые могут быть применены для обработки данных измерения.

5.2. Измерительные шкалы

Рассмотрим подробнее особенности различных измерительных шкал. С. Стивенсом[71] предложена классификация из четырех типов шкал измерения:

1) номинативная (номинальная, шкала наименований);

2) порядковая (ординальная);

3) интервальная (шкала равных интервалов);

4) шкала равных отношений.

Номинативная (от лат. nomen – имя, название) шкала – это шкала, классифицирующая по названию. Название не измеряется количественно, а лишь позволяет отличить один объект от другого или один субъект от другого. Номинативная шкала – это способ классификации объектов или субъектов, распределения их по ячейкам классификации.

Простейший случай номинативной шкалы – дихотомическая шкала, состоящая из двух наименований. Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения (например, леворукий – праворукий). Более сложный вариант номинативной шкалы – классификация из трех и более наименований (например, холерик, сангвиник, флегматик, меланхолик).

Распределив все объекты, реакции или всех испытуемых по классам, можно перейти от наименований к числам, подсчитав количество наблюдений в каждом классе.

Таким образом, номинативная шкала позволяет подсчитывать частоты встречаемости разных наименований или значений признака, а затем работать с этими частотами с помощью математических методов.

Порядковая шкала – это шкала, классифицирующая по принципу «больше – меньше». Если в шкале наименований безразлично, в каком порядке расположены классы, то в порядковой шкале они образуют последовательность от самого малого значения к самому большому (или наоборот).

В порядковой шкале должно быть не менее трех классов (например, положительный ответ – нейтральный ответ – отрицательный ответ). В порядковой шкале неизвестно истинное расстояние между классами, но известно, что они образуют последовательность.

От классов легко перейти к числам, если считать, что низший класс получает ранг 1, средний класс – ранг 2, а высший класс – ранг 3, или наоборот. Чем больше классов в шкале, тем больше возможностей для математической обработки полученных данных и проверки статистических гипотез.

Все психологические методы, использующие ранжирование, построены на применении порядковой шкалы. Если испытуемому предлагается, например, упорядочить 15 потребностей по степени их значимости или проранжировать список личностных качеств учителя, то во всех этих случаях он совершает так называемое принудительное ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (потребностей, качеств и т. п.).

Независимо от того, приписывается ли каждому качеству или испытуемому один из трех-четырех рангов или же совершается процедура принудительного ранжирования, в результате получаются ряды значений, измеренные по порядковой шкале. Однако данные, полученные в разных группах, могут оказаться несопоставимыми, так как группы могут изначально различаться по уровню развития исследуемого качества и испытуемый, получивший в одной группе высший ранг, в другой получил бы лишь средний, и т. п.

Читайте также:  Приборы для измерения гликированного гемоглобина

Единица измерения в шкале порядка – расстояние в 1 ранг, при этом расстояние между классами и рангами может быть разным.

Интервальная шкала – это шкала, классифицирующая по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Построение интервальной шкалы для измерения психических явлений – дело очень сложное. Даже при получении данных в физических единицах (секундах, сантиметрах и т. п.) результаты психологического измерения не являются измеренными по интервальной шкале. Аналогично значения, полученные испытуемыми в баллах по любой нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На самом деле равноинтервальными можно считать только шкалы в единицах стандартного отклонения и процентильные шкалы – и то лишь при условии, что распределение значений в стандартизующей выборке было нормальным.[72]

Принцип построения большинства интервальных шкал основан на правиле «трех сигм»: примерно 97,7—97,8 % всех значений признака при нормальном его распределении укладываются в диапазон М ± 36. Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменений признака, если крайний слева и крайний справа интервалы оставить открытыми.

Американский психолог Р. Кеттелл предложил шкалу стенов – «стандартных десяток». Построение такой шкалы начинается с определения среднего арифметического значения в «сырых» баллах, которое принимается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, слева – интервалы, равные 5, 4, 3, 2 и 1 стенам. На оси «сырых» баллов размечаются границы интервалов в единицах «сырых» баллов. Иногда в шкале стенов за разное количество «сырых» баллов будет начисляться одинаковое количество стенов. Шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки n > 200 и нормальном распределении признака.

Другой способ построения равноинтервальной шкалы – группировка интервалов по принципу равенства накопленных частот (процентильная шкала). При нормальном распределении признака в окрестности среднего значения группируется большая часть всех наблюдений, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются. Следовательно, такая процентильная шкала является равноинтервальной только относительно накопленной частоты.[73]

Многие исследователи не проверяют степень совпадения полученного ими эмпирического распределения с нормальным распределением и тем более не переводят получаемые значения в единицы долей стандартного отклонения, или процентили, предпочитая пользоваться «сырыми» данными. «Сырые» же данные часто дают скошенное, срезанное по краям или двухвершинное распределение. С такими распределениями приходится встречаться очень часто, и дело здесь не в какой-то ошибке, а в специфике психологических признаков.

Шкала равных отношений – это шкала, классифицирующая объекты или субъекты пропорционально степени выраженности измеряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. Однако возможности человеческой психики столь велики, что трудно представить себе абсолютный нуль в какой-либо измеряемой психологической переменной.

Абсолютный нуль может иметь место при подсчете количества объектов или субъектов. По отношению к показателям частот возможно применять все арифметические операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале отношений – одно наблюдение, один выбор, одна реакция и т. п.

Таким образом, универсальной шкалой измерения в частотах встречаемости того или иного значения признака и единицей измерения, которая представляет собой одно наблюдение, является номинативная шкала. Расклассифицировав испытуемых по признакам номинативной шкалы, можно применить потом высшую шкалу измерения – шкалу отношений между частотами.

5.3. Тестирование и теория измерений

Разновидностью процедуры измерения свойств объекта является психологическое тестирование (подробно о нем см. тему 6).

С теоретической точки зрения тестирование состоит из двух основных компонентов: собственно тестирования – взаимодействия испытуемого с тестом и интерпретации – взаимодействия данных (индикаторов) испытуемого с совокупностью данных.

В зависимости от того, с какими свойствами и индикаторами имеет дело исследователь на множестве испытуемых (определяется природой свойства) или индикаторов (определяется описанием поведения и заданий), получаются разные модели теста. Если свойство не определено, то рассматривается отношение различия на множестве людей. Это отношение порождает новый класс объектов. Такой тест выявляет меру сходства каждого человека с «человеком-эталоном».

Если свойство определено качественно, то оно рассматривается как точечное, что позволяет ограничить класс объектов – выделить людей, обладающих этим свойством, и людей, не обладающих им. В этом случае тест позволяет произвести дихотомическую классификацию.

Если свойство линейное или многомерное, то можно выявить величину свойства, характеризующую каждого человека. Тест позволяет измерить свойство количественно.

Кумулятивно-аддитивная модель теста предложена немецким психологом К. Левиным, который понимал поведение как функцию личности и ситуации. В тесте решается задача восстановить свойство личности по поведению в ситуации. Ситуацией является пункт теста, а поведением – ответ испытуемого. Таким образом, каждый индикатор свойства есть соединение поведения и ситуации. Тем самым личность является производным от совокупности индикаторов. Процедура обнаружения свойств, к которой сводится тестовое измерение, завершается выводом суммарного балла. «Сырой» балл считается оценкой, характеризующей испытуемого.

Кумулятивную гипотезу проверяют путем корреляции результатов применения различных методик. При наличии высокого положительного коэффициента линейной корреляции результатов кумулятивно-аддитивная модель принимается для обработки данных личного опросника.

Вероятностная модель теста. Критическую оценку применения кумулятивно-аддитивной модели дал швейцарский психолог Р. Мейли. Он полагал, что тесты измеряют только вероятность наличия у испытуемого того или иного психологического свойства, а не его интенсивность.[74] По мнению В.Н. Дружинина, критика, с которой выступает Р. Мейли, носит только качественный характер и не имеет математического или эмпирического обоснования.[75] С позиции обобщенной модели основное требование к тесту заключается в том, чтобы процедуры измерения и интерпретации были тождественны.

Читайте также:  Комплект измерение электрических величин

Источник

ГЛАВА 3. МЕТОДЫ ПСИХОЛОГИИ

5. ИЗМЕРЕНИЯ В ПСИХОЛОГИИ

Первым, кто заговорил о необходимости измерения в психологии, был создатель психологии способностей, ученик Г. Лейбница (1646-1716) немецкий ученый X. Вольф (1679-1754). Он ввел понятие «психометрия» и пытался измерять одно явление посредством другого, например, величину внимания — продолжительностью аргументации, которую мы в состоянии проследить и удержать. Однако настоящая потребность в измерительных приемах возникает век спустя с развитием экспериментальной психологии, особенно психофизики, основателем которой считается немецкий физик и психолог Густав Фехнер (1801-1887). Исследуя вслед за Э.Г. Вебером (1795-1878) соотношение реальных физических стимулов (света, цвета, звука, запаха, прикосновений и т.п.) с ощущениями, которые они вызывают у человека, Фехнер предложил метод измерения и предпринял попытку математического описания наблюдаемой закономерности. Он исходил из верной мысли о том, что ощущение не может быть измерено непосредственно в абсолютной величине, поскольку мы не располагаем эталоном ощущения, как это имеет место при измерении физических величин (эталон длины, веса, времени и т.д.). Но мы можем измерить внешние стимулы, которые задаются экспериментатором (вес предметов, интенсивность раздражителей, время и т.д.), и определить разностные пороги ощущения, соответствующие этим стимулам. Отсюда идея Фехнера: взять за эталон едва заметное различие, полагая, что одно едва заметное различие субъективно равно другому. Используя этот прием, Фехнеру удалось квантифицировать (правда, косвенно) психические явления. Эта идея оказалась очень продуктивной, она быстро продвинула экспериментальную психологию вперед и содействовала становлению психологии как научной дисциплины.

Шкалирование. Суть любого измерения психических процессов заключается в том, чтобы квантифицированному ряду значений, характеризующему исследуемый процесс, поставить в соответствие ряд чисел или других символов. Этот числовой (символический) ряд позволяет нам в обобщенном, абстрагированном виде рассматривать степень выраженности, количество или частоту проявлений изучаемого процесса. В измерительных процедурах подобный числовой ряд получил название «шкала». Только в отличие от известных эталонных метрических шкал, имеющих в качестве единицы измерения («кванта») сантиметр, секунду, частоту колебания и т.д., единицей измерения большинства психологических шкал выступает субъективное различение, т.е. квантуется исследуемый процесс.

Существуют разные уровни измерений. Например, самым простым из них является простая классификация по заданному критерию. Предположим, стоит задача определить, кого из тридцати ребят, принимавших участие в спортивных занятиях, можно отнести к следующим классам:

2 — скорее активные, чем пассивные

3 — скорее пассивные, чем активные

Мы получили так называемую шкалу наименований по критерию активности, состоящую из цифр 1, 2, 3, 4. Каждая из этих цифр представляет собой не число, а присвоенный символ, поэтому эти цифры могут быть заменены, к примеру, буквами. Отсюда в шкалах наименований нельзя проводить никаких арифметических действий с числами, которые мы присваиваем объектам или классам объектов. Производится только подсчет частоты одного класса, т.е. встречаемости того или иного результата в каждом классе. Методы, применяемые в ходе такой математической обработки, называют «статистикой качественных признаков».

Наиболее распространены в психологических измерениях порядковые (или ранговые) шкалы. Примером такой шкалы является обычная система школьных баллов, в которой цифры представляют собой упорядоченный ряд оценки уровня знаний. Эти баллы позволяют ранжировать учащихся по уровню знаний. Однако на основе такого рода баллов нельзя сказать, насколько или во сколько раз уровень знаний, соответствующий, положим, четырем баллам, ниже уровня знаний, соответствующего пяти баллам. То есть, шкала порядка представляет собой уменьшающийся или увеличивающийся ряд чисел, в котором перестановки чисел (элементов этой шкалы) недопустимы.

Школьная балльная система представляет собой так называемую однополюсную шкалу порядка, однако в психологических измерениях встречаются двухполюсные (биполярные) шкалы. Примером может служить методика семантического дифференциала (Ч. Осгуд, 1952), направленная на измерение свойств или состояний индивида на основании полярных проявлений этих свойств. При этом первоначально отбирают некоторое множество понятий, которые характеризуют изучаемое свойство. Затем каждому понятию находят антоним (например, активный-пассивный, здоровый-больной, сильный-слабый, и т.д.). Между этими двумя полярными понятиями располагается шкала с промежуточными оценочными категориями. Словесное определение промежуточных категорий часто вызывает затруднения, так как в языке мы, как правило, легче находим понятия для обозначения экстремальных степеней выраженности того или иного свойства. Ниже изображен фрагмент самооценочной биполярной шкалы порядка, построенной по типу семантического дифференциала.

«X» +3 +2 +1 -1 -2 -3 «Y»
1. Хороший плохой
2. Контактный замкнутый
3. Активный пассивный
4. Честный лживый
5. Приветливый мрачный
6. Бодрый вялый

Если одно из двух противоположных значений признака обозначить «X», а другое «Y», то семь делений по шкале (слева направо) могут быть интерпретированы как: (+3) — весьма выраженное X; (+2) — выраженное X; (+1) — немного заметное X; (0) — ни Х ни Y (или Х и Y в равной мере); (-1) — немного заметное Y; (-2) — выраженное Y; (-3) — весьма выраженное Y. Оценку выраженности своего состояния по каждой паре признаков человек может сделать, выбрав одно из цифровых значений предложенной шкалы.

Тестирование. Идея квантования как отрезка различения была очень эвристичной. Ее восприняли и стали применять для разработки объективных методов оценки практически во всех направлениях психологии.

В основе метода объективной психологической оценки лежит тест (или проба), который может представлять собой либо стимул определенной модальности [1], если это психофизическое исследование; либо задачи разного уровня сложности, если это педагогическая психология, либо задания, связанные с исследованием внимания, памяти, сообразительности и т.д. в общей и возрастной психологии. Для того, чтобы эти тесты (пробы) могли дать объективные и измеримые данные, они предварительно проверяются на большом числе испытуемых. Например, в педагогической психологии — на детях одного возраста, или людях одного уровня образования и т.д. При этом из всех предложенных задач отбираются те, которые успешно решаются значительным числом всех испытуемых (например, двумя третями). Эта процедура называется нормированием или определением «нормы». С ней впоследствии сравниваются решения тех испытуемых, знания, умения и навыки которых измеряются. Результаты этих измерений оцениваются в условных баллах или в ранговых оценках, объединенных в шкалу порядка и указывающих, какое место данный испытуемый мог бы занять по отношению к соответствующей группе испытуемых (т.е. к «норме»).

Читайте также:  Момент силы прибор для измерения

Задача психологических тестов, таким образом, — измерить различия между индивидами или между реакциями одного индивида в разных условиях. Решение этой задачи привело к развитию дифференциальной психологии и дифференциальной психофизиологии. Велико значение психологических тестов и для других направлений психологии.

Количество и разнообразие различного рода тестов, опросников и шкал в настоящее время огромно. А начиналось тестирование с разработок Ф. Гальтона (1822-1911), который первым их применил для измерения психических свойств. Еще одной его заслугой была разработка методов математической статистики для анализа данных по индивидуальным различиям. В дальнейшем заметный вклад в развитие психологического тестирования внесли работы Джеймса Кеттела (1860-1944) с его «умственными тестами», которые содержали измерение мышечной силы, скорости движения, чувствительности к боли, остроты зрения и слуха, времени реакции, памяти и т.д. Измерением памяти у школьников занимался Г. Эббингауз (1897). Во Франции в 1908г. свою первую шкалу умственного развития для детей создали А. Бине и Т. Симон. Когда США вступили в Первую мировую войну, под руководством P.M. Йеркса (1876-1956) были разработаны армейские так называемые «альфа и бета-тесты», позволяющие отобрать годных к военной службе лиц. Впоследствии эти тесты неоднократно перерабатывались и стали образцом для большинства групповых тестов интеллекта. Тестирование получило мощнейший стимул для своего развития, и вскоре были разработаны групповые тесты интеллекта для всех возрастов и уровней образованности (от дошкольников до аспирантов). Их начали широко использовать в школах, колледжах. Коэффициент интеллекта IQ (см. главу «Способности») учитывался при приеме в учебные заведения и на работу. Однако вскоре стало ясно, что применяемые тесты являются очень грубым инструментом и область их применения весьма ограничена. Тем не менее они широко распространены, продолжают совершенствоваться и применяться для разных целей.

Наряду с тестами интеллекта в ответ на запросы практики возникли также тесты достижений. Их еще называют тестами объективного контроля успешности: школьной, профессиональной, спортивной и т.п. От разных типов контроля знаний и умений (устных и письменных) эти тесты отличаются своей формой. Учащимся предлагается вопрос, ответ на который в нескольких вариантах представлен на этом же бланке. Один из ответов верный, остальные — нет. Нужно отметить верный ответ. При подготовке тестов достижений практикуется экспертная оценка знаний, которая проводится параллельно с тестированием. Когда тест отработан и стандартизован, необходимость в этом отпадает. К сожалению, применение теста достижений ограничено только той областью знаний, которая поддается формализации.

Применение тестов. Как методический инструмент тесты широко используются в современных исследованиях. Однако прежде, чем решить, какой из сотен имеющихся тестов может быть применен для исследования, психолог задается вопросом: какова цель теста? Для какой группы лиц он лучше подходит? Чем он отличается от других методов изучения индивидуальности человека? Насколько ответственно он конструировался? Насколько он точен и надежен? Насколько адекватны и действительны его результаты?

От каждого измерительного инструмента требуется, чтобы он был как можно более точным, чтобы на полученные результаты можно было положиться, как на данные, близкие к «настоящей» величине измеряемого признака. Следовательно, точность можно понимать как меру достоверности, с какой тест измеряет то, что он измеряет. Существует ряд источников погрешностей, которые снижают точность тестов и надежность результатов. К ним относятся: неблагоприятные условия тестирования, недостаточное внимание к состоянию испытуемых в момент испытания, неверное поведение экспериментатора, а также субъективность в истолковании результатов теста. Кроме учета и устранения источников погрешностей, надежность теста (т.е. его согласованность) повышают посредством повторного испытания с последующим вычислением коэффициента корреляции между данными первого и второго тестирования. Подобная тщательная и объективная проверка надежности теста необходима психологам, чтобы знать, для каких целей и в каких пределах его можно применять.

Наряду с надежностью к тесту предъявляется требование валидности, или адекватности. Валидность — это степень, в которой тест является инструментом, измеряющим то, для чего он предназначен.

Для установления валидности обычно требуется независимый внешний критерий по отношению к тому, что тест должен измерить. Например, если разрабатывается тест для измерения склонности к риску, то он может быть валидизирован проверкой этой склонности в группе мотогонщиков, каскадеров и т.д. Совокупность таких внешних показателей риска будет критерием, с которым следует соотнести исходные тестовые показатели риска.

Далее определяется коэффициент валидности с помощью коэффициента корреляции. При конструировании тестов применяется еще целый ряд специальных статистических процедур, позволяющих сделать тест более чувствительным и надежным инструментом.

При работе с тестами следует отметить также и этический аспект: использование, проведение и интерпретация психологических тестов должны обязательно идти под контролем квалифицированного психолога. В руках недобросовестного или некомпетентного экспериментатора тесты могут принести серьезный вред. Особенно это касается личностных тестов или опросников, в связи с чем важно предотвратить доступность их содержания для любого желающего.

Описанные выше базовые методы исследований, а также методы измерения и тестового оценивания индивидуальных различий лежат в основании многих современных объективных методов эмпирических исследований. К основным из них относятся метод опроса, проективный метод, метод отраженной субъективности.

1 Модальность — термин, обозначающий одно из основных свойств ощущений, их качественную характеристику (цвет в зрении, тон и тембр в слухе, запах в обонянии и т.д.).

Источник