Меню

Методология педагогических измерений для чего



Лекция 4 Педагогическое измерение как форма диагностики обучения

1. Основные теоретические положения педагогических измерений

2. Компоненты процесса педагогических измерений.

3. Измерительный инструмент.

4. Обработка и анализ данных измерения.

Согласно наи­более распространенному определению, введенному в 1946 г. аме­риканским психологом С.Стивенсом, измерение — это процеду­ра приписывания чисел некоторым характеристикам объектов в соответствии с определенными правилами. Данное опреде­ление — результат формального обобщения опыта количествен­ных измерений, широко применяемых в физике и других есте­ственных науках, однако на протяжении многих лет его брали за основу и в эмпирических науках.

По мере развития педагогики, психологии и социологии воз­никла потребность во введении не только количественных, но и качественных оценок для величин, отличающихся по степени проявления того или иного свойства. Качественные оценки явля­ются менее точными по сравнению с количественными в силу применяемых способов и инструментов измерения. Например, классифицирующие понятия в образовании («знающий», «подго­товленный» и др.), которые дифференцируют обучающихся по уровню знаний и играют важную роль в учебном процессе, опре­деляются субъективно учителем или группой учителей. Нередко качественные оценки выражают с помощью чисел, которые выби­рают на основе экспертных суждений и соглашений. Приписывае­мые числа могут трактоваться по-разному. Так, в традиционном педагогическом контроле у каждого учителя есть свои представле­ния о том, за что нужно ставить «5», «4», «3» и т.д.

Неоднозначность оценивания в образовании усугубляется ла­тентным (скрытым, исключающим возможность непосредственно­го измерения) характером измеряемых переменных. В силу латентности оцениванию подвергаются не сами характеристики обученности и обучаемости, а их эмпирические референты — наблюдаемые признаки измеряемых характеристик. Выбор по­следних происходит интуитивно, поэтому их соответствие ла­тентным характеристикам нуждается в доказательстве на основе экспертного и статистического анализа эмпирических результа­тов измерения.

Современная теория измерений появилась в 80-х гг. XX в. Она стро­ится на более строгой аксиоматической основе|. В соответ­ствии с новыми представлениями, измерение трактуется как кон­струирование числовой функции, осуществляющей изоморфное отображение некоторой эмпирической структуры в соответствую­щим образом подобранную числовую структуру.

Изоморфизм — важное понятие математики, которое опреде­ляет ряд условий взаимно однозначного отображения двух мно­жеств с сохранением их свойств в процессе такого отображения. Хотя это понятие впервые появилось в высшей алгебре, в наше время оно используется довольно широко, хотя и не вполне стро­го, например в педагогических измерениях. Поскольку эмпири­ческая структура и строящаяся по результатам оценивания число­вая структура (шкала) изоморфны, имея шкалу, можно, не обра­щаясь непосредственно к измеряемым объектам, восстановить все их свойства, характерные для эмпирической структуры.

Компоненты процесса педагогических измерений.Процесс педа­гогических измерений включает:

— выбор предмета измерения (латентных характеристик объек­тов) и их числа;

— выбор эмпирических референтов (наблюдаемых характерис­тик объектов);

— выбор измерительных процедур;

— конструирование и использование измерительных инструмен­тов;

— выбор шкалы (если измеряемая переменная одна) или шкал (если измеряют более одной переменной при многомерных изме­рениях);

— построение отображения результатов измерения на шкалу (шкалы в случае многомерных измерений) по определенным про­цедурам и правилам;

— обработку, анализ и интерпретацию результатов измерения.

В силу неизбежности ошибок измерения оцениваемые характе­ристики объектов могут принимать более или менее точные значе­ния, поэтому эти характеристики принято называть переменными измерения. Любые отклонения от стандартизированных условий из­мерения, обработки, анализа и интерпретации полученных резуль­татов увеличивают ошибки измерения, которые представляют наи­большую опасность в эмпирических науках в силу латентного харак­тера переменных. Поэтому так важен анализ устойчивости и точно­сти (надежности) результатов тестирования, что выгодно отличает тесты от традиционных оценочных средств.

Еще одна характеристика качества результатов тестирования-валидность-отражает адекватность эмпирических результатов по­ставленным целям измерения. В силу многогранности целей анализ валидности должен быть многоаспектным, но в любом случае важное место занимает доказательство адекватности эмпи­рических референтов концептуально выделенной переменной (пе­ременных) измерения (конструктная валидность).

Измерительный инструмент.Измерительный инструмент вклю­чает два компонента. Первый компонент — само измеряю­щее устройство, роль которого в педагогических измерениях чаще всего, но не всегда выполняет тест. В самом обобщенном виде под гестом можно понимать совокупность контрольных заданий в стан­дартизированной форме, обладающих необходимыми системооб­разующими статистическими характеристиками и обеспечиваю­щих обоснованные оценки концептуально выделенной перемен­ной (переменных) измерения с высокой объективностью. Таким образом, в самом определении теста заложены требования к его качеству, отсутствующие в традиционных оценочных средствах.

Второй компонент измерительного инструмента — за­ранее подготовленная шкала, которая служит для фиксации ре­зультатов измерения и на которой откладываются оценки (коли­чественные или качественные) измеряемой переменной. В про­цессе упорядочения оценок каждому элементу совокупности на­блюдаемых эмпирических данных ставится в соответствие опреде­ленный балл, устанавливающий положение наблюдаемого эле­мента на шкале, где можно размещать сырые (первичные) баллы (результаты суммирования оценок по отдельным заданиям теста) или производные баллы, получающиеся в результате преобразо­вания первичных оценок для повышения сопоставимости и удоб­ства интерпретации результатов учащихся.

Шкала с отложенными оценками переменной является целью измерения. При измерениях с высокой надежностью и валидностью она адекватно отображает оцениваемые характеристики и представляет их без существенных искажений. В зависимости от ко­личества оцениваемых характеристик объекта можно говорить об одномерных (одна переменная) или многомерных (более одной пере­менной) измерениях. Соответственно по результатам измерения стро­ится одна шкала или несколько шкал, число которых в последнем случае обычно бывает равно числу переменных измерения.

Обработка и анализ данных измерения.Последний компонент процесса педагогических измерений, включающий обработку, анализ и интерпретацию данных, служит для выявления обеспе­чиваемого качества результатов измерения, коррекции тестов и представления полученных данных в форме, удобной для интер­претации и сравнения. Благодаря сопоставимости тестовых бал­лов, достигаемой в процессе обработки, по результатам педагоги­ческих измерений можно выстраивать качественный анализ ре­зультатов учащихся, проводить мониторинг и принимать обосно­ванные управленческие решения в образовании.

Объективность педагогических измерений. Может ли быть абсолютная объективность?Появление пер­вых стандартизованных тестов в образовании вызвало массовую позитивную реакцию, поскольку первоначально они рассматри­вались как средство получения объективных оценок подготов­ленности обучаемых, преодолевающее субъективизм традицион­ных оценочных средств. По мере развития теории педагогических измерений и накопления опыта применения тестов пришло по­нимание того, что абсолютная объективность — это недостижи­мая характеристика результатов любых, в том числе и педагоги­ческих, измерений в силу существования ошибочных компонен­тов, неизбежно смещающих оценки. Поэтому при использова­нии тестов можно говорить лишь о высокой или низкой объек­тивности, степень проявления которой связана с величиной на­дежности теста.

Наиболее полно трактовка термина «объективность измерений» представлена в исследованиях Е.Вебстера (E.Webster) , предложившего восемь толкований этого понятия. Три из них-процедурная объективность, классическая (традиционная) объек­тивность и инвариантная (специфическая) объективность-не­посредственно относятся к педагогическим измерениям.

Процедурная объективность.Под процедурной объективностью (первая трактовка термина «объективность измерений») понима­ется независимость результатов тестирования от субъективных суж­дений педагога, использующего тест. Эта независимость обеспе­чивается благодаря равенству условий тестирования, использова­нию для одной группы тестируемых параллельных (совпадающих по трудности и другим характеристикам) вариантов теста, стан­дартизации процедуры проверки результатов и максимальной ее автоматизации, исключающей влияние педагога на оценки.

Сведение всех видов объективности только к процедурной не­допустимо, поскольку при таком подходе не выдвигается никаких требований к качеству теста. В этом случае может создаться впе­чатление, что для получения объективных данных о подготовлен­ности испытуемых достаточно перейти от традиционных экзаме­нов к любым, в том числе некачественным, тестам, устранив вли­яние педагога на оценку тестирования путем автоматизации про­цедуры подсчета баллов испытуемых.

Классическая, или традиционная, объективность.Второе, углуб­ленное, понимание объективности измерений рассматривается в классической теории тестов и основывается на понятиях «сырой балл» и «истинный балл», отличающихся друг от друга на величи­ну ошибки измерения.

Сырой (первичный, наблюдаемый, индивидуальный) балл по­лучается простым суммированием результатов испытуемого поотдельным заданиям теста. При дихотомической оценке резуль­татов по заданиям (1 или 0) индивидуальный балл равен коли­честву правильно выполненных заданий теста. Истинный балл в классической теории отождествляется с абсолютно объективной оценкой свойств испытуемого, свободной от влияния любых ошибок измерения. В отличие от сырого балла, который меняет­ся в зависимости от теста и способа подсчета результата испыту­емого, истинный балл трактуется как не зависящая от средств измерения константа, характеризующая оцениваемое свойство испытуемого в момент измерения, но меняющаяся в процессе обучения.

Согласно основной аксиоме классической теории тестов, лю­бой наблюдаемый балл равен сумме истинного балла и ошибки измерения. В тех случаях, когда ошибка измерения не превышает выбранных пределов точности измерений, говорят о высокой объективности результатов тестирования, а оценки испытуемых принимают за их истинные баллы. Таким образом, углубленное понимание объективности измерений требует оценивания вели­чины ошибки измерения, на размер которой влияют не только условия проведения тестирования, но и качество теста.

Инвариантная, или специфическая, объективность.Третья трак­товка объективности основана на современной теории конструи­рования тестов — Item Response Theory (IRT). Преимущества IRT, позволяющие оценить подготовленность обучаемых независимо от трудности заданий теста, приводят к достижению так называемой инвариантной объективности измерений, которая предпочтитель­нее объективности, обеспечиваемой классической теорией тестов.

Для достижения специфической объективности необходима подгонка данных тестирования к требованиям моделей теории IRT и длительная серьезная работа над тестом. Поэтому на практике тестологи часто сталкиваются с тем, что эффект инвариантной объективности либо реализуется со слишком большими затрата­ми, либо не реализуется вообще в силу недостаточно высокого качества теста.

Размерность пространства измерений, одномерные и многомерные конструкты, латентные переменные Концептуальные и реальные переменные измерения, конструкты.

Измерение начинается с постановки цели, в соответствии с ко­торой выбирают одну (одномерный случай) или несколько (мно­гомерный случай) переменных. В последнем случае для обозначе­ния измеряемых характеристик часто используют обобщающий термин — «конструкт». Каждый разработчик теста уверен в том, что он ясно представляет себе измеряемые характеристики и спо­собен на основании своего педагогического опыта точно подо­брать задания, обеспечивающие оценивание конструкта. Многие тестологи так и остаются в полном заблуждении относительно того, что на самом деле измеряет тест, поскольку не проверяют соответствие задуманного конструкта и реальных результатов из­мерения.

Анализ такого соответствия является необходимым этапом оце­нивания валидности измерения. Нередко его пытаются провести априорно, до начала тестирования, экспертным путем, и в ре­зультате, как правило, получают недостоверную информацию. Для корректного оценивания валидности необходим статистический анализ эмпирических данных тестирования, поэтому понять, что же мы на самом деле измеряем, можно лишь после применения теста.

Сложность процедуры установления размерности пространства измерений увеличивает проблемы, связанные с неоднозначной трактовкой многих конструктов в образовании и в других соци­альных науках (рис. 2).

Каждый педагог вкладывает в оценивание учебных достижений свое видение оптимального набора перемен­ных измерения. Неоднозначность трактовки конструкта усугубля­ется по мере продвижения от начальных ступеней образования к более высоким ступеням, когда содержание большинства учеб­ных курсов приобретает междисциплинарный характер.

Операционализации. Операционализация заключается в прида­нии оцениваемым

латентным характеристикам подготовленности учащихся формы, удобной для фиксации определенными прави­лами измерения. При педагогическом измерении в качестве таких характеристик

Латентная переменная А Наблюдаемая переменная В

Рис. 3. Связь между латентной и наблюдаемой переменными

подготовленности обучаемых обычно выступают зна­ния, умения, навыки, компетентности и т.д.

В процессе операционализации происходит выделение набора эмпирических индикаторов, в роли которых выступают задания теста. Количество правильно выполненных заданий, подсчитан­ное и преобразованное по определенным правилам, дает основа­ние для присвоения испытуемому определенного места на шкале переменной измерения.

Контрольные вопросы

1. Процедурная объективность.

3.Инвариантная, или специфическая, объективность.

4Классическая, или традиционная, объективность.

Источник

Методология педагогических измерений для чего

ВОПРОСЫ МЕТОДОЛОГИИ ПЕДАГОГИЧЕСКИХ ИЗМЕРЕНИЙ

testolog @ mtu — net . ru

Впервые статья напечатана в журнале «Педагогические измерения» №1 2005г.

Новая редакция проведена в 2008 году.

Педагогические измерения представляют собой, одновременно, междисциплинарную прикладную теорию (науку) и практику. Такое понимание педагогических измерений требует внимания к вопросам создания и обоснования специальной теории, а также к методам преобразования существующей практики. Это и есть проблема методологии. Главные вопросы методологии – определение сущности, цели, задач, обоснование методов педагогических измерений, шкалирования и правил интерпретации результатов.

Вопрос о сущности педагогических измерений уже затрагивался в предыдущих статьях автора [1] . Из соображений полноты и точности к приведенным там определениям можно добавить ещё два. Первое дано классиком науки N.R.Campbell. Он определяет измерение как процесс присвоения чисел для отображения интересующих свойств, в соответствии с требованиями науки [2] . Этим определением он подчеркивает измеримость только тех свойств, которые наука может определить. Трудности измерения интеллекта, знаний и тому подобных качеств личности N.R.Campbell видит не в самих этих свойствах, а в общем невежестве относительно их сущности (там же).

С логикой N.R.Campbell удачно сочетается другое определение измерений: это процесс, в котором исследователи представляют интересующие свойства личности посредством чисел. В определении A . Tarsky привлекательны два аспекта: подтверждается свойство процессуальности измерений (что много лучше распространенного сейчас слова «процедура») и краткость самого определения. Процесс педагогических измерений — это научное производство и практическое применение методов измерения явно ненаблюдаемых свойств личности [3] .

Читайте также:  Как написать вывод по практической работе измерение обхвата грудной клетки

Каждое интересующее свойство личности в процессе педагогических измерний выражается величиной, по котоой наблюдаемые объекты могут принимать различные значения. Сущность, подтверждаемая подходящей концепцией и термином, а также наблюдаемая дисперсия значений испытуемых является самым существенными признаками переменной величины. В процессе измерения баллы испытуемых часто принимают различающиеся значения. При отсутствии таковых говорят о постоянной величине.

Выделяются два вида переменных величин. Первые — это наблюдаемые и непосредственно измеряемые. Например, скорость движущегося автомобиля наблюдаема, и измеряема с помощью спидометра. Так же наблюдаема и измеряема, с помощью весов, масса чемодана. Другие переменные проявляют себя при научном подходе к проблеме измерения таких свойств, как интеллект и знания. При этом наблюдаемо не само интересующее свойство, а признаки его проявления, такие как умение правильно решить задачу, дать точное название, правильно ответить на задание теста. Такие проявления называются эмпирическими индикаторами.

Свойство личности, измеряемое косвенным образом, посредством индикаторов, называется латентным (скрытыми). R . B . Cattell выделяет два вида свойств: латентное свойство является источником ( source trait ) для внешне наблюдаемого свойства ( surface trait ) [4] . По внешним количественным проявлениям исследователь оценивает значения латентной переменной. Все наблюдаемые ментальные проявления личности считаются индикаторами латентных свойств. Актуальным примером латентных свойств считаются интеллектуальные способности, знания и представления.

Процесс измерения латентных свойств охватывает испытуемых, разработчиков тестов и тестовых заданий, а также тех, кто применяет тесты и различные виды педагогического оценивания, и интерпретирует результаты. Для большинства педагогов самым интересующим свойством (или качеством) личности является уровень подготовленности учащихся (студентов), по одной или нескольким учебным дисциплинам.

Операционализация. Для измерения латентной переменной обязателен этап операционализации понятия об интересующем свойстве личности. Использование операциональных понятий оказывается правильным там, где они занимают свое место в общей системе понятий изучаемого предмета, и неправильным, где они абсолютизируются, и применяются вместо специально-научных, общих и философских понятий. Операционализация понятия есть его идентифицированность с совокупностью конкретных эмпирических действий — операций, синонимичных содержанию понятия [5] . Операционализация позволяет расчленить, уточнить и детализировать основное понятие, поставить ему в соответствие некоторый набор понятийных и эмпирических индикаторов. Структурирование индикаторов методами, например, факторного анализа, позволяет получить новую эмпирическую структуру понятия, обычно не совпадающую с исходной, концептуальной. В таких случаях изучается степень их совпадения — несовпадения, пересматривается состав эмпирических индикаторов, особенности того или иного метода факторного анализа. Если большинство концептуально выделенных индикаторов образует фактор — понятие, то результат рассматривается как успешный для проверки выдвинутой концепции.

Таким образом, операциональные определения обеспечивают правильный переход от теоретического уровня исследования к эмпирическому уровню. Основными элементами перехода выступают понятийные индикаторы различного уровня общности. Так, основному понятию ставится в логическое соответствие некоторое небольшое (обычно не более пяти-шести) число частных понятий, становящихся понятийными индикаторами первой ступени. Затем этим индикаторам ставятся в соответствие еще более частные понятия, которые становятся индикаторами второй и т.д. ступени, вплоть до эмпирических индикаторов, соответствие которых основному понятию проверяется эмпирически. Применительно к педагогическим измерениям в качестве эмпирических индикаторов обычно выступают задания, подобранные с целью проверить знания по какой-либо учебной дисциплине.

Педагогическое измерение удобно определить как процесс отображения уровней проявления интересующего латентного свойства испытуемых в числовую шкалу. Желательно, чтобы процесс отображения давал значения тестовых баллов в интервальной шкале. Это означает шкалу с равными интервалами, у которой есть нулевое значение, единица измерения, правила измерения и правила интерпретации результатов. В педагогических измерениях требованиям интервальной шкалы отвечают тестовые баллы, получаемые по модели G . Rasch [6] .

Педагогические измерения проводятся на основе различных моделей. Модель измерения в литературе определяется как структурное построение, позволяющее соединить латентные переменные с наблюдаемыми переменными [7] . Модель измерения, основанная на содержательном анализе заданий и на элементарных оценках, можно назвать педагогическим оцениванием. Более широким аналогом этого понятия в западной литературе является термин п едагогическое оценивание ( educational evaluation ), которую можно рассматривать как одну из начальных форм педагогического измерения, в которой нет средства измерения (теста), но уже есть чис ловая шкала, на которой могут градуироваться результаты испытуемых. На Западе этот термин нередко включат в себя не только традиционные педагогически оценки, но также результаты экспертизы и педагогических измерений

Методология и уровни методологии

Методология – это система всеобщих, общих и частных методов научного исследования. В литературе она определяется как система принципов и способов организации теоретической и практической деятельности, а также учение об этой системе [8] . Наиболее эффективный путь влияния методологии на практику — через разработку теории деятельности и путей рационального преобразования практики. Именно в организационной теории преломляются те или иные принципы и правила, которые помогают превратить практическую работу в научно-практическую, со всеми проистекающими отсюда преимуществами.

Методологию педагогических измерений можно определить как учение об основных положениях, формах, методах, принципах научного исследования и организации эффективной практики в разработке показателей качества подготовленности учащихся и показателей педагогической деятельности.

Как и во всякой прикладной науке – а педагогические измерения надо отнести к таковой — можно выделить, как минимум, следующие уровни рассмотрения основных проблем педагогических измерений.

Первый, самый главный уровень – это рассмотрение проблем измерения сквозь призму сложившейся практики, той, которая своим основным предметом деятельности имеют разработку и применение тестов. В практике формируется и соответствующее практическое мышление, заметно отличающееся от форм теоретического мышления. Практическое мышление создаёт и свою систему деятельности, в которой наряду с нормальным формами педагогических измерений встречается немало отклонений от общепринятого, в западной науке, канона. В России такого рода субкультурные формы получили своего рода уникальное чиновно-лексическое оформление в виде т.н. контрольно-измерительных материалов — «КИМов», «АПИМов» и других тестоподобных, но не тестовых форм. Не случайно одной из основных задач методологии становится разработка критериев эффективности и качества педагогических измерений. В то время как подлинная практика педагогических измерений имеет преимущественно дело с тестами и тестированием, названные выше формы, из-за отсутствия показателей их собственного качества, на статус тестовых форм никак не тянет.

Второй уровень рассмотрения проблем педагогических измерений является теоретическим. Это совсем другая, отличная от практики тестирования форма духовной деятельности, на которую нередко претендуют и практики. Однако различия между материальными и духовными формами деятельности в педагогических измерениях настолько сильны, что совмещать в одном лице претензии на одинаково успешную деятельность в науке и практике фактически невозможно, а там, где это пытаются, дело нередко доходит до абсурда. Ошибочная практика создания субкультурных форм педагогических измерений отвергает теорию и науку вообще, подменяют научную теорию псевдонаучной, содержательную лексику – общей и бессодержательной лексикой. В качестве примеров можно назвать фактически сложившиеся исключительно в России, т.н. ЕГЭведение и КИМология. В то время как в других старнах — тестировани еи теория педагогических измерений.

Подлинная теория педагогических измерений совсем не похожа на практику: легко найти различия в целях, объекте, предмете, методах и в содержании теоретической и практической деятельности, в типах мышления и лейтмотивах деятельности. К тому же практическая деятельность сильно отягощена фактором коммерции, что ещё дальше отодвигает субъектов практической деятельности от подлинной науки. Нынешняя тестовая действительность лишь отдалённо напоминает педагогические измерения, что лишний раз доказывает существенность различий между теорией и практикой, равно как и различий между теоретическим и практическим мышлением. В указанном смысле претензии отдельных авторов на использование практического понятия «тестирование» в качестве основного понятия науки о педагогических измерений не имеют оснований. вместо тестологии в наше время правильнее говорить о теории педагогических измерений.

Анализ различных форм проверки знаний с точки зрения объективности, измеримости, научности, репрезентативности и технологичности приводит к выводу о преимуществах тестов перед многими другими традиционными формами оценивания и методами контроля знаний.

Тесты позволяют получить объективные оценки уровня знаний, умений, навыков, проверить соответствие требований к подготовке выпускников заданным стандартам, выявить пробелы в подготовке студентов. В сочетании с персональными ЭВМ и программно — педагогическими средствами тесты помогают перейти к созданию современных систем адаптивного обучения и адаптивного контроля — наиболее эффективных, и, к сожалению, наименее применяемых у нас форм организации учебного процесса. Педагогические измерения посредством тестов позволяют лучше дифференцировать знания испытуемых и правильнее отображать уровень их знаний в виде шкальных значений по измеряемой латентной переменной.

Сказанное не означает, что остальные методы оценивания учащихся, особенно в текущем учебном процессе, должны быть отменены. Тест – лишь один из методов, который полезно применять как технологичную итоговую форму оценки результатов обучения. Для текущего контроля применяется множество других, в том числе и традиционных форм. Однако в последние годы всё большее значение начинают приобретать задания в тестовой форме. Тем самым, в практике получает развитие идея широкого использования обучающего потенциала заданий в тестовой форме.

Проблема методологического обоснования педагогических измерений

Эта проблема является междисциплинарной; она является философско-социально-педагогической и логико-математико-статистической. Философско-педагогической ее можно считать потому, что решение проблемы зависит от использования достижения наук, относящихся традиционно к философским — это сама философия и логика. Социально-педагогической она является, потому что в ней содержатся признаки, присущие общественным проблемам, таким как влияние результатов тестового контроля на социум — учащихся и их родителей, на зависимость образования от качества тестов, от уровня педагогической культуры, от ценностей общества и др.

К социальным условиям эффективности педагогических измерений можно отнести:

— социально направленный вектор образовательной политики государства;

— управление процессом педагогических измерений общественно-профессиональными организациями;

— взаимодействие (партнёрство) испытуемых, родителей, школ, вузов и органов управления образованием;

Нередко обоснование качества результатов педагогических исследований требует обращения к внепедагогическим понятиям и критериям — философским, логическим, математико-статистическим. В частности, философский элемент в теорию педагогических измерений вносит уже упоминавшийся тезис о неизбежности погрешности измерений. Критики нередко апеллируют к этому тезису как к обоснованию принципиальной порочности тестов в смысле точности измерений. При этом забывается, что формой преодоления этого философского скепсиса является тезис о возможности приближенного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например, в физике те фундаментальные результаты, которыми эта наука по праву гордится.

Методологическое обоснование качества педагогических измерений охватывает два слоя знаний: 1) теорию организации процесса измерения и 2) вопросов научного обоснования этого процесса. В западных странах хорошо разработана математико-статистическая теория тестов, но недостаточно исследована педагогическая теория тестов. Главная причина — изрядная доля прагматизма и технократизма, присущая американскому подходу к тестированию.

Педагогические аспекты проблемы обоснования — это связь педагогических измерений с педагогической наукой, определение предмета педагогических измерений, соотношение понятийного аппарата педагогики и теории педагогических измерений, методы отбора содержания учебной дисциплины для разработки тестовых заданий и теста.

В этой связи полезно выделить два принципиальных отличия тестов от обычно используемых задач. Первое отличие состоит в том, что тест является научно обоснованным методом эмпирического исследования в педагогике. В период зрелости педагогической науки в ней, как и в других, все большее внимание уделяется способам познания и критериям обоснованности истинности знания. Рефлексию такого рода Э.Г.Юдин справедливо назвал методологизмом. Появление и развитие последнего в ХХ в. связано с возрастанием роли средств научного познания [9] . Второе принципиальное отличие заключается в сравнительно новой роли теста как инструмента теоретического исследования в таких, например, направлениях, как изучение личности, способностей. Здесь использование тестов позволило преодолеть методологический тупик, в котором оказались авторы многочисленных теорий, концепций и иных умозрительных построений.

Только в последние десятилетия в педагогике стала осознаваться задача согласования теоретических конструкций с эмпирическими результатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являются сейчас, по-видимому, наиболее развитой в научном отношении частью методического арсенала педагогики, позволяющей адекватно скреплять теорию с эмпирией, в соответствии с такими известными стандартами качества информации, как критерии надежности и валидности.

Ведущие проблемы методологии педагогических измерений.

В круг ведущих (основных) методологических проблем входят анализ и реконструкция исторических знаний по данной проблеме, формулирование главных идей педагогических измерений, целей и задач, определение сущности и принципов педагогических измерений, проблема соотношения научных основ измерения с практикой тестирования и других форм педагогического оценивания ( evaluation ).

Вопрос начала педагогических измерений. Педагогическое измерение (от англ. Educational measurement ) возникло как научное направление в начале XX века. Именно в эти годы была осознана недостаточность оценочной деятельности педагогов. Тесты возникли позже того времени, когда в Европе сложились первые педагогические системы Коменского, Ушинского, Гербарта, Дистервега, Песталоцци и других. В тех системах не было тестов. К началу 30-х годов XX века тесты уже были, но к этому времени в СССР успела сложиться педагогическая система, целью и основным предметом которой стало воспитание в духе преданности известной идеологии и известным лицам. Образование и обучение могли быть воспитывающими в духе той же идеологии.

Читайте также:  Прибор для измерения влажности воздух

В качестве критериев демаркации теста от других форм оценивания, в определение теста включены термины: задание, содержание, форма, трудность, уровень, система, структура, качество. Именно на этом этапе важно сформулировать совокупность взаимосвязанных понятий основных, исходных и производных, способствующих развитию тестов в наиболее перспективных направлениях: это развитие теории педагогических измерений и, в частности, латентно-структурного анализа в педагогике, использование системных понятий в теории тестов, разработка критериев обоснования качества тестов.

Усилиями многих ученых оно достигло с той поры заметных успехов. Среди зарубежных авторов, сделавших много полезного для развития Educational Measurement — A.Anastasi, A.Birnbaum, W.Brown, L.J.Cronbach, R.L.Ebel, R. Fisher, R . Gleze r , J . P . Guilford , H. Gulliksen, L . L . Guttman , R.Hambltone, P . Horst , G.F.Kuder, R . Linn , J . Loevinger , F.M.Lord, W. Masters, J . Nitko J.Nunnally, G.Rasch, M.W.Richardson, G.Sax, C.Spearman, M.Sto­ne, E.L.Thorndike, R.L. Thorndike, D.Weiss, W . Wiersma и S . G . Jurs , B . D . Wright и многие другие. В западных странах, особенно в США, к настоящему времени удалось накопить обширный теоретический и фактический материал. В области педагогических измерений там ежегодно выпускаются монографии, специальные научные журналы, пособия.

Попытки развивать теорию и методологию педагогических измерений и разрабатывать на этой основе тесты предпринимались неоднократно в СССР и России. Первые попытки относятся к началу 20-х годов; они связаны с авторами первых тестологических работ: П.П.Блонский, А.А.Болтунов, М.С.Бернштейн, Н.А.Бухгольц, С.Г.Геллерштейн, Е.В.Гурьянов, А.Б.Залкинд, М.И.Зарецкий, С.М.Ривес, А.М.Мандрыка, А. А.Смирнов, М.В. Соколов, А.А.Толчинский, Н.К.Удовиченко, Б.А.Шевырев, А.М.Шуберт, Т.А.Эрн и мн. др. Названные авторы дали первые, а потому не очень точные определения теста, исследовали формы заданий, критерии качества тестов, занимались практическим применением тестов. Однако эта работа в начале тридцатых годов была свернута: вначале с помощью идеологизированной критики, а затем, в 1936 году, и политическим запретом.

В начале 30х годов в СССР резко усилился субъективизм и начал распространяться эгалитаризм. Субъективизм в политике препятствовал развитию любого объективного метода контроля знаний, ибо в нем усматривалась угроза существованию командно-административной системы. С её тщательно культивируемым отрицательным подбором кадров, в соответствии с которым каждое последующее поколение управленческих кадров оказывается хуже предыдущего. Это происходит, в частности, из-за того, что решающими признаком подбора становится не знания, не способности, а послушность в выполнении приказов вышестоящих лиц. Начиная с той поры, в литературе много писалось о вредности тестов, о недопустимости использования последних в отечественной педагогической науке и практике. Сравнение с западными странами показывает, что они опережают нас по масштабам работы, по числу публикаций, по подготовке научных кадров, уровню и качеству развития теории тестов, по технической и программно-вычислительной оснащенности тестового процесса.

Наиболее развитые в тестовом отношении страны Нидерланды, США, Англия, Япония, Дания, Израиль, Канада, Австралия. Нет никакой случайности в том, что в этот список попали страны с достаточно высоким уровнем жизни населения. Применение тестов благотворно влияет на качество образования; качество образования связано с качеством управления; качественное управление создает предпосылки для повышения качества жизни населения. Сейчас с помощью тестов там проверяется подготовленность миллионов школьников и студентов, военнослужащих, управленческого персонала.

Полезен зарубежный опыт выпуска общественными ассоциациями десятка специализированных журналов по разработке тестов, таких как Journal of Educational Measurement, Educational and Psychological Measurement, Psychometrika и т.п., а также опыт подготовки сотен монографий, учебных пособий, диссертаций по тестам и педагогическим измерениям

Можно привнести свидетельства и личного опыта автора. Естественный научный дрейф от одной проблемы к другой привел к исследованию тестов, невостребованных в то время отечественной педагогической наукой. Для публикации результаты своих работ в то время надо было вначале убедить членов академии педагогических наук в важности тестовой проблематики. При этом самыми трудными были попытки преодолеть у них тестофобию. Делать это в педагогических изданиях было невозможно. Только в 1978 г. автору удалось опубликовать в журнале «Вопросы психологии» статью «Проблема психологических тестов», где были поставлены вопросы организации психологического и педагогического тестирования [10] .

В предисловии ко второму английскому переводу этой статьи [11] зарубежные издатели сделали предположение, что в статье обнажается только видимая часть айсберга той работы с тестами, которая якобы велась в СССР, но это было неверно: айсберг тестовых результатов на самом деле был у них. У нас же было отставание, причем возрастающее. Разрыву в уровне педагогических измерений способствовало то, что в США не было ни запретов на тесты, ни перерывов в их разработке, как не было и других идеологических помех. Напротив, год от года возрастали финансовые вложения в эту сферу. Особый размах в деле разработки и применения тестов знаний и способностей отмечен во время второй мировой войны. Тогда тесты широко применялись для профотбора летного и технического персонала ВВС, что позволило на каждый вложенный в это дело доллар сэкономить тысячу долларов. Последние двадцать лет характеризуются там радикальными изменениями как в теории тестов, так и в практике тестирования.

Вероятно, одну из первых, после запрета, попыток сформулировать основы методологии педагогических измерений сделал автор этой работы в учебном пособии по педагогике и психологии высшей школы [12] . Затем эта работа была существенно расширена и опубликована в виде специального учебного пособия по основам научной организации тестового педагогического контроля знаний студентов высшей школы. С ориентацией на педагогические измерения там было дано определение предмета, основных функций и принципов педагогического контроля в вузе, показана роль измерений как научной основы тестового контроля знаний, рассмотрены вопросы истории и теории педагогических тестов, критериев их качества, методы сравнения и интеграции результатов тестирования в учебном процессе [13] . Затем вышло и диссертационное исследование [14] , в котором проблема педагогических измерений была рассмотрена в тесной связи с вопросами педагогического оценивания.

Хотя интерес к тестам в последнее время заметно вырос, ситуация с ними в России не улучшилась. Кажущаяся простота создания тестов и возросший спрос на них породили множество некачественных материалов, называемых «тестами» либо по незнанию, либо в силу укоренившейся привычки называть вещи не своими настоящими именами.

Одна из причин сложившейся ситуации — трудности изменения учебного процесса, с огромными затратами времени на экзамены, зачеты и другие формы традиционного контроля знаний. В сочетании с неизбежным педагогическим консерватизмом, такая организация легко отторгает любые новшества, а если и принимает их, то в сильно измененном, до неузнаваемости, виде. Отмеченная ситуация находится в противоречии с мировой тенденцией повышения эффективности образования и превращения самой образовательной деятельности в ведущую отрасль общественного производства.

По-настоящему тесты могут быть востребованы только при такой организации учебного процесса, в котором преподаватель из урокодателя превращается в разработчика новых программно — педагогических средств, в организатора процесса самостоятельного учения студентов. Другое условие — концентрация усилий на модернизации учебного процесса.

Процесс педагогических измерений.

Для практической разработки методов педагогических измерений знаний одной только теории недостаточно. Как и в выпуске промышленной продукции, где помимо теории, требуются материалы, оборудование, кадры и технология, нечто подобное требуется и для выпуска тестов. Но это в теорию не входит. При разработке тестов необходима методика, включающая в себя совокупность методов анализа содержания учебных текстов и учебников, анализа содержания и формы заданий. Нужен также процесс сбора и обработки информации, нужны методы расчета параметров тестовых заданий и тестов, расчета статистических показателей и др. В общем, нужна теория о тестовом методе контроля знаний. Теории такого рода в философской литературе называется методологией.

Помимо разработки теста и оценки его качества, процесс педагогических измерений предполагает активное применение тестов. В американской литературе эта часть контроля называется Test Administration. Задачи этой деятельности имеют слишком мало общего с содержанием теории тестов. По сути, мы имеем здесь дело с необходимостью организации той части процесса, которая занимается применением тестов. В западной литературе выделяется шесть задач, решаемых Test Administration [15] .

1. Организация тестового контроля в соответствии с инструкциями разработчиков теста;

2. Подготовка испытуемых к тестированию, работа с ними во время контроля и после него;

3. Создание необходимых материально-технических условий для качественной организации тестового контроля: подготовка места, техники, приборов, программно — методического обеспечения;

4. Создание благоприятных психологических условий для положительного отношения к тестированию;

5. Осуществление таких форм предъявления теста испытуемым, которые обеспечивают эффективный и качественный сбор данных, как в режиме индивидуального, так и группового контроля;

6. Разработка оптимальной системы подсчета баллов, методов интерпретации и представления данных.

Важная особенность заключается в том, что материалы, относящиеся к Test Administration, обычно публикуются не в теоретической, а преимущественно в методической литературе, что можно объяснить их соотнесенностью с методологией и практикой. Таким образом, если для разработки тестов нужны знания только теории тестов, то для научной организации процесса педагогических измерений приходится думать о необходимости методологии, охватывающей, помимо разработки тестового метода, вопросы применения тестов для различных целей, интерпретации тестовых результатов, разработки принципов научной организации тестового процесса.

Цели педагогических измерений. Цель педагогических измерений — получение численных эквивалентов уровней подготовленности учащихся и студентов. Педагогические измерения проводятся посредством различных тестов. Основные цели педагогически измерений неразрывно связаны с качеством образования и педагогической деятельности. В архиве американской литературы обнаруживаются такие, например, цели:

— помочь студенту познать себя и окружающий его мир;

— подготовить его к жизни, помочь адаптироваться к современным условиям, к жизни в демократическом обществе;

— способствовать раскрытию индивидуальных способностей;

помочь в интеллектуальном и эмоциональном развитии, в синтезировании фактов и различной информации [16] .

Автор одной из очень редких работ по обоснованию процесса тестового контроля R.Tyler уже давно наметил общий алгоритм (сам он пишет «метод») перехода от формулирования целей обучения к достижению этих целей, что сводится к следующим действиям:

1. Формулирование целей учебного курса.

2. Определение каждой цели в терминах реального поведения студента.

3. Подбор ситуаций, в которых проявилось бы наличие или отсутствие факта достижения студентом поставленной цели.

4. Проверка готовности студентов действовать правильно в данных ситуациях.

5. Оценка ответов студентов с точки зрения меры достижения поставленной цели.

6. Определение степени объективности тестового контроля, включая проверку надежности метода.

7. Совершенствование метода измерения учебных достижений на основе полученных данных [17] .

Другой известный специалист по вопросам формулирования целей образования и структуры подготовленности B.Bloom, будучи ещё аспирантом, подметил один существенный недостаток «алгоритма» R.Tyler — это отсутствие этапа трансляции содержания учебника в содержание тестовых заданий. Упоминая в своей диссертации о важной роли контроля, он заметил, что лишь немногие преподаватели могут сказать, что их курс можно изучить одним только чтением учебника, без выполнения контрольных заданий [18] .

В практике цель педагогических измерений неразрывно связана с применением тестов. Соответственно, выделяется два подхода к тестированию: итоговый и обучающий. В силу отставленности по времени, итоговое тестирование мало влияет на текущий ход учебного процесса, хотя в зарубежной литературе уже отмечалось, что студенты готовятся лучше, если они заранее предупреждены об этом. Их знания бывают выше, чем при использовании традиционных экзаменов и зачетов [19] . В подавляющей массе педагогов-практиков идея итогового тестирования результатов обучения, без содействия самому процессу обучения, рассматривается нередко как чуждая, и к тому же с небезобидными выводами. Этим суждениям способствует и общая ориентация теории и практики тестирования на итоговое оценивание — ориентация, которая порождает соответствующие этому формы тестов и тестовых заданий.

Педагог-практик заинтересован чаще всего в обучающем контроле знаний студентов, а не в итоговом. Последнее, как обычно считается, он может сделать и сам, без тестов. Тестирование в процессе обучения такой педагог использует для регулярного выявления текущего уровня знаний, для коррекции учебного процесса и выявления возникающих пробелов в знаниях. Обучающий тестовый контроль станет в перспективе самым распространенным видом контроля, но пока по уровню научной разработанности и по масштабам применения лидерство принадлежит итоговому тестированию.

Драматическую для нас историю тестового контроля можно объяснить, помимо прочего, жестким по характеру и длительным, по времени, противостоянием носителей этих двух взглядов на контроль знаний — итоговый и обучающий. Потребность в разных формах итогового контроля возникла, главным образом, вместе с расширением масштабов образования, попытками как-то управлять этим массовым процессом. Но лишь немногие педагоги смогли правильно оценить общественную значимость тестовых методов оценки результатов педагогической деятельности. Основная же часть педагогов заняла позицию противостояния, руководствуясь привычной логикой обучающего контроля, логикой, имеющей древние традиции и возрастающую актуальность. Наиболее зримо противостояние проявилось в критике некоторых форм тестовых заданий.

Читайте также:  Ее возраст не измерить человеческими мерками

Больше всего эта критика относилась к заданиям с выбором одного правильного ответа. Готовые ответы на задания могут породить, по мнению некоторых педагогов, верхоглядство, поощрить догадку, запоминание неверной информации, в то время как для студента важно, чтобы он думал, искал правильный ответ, мог его формулировать, и только после неудачного поиска есть смысл сообщать студенту ответ на задание.

В этих суждениях, по-своему правильных, логика итогового контроля подменялась логикой контроля обучающего. Остается только добавить, что основная литература по тестам, написанная как у нас в стране, так и за рубежом, долгое время не проясняла возникшую в практике ситуацию с подменой целей и средств контроля. Это объясняется тем, что подавляющее большинство книг и научных статей по тестам написано с позиций итогового контроля, в то время как интересные особенности заданий в тестовой форме для обучения по-настоящему педагогической наукой еще не изучены. Основные силы зарубежных тестологов в течение длительного времени концентрировались на задачах объективной оценки итогов обучения, и на этой основе — получения сравнительных оценок достижений студентов различных вузов. И только с появлением персональных компьютеров активизировалось внимание к созданию тестовых заданий для текущего контроля знаний.

Двум основным целям тестирования поставлено в соответствие две различающиеся организации тестового контроля — итогового и обучающего. Если в итоговом контроле используются тесты учебных достижений, то в процессе текущего контроля основное средство проверки — традиционные вопросы, упражнения, задачи и т.п., задания в тестовой форме, тестовые задания, а при достаточном овладении тестовой культурой профессорско-преподавательским составом — ситуационные и тематические тесты. Основная часть педагогического корпуса в оценке тестов руководствуется обычно логикой обучающего контроля, в то время как педагогические тесты являются средством для проведения массового объективного итогового контроля.

Принципы педагогических измерений

Педагогическими принципами называются основные требования, которыми руководствуются преподаватели в своей деятельности. Принципы возникают в результате обобщения передового педагогического опыта, а также в процессе развития методологии и теории. Соответственно, формулируются принципы практической и теоретической деятельности. Одна из задач методологии педагогических измерений — разработка принципов научной организации этой деятельности. В педагогическую теорию и практику принципы вводятся как совокупность исходных правил, способствующих эффективности учебного процесса. Помимо известных в литературе общих принципов обучения и воспитания, можно сформулировать группу специфических принципов, регламентирующих процесс измерений. Процесс педагогических измерений может быть назван научно обоснованным, если он регламентируется группой специфических принципов: объективности, связи контроля с образованием, обучением и воспитанием; справедливости и гласности; научности и эффективности; система­тичности и всесторонности.

Принцип объективности. На всех этапах тестового процесса принцип объективности нацеливает на минимизацию субъективных влияний в процессе педагогических измерений и педагогического оценивания, на повышение в этом процессе роли программно — педагогических и программно — инструментальных средств, применение стандартов, общих для всех условий и правил оценивания. В книге «Эксперимент продолжается» В.Ф. Шаталов выделил и обосновал причину появления чрезвычайно важной и, по его словам, коварной стороны современной системы оценивания знаний — предвзятости преподавателя [20] , противостоящей требованию объективности.

Объективность контроля достигается разными путями.

Первый, традиционный путь — формирование коллегиальной оценки, для чего создаются различные комиссии, состав и число членов которых зависит от важности того дела, которое нужно оценивать. Получаемые при этом оценки нередко называются объективными, хотя известно, что сложение субъективных мнений не всегда отражает объективное положение. Это происходит из-за того, что индивидуальные мнения, сложенные вместе, все равно продолжают оставаться субъективными, а точнее, интерсубъективными: близость к объективности зависит от качественного состава комиссии, в которой мнение одного высококвалифицированного специалиста может оказаться более объективным, чем мнение всех остальных, вместе взятых. Преодолению этого момента способствует процесс экспертизы, роль которой особенно важна при пересмотре содержания образования и при попытке объективной оценки качества контрольного материала.

Второй путь повышения объективности — это использование стандартных тестовых программ и технических средств. После определенного периода подготовки такой контроль может проводиться в каждом институте и на каждой кафедре. Особый интерес к тестовым средствам контроля знаний начали проявлять органы управления в связи с попытками повышения качества учебного процесса, посредством аттестации и аккредитации вузов.

Третий путь повышения объективности контроля является психологическим. Он связан с личностными факторами. Так, в нашем исследовании выявлено и подтверждено экспериментально существование систематических различий в требованиях разных педагогов к одним и тем же студентам [21] . Некоторые преподаватели оказывались «добрее», другие «строже». Отсюда понятна важность выявления психологической склонности каждого преподавателя при выставлении оценки, а также аргументации. Принимая решение, педагог объясняет, правда не всегда, почему выставляется та или иная отметка. В случае убедительной аргументации последняя воспринимается как объективная, представляющая достигнутый студентом уровень знаний. Можно вывести и общее правило: оценка решает правильно свою воспитывающую функцию только тогда, когда она воспринимается студентами как объективная.

Личностный фактор иногда путается с субъективным фактором и с субъективизмом. Абсолютизация роли субъекта и его оценок, как это имеет место, например, при авторитарно организованной системе обучения и контроля, всегда имеет следствием субъективизм. Последний характеризуется односторонним привнесением в оценку личных интересов и собственных представлений о предмете оценивания. Поскольку оценка человека часто основывается на субъективных представлениях, нередко ставится вопрос о поисках методов отделения объективного от субъективного. Между тем, вопрос состоит не в разделении это только начальная часть работы, а в устранении субъективизма, что отнюдь не тождественно устранению субъективного. Оценки можно рассматривать как производные от свойств объекта, от потребностей, возможностей и интересов оцениваемых и оценивающего. Субъективные моменты проистекают из общих свойств человеческих оценок. При известных условиях субъективные моменты могут быть положены в основу начального процесса формирования объективных, а точнее, объективированных оценок. Это имеет место, например, при проведении экспертных опросов по содержанию контрольного материала, в работе государственных экзаменационных комиссий и др. При этом выдвигается одно существенное условие: процесс объективирования оценок должна основываться на идее измерения, или иначе, на измеримости результатов учебной деятельности учащихся и преподавателей.

Одной из форм нарушения принципа объективности измерений является стремление приукрасить несовершенные показатели. Это как раз элемент формализма, при котором главным становится не работа, а несовершенные показатели работы. Поскольку ни один показатель не дает полностью адекватную информацию о результатах деятельности, подмена такого рода приводит к тактике работы на показатель; последний, по сути, овеществляется, делается самоцелью и смыслом работы. Процессы такого рода называются реификацией показателя. В качестве реального примера можно привести сдачу экзамена по ЕГЭ. Сейчас это стало главным смыслом и показателем образовательной деятельности. Всё, что не входит в ЕГЭ – а это около 70 % всех предлагаемых учащимся знаний — не изучается большинством учащихся. Каков экзамен, таково и образование!

Принцип связи педагогических измерений с образованием, обучением и воспитанием ориентирует на такую организацию измерений, которые органично вошли бы в общий учебно-воспитательный процесс, где могли бы эффективно использоваться не только тесты, но главным образом, задания в тестовой форме и системы заданий в тестовой форме [22] . Принцип связи не получил заметного отражения в отечественной педагогике. В качестве такового он признан в решении ассоциации директоров американских школ: «Обучение без последующего тестирования — немыслимо; только по итогам применения тестов можно судить о необходимой обратной связи от контроля к обучению, а также знать — что достигнуто, и в каком направлении дальше двигаться» [23] .

Принцип справедливости и гласности. Этот принцип означает одинаковую для всех испытуемых систему требований, отсутствие каких-либо особых прав и привилегий перед остальными участниками процесса измерений, открытость всей процедуры для обсуждения и конструктивной критики, исключение проявлений тех негативных явлений, которые имеют место при использовании донаучных форм педагогического оценивания.

Систематичности и всесторонности. Идеей систематичности подчеркивается важность регулярного мониторинга хода учебно-воспитательного процесса. В отличие от эпизодических проверок, систематическое отслеживание помогает упорядочить процессы обучения и воспитания, дает возможность получить достаточное количество оценок, позволяющих вывести в конце года более объективную итоговую оценку. Систематичность тесно связана с плановостью. При планировании учитывается необходимость согласования целей и результатов текущего, рубежного, тематического и итогового контроля. Систематические проверки способствуют лучшей реализации диагностической, обучающей, воспитывающей и организующей функций педагогических измерений в процессе подготовки специалистов с высшим образованием.

Всесторонность акцентирует внимание на необходимости полного, по возможности, охвата вопросов, подлежащих оцениванию. При оценке знаний в первую очередь обращается внимание на проверку усвоения основных тем и разделов, на степень усвоения требуемых навыков и умений. Несколько слов надо сказать и об оценке физической подготовленности студентов. В этой области разработаны тесты, позволяющие оценить уровень развития таких физических качеств и способностей как сила, быстрота, выносливость, способность к координации движений [24] .

Принцип справедливости и гласности. Близким по смыслу принципу объективности является принцип справедливости и гласности контроля. Эту близость можно сформулировать логически, по признаку включенности: где не хватает гласности, там не хватает справедливости и не хватает объективности.

Гласность представляет собой неотъемлемый элемент организации тестирования. Это означает открытость всех этапов и общедоступность ознакомления с результатами педагогического контроля, ясность и одинаковое применение всех правил, лежащих в основе контроля, ко всем без исключения студентам, а также возможность перепроверки результатов контроля. Принцип справедливости включает в себя широкую область морального, а иногда, и правового регулирования. Последнее случается там, где имеют место случаи проявления протекционизма, непотизма и т.п.

Другой аспект применения принципа справедливости охватывает широкую область морального сознания. Известно, что списывают и подсказывают, с целью получения незаслуженно высокой оценки только там, где это не расценивается как нарушение учебной этики. Такие поступки часто оправдываются студентами как проявление товарищеской взаимопомощи и групповой солидарности. Немало нареканий этического характера вызывает сложившаяся практика оценивать работу преподавателей по средней оценке в группе и по количеству отличников. При отсутствии системы объективного педагогического тестирования менее принципиальные и требовательные преподаватели нередко выглядят лучше тех, кто ответственно относится к оценке знаний студентов.

Вопрос справедливости оценки не случайно ассоциируется с понятием объективности. Мнение преподавателя воспринимается как справедливое только тогда, когда оно имеет объективное основание, поддающееся рациональному объяснению. Под основанием оценки понимаются позиции и доводы, которые склоняют к тому или иному решению. В качестве основания обычно выступает некоторый стандарт (образец, идеал), представленный в учебных материалах. В разных вузах стихийно формируются свои стандарты успеваемости. При прочих равных условиях, повышение требовательности влечет, на первых порах, ухудшение оценок.

Принцип научности и эффективности. Оценивание может быть организовано как на научной основе, так и на основе опыта, интуиции, здравого смысла. Этим принципом подчеркивается характерная для тестовой технологии наукоемкость, междисциплинарность, нацеленность на автоматизацию и широкое использование компьютерных технологий, что создает предпосылки для повышения эффективности всего процесса. Научность выступает в качестве необходимого условия достижения эффективности, что включает в себя, помимо научности, вопросы оптимальной организации контроля, учета соотношения между достигнутым эффектом и совокупными затратами времени, средств. Например, для решения задачи повышения дифференцирующей способности педагогических оценок автором этой статьи в своё время была предложена, одиннадцатибалльная шкала, которая получается из известной в литературе шкалы стандартных девяти единиц за счет добавления по одному интервалу в 0,5 стандартного отклонения справа и слева [25] .

В отличие от известной шкалы стандартных девяти единиц (stanine) [26] , здесь появляется возможность более тонкой дифференциации испытуемых. Если значениям стандартных баллов приписать оценочные эквиваленты, то соотношение между значениями нормированных отклонений Z, процентом испытуемых и оценочными эквивалентами можно представить в табл.2.

В случае перевода системы образования с нынешней пятибалльной на более дифференцированную шкалу, одиннадцатибалльная шкала является наиболее подходящей и рекомендуемой как по своим статистическим свойствам, так и по наличию лексических эквивалентов каждой числовой оценки [27] .

Практическое отсутствие у нас настоящих педагогических тестов, условий для их производства на высоком уровне качества и, одновременно, непригодность пятибалльной оценки для эффективной итоговой дифференциации масс студентов и абитуриентов по уровню знаний актуализируют внедрение в практику одиннадцатибалльной шкалы оценивания. Преимущество последней обосновано с педагогической, статистической и управленческой точек зрения [28] .

Соотношение между балльными оценочными эквивалентами баллами представлено в табл.2. Эта таблица впервые появилась в диссертационной работе автора.

Z — значениями и процентом испытуемых. Табл.2.

Источник