Бодалев А.А.

https://wodolei.ru/catalog/accessories/

Но, кроме того, она применима и для многофакторного
теста, хотя и нуждается в пересчете после первоначального отбора
пунктов, релевантных фактору (после того как на основании много-
факторного анализа отобраны пункты по одному фактору, снова про-
водится факторный анализ - только для этих отобранных пунктов).
Надежность отдельных пунктов. Надежность теста обеспечивается
надежностью пунктов, из которых он состоит. Чтобы повысить ретесто-
вую (диахронную) надежность теста в целом, надо отобрать из исход-
ного набора пунктов, апробируемых в пилотажных психометрических
экспериментах, такие пункты, на которые испытуемые дают устойчи-
вые ответы. Для дихотомических пунктов (типа <решил - не решил>,
<да-нет>) устойчивость удобно измерять с использованием четырех-
клеточной матрицы сопряженности:
Тест 1
Да Нет
Здесь в клеточке А суммируются частота ответов <верно>, данных
испытуемым при первом и втором тестировании, в клеточке В - числа
случаев, когда испытуемый при первом тестировании отвечал <верно>,
а .при втором - <неверно> и т. д. В качестве меры корреляции вычис-
ляется фи-коэффициент:
(р , - (3.2.12)
y(a+b){c+d)(a+c)(b+d)
Как известно, значимость фи-коэффициента определяется с по-
мощью критерия хи-квадрат:
71
STR.72
x!=.q). (3.2.13)
Если вычисленное значение хи-квадрат выше табличного с одной
степенью свободы, то нулевая гипотеза (о нулевой устойчивости) от-
вергается. Удобство в использовании фи-коэффициента состоит в том,
что он одновременно оценивает степень оптимальности данного пункта
по силе (трудности): фи-койффициент оказывается тем меньше, чем
сильнее частота ответов <да> отличается от частоты ответа <нет>.
Кроме того, сама"четырехклеточная таблица позволяет нам про-
следить возможную несимметричность в устойчивости ответов <да> и
<нет> (это важнее для задач, чем для вопросов: например, может ока-
заться, что все испытуемые, уже решившие однажды данную задачу,
решают ее при повторном тестировании - это наводит на мысль о
том, что при втором тестировании происходит сбережение опыта, при-
обретенного при первом тестировании). Выявленные в результате та-
кого анализа неустойчивые и неинформативные (слишком сильные или
слишком слабые) пункты должны быть исключены из теста. Пункты
следует считать недостаточно устойчивыми, если на репрезентативной
выборке величина}-превышает 0,71. При этом (р<0,5.
Для того чтобы повысить одномоментную (синхронную) надежность
теста, следует из исходной пилотажной батареи пунктов отбросить те,
которые плохо согласованы с остальными В отсутствие компьютера
согласованность для пунктов также очень просто определяется с по-
мощью четырехклеточной корреляции. В этом случае в первом столбце
таблички суммируются ответы испытуемых из <высокой> группы (по
величине суммарного балла), во втором столбце - из <низкой>.
Высокая Низкая
"низкая " группаДа Нет (\АВ
СD
При нормальном распределении час-, " тот суммарных баллов <высокая> и группа <низкая> группы отсекаются справа \ и слева 27%-ными маргинальными IJ квантилями (рис. 8). ll Для оценки согласованности с сум- марным баллом применяется полная -%>. (
27/, 73% X фИ-К с. 8. Области (квантили) <высо-оэффициента: 2а -.Pi-Iп 1
VPiW-Pi
Рис. 8. Области (квантили) <высо- P - fp-lN_ Р\
кой> и <низкой> группы на графике
распределения тестовых баллов __ количество ответов <верно>
(<да>) на 1-тый пункт теста;
N -.сумма всех элементов таблички;
N= 11-0,54, где п - численность всей выборки;
В ряде пособий показатель согласованности для пунктов называется дискрими
иативностью пунктов (Гайда В. К., Захаров В. П., 1982).
Полная формула отличается от (3.2.12) наличием в числителе вычитаемог
(д+b+c+d)/2-поправки с учетом вклада, который i-тый пункт вносит в сумма]
ный балл X. п ,
- Если 2а-Р.<0, то числитель в формуле (3.2.14) выглядит так: ia- .+1.
STR.73
Pi==a+b. При включении в эстремальную группу 1/3 выборки N-.
=0,66-п.
В некоторых случаях подобный анализ позволяет уточнить ключ
для пункта: если пункт получает значимый положительный фи-коэф-
фициент, то ключ определяется величиной <+1>, если пункт получает
значимый отрицательный фи-коэффициент, то величиной <-1>. Если
пункт ролучает незначимый фи-коэффициент, то его целесообразно
исключить из батареи.
При ручных вычислениях фи-коэффициента удобно вначале с по-
мощью формул (3.2.13) и (3.2.14) определить граничное значение зна-
чимого (по модулю) фи-коэффициента. Например, при выборке в
100 человек и уровне значимости р<0,01 пороговое значение вычисля-
ется так:
f-~,___ ____ \
=V?-=V-iг -
При постоянном использовании компьютера при подсчете суммар-
ных баллов - ключ для каждого пункта С/ целесообразно определить
в виде самого фи-коэффициента (или другого коэффициента корреля-
ции), определенного при коррелировании ответов на пункт с суммар-
ным баллом. Тогда тестовый балл подсчитывается по формуле
1 Rifli, (3.2.16)
/-i
где Xi - суммарный балл i-того испытуемого;
Ra - ответ <верно> (+1) или <неверно> (-1) i-того испытуемого
на J-ТЫЙ пункт;
Cj - ключ для J-ТОГО пункта: С/=-Ц для прямого, С,=-1 для
обратного.
Более чувствительный коэффициент, который также применяется
для дихотомических пунктов,- это точечный бисериальный коэффи-
циент корреляции, учитывающий амплитуду отклонения индивидуаль-
ных суммарных баллов от среднего балла:
х - pix
т " - , (3.2.17)
Sx-r PW
где 2х"- сумма финальных баллов тех индивидов, которые дали
утвердительный ответ на t-тый пункт теста (решили i-тую задачку);
Sx - стандартное отклонение для суммарных баллов всех индиви-
дов из выборки;
У piOt- стандартное отклонение по i-тому пункту;
х - средний балл по всем пунктам.
А. Анастази относит критерий внутренней согласованности теста к
валидности (Анастази А., 1982, кн. 1, с. 143), однако если и можно
в данном случае говорить о валидности, то только в смысле особой
внутренней валидности теста. Как правило, слишком высокая согласо-
ванность снижает внешнюю валидность теста по критерию (см. 3.3).
Если проверяется согласованность пунктов, составленных одним авто-
ром (одним коллективом по стандартной инструкции), то выявление
достаточного набора согласованных пунктов свидетельствует о внут-
72 1:
STR.74
ИррЕлебантные
уактры
"Прямые пункты
ренней валидности (согласованности) разработанного диагностического
понятия (конструкта).
В компьютерных данных факторного анализа аналогом корреля-
ции пункта с суммарным баллом является нагрузка пункта на веду-
щий фактор (<факторная валидность> в терминах А. Анастази). Если
прибегать к геометрическому изображению нагрузки как проекции
вектора-пункта на ось-фактор, то структура пунктов хорошо согласо-
ванного теста предстанет в виде пуч-
ка векторов, плотно прилегающих к
фактору и вытянувшихся вдоль его
оси (рис. 9).
Последовательность действий при
проверке надежности. 1. Узнать, суще-
ствуют ли данные о надежности теста,
предполагаемого к использованию, на
какой популяции и в какой диагности-
ческой ситуации проводилась провер-
ка. Если проверки не было или приз-
наки новой популяции и ситуации яв-
но специфичны, провести .заново про-
верку надежности с учетом указанных
ниже возможностей.
2. Если возможности обследова-
ния испытуемых, смысл теста и
возможности обработки (наличие
ЭВМ) позволяют, то произвести по-
вторное тестирование на всей выборке стандартизации и подсчитать
все коэффициенты, приведенные в 3.2, как для целого теста, так и
для отдельных пунктов. Анализ полученных коэффициентов позволит
понять, насколько пренебрежима ошибка измерения, дает ли данный
тест интервальную шкалу (высокий г) или только диагностичен для
крайних групп (высокий (р), насколько устойчиво измеряемое свойство
во времени (возможен ли статистический .прогноз - проекция тесто-
вого балла на будущее), в каких своих частях (пунктах) тест менее
надежен (анализ этих пунктов позволяет психологически осмыслить
содержательный механизм взаимодействия пунктов с испытуемыми).
3. Если возможности ограничены, произвести повторное тестирова-
ние только на части выборки (не менее 30 испытуемых), подсчитать
вручную) ранговую или четырехклеточную корреляцию для оценки
внутренней согласованности (методом расщепления) и стабильности
целого теста.
Рем8он1П.-
-" ныи
фактор
Рис. 9. Векторная графическая мо-
дель соотношения <прямых> и <об-
ратных> эмпирических индикаторов
(пунктов) с релевантным (измеряе-
мый) фактором и иррелевантными
(<шумовыми>) факторами
3.3. ВАЛИДНОСТЬ ТЕСТОВ
Проблемы валидизации психологических тестов являются централь-
ными для дифференциальной психометрики, но, к сожалению, до сих
пор решенными не до конца. Решение этой проблемы зависит не от
статистического аппарата, а от уровня развития теоретического аппа-
рата дифференциальной психологии.
Валидность и надежность. Валидность (или обоснованность) всякой
процедуры измерения состоит в однозначности (устойчивости) получае-
мых результатов относительно измеряемых свойств объектов, т. е. от-
носительно предмета измерения. Отличие понятия валидности от на-
дежности измерения удобно раскрывать с помощью различения
<объекта> и <предмета> измерения. Надежность - это устойчивость
STR.75
процедуры относительно объектов. Надежность не обязательно пред-
полагает валидность. В психологии довольно часто возникает такая си-
туация, когда исследователь вначале предлагает определенную про-
цедуру измерения, показывает ее надежность -способность устойчиво
различать объекты, но вопрос о валидности остается открытым.
Если в сенсорной психофизике вопрос о валидности измерений ока-
зывается в значительной степени затушеванным тем обстоятельством,
что простейшие физические стимулы достаточно однозначно детерми-
нируют измеряемые свойства ощущений, то в дифференциальной психо-
метрике значимость проблемы валидности резко возрастает. Здесь си-
туация подобна той, когда в психофизическом опыте испытуемому не
указывают, по какому именно параметру следует сравнивать стимулы.
Пусть испытуемый А понял инструкцию так, что стимульные объекты
надо сравнивать по весу, а испытуемый Б - по размеру. Если проце-
дура измерения будет повторена по отношению к тем же объектам, то
она даст вполне устойчивые данные относительно объектов, но не даст
валидной информации ни о шкале ощущений <веса>, ни о шкале ощу-
щений <размера>.
При измерении способностей предъявляемый тест отнюдь не обяза-
тельно актуализирует именно тот психический процесс, который пред-
полагается измерить. Например, столкнувшись с уже встречавшейся
однажды задачей (например, с анаграммой <дзиканпр>), испытуемый
может начать запоминать просто то решение, к которому он уже одна-
жды пришел (слово <праздник>), чем заново решать эту задачу. Здесь
будет измеряться скорее уровень словесной памяти, чем уровень вер-
бального интеллекта. Точно так же реальная валидность некоторых
тестов раскрывается только в результате значительного опыта работы
с ними. Например, показано, что ряд тестов, внешне выглядящих
интеллектуальными, на деле измеряют скорее личностно-стилевые осо-
бенности индивида, чем операциональные возможности интеллекта, иа-
пример, методика <креативного поля> Д. Б. Богоявленской (1977).
Устойчивость теста относительно объектов (испытуемых) является
необходимым, но не достаточным условием его устойчивости относи-
тельно измеряемых атрибутов (свойств) объектов. Надежность явля-
1 ется необходимым, но не достаточным условием валидности. Отсюда
понятно основное соотношение психометрики:
валидность < надежность..
Это означает, что валидность теста не может превышать надежность
теста.
Данное соотношение, однако, неверно трактовать как указание на
прямо пропорциональную связь валидности и надежности. Повышение
надежности отнюдь не обязательно приводит к повышению валидно-
сти. В терминах А. Анастази валидность определяется репрезентатив-
ностью теста относительно измеряемой области поведения. Если эта
область поведения складывается из разнообразных феноменов, то со-
держательная валидность теста автоматически требует представленно-
сти в нем моделей всех этих разнообразных феноменов. Возьмем гло-
бальное понятие <речевая способность> (этому психолингвистическому
термину в традиционной тестологии соответствует <вербальный интел-
лект>). Сюда относятся такие относительно независимые друг от друга
навыки, как навыки письма и чтения. Если заботиться о содержа
Предельной внутренней согласованностью будет, например, .обладать тест-
опросник, состоящий из повторения одного и того же вопроса. Но валидность
данном случае будет минимальной.
STR.76
тельной валидности соответствующего теста, то нужно ввести в него
группы заданий на проверку этих довольно разных по своему опера-
циональному составу компонентов вербального интеллекта. В резуль-
тате введения разнородных пунктов и субшкал (субтестов) мы обяза-
тельно сокращаем внутреннюю согласованность, одномоментную на-
дежность теста, но зато добиваемся повышения валидности. Таким
образом, для расширения области применения теста психодиагност
должен избегать излишнего повышения внутренней согласованности.
Одновременно с этим снижением внутренних корреляций между раз-
личными пунктами теста (как это уже упоминалось в 3.1) обяза-
тельно исчезает отрицательный эксцесс на кривой распределения тес-
товых баллов, и она все более приближается по форме к нормальной
кривой.
Эмпирическая валидность. Если в случае с содержательной валид-
ностью оценка теста производится за счет экспертов (устанавливаю-
щих соответствие заданий теста содержанию предмета измерения), то
эмпирическая валидность измеряется всегда с помощью статистиче-
ского коррелирования:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70

Основы психодиагностики, немедицинской психотерапии и психологического конконсультирования

А-П

П-Я