Тест бине симона представляет собой. Диагностическое обследование по шкале умственного развития А

Тест Бине-Симона - наиболее распространенный метод количественной оценки уровня развития способностей.

Истоия появления

Разработан в 1905 г. А. Бине и Т. Симоном по заказу Министерства народного образования Франции с целью отсева детей, недостаточно развитых для обучения в массовой школе. Первоначально тест содержал 30 задач, которые были подобраны по степени трудности таким образом, чтобы их могли решить 75% детей определенного возраста, умственное развитие которых можно было бы считать нормальным. Количество правильно решенных задач характеризует так называемый умственный возраст.

Модификации теста

Наиболее известная модификация разработана Л. Терменом в Стэнфордском университете (США); созданный им так называемый тест Стэнфорд-Бине является наиболее признанным методом диагностики интеллекта. На его основе вычисляется коэффициент интеллекта. Однако практическое использование данного теста, как и большинства

подобных методик, позволяет дать количественную оценку индивидуальных различий в умственных способностях, не вскрывая их природы и перспектив развития. Это затрудняет использование результатов теста в постановке психологического диагноза и прогнозировании развития интеллекта.

Шкала́ интелле́кта Стэ́нфорд - Бине́ (англ. Stanford-Binet Intelligence Scale) - шкала для оценки интеллекта, разработанная в 1916 году. В тесте используется единый показатель уровня интеллекта - IQ. Коэффициент интеллекта равен частному умственного возраста испытуемого и его реального возраста, умноженному на 100. Оба возраста измеряются в месяцах.
В настоящее время шкала Стэнфорд - Бине используется преимущественно в западных странах для оценки готовности к школе, распределения учеников в школы разного уровня и при поступлении в вузы.

Связанные понятия

Счёт по Крепелину - метод патопсихологического исследования. Используется для качественной и количественной оценки работоспособности, упражняемости и утомляемости. Метод применяется в клинической, школьной и профессиональной психодиагностике, начиная с подросткового возраста. Предложен немецким психиатром Эмилем Крепелином в 1895 году. Первоначально методика представляла собой таблицу, в большой столбец которой записывался длинный ряд однозначных чисел, которые нужно было сложить в уме. В модификации...

лат. scala - лестница] - тест интеллекта, предназначенный для измерения уровня умственного развития. Первый вариант С.-Б. у. р. ш. был разработан Л. М. Терменом в 1916 г. и представлял собой модификацию Бине-Симона шкалы умственного развития. В ходе разработки в базовую методику было введено большое количество изменений. По сравнению со шкалой Бине было добавлено более трети новых заданий, ряд старых был либо переделан, либо отброшен или переадресован другим возрастным группам. Фактически уже первая редакция С.-Б. у. р. ш. представляла собой новый тест. В дальнейшем тест неоднократно радикально совершенствовался. С.-Б. у. р. ш. включает задания, направленные на исследование широкого диапазона способностей - от простого манипулирования до абстрактного рассуждения. На ранних возрастных уровнях тесты требуют главным образом зрительно-моторной координации, перцептивного различия, способности понимать инструкцию (в заданиях типа складывания кубиков, нанизывания бус, подбора геометрических фигур), а также способности узнавать предметы, предъявляемые в виде игрушечных моделей или изображений на карточках. На высших возрастных уровнях в наибольшей степени представлены тесты, использующие вербальное содержание заданий. Среди них словарный тест (объяснение значения слов), аналогии, завершение предложений, определение абстрактных понятий, интерпретация пословиц. Некоторые тесты направлены на характеристику степени плавности и беглости речи (быстрое называние не связанных между собой слов, подбор рифм, построение предложений с заданными словами). Среди заданий батареи широко представлены тесты общей осведомленности, знания норм общественной жизни, правил поведения (ответы на вопросы, интерпретация ситуаций, обнаружение несоответствий в сюжетных картинках или рассказах). В шкалу включен ряд тестов памяти, пространственной ориентации (визуальная репродукция фигур, лабиринты, складывание и разрезание бумажных объектов и т. д.). На более высоких возрастных уровнях анализируется степень усвоения некоторых навыков, приобретенных в школе (умение читать, знание арифметики). При обследовании с помощью ряда тестов методика допускает возможность получения широкой качественной информации о методах работы испытуемого, способах решения им задач. Большие возможности предоставляются и наблюдению за личностными качествами: уровнем активности и мотивированности, уверенности, настойчивости, сосредоточенности и т. д. Сложная процедура проведения обследования и интерпретации полученных результатов, необходимость строгого соблюдения стандартов требуют высокой квалификации и предварительной тренировки экспериментатора. По применению С.-Б. у. р. ш. накоплен огромный опыт, включающий фактические данные и их интерпретацию. По широте использования эта методика занимает в зарубежной психодиагностике одно из ведущих мест среди тестов интеллекта. Длительность использования и широта распространения сделали систему отсчета оценок С.-Б. у. р. ш. стандартом для других психометрических тестов. Распределение результатов IQ-показателей шкал Стэнфорд-Бине положено в основу классификации степеней умственной отсталости, широко распространенной в зарубежной психодиагностике. Л.Ф. Бурлачу к, С.М.Морозов

Тест Бине-Симона - средство для диагностики развития интеллекта, предложенное в 1905 г. А.Бине и Т.Симоном .

Сначала тест состоял из 30 вербальных, перцептивных и манипулятивных задач, которые были расположены по критерию повышения трудности в соответствующие возрастные когорты: каждая задача определенной возрастной когорты должна была решаться 75% детей этого возраста с нормальным интеллектуальным развитием. По количеству правильно решенных ребенком задач определялся его умственный возраст. Понятие «умственного возраста » было использовано А. Бине и Т. Симоном в 1908 г. как количественный показатель развития интеллекта. Это - характеристика интеллектуального развития индивида на основе его сравнения с уровнем интеллекта других людей того же возраста. Количественно выражается как возраст, в котором - по среднестатистическим данным - решаются те тестовые задания, которые доступны данному индивиду. По мнению Бине, этот уровень не зависит от обучения, а определяется лишь генетическими факторами.

Вторая версия шкалы, 1908 г., была соотнесена с возрастами от 3 лет до взрослого состояния, а третья, 1911 г., была несколько отредактирована и дополнена.

Тест Векслера. Самым популярным тестом для диагностики интеллекта в нашей стране стал тест Д. Векслера (1939). Векслер отказался от представлений об интеллекте, как об «умственном возрасте», которые ввел А. Бине, создатель первого теста умственных способностей. Сам Векслер определял интеллект как комплексную глобальную способность индивида целенаправленно вести себя, разумно мыслить и успешно взаимодействовать с внешней средой.

Векслер выделил в интеллекте две составляющих, а также две сферы его проявления: вербальный интеллект и интеллект действия . Векслер предположил, что помимо общего интеллекта существуют вербальный и невербальный интеллекты, которые также следует измерять.

Векслер ввел понятие «возрастная норма». Испытуемый получал тестовый балл на основании сопоставления его результатов со средними результатами той возрастной группы, к которой он принадлежал. Коэффициент интеллекта выражался в единицах стандартного отклонения.

Тест предназначался для комплексного обследования пациентов психиатрической клиники. Главная цель применения теста - диагностика психических нарушений при различных заболеваниях (психозах, неврозах и пр.), а также определение уровня интеллектуального дефекта у лиц с врожденным интеллектуальным недоразвитием и со старческим слабоумием.

Тест Векслера сразу после своего появления стал широко применяться за пределами клиники: при профессиональном отборе, для оценки уровня интеллекта «нормальных», то есть психически здоровых взрослых и детей, и даже для оценки уровня интеллектуальной одаренности.

Версии теста Д.Векслера для взрослых состоят из 11 субтестов, версия для детей - из 12. Все версии имеют две шкалы: шкалу действия и словесную шкалу . Векслер полагал, что сумма баллов, полученных за все задания теста, характеризует общий интеллект, а сумма по каждой из шкал - невербальный и вербальный интеллекты.

Субтесты: 1) Осведомленность, 2)Понятливость, 3)Арифметический, 4)Сходство, 5)Словарь, 6)Запоминание цифр, 7)Недостающие детали, 8)Последовательные картинки, 9)Кубики Кооса, 10)Сложение фигур, 11)Шифровка 12)Лабиринты.

Таким образом, тест должен был измерять три способности. Однако факторный анализ результатов применения «взрослой» версии теста показал, что тест на самом деле измеряет четыре способности: 1) общий интеллект, 2) словесное понимание, 3) перцептивную организацию, 4) способность, которая влияет на выполнение субтестов «Запоминание цифр», «Арифметический», «Шифровка».

Тест «Последовательные картинки», при выполнении которого испытуемый должен упорядочить «комическую историю», считается сложным: успешность его выполнения зависит как от перцептивной организации, так и от вербального понимания.

Выполнение каждого субтеста требует комплекса способностей. Поэтому следует подробно анализировать процесс выполнения отдельных субтестов. Важнейшее значение имеет анализ профиля, в частности, соотношение успешности выполнения субтестов, оценка степени разброса результатов относительно индивидуального среднего уровня (степень «пилообразности» профиля) и т.д. Каждый из дополнительных индексов имеет важное диагностическое значение .

Прогрессивные матрицы Равена - батарея тестов, разработанная английским психологом Дж.Равеном в 1938 г. для диагностики уровня интеллекта, основанная на работе наглядного мышления по аналогии. Имеет 2 варианта: 1) для взрослых и подростков с 12 лет и 2) для детей 5 - 11 летнего возраста.

Каждая задача теста заключается в том, чтобы в ограниченное для всего теста время на место пробела в правом нижнем углу основного рисунка („матрицы“), представляющего собой геометрический узор, вставить один из 6 или 8 фрагментов, находящихся под основным рисунком. Тест имеет 5 серий, по 12 матриц в каждой, с увеличением порядкового номера сложность задания растет.

Методика Равена - одна из наиболее сильных методик для исследования невербального интеллекта человека. Она предназначена для определения уровня развития логичности мышления человека, развития способностей к выявлению закономерностей и построению в соответствии с ними новых объектов.

Тест структуры интеллекта Амтхауэра . Тест структуры интеллекта был разработан Р.Амтхауэром в 1953 году для дифференциации кандидатов на различные виды обучения и деятельности в практике профессионального отбора.

Растущий интерес отечественных психологов к указанному тесту объясняется рядом преимуществ, отличающих его от известных методик исследования интеллекта Векслера, Равена и других.

Прежде всего, тест структуры интеллекта Амтхауэра пригоден не только для индивидуальных, но и для массовых исследований, что особенно важно в условиях обследования больших контингентов ограниченным числом психодиагностов.

При этом указанный тест имеет шкалу пересчета оценок в привычные для всех единицы IQ теста Векслера, что позволяет сравнивать результаты полученные на аналогичных выборках с помощью теста Векслера.

Тест структуры интеллекта был составлен Р.Амтхауэром в трех вариантах , два из которых являются равноценными и применимыми на выборках лиц с различным профессиональным и жизненным опытом. Тест составлен из 9 групп заданий (субтестов), ориентированных на исследование таких составляющих вербального и невербального интеллекта, каковыми являются: лексический запас, способность к абстрагированию, способность к обобщению, математические способности, комбинаторное мышление, пространственное воображение, способность к кратковременному запоминанию наглядно-образной информации.

При нормировании стандартных показателей он придерживался возрастного критерия.

Субтесты:

1 - включает задания, ориентированные на исследование словарного запаса испытуемого ("чувство языка" по Амтхауэру),

2 - способности к абстрагированию,

3 - способности выносить суждение и умозаключение,

4 - способности к обобщению,

5 - математические способности,

6 - математические способности ("ряды чисел"),

7 - комбинаторное мышление ("геометрические фигуры"),

8 - пространственное воображение ("кубики Кооса"),

9 - способность к запоминанию и воспроизведению наглядной информации.

Векслер: шкала для измерения уровня интеллектуального развития (детский вариант WISC, взрослый вариант WAIS) состоит из 11 субтестов , составляющих вербальную (1-6) и невербальную (7-11) шкалы:

1) общая осведомленность – уровень простых знаний;

2) понимание смысла выражений – способность к суждениям

3) арифметика – легкость оперирования числовым материалом

4) нахождение сходства – понятийное мышление

5) запоминание цифр – память

6) словарный запас – вербальный опыт, умение давать определения понятиям

7) шифровка/цифровые символы – зрительно-моторная скорость

8) недостающие детали/завершение картинок – зрительная наблюдательность, способность выявлять существенные признаки

9) конструирование блоков – двигательная координация, визуальный синтез

10) последовательные картинки – способность организации целого из частей, понимание ситуации, экстраполяция

11) складывание фигур – способность к синтезу целого

Определяется IQ-вербальный, IQ-невербальный, IQ-общий.

Нормы : 130 и выше – очень высокий интеллект, 120-129 – высокий интеллект, 110-119 – хорошая норма, 90-109 – средний уровень, 80-89 – сниженная норма, 70-79 – пограничный уровень, 69 и ниже – умственный дефект.

Равен: прогрессивные матрицы, измерение интеллекта через выявление соотношений между абстрактными фигурами. Есть два варианта: цветной (более простой, для детей 5-11 лет и взрослых после 65 лет) – 12 матриц, 3 серии и черно-белый - 60 матриц (композиций) на 5 серий; стандартный IQ показывает в каком соотношении оказывается результат данного человека к величине распределения результатов для его возраста.

Амтхауэр: измеряет интеллект у людей 13-61 года. Разрабатывался как тест диагностики общих способностей в сфере профессиональной пригодности, состоит из 9 субтестов:

1) логический отбор – индуктивное мышление, чувство языка

2) определение общих черт – способность к абстрагированию, оперированию вербальными понятиями

3) аналогии – комбинаторные способности

4) классификация – способность выносить суждение

5) счет – уровень практического математического мышления

6) ряды чисел – индуктивное мышление, способность оперировать математическими закономерностями

7) выбор фигур – пространственное воображение, комбинаторные способности

8) кубики – пространственное мышление

9) запоминание слов – способность сосредоточить внимание, память

Подсчитываются баллы по каждому из субтестов, баллы переводятся в шкальные оценки, чертится профиль, определяющий способности к практической или теоретической деятельности.

Бине-Симон: шкала умственного развития. Первоначально (1905) содержала 30 тестов расположенных по мере возрастания трудности таким образом, что вероятность успешного выполнения увеличивалась с хронологическим возрастом. Уровень трудности определялся эмпирически на основе данных по выборке 50 нормальных детей 3-11 лет и незначительного количества слабоумных. Следующая редакция (1908) позволила выделять разные уровни интеллектуального развития нормальных детей (уровень=«умственный возраст»). Третья редакция (1911) продлила шкалу до уровня взрослых, но по-прежнему не предусматривала определение IQ. Затем преобразована в шкалу Станфорд-Бине, где введен IQ:

умственный возраст

Современная редакция этой хорошо зарекомендовавшей себя шкалы является результатом наиболее обширного ее пересмотра (Delaney, & Hopkins, 1987; Thorndike, Hagen, & Sattler, 1986a, 1986b). Сохраняя главные преимущества более ранних редакций как индивидуально применяемого клинического инструмента, эта версия отражает результаты развития как теоретических представлений об интеллектуальных функциях, так и методологии конструирования тестов. Преемственность с более ранними редакциями была отчасти обеспечена путем сохранения многих типов заданий из ранних форм. Еще важнее, что удалось сохранить адаптивную процедуру тестирования, благодаря которой каждый тестируемый получает только те задания, чья трудность соответствует продемонстрированному им уровню выполнения.

В то же время сфера содержания была сильно расширена по сравнению с преимущественно вербальным фокусом ранних форм, с тем чтобы обеспечить более репрезентативный охват задач на оперирование числами, пространственными отношениями и данными кратковременной памяти. Кроме того, каждый тип заданий используется, насколько это возможно, в широком возрастном диапазоне, обеспечивая тем самым почти полную сопоставимость оценок на разных возрастных уровнях. Четвертая редакция шкалы Стэнфорд-Бине предназначена для использования в возрастном Диапазоне от двух лет до взрослости.

Проведение тестирования и подсчет баллов. Типовой набор материалов, необходимых для проведения теста Стэнфорд-Бине, показан на рис. 8-1. В него входят четыре книжечки отпечатанных типографским способом карточек с изображениями тестовых заданий, смена которых осуществляется перебрасыванием страниц; предметный материал теста, включающий кубики, доску (геометрических) форм, набор разноцветных и имеющих разную форму бусинок, а также большую картинку с изображением неразличимой по полу и этническим признакам куклы; тетрадь с протоколами Для регистрации ответов и руководство по проведению теста и оценки результатов.

Как и большинство индивидуальных тестов интеллекта, шкала Стэнфорд-Бине требует, чтобы с ней работали только высококвалифицированные специалисты. Специальная подготовка и опыт работы с этой шкалой совершенно необходимы для пра-

Часть 3. Тестирование способностей

Рис. 8-1. Материалы, используемые при проведении тестирования с помощью шкалы интеллекта Стэнфорд-Бине (четвертая редакция)

вильного проведения, подсчета баллов и интерпретации результатов теста. Неуверенность и неумелость могут губительно сказаться на раппорте, особенно с маленькими детьми. Незначительные изменения в словесных формулировках, допускаемые по невнимательности, могут изменить трудность заданий. Дополнительные сложности возникают в связи с тем, что задания должны оцениваться сразу же после их выполнения, поскольку последующее проведение испытания зависит от того, как обследуемый справился с заданиями предыдущих уровней.

Десятилетиями клиницисты относились к шкале Стэнфорд-Бине и подобным ей индивидуальным шкалам не только как к набору стандартизованных тестов, но и как к клиническому интервью. Те же особенности, которые затрудняют применение таких шкал, создают благоприятные возможности для взаимодействия диагноста и обследуемого и позволяют опытному клиницисту выявить необходимую ему для диагноза информацию. Шкала Стэнфорд-Бине и другие тесты, описанные в этой главе, позволяют наблюдать методы работы респондента, его подходы к решению задач и другие качественные аспекты выполнения заданий. Проводящий тестирование имеет также возможность оценить некоторые эмоциональные и мотивационные характеристики тестируемого, такие как способность сосредоточиться, уровень активности, уверенность в себе и настойчивость. Конечно, любые качественные наблюдения, делаемые в момент проведения индивидуальных тестов, необходимо фиксировать именно как наблюдения, а не интерпретировать тем же способом, что и объективные тестовые показатели. Ценность таких качественных наблюдений сильно зависит от мастерства, опыта и психологического чутья проводящего тестирование специалиста, равно как И от знания ловушек и ограничений, свойственных этому виду наблюдения.

Глава 8. Индивидуальные способности

Рис. 8-2. Возрастной диапазон 15 тестов шкалы Стэнфорд-Бине (четвертая редакция) Примечание, касающееся областей, закрашенных серым цветом. Что касается девяти тестов с ограниченными возрастными диапазонами, некоторым членам выборки стандартизации, выходящим за их границы, все же предъявлялись какие-то из этих тестов из-за необычайно высокого или низкого результата по тесту, определяющему маршрут тестирования. Их показатели учитывались при оценивании результатов всей соответствующей возрастной выборки для составления нормативных таблиц, но эти оценки включались в них со специальным предостережением в отношении их использования. Что касается деталей, см. Guide (Thorndike et al., 1986a, p. 7) и Technical Manual (Thorndike et al., 1986b, p. 30).

(Приведено с упрощениями из The Stanford-Binet Intelligence Scale: Fourth Edition, Guide for administering and scoring, p. 7. Copyright © 1986 by the Riverside Publishing Company-Воспроизведено с разрешения издателя)

В отличие от возрастного принципа группировки заданий, применяемого в более Ранних редакциях шкалы, в SB-W задания каждого типа помещены в отдельные тесты в Порядке возрастания трудности. Шкала состоит из 15 тестов, подобранных таким °бразом, чтобы представлять четыре основные когнитивные области: вербальное расоведение, абстрактное/наглядное рассуждение, количественное рассуждение и кратковременную память (см. рис. 8-2). Эти 15 тестов, хотя и сгруппированы в четыре Категории в целях вычисления показателей, проводятся в смешанном порядке для По Ддержания интереса и внимания тестируемых. Диапазон трудности шести из этих ес тов перекрывает весь возрастной диапазон шкалы SB-IV. Как можно увидеть на

Часть 3. Тестирование способностей

рис. 8-2, остальные девять тестов, вследствие характера содержащихся в них задач, либо начинают предъявлять позже, либо перестают предъявлять раньше соответствующих предельных возрастных уровней.

Проведение SB-IV представляет собой двустадийный процесс. На первой стадии тестирующий дает Словарный тест, который служит для выбора маршрута обследования через определение начального уровня (епЩ level) для всех остальных тестов. С какого задания начать Словарный тест зависит исключительно от хронологического возраста тестируемого. Для остальных тестов начальный уровень определяется по номограмме (или таблице) исходя из показателя Словарного теста и хронологического возраста. На второй стадии тестирования проводящий его специалист должен установить базальный (basal) и предельный (ceiling) уровни для каждого теста на основе фактического выполнения тестов индивидуумом. Базальный уровень достигается в том случае, когда испытуемый справляется с четырьмя заданиями на двух соседних уровнях. Предельный уровень достигается, когда три из четырех заданий (или все четыре задания) на двух соседних уровнях не выполняются испытуемым. По достижении предельного уровня по конкретному тесту его перестают использовать в дальнейшем тестировании испытуемого.

Когда задание предъявлено и на него получена реакция испытуемого, проводящий тестирование заносит оценку в тетрадь для записи ответов. Первичная оценка («сырой балл») по каждому тесту находится путем фиксирования номера задания самого высокого уровня из всех предъявленных испытуемому и вычитания из получившегося числа суммарного количества заданий, которые он выполнил неправильно. Кроме того, в состав 11 тестов входят задания-образцы, служащие лишь для ознакомления с тестом и никогда не учитываемые при вычислении показателя. В большинстве тестов каждое задание имеет только один верный ответ; такие ответы указаны на обратной стороне карточек с заданиями и в тетради для записи ответов. Все задания оценивают по принципу «выполнено/не выполнено», в соответствии с установленными эталонными ответами. Пять тестов предполагают свободные ответы, и потому требуют использования более развернутых нормативов и правил оценивания, которые даны в руководстве к проведению и оценке результатов SB-IV (Thorndike et al., 1986a), 1 где приведены и некоторые образцы двусмысленных ответов, требующих дополнительного уточнения со стороны проводящего тестирование специалиста.

Хотя полная шкала SB-W имеет в своем составе 15 тестов, ни один человек не проходит все эти тесты, поскольку часть из них применима только в ограниченных возрастных диапазонах. Обычно полная батарея включает от 8 до 13 тестов, в зависимости от возраста тестируемого и его результата по тесту, определяющему маршрут обследования. Время проведения полной батареи предположительно колеблется от 30 до 90 минут, но менее опытным пользователям может потребоваться и больше времени. Как правило, обследование с помощью шкалы SB-YV проводится за один сеанс, возможно с перерывами в несколько минут между тестами. Для некоторых целей в руководстве по проведению и оценке результатов SB-IV (Thorndike et al., 1986a) предлагается несколько сокращенных батарей, требующих меньшего времени тестирования, но сфокусированных на тестах, наиболее подходящих для конкретной цели тестирования. В число таких батарей входят 6-тестовая сокращенная батарея общего

" К числу этих тестов относятся: Словарный, Понимание, Нелепости, Копирование и Вербальные отношения.

Глава 8. Индивидуальные способности

назначения и 4-тестовая батарея экспресс-скрининга. Обе имеют в своем составе по меньшей мере один тест в каждой из четырех когнитивных областей. Кроме того, предлагаются три батареи для обследования учащихся с целью включения в программы для одаренных детей, соответственно для каждого из трех возрастных уровней, и три батареи для учащихся с трудностями в обучении, также соответствующие трем возрастным уровням. Во всех этих сокращенных батареях используются стандартные процедуры для определения начальных уровней, проведения тестирования и подсчета баллов. В «Справочном руководстве для пользователей SB-IV» (Examiner"s Handbook) (Delaney, & Hopkins, 1987) разъясняются многие процедурные вопросы, касающиеся проведения (и оценки результатов) этого теста с различными категориями обследуемых.

Стандартизация и нормы. Объем выборки стандартизации SB-IV немного превышал 5000 испытуемых в возрасте от 2 до 23 лет, протестированных в 47 штатах (включая Аляску и Гавайи) и округе Колумбия. Эта выборка была стратифицирована по таким признакам, как географический район, размер общины (community size), этническая группа и пол, с целью достичь близкого соответствия (на уровне пропорциональности) данным переписи населения США 1980 г. В добавление к этому контролировался социоэкономический статус испытуемых в виде профессионального и образовательного уровня родителей. Результаты этого контроля обнаружили избыточную представленность испытуемых на верхнем и недостаточную представленность на нижнем уровнях. Эти несоответствия были скорректированы путем приписывания различных весовых коэффициентов частотам при расчете значений показателя в нормативных таблицах. Таким образом, каждый испытуемый из семьи с высоким социоэко-номическим статусом засчитывался как какая-то часть наблюдаемого случая, тогда как испытуемый из семьи с низким социоэкономическим статусом учитывался как случай с некой добавкой.

Нормативные таблицы используются для преобразования первичных показателей по каждому из 15 тестов в «стандартные показатели возраста» (Standard Age Scores, или, сокращенно, SAS).* Они представляют собой нормализованные стандартные показатели со средним, равным 50, и SD = 8 в каждой возрастной группе. Нормативные таблицы составлены с 4-месячным интервалом для возраста от 2 до 5 лет, с 6-месячным интервалом для возраста от 6 до 10 лет и с интервалом в 1 год для возраста от 11 до 17 лет; для возрастного уровня от 18 до 23 лет имеется одна-единственная нормативная таблица. Тетрадь для записи ответов содержит специальный бланк-диаграмму Для построения индивидуального профиля 5Л5по результатам проведенных с конкретным испытуемым тестов.

Стандартные показатели возраста (SAS) можно также получить для каждой из Четырех когнитивных областей и для совокупного результата по полной шкале 55-IV. Комплексный и четыре частных стандартных показателя возраста находят по значениям SAS для тестов, проведенных с конкретным испытуемым, для чего нужно просто обратиться к соответствующим нормативным таблицам. Эти пять SAS тоже являются

Эти таблицы приведены и Thorndike et al., 1986a, p. 183-188. Некоторые значения SAS, основанные "а менее 100 наблюдаемых случаев, статистически оценивались для полной возрастной когорты и "Ыделены в нормативных таблицах темным фоном. Такие показатели появлялись тогда, когда испы-"Уемые показывали необычайно высокий или, наоборот, низкий для своего возраста результат по

СТ У, определяющему маршрут обследования (Thorndike ct al., 1986b, p. 29-30).

Часть 3. Тестирование способностей

нормализованными стандартными показателями, но со средним, равным 100, и SD =16. Таким образом, они выражаются в тех же единицах, что и стандартный IQ более ранних редакций шкалы Стэнфорд-Бине. Однако от использования термина «/Q» теперь полностью отказались. Для специальных целей предусмотрены возможности вычисления стандартных показателей возраста для любой комбинации двух или более частных (т. е. соответствующих одной из четырех когнитивных областей) SAS - так называемых «парциальных композиций» (partial composites). Например, комбинация SAS для вербального и количественного рассуждения близко соответствует «способности к обучению» (scholastic aptitude) и может представлять особый интерес в связи с оценкой академических достижений или готовности к обучению.

Надежность. Поскольку в SB-IV нет альтернативной формы, надежность этой шкалы можно было оценить только вычисляя внутреннюю согласованность или проводя повторное тестирование. В большинстве случаев использовался метод Кьюдера-Ричардсона, который применяли к данным, полученным на всей выборке стандартизации. Как и ожидалось, комплексный показатель по полной батарее дал наибольшие коэффициенты надежности на всех возрастных уровнях, значения которых колебались от 0,95 до 0,99. Надежность частных показателей в каждой из четырех когнитивных областей также оказалась высокой. Хотя она и изменялась в зависимости от числа тестов, включаемых в каждую область, соответствующие коэффициенты надежности варьировали в пределах от 0,80 до 0,97. Что касается отдельных тестов, то у большинства из них коэффициенты надежности попадают в интервал между 0,80 и 0,90, за исключением короткого (состоящего из 14 заданий) теста «Память на предметы», надежность которого варьирует от 0,66 до 0,78. В общем, все коэффициенты надежности имеют тенденцию несколько повышаться при переходе от младших к старшим возрастным уровням.

Дополнительные данные по ретестовой надежности были получены на 57 дошкольниках (5 лет) и 55 школьниках (8 лет), повторное тестирование которых проводилось спустя несколько месяцев (от 2 до 8). В общем, надежность оказалась высокой у комплексного показателя: соответствующие коэффициенты для этих двух групп составили 0,91 и 0,90. Хотя частный показатель в области вербального рассуждения дал коэффициенты надежности выше 0,80, ретестовая надежность других частных показателей и отдельных тестов обнаружила существенные колебания. Эти результаты трудно интерпретировать из-за возможного влияния ограниченных возрастных диапазонов некоторых тестов и эффекта практики, который мог существенно различаться от ребенка к ребенку.

В добавление к коэффициентам надежности в руководстве по проведению и оценке результатов SB-W (Guide) и в техническом руководстве (TechnicalManual) приводятся стандартные ошибки измерения (SEM) в пределах каждого возрастного уровня для каждого теста, частных показателей по когнитивным областям и комплексного показателя по полной шкале. Такие SEM нужны для оценивания индивидуальных показателей и для интерпретации различий между показателями при анализе профиля. Общий комплексный SAS (М = 100, SD = 16) имеет SEM от 2 до 3 единиц шкалы. Например, если в качестве приближенного среднего значения SEM взять 2,5, т. е. 2 шанса к 1, что «истинный» комплексный показатель конкретного испытуемого не будет отличаться от полученного им показателя больше чем на 2,5 единицы; кроме того, есть 95 шансов из 100, что его вариация составит не более 5 единиц (2,5 х 1,96 = 4,90).

Глава 8. Индивидуальные способности

В Справочном руководстве для пользователей 5B-/V(Delaney, & Hopkins, 1987) представлена интерпретационная основа, побуждающая формулировать гипотезы и проводить их перекрестную проверку на основе количественных и качественных данных, собранных с помощью этой батареи. Количественный анализ следует модели, впервые предложенной Ф. Б. Дэвисом (F. В. Davis, 1959) и примененной Кауфманом (Kaufman, 1979, 1994) и др. к шкалам Векслера. В сущности, он состоит из типовых схем сравнений комплексного и четырех частных (см. рис. 8-2) показателей с целью обнаружения статистически значимых различий исходя из величины SEM. Частоту полученных различий также сравнивают с соответствующими нормативными данными из выборки стандартизации. В дополнение к этому могут систематически оценивать сильные и слабые стороны конкретных способностей индивидуума, выявляемых каждым тестом, для чего проводят сравнения среднего результата испытуемого по комплексному и частным показателям с показателями по отдельным тестам. Указанное справочное руководство содержит всю необходимую информацию для проведения этих разновидностей анализа профиля, а также дает четыре полных примера их применения; оно наверняка будет оценено по достоинству как начинающими, так и опытными пользователями шкалы Стэнфорд-Бине.

Валидность. В соответствии с современными концепциями валидизации тестов разработчики четвертой редакции шкалы Стэнфорд-Бине придерживались разнообразных подходов при идентификации и определении закладываемых в ее основу конструктов. Первичный выбор конструктов направлялся результатами анализа доступной научной литературы о природе и измерении интеллекта (R. L. Thorndike et al., 1986b, chap. 1). Опыт использования прежних редакций этой шкалы и обнаружившиеся в ходе него ее сильные и слабые стороны служили дополнительными ориентирами при составлении планов конструирования новой шкалы и принятии решений. Например, разделение типов заданий на надежные субтесты было необходимой заменой традиционной клинической практики нестрогого анализа структуры ответов на основе субъективных группировок заданий.

После первичного выбора и предварительного определения конструктов, оцениваемых в SB-IV, были идентифицированы старые и разработаны новые задания, соответствующие этим определениям. Вся совокупность заданий подвергалась всестороннему и статистически изощренному анализу, включая как субъективную, так и статистическую оценку необъективности задания (R. L. Thorndike et al., 1986b, chap. 2). Окончательная версия шкалы, полученная в результате нескольких предварительных проверок и полевых испытаний, была проведена на выборке стандартизации и затем исследована в аспекте трех основных типов данных валидизации: 1) интеркорреля-Ции и факторного анализа показателей; 2) корреляции с другими тестами интеллекта и 3) сравнения результатов в заранее установленных особых группах (Thorndike et al., 1986b, chap. 6).

Прежде всего, по данным полной выборки стандартизации вычисляли интеркорреляции между показателями всех тестов, частными показателями для четырех когнитивных областей и комплексными показателями батареи - отдельно по каждому в °зрастному уровню. Медианные корреляции (найденные ранжированием однотипных коэффициентов для всех возрастов) использовали в качестве исходных данных Для конфирматорного (подтверждающего) факторного анализа. Главной целью этого а Нализа была проверка гипотезы о наличии общего фактора, объясняющего корреля-

Часть 3. Тестирование способностей

ции между тестами из разных когнитивных областей, и групповых факторов, объясняющих остаточные корреляции внутри каждой области. Аналогичный факторный анализ также проводился с медианными корреляциями в каждой из трех возрастных групп (от 2 до 6, от 7 до 11 и от 12 до 18-23 лет).

Результаты факторного анализа в каждом случае показали существенные нагрузки общего фактора во всех тестах, оправдывая таким образом использование общего комплексного показателя. Для трех из четырех когнитивных областей групповые факторы объяснили значительную долю остаточной общей дисперсии внутри соответствующей области. Исключение составила область «абстрактного/наглядного рассуждения», где все четыре теста обнаружили высокую степень специфичности. Можно высказать предположение, что неспособность найти ясное подтверждение группового фактора в этой когнитивной области могла быть связана с кумулятивными эффектами школьного курса обучения, которое не так тщательно организовано в отношении пространственно-перцептивного содержания, как в отношении словесного и числового материала. Повседневный личный опыт, способствующий развитию пространственно-перцептивных способностей, не организуется систематически в «учебные курсы» или области содержания, подобно опыту, связанному с обучением. Поэтому менее вероятно, что личный опыт благоприятствует формированию общих структур связей у различных людей (Anastasi, 1970,1986b).

Обзор результатов факторного анализа, приведенных в руководстве к тесту, так же как и результаты факторного анализа, проведенного независимо другими исследователями по данным стандартизации SB-YV, подтвердили правомерность использования комплексного показателя как меры общей интеллектуальной способности (R. M. Thor-ndike, 1990). Однако исследователи расходятся в том, что касается числа и природы более узких факторов (см. также McCallum, 1990). Эта ситуация осложняется тем, что поскольку SB-YV состоит из различных наборов тестов в разных возрастах, «сырые» данные для факторного анализа (т. е. корреляции между тестовыми показателями) различаются соответственно. Отсюда и различия в типах и количестве факторов - в пределах от двух до четырех, - появляющиеся на разных возрастных уровнях. Эти расхождения усугубляются разнообразием применяемых в разных исследован иях способов факторного анализа. Однако, в общем, с увеличением возраста испытуемых факторное решение лучше соответствует четырехфакторной модели, постулированной при разработке SB-IV, в особенности при использовании конфнрматорпого факторного анализа в противоположность эксплораторному (разведочному).

Второй источник данных валидизации основан на серии исследований групп, в которых проводился SB-YV и какой-нибудь другой тест интеллекта, включая форму L-Мсамой шкалы Стэнфорд-Бине. 1 Эти группы состояли из школьников, систематически посещающих занятия и охарактеризованных учителями как «обычные» (non-exceptional). Кроме того, в распоряжении исследователей были три «особые» (exceptional) группы учащихся, занимавшихся по программам для одаренных детей, детей с трудностями в обучении и детей с задержкой психического развития. В обычной выборке корреляция стандартного IQ по более ранней редакции шкалы Стэнфорд- Бине (форма 1-М) с комплексным показателем по 56-IV составила 0,81; второй по величине (0,76) оказалась корреляция стандартного IQ формы L-Mc частным пока-

1 К числу других относились WISC-R, WAIS-R, WPPSI и К-АВС, которые будут рассмотрены в это» главе чуть позже.

Глава 8. Индивидуальные способности

зателем SB-W в области «вербального рассуждения», а самую низкую корреляцию (0,56) стандартный /Qдал с частным показателем SB-W в области «абстрактного/наглядного рассуждения», что и следовало ожидать исходя из сходства и различия в содержании этих двух форм шкалы Стэнфорд-Бине. Во всех группах корреляции комплексного и частных показателей SB-IV с общим или парциальными показателями по другим тестам интеллекта большей частью не противоречили гипотезам в отношении тестируемых конструктов. В то же время тщательное изучение всех корреляций, обнаруженных между специфическими показателями SB-W и других тестов интеллекта способствует более твердому пониманию конструктов, измеряемых современной шкалой Стэнфорд-Бине.

Третья серия специальных исследований на особых выборках показала, что SB-IW позволяет правильно определять уровень выполнения одаренных, имеющих трудности в обучении и отстающих в развитии детей школьного возраста. Средние комплексного показателя и четырех частных показателей в выборке одаренных оказались существенно выше соответствующих средних в выборке стандартизации. Средние в выборках детей с трудностями в обучении и с задержкой психического развития были значимо ниже средних выборки стандартизации, а средние умственно отсталых - значимо ниже средних в выборке имеющих трудности в обучении. Следует заметить, что во всех исследованиях особых групп их участники определялись на основе тестов или других показателей деятельности, но сама шкала SB-1 V при этом не использовалась.

В более позднем обзоре исследований валидности SB-W (Laurent, Swerdlik, & Ry-burn, 1992) делается вывод, что эта шкала является, по меньшей мере, столь же хорошим средством измерения общей интеллектуальной способности, как и другие имеющиеся в наличии средства; что она сильно коррелирует с мерами достижения и к тому же позволяет различать умственно отсталых, одаренных и больных с неврологическими повреждениями. Авторы обзора предполагают, что SB-IV можно использовать в качестве инструмента отбора при оценивании одаренных детей вследствие высокого «потолка», обеспечиваемого возрастным диапазоном этого теста; с другой стороны, они критикуют SB- IV за отсутствие предельно легких заданий - достаточно простых, чтобы диагностировать задержку умственного развития у самых маленьких детей.

Исследования, необходимые для усиления интерпретационного значения показателей различных тестов SB-W и их комбинаций, продолжают быстро накапливаться. В добавление к этому появилось несколько работ, в которых даны методические указания по использованию этой шкалы (Sattler, 1988; Glutting, & Kaplan, 1990; Kampha-us, 1993). Современная редакция Стэнфорд-Бине отражает истинный прогресс в конструировании шкалы. 55-IV обеспечивает необходимую гибкость, позволяя пользователям оценивать отдельные способности в соответствии с конкретными целями тестирования. Наконец, эта версия шкалы гораздо лучше согласуется с современными теоретическими представлениями о природе интеллекта и свежими данными исследований в этой области (см. главу 11).

Шкалы Векслера

Разработанные Дэвидом Векслером шкалы интеллекта включают несколько последовательных редакций трех шкал: для взрослых, для детей школьного возраста и ^ л я дошкольников. Помимо их использования для измерения общего интеллекта век-

Часть 3. Тестирование способностей

слеровские шкалы пробовали применять в качестве вспомогательного средства психиатрического диагноза. Опираясь на наблюдение, что повреждения мозга, психотические обострения и эмоциональные расстройства могут избирательно воздействовать на интеллектуальные функции, Д. Векслер и другие медицинские психологи утверждали, что сравнительный анализ выполнения пациентом разных субтестов мог бы пролить свет на специфику психического расстройства. Проблемы и результаты, относящиеся к такому анализу профиля шкал Векслера, будут рассмотрены в главе 17 как пример использования тестов в условиях клиники.

Об интересе к шкалам Векслера и широте их применения свидетельствуют несколько тысяч посвященных им публикаций, появившихся к настоящему времени. Помимо обычных обзоров по тестам в Ежегодниках психических измерений исследования, касающиеся шкал Векслера, периодически освещаются в журналах (Guertin, Frank, & Rabin, 1956; Guertin, Ladd, Frank, Rabin, & Hiester, 1966; Guertin, Ladd, Frank, Rabin, & Hiester, 1971; Guertin, Rabin, Frank, & Ladd, 1962; T. D. Hill, Reddon, & Jackson, 1985; Littell, 1960; Rabin, & Guertin, 1951; I. L. Zimmerman, & Woo-Sam, 1972) и обобщены в нескольких книгах (например, Forster & Matarazzo, 1990; Gyurke, 1991; Kamp-haus, 1993; Kaufman, 1979,1990,1994; Sattler, 1988,1992).

Прошлое и настоящее векслеровских шкал интеллекта. Первая форма шкал Векслера, известная как шкала интеллекта Векслера-Белльвью, была опубликована в 1939 г. Одной из главных целей подготовки этой шкалы была разработка теста интеллекта, пригодного для тестирования взрослых людей. Представляя впервые эту шкалу, Д. Векслер (Wechsler, 1939) отмечал, что доступные ранее тесты интеллекта разрабатывались главным образом для школьников и адаптировались для взрослых добавлением более трудных заданий того же типа. Содержание таких тестов часто не представляло никакого интереса для взрослых людей. Если задания теста не обладают хотя бы минимумом очевидной валидности, то практически невозможно установить должный раппорт со взрослыми испытуемыми. Многим заданиям теста интеллекта, специально составленным с учетом повседневных занятий ребенка школьного возраста, явно не хватает очевидной валидности с точки зрения большинства взрослых.

Ориентировка большинства тестов на скорость выполнения может также ставить в невыгодные условия пожилых людей. Кроме того, Д. Векслер считал, что в традиционных тестах интеллекта неоправданно большое значение придавалось относительно шаблонным манипуляциям словами. Он обратил внимание коллег на неприменимость норм умственного возраста к взрослым и указал на то, что прежние выборки стандартизации для индивидуальных тестов интеллекта включали лишь незначительное число взрослых.

Стремление преодолеть все эти недостатки и привело к разработке первой шкалы Векслера-Белльвью. По форме и по содержанию эта шкала служит базисной моделью для всех последующих векслеровских шкал интеллекта, каждая из которых, в свою очередь, вносила некоторые усовершенствования в предшествующую ей версию. В 1949 г. была подготовлена Векслеровская шкала интеллекта для детей {W1SO как расширение шкалы Векслера-Белльвью в сторону более низких возрастных уровней (Seashore, Wesman, & Doppelt, 1950). Многие задания были взяты непосредственно из теста для взрослых, и в каждый субтест были добавлены более легкие задания того же типа. В 1955 г. шкала Векслера-Белльвью была вытеснена ВекслеровскоИ шкалой интеллекта для взрослых (WAIS), свободной от некоторых технических не-

Глава 8. Индивидуальные способности

достатков прежней шкалы, касающихся объема и репрезентативности нормативной выборки, а также надежности субтестов. В 1967 г. семейство тестов Векслера пополнилось еще одним, «самым младшим ребенком» - Векслеровской шкалой интеллекта для дошкольников и младших школьников (WPPSP), первоначально задуманной для детей от 4 до 6,5 лет как расширение нижней области возрастного диапазона WISC, которая предназначалась для детей от 5 до 15 лет.

Разработка WISC с самого начала была отмечена известными противоречиями, так как Векслер приступил к созданию своих тестов отчасти из-за острой потребности в такой шкале для измерения интеллекта взрослых, которая не была бы простым расширением имеющихся на тот момент шкал для детей в сторону более высоких возрастных уровней. Первая редакция WISC была фактически полностью раскритикована за недостаточную ориентацию ее содержания на детей. В пересмотренной редакции этой шкалы (WISC-R), изданной в 1974 г. и предназначавшейся для детей от 6 до 16 лет, ориентированные на взрослых задания были заменены или изменены таким образом, чтобы приблизить их содержание к обычному детскому опыту. В арифметическом субтесте, например, в условиях задачи «сигары» были заменены «конфетами». Другие изменения состояли в исключении заданий, которые могли быть в разной степени знакомы отдельным группам детей, и включении большего количества женских и негритянских персонажей в наглядный материал субтестов. Ряд субтестов пришлось удлинить в целях повышения их надежности. Кроме того, были внесены некоторые усовершенствования в процедуры проведения теста и подсчета баллов.

Описание шкал. К настоящему времени каждая из трех шкал Векслера подверглась хотя бы одной, а то и нескольким переработкам. Современных версий шкал, опубликованных под именем Дэвида Векслера уже после его смерти в 1981 г., три: Пересмотренная шкала интеллекта взрослых Векслера (WAIS-R - Wechsler, 1981), охватывающая возрастной диапазон от 16 до 74 лет; Векслеровская шкала интеллекта для детей - Третья редакция (WISC-III- Wechsler, 1991), предназначенная для детей от 6 лет до 16 лет 11 месяцев; Пересмотренная Векслеровская шкала интеллекта для дошкольников и младших школьников (WPPSI-R - Wechsler, 1989), покрывающая теперь возрастной диапазон от 3 лет до 7 лет 3 месяцев. Третью редакцию шкалы интеллекта взрослых (WAIS), работа по усовершенствованию которой велась с 1992 г., предполагается подготовить к 1997 г.

WAIS-R, WISC-III и WPPSI-R имеют много общих черт, включая основную организацию Вербальной и Невербальной шкал, каждая из которых состоит минимум из пяти (а максимум из семи) субтестов и дает отдельные показатели в единицах стандартного IQ Индивидуальные показатели но всем 10 систематически проводимым субтестам (11 для WAIS-R) объединяются в Полную шкалу IQ (Full Scale IQ), которая имеет то же среднее и стандартное отклонение (М= 100, SD = 15), что и две подшкалы - Вербальная и Невербальная. Из 17 различных видов субтестов, используемых в WAIS-R, WlSC-Ши WPPSI-R, восемь (5 вербальных и 3 невербальных) являются общими для всех трех шкал. При применении этих шкал вербальные и невербальные субтесты чередуются и предъявляются в заранее установленной последовательности, своей для каждой шкалы.

Субтест «Осведомленность» - первый вербальный субтест, предъявляемый во всех т рех шкалах и служащий хорошим средством установления раппорта с тестируемым. Было затрачено немало усилий, чтобы избежать в нем вопросов, касающихся специ-

Часть 3. Тестирование способностей

альных знаний. Его первые задания достаточно легки для того, чтобы с ними справились подавляющее большинство тестируемых, если только они не страдают умственной отсталостью или нарушением ориентации в действительности. В таких случаях тестирующий может быстро принять решение о прекращении тестирования. Вопросы субтеста «Осведомленность» в версиях WAIS-R и WISC-III касаются фактов, о которых большинство живущих в США скорее всего имело шанс узнать, например: «Какой месяц наступает перед декабрем?» или «Кем был Марк Твен?» В версии WPPSI-R предлагаются аналогичные вопросы, хотя и на более низком уровне трудности. На самом деле, эта версия начинается с заданий, предъявляемых в изобразительной форме, которые требуют только показать правильный ответ. Например, при предъявлении картинки с изображением нескольких бытовых предметов ребенка могут спросить, какой из них используется для уборки. Субтест «Арифметический» - еще одна вербальная мера, демонстрирующая широкий диапазон трудности на группе шкал Век-слера. В самых легких арифметических заданиях WPPSI-R требуется показать только один предмет в ряду, иллюстрирующем количественное понятие (такое, как «самый маленький» или «больше»). Более сложные задания могут быть связаны с вычислениями или решением арифметических задач, самые трудные из которых требуют хорошего усвоения дробей.

Также по теме

Маринованная капуста быстрого приготовления — быстро и очень вкусно!

Молочная геркулесовая каша в мультиварке-скороварке

Центральный военный округ

Свиные рёбрышки с картофелем

Яблочный пирог “Невесомость” Ингредиенты на десять порций