Тесты в процессе разработки программного обеспечения. Методология тестирования

  • Tutorial

Доброго времени суток!

Хочу собрать всю самую необходимую теорию по тестирвоанию, которую спрашивают на собеседованиях у trainee, junior и немножко middle. Собственно, я собрал уже не мало. Цель сего поста в том, чтобы сообща добавить упущенное и исправить/перефразировать/добавить/сделатьЧтоТоЕщё с тем, что уже есть, чтобы стало хорошо и можно было взять всё это и повторить перед очередным собеседованием про всяк случай. Вообщем, коллеги, прошу под кат, кому почерпнуть что-то новое, кому систематизировать старое, а кому внести свою лепту.

В итоге должна получиться исчерпывающая шпаргалка, которую нужно перечитать по дороге на собеседование.

Всё ниже перечисленное не выдумано мной лично, а взято с разных источников, где мне лично формулировка и определение понравилось больше. В конце список источников.

В теме: определение тестирования, качество, верификация / валидация, цели, этапы, тест план, пункты тест плана, тест дизайн, техники тест дизайна, traceability matrix, tets case, чек-лист, дефект, error/deffect/failure, баг репорт, severity vs priority, уровни тестирования, виды / типы, подходы к интеграционному тестированию, принципы тестирования, статическое и динамическое тестирование, исследовательское / ad-hoc тестирование, требования, жизненный цикл бага, стадии разработки ПО, decision table, qa/qc/test engineer, диаграмма связей.

Поехали!

Тестирование программного обеспечения - проверка соответствия между реальным и ожидаемым поведением программы, осуществляемая на конечном наборе тестов, выбранном определенным образом. В более широком смысле, тестирование - это одна из техник контроля качества, включающая в себя активности по планированию работ (Test Management), проектированию тестов (Test Design), выполнению тестирования (Test Execution) и анализу полученных результатов (Test Analysis).

Качество программного обеспечения (Software Quality) - это совокупность характеристик программного обеспечения, относящихся к его способности удовлетворять установленные и предполагаемые потребности.

Верификация (verification) - это процесс оценки системы или её компонентов с целью определения удовлетворяют ли результаты текущего этапа разработки условиям, сформированным в начале этого этапа. Т.е. выполняются ли наши цели, сроки, задачи по разработке проекта, определенные в начале текущей фазы.
Валидация (validation) - это определение соответствия разрабатываемого ПО ожиданиям и потребностям пользователя, требованиям к системе .
Также можно встретить иную интерпритацию:
Процесс оценки соответствия продукта явным требованиям (спецификациям) и есть верификация (verification), в то же время оценка соответствия продукта ожиданиям и требованиям пользователей - есть валидация (validation). Также часто можно встретить следующее определение этих понятий:
Validation - ’is this the right specification?’.
Verification - ’is the system correct to specification?’.

Цели тестирвоания
Повысить вероятность того, что приложение, предназначенное для тестирования, будет работать правильно при любых обстоятельствах.
Повысить вероятность того, что приложение, предназначенное для тестирования, будет соответствовать всем описанным требованиям.
Предоставление актуальной информации о состоянии продукта на данный момент.

Этапы тестирования:
1. Анализ
2. Разработка стратегии тестирования
и планирование процедур контроля качества
3. Работа с требованиями
4. Создание тестовой документации
5. Тестирование прототипа
6. Основное тестирование
7. Стабилизация
8. Эксплуатация

Тест план (Test Plan) - это документ, описывающий весь объем работ по тестированию, начиная с описания объекта, стратегии, расписания, критериев начала и окончания тестирования, до необходимого в процессе работы оборудования, специальных знаний, а также оценки рисков с вариантами их разрешения.
Отвечает на вопросы:
Что надо тестировать?
Что будете тестировать?
Как будете тестировать?
Когда будете тестировать?
Критерии начала тестирования.
Критерии окончания тестирования.

Основные пункты тест плана
В стандарте IEEE 829 перечислены пункты, из которых должен (пусть - может) состоять тест-план:
a) Test plan identifier;
b) Introduction;
c) Test items;
d) Features to be tested;
e) Features not to be tested;
f) Approach;
g) Item pass/fail criteria;
h) Suspension criteria and resumption requirements;
i) Test deliverables;
j) Testing tasks;
k) Environmental needs;
l) Responsibilities;
m) StafÞng and training needs;
n) Schedule;
o) Risks and contingencies;
p) Approvals.

Тест дизайн - это этап процесса тестирования ПО, на котором проектируются и создаются тестовые случаи (тест кейсы), в соответствии с определёнными ранее критериями качества и целями тестирования.
Роли, ответственные за тест дизайн:
Тест аналитик - определяет «ЧТО тестировать?»
Тест дизайнер - определяет «КАК тестировать?»

Техники тест дизайна

Эквивалентное Разделение (Equivalence Partitioning - EP) . Как пример, у вас есть диапазон допустимых значений от 1 до 10, вы должны выбрать одно верное значение внутри интервала, скажем, 5, и одно неверное значение вне интервала - 0.

Анализ Граничных Значений (Boundary Value Analysis - BVA) . Если взять пример выше, в качестве значений для позитивного тестирования выберем минимальную и максимальную границы (1 и 10), и значения больше и меньше границ (0 и 11). Анализ Граничный значений может быть применен к полям, записям, файлам, или к любого рода сущностям имеющим ограничения.

Причина / Следствие (Cause/Effect - CE) . Это, как правило, ввод комбинаций условий (причин), для получения ответа от системы (Следствие). Например, вы проверяете возможность добавлять клиента, используя определенную экранную форму. Для этого вам необходимо будет ввести несколько полей, таких как «Имя», «Адрес», «Номер Телефона» а затем, нажать кнопку «Добавить» - эта «Причина». После нажатия кнопки «Добавить», система добавляет клиента в базу данных и показывает его номер на экране - это «Следствие».

Исчерпывающее тестирование (Exhaustive Testing - ET) - это крайний случай. В пределах этой техники вы должны проверить все возможные комбинации входных значений, и в принципе, это должно найти все проблемы. На практике применение этого метода не представляется возможным, из-за огромного количества входных значений.

Traceability matrix - Матрица соответствия требований - это двумерная таблица, содержащая соответсвие функциональных требований (functional requirements) продукта и подготовленных тестовых сценариев (test cases). В заголовках колонок таблицы расположены требования, а в заголовках строк - тестовые сценарии. На пересечении - отметка, означающая, что требование текущей колонки покрыто тестовым сценарием текущей строки.
Матрица соответсвия требований используется QA-инженерами для валидации покрытия продукта тестами. МСТ является неотъемлемой частью тест-плана.

Тестовый случай (Test Case) - это артефакт, описывающий совокупность шагов, конкретных условий и параметров, необходимых для проверки реализации тестируемой функции или её части.
Пример:
Action Expected Result Test Result
(passed/failed/blocked)
Open page «login» Login page is opened Passed

Каждый тест кейс должен иметь 3 части:
PreConditions Список действий, которые приводят систему к состоянию пригодному для проведения основной проверки. Либо список условий, выполнение которых говорит о том, что система находится в пригодном для проведения основного теста состояния.
Test Case Description Список действий, переводящих систему из одного состояния в другое, для получения результата, на основании которого можно сделать вывод о удовлетворении реализации, поставленным требованиям
PostConditions Список действий, переводящих систему в первоначальное состояние (состояние до проведения теста - initial state)
Виды Тестовых Случаев:
Тест кейсы разделяются по ожидаемому результату на позитивные и негативные:
Позитивный тест кейс использует только корректные данные и проверяет, что приложение правильно выполнило вызываемую функцию.
Негативный тест кейс оперирует как корректными так и некорректными данными (минимум 1 некорректный параметр) и ставит целью проверку исключительных ситуаций (срабатывание валидаторов), а также проверяет, что вызываемая приложением функция не выполняется при срабатывании валидатора.

Чек-лист (check list) - это документ, описывающий что должно быть протестировано. При этом чек-лист может быть абсолютно разного уровня детализации. На сколько детальным будет чек-лист зависит от требований к отчетности, уровня знания продукта сотрудниками и сложности продукта.
Как правило, чек-лист содержит только действия (шаги), без ожидаемого результата. Чек-лист менее формализован чем тестовый сценарий. Его уместно использовать тогда, когда тестовые сценарии будут избыточны. Также чек-лист ассоциируются с гибкими подходами в тестировании.

Дефект (он же баг) - это несоответствие фактического результата выполнения программы ожидаемому результату. Дефекты обнаруживаются на этапе тестирования программного обеспечения (ПО), когда тестировщик проводит сравнение полученных результатов работы программы (компонента или дизайна) с ожидаемым результатом, описанным в спецификации требований.

Error - ошибка пользователя, то есть он пытается использовать программу иным способом.
Пример - вводит буквы в поля, где требуется вводить цифры (возраст, количество товара и т.п.).
В качественной программе предусмотрены такие ситуации и выдаются сообщение об ошибке (error message), с красным крестиком которые.
Bug (defect) - ошибка программиста (или дизайнера или ещё кого, кто принимает участие в разработке), то есть когда в программе, что-то идёт не так как планировалось и программа выходит из-под контроля. Например, когда никак не контроллируется ввод пользователя, в результате неверные данные вызывают краши или иные «радости» в работе программы. Либо внутри программа построена так, что изначально не соответствует тому, что от неё ожидается.
Failure - сбой (причём не обязательно аппаратный) в работе компонента, всей программы или системы. То есть, существуют такие дефекты, которые приводят к сбоям (A defect caused the failure) и существуют такие, которые не приводят. UI-дефекты например. Но аппаратный сбой, никак не связанный с software, тоже является failure.

Баг Репорт (Bug Report) - это документ, описывающий ситуацию или последовательность действий приведшую к некорректной работе объекта тестирования, с указанием причин и ожидаемого результата.
Шапка
Короткое описание (Summary) Короткое описание проблемы, явно указывающее на причину и тип ошибочной ситуации.
Проект (Project) Название тестируемого проекта
Компонент приложения (Component) Название части или функции тестируемого продукта
Номер версии (Version) Версия на которой была найдена ошибка
Серьезность (Severity) Наиболее распространена пятиуровневая система градации серьезности дефекта:
S1 Блокирующий (Blocker)
S2 Критический (Critical)
S3 Значительный (Major)
S4 Незначительный (Minor)
S5 Тривиальный (Trivial)
Приоритет (Priority) Приоритет дефекта:
P1 Высокий (High)
P2 Средний (Medium)
P3 Низкий (Low)
Статус (Status) Статус бага. Зависит от используемой процедуры и жизненного цикла бага (bug workflow and life cycle)

Автор (Author) Создатель баг репорта
Назначен на (Assigned To) Имя сотрудника, назначенного на решение проблемы
Окружение
ОС / Сервис Пак и т.д. / Браузера + версия /… Информация об окружении, на котором был найден баг: операционная система, сервис пак, для WEB тестирования - имя и версия браузера и т.д.

Описание
Шаги воспроизведения (Steps to Reproduce) Шаги, по которым можно легко воспроизвести ситуацию, приведшую к ошибке.
Фактический Результат (Result) Результат, полученный после прохождения шагов к воспроизведению
Ожидаемый результат (Expected Result) Ожидаемый правильный результат
Дополнения
Прикрепленный файл (Attachment) Файл с логами, скриншот или любой другой документ, который может помочь прояснить причину ошибки или указать на способ решения проблемы.

Severity vs Priority
Серьезность (Severity) - это атрибут, характеризующий влияние дефекта на работоспособность приложения.
Приоритет (Priority) - это атрибут, указывающий на очередность выполнения задачи или устранения дефекта. Можно сказать, что это инструмент менеджера по планированию работ. Чем выше приоритет, тем быстрее нужно исправить дефект.
Severity выставляется тестировщиком
Priority - менеджером, тимлидом или заказчиком

Градация Серьезности дефекта (Severity)

S1 Блокирующая (Blocker)
Блокирующая ошибка, приводящая приложение в нерабочее состояние, в результате которого дальнейшая работа с тестируемой системой или ее ключевыми функциями становится невозможна. Решение проблемы необходимо для дальнейшего функционирования системы.

S2 Критическая (Critical)
Критическая ошибка, неправильно работающая ключевая бизнес логика, дыра в системе безопасности, проблема, приведшая к временному падению сервера или приводящая в нерабочее состояние некоторую часть системы, без возможности решения проблемы, используя другие входные точки. Решение проблемы необходимо для дальнейшей работы с ключевыми функциями тестируемой системой.

S3 Значительная (Major)
Значительная ошибка, часть основной бизнес логики работает некорректно. Ошибка не критична или есть возможность для работы с тестируемой функцией, используя другие входные точки.

S4 Незначительная (Minor)
Незначительная ошибка, не нарушающая бизнес логику тестируемой части приложения, очевидная проблема пользовательского интерфейса.

S5 Тривиальная (Trivial)
Тривиальная ошибка, не касающаяся бизнес логики приложения, плохо воспроизводимая проблема, малозаметная посредствам пользовательского интерфейса, проблема сторонних библиотек или сервисов, проблема, не оказывающая никакого влияния на общее качество продукта.

Градация Приоритета дефекта (Priority)
P1 Высокий (High)
Ошибка должна быть исправлена как можно быстрее, т.к. ее наличие является критической для проекта.
P2 Средний (Medium)
Ошибка должна быть исправлена, ее наличие не является критичной, но требует обязательного решения.
P3 Низкий (Low)
Ошибка должна быть исправлена, ее наличие не является критичной, и не требует срочного решения.

Уровни Тестирования

1. Модульное тестирование (Unit Testing)
Компонентное (модульное) тестирование проверяет функциональность и ищет дефекты в частях приложения, которые доступны и могут быть протестированы по-отдельности (модули программ, объекты, классы, функции и т.д.).

2. Интеграционное тестирование (Integration Testing)
Проверяется взаимодействие между компонентами системы после проведения компонентного тестирования.

3. Системное тестирование (System Testing)
Основной задачей системного тестирования является проверка как функциональных, так и не функциональных требований в системе в целом. При этом выявляются дефекты, такие как неверное использование ресурсов системы, непредусмотренные комбинации данных пользовательского уровня, несовместимость с окружением, непредусмотренные сценарии использования, отсутствующая или неверная функциональность, неудобство использования и т.д.

4. Операционное тестирование (Release Testing).
Даже если система удовлетворяет всем требованиям, важно убедиться в том, что она удовлетворяет нуждам пользователя и выполняет свою роль в среде своей эксплуатации, как это было определено в бизнес моделе системы. Следует учесть, что и бизнес модель может содержать ошибки. Поэтому так важно провести операционное тестирование как финальный шаг валидации. Кроме этого, тестирование в среде эксплуатации позволяет выявить и нефункциональные проблемы, такие как: конфликт с другими системами, смежными в области бизнеса или в программных и электронных окружениях; недостаточная производительность системы в среде эксплуатации и др. Очевидно, что нахождение подобных вещей на стадии внедрения - критичная и дорогостоящая проблема. Поэтому так важно проведение не только верификации, но и валидации, с самых ранних этапов разработки ПО.

5. Приемочное тестирование (Acceptance Testing)
Формальный процесс тестирования, который проверяет соответствие системы требованиям и проводится с целью:
определения удовлетворяет ли система приемочным критериям;
вынесения решения заказчиком или другим уполномоченным лицом принимается приложение или нет.

Виды / типы тестирования

Функциональные виды тестирования
Функциональное тестирование (Functional testing)
Тестирование безопасности (Security and Access Control Testing)
Тестирование взаимодействия (Interoperability Testing)

Нефункциональные виды тестирования
Все виды тестирования производительности:
o нагрузочное тестирование (Performance and Load Testing)
o стрессовое тестирование (Stress Testing)
o тестирование стабильности или надежности (Stability / Reliability Testing)
o объемное тестирование (Volume Testing)
Тестирование установки (Installation testing)
Тестирование удобства пользования (Usability Testing)
Тестирование на отказ и восстановление (Failover and Recovery Testing)
Конфигурационное тестирование (Configuration Testing)

Связанные с изменениями виды тестирования
Дымовое тестирование (Smoke Testing)
Регрессионное тестирование (Regression Testing)
Повторное тестирование (Re-testing)
Тестирование сборки (Build Verification Test)
Санитарное тестирование или проверка согласованности/исправности (Sanity Testing)

Функциональное тестирование рассматривает заранее указанное поведение и основывается на анализе спецификаций функциональности компонента или системы в целом.

Тестирование безопасности - это стратегия тестирования, используемая для проверки безопасности системы, а также для анализа рисков, связанных с обеспечением целостного подхода к защите приложения, атак хакеров, вирусов, несанкционированного доступа к конфиденциальным данным.

Тестирование взаимодействия (Interoperability Testing) - это функциональное тестирование, проверяющее способность приложения взаимодействовать с одним и более компонентами или системами и включающее в себя тестирование совместимости (compatibility testing) и интеграционное тестирование

Нагрузочное тестирование - это автоматизированное тестирование, имитирующее работу определенного количества бизнес пользователей на каком-либо общем (разделяемом ими) ресурсе.

Стрессовое тестирование (Stress Testing) позволяет проверить насколько приложение и система в целом работоспособны в условиях стресса и также оценить способность системы к регенерации, т.е. к возвращению к нормальному состоянию после прекращения воздействия стресса. Стрессом в данном контексте может быть повышение интенсивности выполнения операций до очень высоких значений или аварийное изменение конфигурации сервера. Также одной из задач при стрессовом тестировании может быть оценка деградации производительности, таким образом цели стрессового тестирования могут пересекаться с целями тестирования производительности.

Объемное тестирование (Volume Testing) . Задачей объемного тестирования является получение оценки производительности при увеличении объемов данных в базе данных приложения

Тестирование стабильности или надежности (Stability / Reliability Testing) . Задачей тестирования стабильности (надежности) является проверка работоспособности приложения при длительном (многочасовом) тестировании со средним уровнем нагрузки.

Тестирование установки направленно на проверку успешной инсталляции и настройки, а также обновления или удаления программного обеспечения.

Тестирование удобства пользования - это метод тестирования, направленный на установление степени удобства использования, обучаемости, понятности и привлекательности для пользователей разрабатываемого продукта в контексте заданных условий. Сюда также входит:
Тестирование пользовательского интерфейса (англ. UI Testing) - это вид тестирования исследования, выполняемого с целью определения, удобен ли некоторый искусственный объект (такой как веб-страница, пользовательский интерфейс или устройство) для его предполагаемого применения.
User eXperience (UX) - ощущение, испытываемое пользователем во время использования цифрового продукта, в то время как User interface - это инструмент, позволяющий осуществлять интеракцию «пользователь - веб-ресурс».

Тестирование на отказ и восстановление (Failover and Recovery Testing) проверяет тестируемый продукт с точки зрения способности противостоять и успешно восстанавливаться после возможных сбоев, возникших в связи с ошибками программного обеспечения, отказами оборудования или проблемами связи (например, отказ сети). Целью данного вида тестирования является проверка систем восстановления (или дублирующих основной функционал систем), которые, в случае возникновения сбоев, обеспечат сохранность и целостность данных тестируемого продукта.

Конфигурационное тестирование (Configuration Testing) - специальный вид тестирования, направленный на проверку работы программного обеспечения при различных конфигурациях системы (заявленных платформах, поддерживаемых драйверах, при различных конфигурациях компьютеров и т.д.)

Дымовое (Smoke) тестирование рассматривается как короткий цикл тестов, выполняемый для подтверждения того, что после сборки кода (нового или исправленного) устанавливаемое приложение, стартует и выполняет основные функции.

Регрессионное тестирование - это вид тестирования направленный на проверку изменений, сделанных в приложении или окружающей среде (починка дефекта, слияние кода, миграция на другую операционную систему, базу данных, веб сервер или сервер приложения), для подтверждения того факта, что существующая ранее функциональность работает как и прежде. Регрессионными могут быть как функциональные, так и нефункциональные тесты.

Повторное тестирование - тестирование, во время которого исполняются тестовые сценарии, выявившие ошибки во время последнего запуска, для подтверждения успешности исправления этих ошибок.
В чем разница между regression testing и re-testing?
Re-testing - проверяется исправление багов
Regression testing - проверяется то, что исправление багов не повлияло на другие модули ПО и не вызвало новых багов.

Тестирование сборки или Build Verification Test - тестирование направленное на определение соответствия, выпущенной версии, критериям качества для начала тестирования. По своим целям является аналогом Дымового Тестирования, направленного на приемку новой версии в дальнейшее тестирование или эксплуатацию. Вглубь оно может проникать дальше, в зависимости от требований к качеству выпущенной версии.

Санитарное тестирование - это узконаправленное тестирование достаточное для доказательства того, что конкретная функция работает согласно заявленным в спецификации требованиям. Является подмножеством регрессионного тестирования. Используется для определения работоспособности определенной части приложения после изменений произведенных в ней или окружающей среде. Обычно выполняется вручную.

Предугадывание ошибки (Error Guessing - EG) . Это когда тест аналитик использует свои знания системы и способность к интерпретации спецификации на предмет того, чтобы «предугадать» при каких входных условиях система может выдать ошибку. Например, спецификация говорит: «пользователь должен ввести код». Тест аналитик, будет думать: «Что, если я не введу код?», «Что, если я введу неправильный код? », и так далее. Это и есть предугадывание ошибки.

Подходы к интеграционному тестированию:

Снизу вверх (Bottom Up Integration)
Все низкоуровневые модули, процедуры или функции собираются воедино и затем тестируются. После чего собирается следующий уровень модулей для проведения интеграционного тестирования. Данный подход считается полезным, если все или практически все модули, разрабатываемого уровня, готовы. Также данный подход помогает определить по результатам тестирования уровень готовности приложения.

Сверху вниз (Top Down Integration)
Вначале тестируются все высокоуровневые модули, и постепенно один за другим добавляются низкоуровневые. Все модули более низкого уровня симулируются заглушками с аналогичной функциональностью, затем по мере готовности они заменяются реальными активными компонентами. Таким образом мы проводим тестирование сверху вниз.

Большой взрыв («Big Bang» Integration)
Все или практически все разработанные модули собираются вместе в виде законченной системы или ее основной части, и затем проводится интеграционное тестирование. Такой подход очень хорош для сохранения времени. Однако если тест кейсы и их результаты записаны не верно, то сам процесс интеграции сильно осложнится, что станет преградой для команды тестирования при достижении основной цели интеграционного тестирования.

Принципы тестирования

Принцип 1 - Тестирование демонстрирует наличие дефектов (Testing shows presence of defects)
Тестирование может показать, что дефекты присутствуют, но не может доказать, что их нет. Тестирование снижает вероятность наличия дефектов, находящихся в программном обеспечении, но, даже если дефекты не были обнаружены, это не доказывает его корректности.

Принцип 2 - Исчерпывающее тестирование недостижимо (Exhaustive testing is impossible)
Полное тестирование с использованием всех комбинаций вводов и предусловий физически невыполнимо, за исключением тривиальных случаев. Вместо исчерпывающего тестирования должны использоваться анализ рисков и расстановка приоритетов, чтобы более точно сфокусировать усилия по тестированию.

Принцип 3 - Раннее тестирование (Early testing)
Чтобы найти дефекты как можно раньше, активности по тестированию должны быть начаты как можно раньше в жизненном цикле разработки программного обеспечения или системы, и должны быть сфокусированы на определенных целях.

Принцип 4 - Скопление дефектов (Defects clustering)
Усилия тестирования должны быть сосредоточены пропорционально ожидаемой, а позже реальной плотности дефектов по модулям. Как правило, большая часть дефектов, обнаруженных при тестировании или повлекших за собой основное количество сбоев системы, содержится в небольшом количестве модулей.

Принцип 5 - Парадокс пестицида (Pesticide paradox)
Если одни и те же тесты будут прогоняться много раз, в конечном счете этот набор тестовых сценариев больше не будет находить новых дефектов. Чтобы преодолеть этот «парадокс пестицида», тестовые сценарии должны регулярно рецензироваться и корректироваться, новые тесты должны быть разносторонними, чтобы охватить все компоненты программного обеспечения, или системы, и найти как можно больше дефектов.

Принцип 6 - Тестирование зависит от контекста (Testing is concept depending)
Тестирование выполняется по-разному в зависимости от контекста. Например, программное обеспечение, в котором критически важна безопасность, тестируется иначе, чем сайт электронной коммерции.

Принцип 7 - Заблуждение об отсутствии ошибок (Absence-of-errors fallacy)
Обнаружение и исправление дефектов не помогут, если созданная система не подходит пользователю и не удовлетворяет его ожиданиям и потребностям.

Cтатическое и динамическое тестирование
Статическое тестирование отличается от динамического тем, что производится без запуска программного кода продукта. Тестирование осуществляется путем анализа программного кода (code review) или скомпилированного кода. Анализ может производиться как вручную, так и с помощью специальных инструментальных средств. Целью анализа является раннее выявление ошибок и потенциальных проблем в продукте. Также к статическому тестирвоанию относится тестирования спецификации и прочей документации.

Исследовательское / ad-hoc тестирование
Простейшее определение исследовательского тестирования - это разработка и выполнения тестов в одно и то же время. Что является противоположностью сценарного подхода (с его предопределенными процедурами тестирования, неважно ручными или автоматизированными). Исследовательские тесты, в отличие от сценарных тестов, не определены заранее и не выполняются в точном соответствии с планом.

Разница между ad hoc и exploratory testing в том, что теоретически, ad hoc может провести кто угодно, а для проведения exploratory необходимо мастерство и владение определенными техниками. Обратите внимание, что определенные техники это не только техники тестирования.

Требования - это спецификация (описание) того, что должно быть реализовано.
Требования описывают то, что необходимо реализовать, без детализации технической стороны решения. Что, а не как.

Требования к требованиям:
Корректность
Недвусмысленность
Полнота набора требований
Непротиворечивость набора требований
Проверяемость (тестопригодность)
Трассируемость
Понимаемость

Жизненный цикл бага

Стадии разработки ПО - это этапы, которые проходят команды разработчиков ПО, прежде чем программа станет доступной для широко круга пользователей. Разработка ПО начинается с первоначального этапа разработки (стадия «пре-альфа») и продолжается стадиями, на которых продукт дорабатывается и модернизируется. Финальным этапом этого процесса становится выпуск на рынок окончательной версии программного обеспечения («общедоступного релиза»).

Программный продукт проходит следующие стадии:
анализ требований к проекту;
проектирование;
реализация;
тестирование продукта;
внедрение и поддержка.

Каждой стадии разработки ПО присваивается определенный порядковый номер. Также каждый этап имеет свое собственное название, которое характеризует готовность продукта на этой стадии.

Жизненный цикл разработки ПО:
Пре-альфа
Альфа
Бета
Релиз-кандидат
Релиз
Пост-релиз

Таблица принятия решений (decision table) - великолепный инструмент для упорядочения сложных бизнес требований, которые должны быть реализованы в продукте. В таблицах решений представлен набор условий, одновременное выполнение которых должно привести к определенному действию.

QA/QC/Test Engineer


Таким образом, мы можем построить модель иерархии процессов обеспечения качества: Тестирование - часть QC. QC - часть QA.

Диаграмма связей - это инструмент управления качеством, основанный на определении логических взаимосвязей между различными данными. Применяется этот инструмент для сопоставления причин и следствий по исследуемой проблеме.

Тестами в психологии называют стандартизированные методики психодиагностики, позволяющие получать сопоставимые количественные и качественные показатели степени развитости изучаемых свойств. Под стандартизированностью таких методик имеется в виду то, что они всегда и везде должны применяться одинаковым образом, начиная от ситуации и инструкции, получаемой испытуемым, кончая способами вычисления и интерпретации получаемых показателей. Сопоставимость означает, что оценки, получаемые при помощи теста, можно сравнивать друг с другом независимо от того, где? когда? как? и кем? они были получены, если, разумеется, тест применялся правильно Гуревич К.М. Что такое психологическая диагностика М.: Знание, 1985.- 80 с..

Что такое психологический тест в понимании большинства людей? Это - набор вопросов и ключ для их обработки. О том, что есть специальная процедура и правила проведения теста, о том, что тест должен быть валидным и надёжным чаще всего забывают. Даже люди, получившие профильное образование, почувствовав вольный воздух самостоятельности напрочь забывают о жёстких требованиях по проведению методик. Из многочисленных тестов выбираются самые простые в обработке или самые интересные для рекрутера. Так в практику отбора массово вошли принципиально маловалидные или неприемлемые для профотбора проективные методики, тесты: Люшера, Сонди, Несуществующее животное, Дом-дерево-человек, Розовый куст и многие другие. Методики, отлично подходящие для клинической или консультативной диагностики потоком пошли в практику отбора кандидатов и, тем самым, значительно дискредитировали все остальные методики Горшкова Е. Оценка персонала: тонкая настройка бизнеса // Управление компанией. - 2006. - № 3..

Психологическое тестирование относится к разделу психодиагностики и занимается изучением психологических качеств и свойств личности через применение психологических тестов. Этот метод часто применяется в консультировании, психотерапии, а также работодателями при приёме на работу. Психологические тесты нужны, когда требуется узнать о личности человека более подробно, чего нельзя сделать при помощи беседы или опроса.

Основными характеристиками психологических тестов являются:

ѕ Валидность - соответствие полученных из теста данных той характеристике, для которой тест проводится;

ѕ Надёжность - соответствие полученных результатов при повторном тестировании;

ѕ Достоверность - свойство теста давать истинные результаты, даже при намеренных или непреднамеренных попытках их искажения испытуемыми;

ѕ Репрезентативность - соответствие нормам.

По-настоящему эффективный тест создаётся путём проб и модификаций (изменение количества вопросов, их состава и формулировок). Тест должен пройти многоступенчатую процедуру проверки и адаптации. Действенный психологический тест - это стандартизированная проверка, на основе результатов которой становится возможным произвести оценку психофизиологических и личностных характеристик, а также знаний, умений и навыков испытуемого.

Существуют различные виды тестов:

ѕ Тесты на профориентацию - для определения предрасположенности человека к какому-либо виду деятельности или соответствия должности;

ѕ Тесты личности - для изучения характера, потребностей, эмоций, способностей и других свойств личности;

ѕ Тесты интеллекта - для изучения степени развития интеллекта;

ѕ Вербальные тесты - для изучения умения человека описывать словами совершаемые действия;

ѕ Тесты достижений - для оценки уровня овладения знаниями и навыками.

Есть и другие варианты тестов, направленных на изучение человека и особенностей его личности: цветовые тесты, лингвистические тесты, опросники, анализ почерка, психометрия, детектор лжи, различные методы диагностирования и др.

Психологические тесты очень удобно использовать в обычной жизни для того, чтобы лучше узнать себя или людей, к которым вы неравнодушны.

Практические области применения психологии: психология труда, инженерная, социальная, педагогическая, медицинская, юридическая, военная и спортивная психология - при создании и применении психодиагностических методов находят в психодиагностике общий теоретико-методологический базис для оценки личности в системе социальных, экономических и других отношений. Эти практические области психологии со своей стороны обогащают систему основных психологических знаний применением и многократной проверкой их на практике.

Психологическое тестирование применяется в образовании, для тестирования интеллекта, специальных способностей, достижений, личностных качеств, поведения и др.

Тестирование проводится в сфере профессиональной деятельности в качестве вспомогательных средств, для принятия решений о приеме на работу, расстановке кадров.

В клинической психологии и психологическом консультировании применяется тестирование и оценка психического состояния, при неспособности индивида справиться со своими трудностями или проблемами.

В нейрофизиологии проводятся нейропсихологические исследования взаимодействия мозговых патологий с поведением человека. Установлено влияние возраста на поведенческие эффекты, к которым приводит поражение мозга.

Остановимся на наиболее распространенной сфере применения психологического тестирования - отборе персонала.

Тестирование сотрудников является важнейшим компонентом в системе управления персоналом, которое позволяет оценить, как персонал компании в целом, так и каждого сотрудника индивидуально. Проводить тестирование сотрудников необходимо не только при приеме на работу, при окончании испытательного периода, при переводе на другую вакантную должность, при создании кадрового резерва, но и на регулярной основе по утвержденному генеральным директором плану. Именно тестирование сотрудников способно предоставить руководству компании реальную картину состояния дел с персоналом. Отсутствие или несвоевременное проведение мероприятий, таких, как тестирование сотрудников, может привести к весьма негативным последствиям для самой организации, когда исправить состояние дел уже почти невозможно.

Анализируя множество публикаций по теме тестирования персонала организации, можно отметить неодинаковое отношение к данному методу оценки как со стороны руководителей, так и со стороны профильных специалистов.

Совершенно очевидно, что отборные процедуры очень важны для предприятия как при приеме на работу, поскольку от правильно подобранного персонала зависит конечный результат его деятельности: получение прибыли и конкурентоспособность самого предприятия в избранном сегменте рынка, так и при отборе в кадровый резерв и отборе персонала для высвобождения.

Выборочное исследование разных источников показало невысокую результативность распространенных в практике предприятий тестов (см. табл. 1).

Таблица 1- Сравнительная эффективность тестирования кандидатов

Руководители малых и средних по размеру предприятий, проводившие оценку своих служащих, используя тестирование в качестве основного метода отбора персонала, часто не удовлетворены ее результатами.

Основные аргументы противников применения тестов следующие Маличевский В. Технология оценки и диагностики кандидатов разного уровня HQS при приеме на работу (Human quality selection) // http://www.trn.com.ua/news/2970/.:

Высокая трудоемкость тестирования при профотборе персонала;

Подготовка тестов под должность занимает много времени;

Далеко не каждый менеджер способен грамотно и корректно использовать компьютерные тестовые задания;

Распространенность психологических тестов неизвестной направленности, представленных в Интернете;

Невысокий уровень тестового прогнозирования;

Множество факторов, влияющих на кандидата как в процессе тестирования, так и в процессе работы;

Неуверенность претендентов в том, что в результате тестирования можно получить адекватное представление об их способностях.

Американская ассоциация по менеджменту привела данные, что 44 % предприятий, принявших участие в опросе, применяют тесты при отборе сотрудников. Более того, 40 % компаний из списка Fortune100 применяют психологическое тестирование Психологическое тестирование в процессе кадрового менеджмента // http:// www.podborkadrov.ru/ articles/detail.php?ID=1547..

В нашей стране эта проблема приобретает дополнительную остроту, поскольку, следуя моде на тестирование, на предприятиях используются тесты с ключами, опубликованные как в научных, так и в научно-популярных изданиях. Кроме того, в России в 80 % случаев используются тесты Векслера, Равенна, Амтхауера и Кеттелла, которые достаточно известны не только работодателям, но и работополучателям.

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

  • Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
  • Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
  • Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
  • После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

  1. дизайн и разработка
  2. тестирование
  3. реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

  1. Планирование
  2. Анализ рисков
  3. Разработка
  4. Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

  • Участие в Scrum планировании
  • Поддержка в юнит-тестировании
  • Тестирование пользовательских историй
  • Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
  • Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

  • Оценка усилий, необходимых для каждой пользовательской истории является обязательной
  • Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
  • Риск регрессии возрастает вместе с частыми изменениями в коде
  • Одновременность планирования и выполнения тестов
  • Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Особым методом исследования управления, наиболее популярным в со­временных условиях и, пожалуй, достаточно эффективным является метод тестирования.

Существует множество определений теста. Тест - это удовлетворяющая критериям исследования эмпирико-аналитическая процедура. Очень общее определение. Но есть определения и более конкретные. Например: тест - это система высказываний, позволяющая получить объективное отражение реально существующих отношений между людьми, их свойств, признаков и количественных параметров.

Но можно сформулировать более точное определение теста относительно проблем исследования управления.Тест - это метод изучения глубинных процессов деятельности человека, посредством его высказываний или оце­нок факторов функционирования системы управления.

Ошибочно бытует представление, что тестирование используется главным образом в изучении психологических проблем. Действительно, в психологии тестирование является наиболее эффективным методом изучения человека. Но сфера использования тестирования не ограничивается только психологи­ческой проблематикой.

Большую роль в исследовании при помощи тестирования играет конст­рукция теста.

Тест включает набор высказываний и оценок по определенной проблеме или ситуации. Оценки могут быть упрощенные (типа "согласен" - "не со­гласен" или шкалированные (типа "совершенно верно", "верно", "скорее верно, чем неверно", "трудно сказать", "скорее неверно, чем верно", "неверно", "совсем неверно"). Шкала может иметь цифровые оценки в виде рейтинговых коэффициентов или выбора степени согласия.

Конструкция теста должна предполагать возможность обработки его ре­зультатов по определенным статистическим программам.

Каждый тест имеет ключ, позволяющий обработать полученную инфор­мацию в соответствии с целями тестирования.

Существуют правила формулировки высказываний. Они включают сле­дующие положения(схема 34 ).

А) высказывания должны быть короткими, не более одного придаточного предложения;

Б) понятны для всех без исключения исследуемых (респондентов);

В) в высказываниях не должно быть намека на правильный, одобряемый или ожидаемый ответ;

Г) структурированные ответы по каждому из высказываний желательно иметь с одним и тем же числом альтернатив (не менее 5 и не более 11);

Д) тест не может состоять целиком из предложений, в которых высказываются только позитивные или только негативные суждения;

е) в каждом высказывании теста следует утверждать что-нибудь одно.

При составлении теста необходимо учитывать его основные характерис­тики.

Надежность - одна из главных и важнейших характеристик. Ее связы­вают с точностью, определяющей возможность измерения, перевода в ко­личественные показатели. Надежность определяется целью, задачами и ха­рактером тестового исследования, качеством высказываний.

Существуют приемы проверки надежности тестов. Они включают по­вторное тестирование, параллельное тестирование, прием раздельного коррелирования (внутренняя корреляция высказываний), использование диспер­сионного анализа, факторный анализ.

Валидность тестов - способность отражать и измерять то, что оно должен отражать и измерять по замыслу, целям. Это относится не только к самому тесту, но и к процедуре его проведения. Валидность теста может быть проверена посредством сравнительной оценки результатов, полученных другими методами, или экспериментом формирования различных групп тес­тируемых, можно проверить валидность по содержанию теста, проанализи­ровав каждое его высказывание.

В управлении при помощи тестирования можно исследовать проблемы использования ресурсов (в частности, важнейшего из них - времени), уро­вень квалификации персонала, распределение функций управления, сочета­ние формального и неформального управления, стиль управления и пр.

Тестирование.

Тестирование (англ. test - испытание, проверка) - эксперементальный метод психродиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжиования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Основоположники тестирования - Ф.Гальтон, Ч.Спирман, Дж.Каттел, А.Бине, Т.Симон. Сам термин "умственный тест" придумал Кеттел в 1890 г. Начало развития современной тестологии массового применения тестов на практике связано с именем французского врача Бине, разработавшего в соавторстве с Симоном метрическую шкалу умственного развития, известную под названием "тест Бине-Симона".

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют обёективности оценок, не зависящих от субёективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

Тесты предъявляют требования:

Строгая формализация всех этапов тестирования,

Стандартизация заданий и условий их выполнения,

Квантификация полученных результатов и их структурирование по заданной программе,

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий,

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится,

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученыный результат.

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь неодходимо учитывать, что переносить интерпретацию плученых результатов можно только на те группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров,

2) введение поправочных коэффициетнов с учетом характеристик выборки,

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос)

б) указаний относительно регистрации или интнграции полученых ответов.

Типичная для тестов стандартизация ситуации обеспечивает им в отличие от "свободного" наблюдения поведения большуюю объективность результатов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя различают тесты объективные и субъективные.

К объективным относятся большинство тестов достижений и психофизиологические тесты, к субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

Для проективных тестов типична ситуация, когда испытуемый не информирован о действительной цели исследования. При выполнениис заданий проективных тестов не существует "правильных" ответов. В зависимости от представленности в тесте речевого компонента различаются тесты вербальные и невербальные. Вербальным, например, является тест на словарный запас, невербальным - тест, требующий в качестве ответа определенных действий.

По формальной структуре различаются тесты простые,т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатичтияескими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой "идеальной норме".

Разработка теста состоит из четырех этапов.

На первомэтапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

На втором - производится отбор предварительных пунктов испытания с из последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

На третьем этапе тест проверяется повторно на той же самой популяции;

На четвертом - калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его пpоявления (напpимеp, способности, уpовень знаний, темпеpамент, интеpесы, установки);

б) связанную с этим валидизацию метода, т.е. опpеделение того, насколько он измеpяет тpебуемое свойство;

в) величину выбоpки из популяции, на котоpой должна пpоводиться оценка метода;

г) стимулиpующий матеpиал (таблички, изобpажения, игpушки, фильмы);

д) влияние исследователя в пpоцессе инстpуктиpования, постановки задач, pазъяснений, ответов на вопpосы;

е) условия ситуации;

ж) такие фоpмы поведения испытуеого, котоpые свидетельствуют об измеpяемом свойстве;

з) шкалиpование pелевантных фоpм поведения;

и) сведение pезультатов по отдельным измеpяемым пунктам в общие значения (напpимеp, суммиpование ответов типа "Да");

к) фоpмулиpовку pезультатов в ноpмиpованной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам. Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечаяя на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, крижочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал "лжи". Опросники применяются преимущественно для диагностики характера, диагностики личности (например, экстроверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций. Для таких свойств личности, как экстраверсия - интроверсия, доминирующий мотив, заторможенность, возбудимость, ригидность, разработан ряд диагностических методов (опросники и проективные тесты), с помощью которых можно определить выраженность этих свойств. При конструировании таких методов, как правило, пользуются факторным анализом (Г. Айзенк, Дж.Каттел, Дж. Гилфорд) и конструктивной валидизацией.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

Тест - это проба, испытание, один из способов психологической диагностики уровня развития психических процессов и свойств человека. Психологические тесты представляют собой определенную систему заданий, надежность которых испытывается на определенных возрастных, профессиональных, социальных группах и оценивается и стандартизируется с помощью специального математического (корреляционного, факторного и др.) анализа.

Различают тесты для изучения интеллектуальных способностей, уровня умственного развития личности и тесты успеваемости. С их помощью можно выяснить уровень развития отдельных психических процессов, уровни усвоения знаний, общего умственного развития личности. Тесты как стандартизированные методы дают возможность сравнивать уровни развития и успешности подопытных требованиям школьных программ и профессиограммы различных специальностей.

С целью избежания ошибок при использовании тестов как метода психологического исследования их содержание должно соответствовать исследуемому явлению (умственной деятельности, вниманию, памяти, воображении и т.п.) и не требуется для выполнения специальных знаний. Содержание теста и инструкция к его исполнению должны быть максимально четкими и понятными. Результаты тестового исследования нельзя оценивать как абсолютные показатели умственных возможностей личности. Они являются лишь показателями уровня развития определенных качеств на момент исследования по конкретным условиям жизни, обучения и воспитания личности.

В психологии, в частности в педагогической практике, широко применяют метод опроса , когда нужно выяснить уровень понимания подопытным задач, жизненных ситуаций, употребляемых в обучении и практической деятельности понятий (естественнонаучных, технических, социальных) или когда нужна информация об интересах, взглядах, чувствах, мотивах деятельности и поведения личности. К наиболее распространенным разновидностям опроса как метода психологического исследования относятся беседа, интервью, анкетные и социометрические исследования .

дним из видов эмпирических методов является тестирование.

Тест – кратковременное задание, выполнение которого может служить показателем совершенства некоторых психических функций. Задачей тестов является не получение новых научных дачных, а испытание, проверка.

Тесты – более или менее стандартизированные кратковременные испытания свойств личности. Существуют тесты, направленные на оценку интеллектуальных, перцептивных способностей, двигательных функций, личностных особенностей, порога возникновения тревоги, досады в определенной ситуации или интереса, проявляемого к тому или иному виду активности. Хороший тест – результат большой предварительной экспериментальной проверки. Теоретически обоснованные и экспериментально апробированные тесты имеют научное (дифференциация испытуемых по уровню развития того или иного свойства, особенностей и т. п.) и, главное, практическое (профотбор) значение.

Наиболее широко известны и популярны личностные тесты, направленные на определение уровня интеллектуального развития личности. Однако в настоящее время они все меньше и меньше применяются для отбора, хотя первоначально были созданы именно для этого. Такое ограничение применения данных тестов может быть объяснено целым рядом причин. Но именно благодаря их использованию, критике по поводу злоупотребления тестами и мерам, предпринятым для их улучшения, стали значительно лучше понимать сущность и функционирование интеллекта.

При разработке первых тестов были выдвинуты два основных требования, которым должны удовлетворять «хорошие» тесты: валидность и надежность.

Валидность теста заключается в том, что он должен оценивать именно то качество, для которого предназначен.

Надежность теста заключается в том, что его результаты воспроизводятся с хорошим постоянством у одного и того же человека.

Также очень важным является требование нормализации теста. Это означает, что для него в соответствии с данными испытания эталонной группы должны быть установлены нормы. Такая нормализация может не только четко определить группы лиц, к которым может быть применен данный тест, но и располагать результаты, получаемые при тестировании испытуемых, на кривой нормального распределения эталонной группы. Очевидно, было бы нелепо использовать нормы, полученные на студентах университета, для оценки (с помощью тех же тестов) интеллекта детей начальной школы, или применить нормы для детей из западных стран при оценке умственных способностей молодых африканцев или азиатов.

Таким образом, критерии интеллекта в такого рода тестах обусловливаются преобладающей культурой, т. е. теми ценностями, которые первоначально сложились в западно-европейских странах. При этом не учитывается, что у кого-то могут быть совершенно иное семейное воспитание, иной жизненный опыт, иные представления (в частности, о значении теста), а в некоторых случаях и плохое владение тем языком, на котором говорит большинство населения.

Тестирование - это метод психологической диагностики, использующий стандартизированные вопросы и задачи (тесты), имеющие определенную шкалу значений. Существуют три основные сферы тестирования: а) образование - в связи с увеличением продолжительности обучения и усложнением учебных программ; б) профессиональная подготовка и отбор - в связи с темпом роста и усложнением производства; в) психологическое консультирование - в связи с ускорением социодинамических процессов.

Тестирование позволяет с известной вероятностью определить актуальный уровень развития у индивида необходимых навыков, знаний, личностных характеристик. Сам процесс тестирования может быть разделен на следующие этапы: 1) выбор теста с учетом цели и степени его достоверности; 2) его проведение определяется инструкцией к тесту; 3) интерпретация результатов. На всех трех этапах нужен профессионализм, участие или консультация психолога.

Тест (англ. test - проба, испытание, проверка) - стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных или качественных индивидуально-психологических различий.

Существуют разнообразные классификации тестов. Они могут подразделяться:

1) по особенностям используемых тестовых задач на тесты вербальные и тесты практические;

2) по формам процедуры обследования - на тесты групповые и индивидуальные;

3) по направленности - на тесты интеллекта и тесты личности;

4) в зависимости от наличия или отсутствия временных ограничений - на тесты скорости и тесты результативности;

5) тесты различаются также по принципам конструирования, например, в последние десятилетия активно разрабатываются компьютерные тесты.

Вербальные тесты - тип тестов, в которых материал тестовых задач представлен в словесной (вербальной) форме. Основным содержанием работы испытуемого являются операции с понятиями, мыслительные действия в словесно-логической форме. Вербальные тесты чаще всего направлены на измерение способности к пониманию словесной информации, навыков оперирования грамматическими языковыми формами, овладения письмом и чтением, также распространены среди тестов интеллекта, тестов достижений и при оценке специальных способностей (например, тесты творческих способностей, составление рассказов и т.д.).

Практические (невербальные) тесты - тип тестов, в которых материал тестовых задач представлен заданиями в наглядной форме (например, составление фигур, дополнение изображения, определенные действия по образцу, составление изображения из кубиков или перерисовывание).

Тесты групповые - предназначены для одновременного обследования группы испытуемых. Число одновременно тестируемых лиц ограничивается, как правило, возможностями контроля и наблюдения со стороны обследующего. Обычно максимально допустимое количество лиц в обследуемой группе - 20-25 человек. Такая форма обследования для детей является более привычной, так как напоминает естественные условия обучения и осуществления контроля знаний в классе, и поэтому часто используется школьными психологами.

Следующая разновидность тестов - индивидуально-ориентированные; они реализуют индивидуальный подход к диагностике психологических особенностей и поведения испытуемого.

Тесты интеллекта (лат. intellectus - понимание, познание), или тесты общих способностей, предназначены для измерения уровня интеллектуального развития и являются одними из наиболее распространенных в психодиагностике.

Тесты специальных способностей - группа психодиагностических методик, предназначенных для измерения уровня развития отдельных аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих эффективность в конкретных, достаточно узких областях деятельности. Обычно различают следующие группы способностей: сенсорные, моторные, технические (механические) и профессионализированные (счетные, музыкальные, скорости чтения и понимания прочитанного и др.). Наибольшее распространение получили комплексные тестовые батареи способностей.

Разновидностью тестов способностей можно считать тесты креативности (лат. creatio - сотворение, создание) - группа психодиагностических методик, предназначенных для измерения творческих способностей личности (способности порождать необычные идеи, отклоняться от традиционных схем мышления, быстро решать проблемные ситуации).

Тесты личностные - группа тестов, направленных на измерение неинтеллектуальных проявлений личности. Тесты личностные - понятие собирательное, включающее в себя методы психодиагностики, с помощью которых измеряются различные стороны личности индивида: установки, ценностные ориентации, отношения, эмоциональные, мотивационные и межличностные свойства, типичные формы поведения. Известно несколько сот разновидностей личностных тестов. Они обычно имеют одну из двух форм: объективные тесты действия и ситуационные тесты. Объективные тесты действия представляют собой относительно простые, четко структурированные процедуры, ориентирующие обследуемого на выполнение какой-либо задачи. Особенностью ситуационных тестов является помещение обследуемого в ситуации, близкие к реальным.

Компьютерные тесты, несмотря на их широкое распространение и на наличие определенных плюсов (автоматизация обработки, уменьшение эффекта воздействия экспериментатора), недостаточно гибки в интерпретации данных и не могут полностью заменить работу профессионального психолога.

Тесты скорости (англ. speed tests) - тип психодиагностических методик, в которых основным показателем продуктивности работы испытуемых является время выполнения (объем) задач тестовых. Такие тесты обычно включают большое количество однородных заданий (пунктов).

Тесты достижений направлены на оценку достигнутого уровня развития навыков, знаний и умений индивида, как правило, после завершения обучения. Они относятся к наиболее многочисленной группе психодиагностических методик (по числу конкретных тестов и их разновидностей).

Кроме того, существуют и тесты, ориентированные на социально-психологический норматив или общественно заданный объективный содержательный эталон (например, ШТУР - школьный тест умственного развития).

В последнее время все большую популярность приобретает выделившийся из лабораторного психологического экспериментаметод тестирования.
Термин "тест" (по-английски - задача, или проба) был введен в 1890 г. в Англии. Тесты получили широкое распространение в детской психологии после 1905 г., когда во Франции были разработаны серии тестов для определения одаренности детей, и в практике психодиагностики после 1910 г., когда в Германии была разработана серия тестов для профессионального отбора.

Применяя тесты, можно получить относительно точную количественную или качественную характеристику изучаемого явления. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных, а также своеобразие их последующей интерпретации. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки.

Наиболее распространенные варианты теста: тест-опросник, тест-задание, проективный тест.

Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых.

Тест-задание предполагает оценку психологии и поведения человека на базе того, что он делает. В тестах этого типа испытуемому предлагается серия специальных заданий, по итогам выполнения которых судят о наличии или отсутствии и степени развития (выраженности, акцентуации) у него изучаемого качества.

Данные типы тестов применимы к людям разного возраста и пола, принадлежащим к различным культурам, имеющим разный уровень образования, любые профессии и жизненный опыт - в этом их положительная сторона. Но вместе с тем имеется и существенный недостаток, состоящий в том, что при использовании тестов испытуемый по собственному желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по результатам будут оценивать его психологию и поведение. Кроме того, такие тесты неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не может быть полностью уверен, не осознает или сознательно не хочет признавать их наличие у себя. Такими характеристиками являются, например, многие отрицательные личностные качества и мотивы поведения.

В этих случаях обычно применяютсяпроективные тесты. В основе их лежит механизм проекции, согласно которому неосознаваемые собственные качества, особенно недостатки, человек склонен приписывать другим людям. Такие тесты предназначены для изучения психологических и поведенческих особенностей людей, вызывающих негативное отношение. Применяя тесты подобного типа, о психологии испытуемого судят на основании того, как он воспринимает и оценивает ситуации, психологию и поведение людей, какие личностные свойства, мотивы положительного или отрицательного характера он им приписывает.

Пользуясь проективным тестом, психолог с его помощью вводит испытуемого в воображаемую, сюжетно неопределенную ситуацию, подлежащую произвольной интерпретации. Такой ситуацией может стать, например, поиск определенного смысла в картинке, где изображены неизвестно какие люди, непонятно чем занятые. Нужно ответить на вопросы, кто эти люди, чем они озабочены, о чем думают и что произойдет дальше. На основании содержательной интерпретации ответов судят о собственной психологии отвечающих.

Тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в этом состоит основное практическое ограничение их применимости. Кроме того, такие тесты требуют достаточно большой специальной подготовки и высокой профессиональной квалификации самого психолога.

Еще одна важная проблема, относящаяся практически ко всем без исключения типам тестов, в процессе проведения самой процедуры тестирования заключается в формальной, поверхностной интерпретации получаемых результатов эксперимента, в сознательном отказе исследователя от познания сущности изучаемого явления и подмене ее случайным итогом выполнения задания; в фетишизации математической обработки формальных результатов "тестовых испытаний".

Данная проблема непосредственно связана с ошибочными взглядами метафизической функциональной психологии, которая рассматривает каждую "психическую функцию" как нечто неизменное, "всегда само себе равное" и не связанное ни с целями и условиями деятельности человека, ни с другими психическими функциями, ни с особенностями личности в целом. В соответствии с этим тесты нацелены только на учет количественного изменения "уровня развития" каждой отдельной функции - психометрию.

Сами задачи и задания (тесты различных типов) могут при правильном их применении давать весьма ценный материал для психологического анализа, однако неподготовленный в профессиональном отношении исследователь не сможет дать ему адекватную оценку и эффективно применить главный принцип практического психолога "не навреди".

Весьма ошибочным (а нередко и приводящим на практике к весьма печальным последствиям) является мнение, что любой человек, купив популярную книгу с психологическими тестами и бегло ознакомившись с ее содержанием, может представляться окружающим психологом и заниматься тестированием на профессиональном уровне.

Таким образом, порочным является не сам тест, а его неправильное использование.

Социометрия: исследование межличностных отношений в группе.

Социометрическая техника, разработанная Дж. Морено, применяется для диагностики межличностных и межгрупповых отношений в целях их изменения, улучшения и совершенствования. С помощью социометрии можно изучать типологию социального поведения людей в условиях групповой деятельности, судить о социально-психологической совместимости членов конкретных групп.

Социометрическая процедура может иметь целью:

а) измерение степени сплоченности-разобщенности в группе;
б) выявление «социометрических позиций», т. е. соотносительного авторитета членов группы по признакам симпатии-антипатии , где на крайних полюсах оказываются «лидер» группы и «отвергнутый»;
в) обнаружение внутригрупповых подсистем, сплоченных образований, во главе которых могут быть свои неформальные лидеры.

Использование социометрии позволяет проводить измерение авторитета формального и неформального лидеров для перегруппировки людей в командах так, чтобы снизить напряженность в коллективе, возникающую из-за взаимной неприязни некоторых членов группы. Социометрическая методика проводится групповым методом, ее проведение не требует больших временных затрат (до 15 мин.). Она весьма полезна в прикладных исследованиях, особенно в работах по совершенствованию отношений в коллективе. Но она не является радикальным способом разрешения внутригрупповых проблем, причины которых следует искать не в симпатиях и антипатиях членов группы, а в более глубоких источниках.

Надежность процедуры зависит прежде всего от правильного отбора критериев социометрии, что диктуется программой исследования и предварительным знакомством со спецификой группы.

Психологическое тестирование – это метод измерения и оценки психологических характеристик человека с помощью специальных техник. Предметом тестирования могут быть любые психологические характеристики человека: психические процессы, состояния, свойства, отношения и т. п. Основой психологического тестирования является психологический тест – стандартизированная система испытаний, позволяющая обнаружить и измерить качественные и количественные индивидуально-психологические различия.

Изначально тестирование рассматривалось как разновидность эксперимента. Однако к настоящему времени специфика и самостоятельное значение тестирования в психологии позволяют отграничить его от собственно эксперимента.

Теория и практика тестирования обобщены в самостоятельных научных дисциплинах – психологической диагностике и тестологии. Психологическая диагностика – это наука о способах выявления и измерения индивидуально-психологических и индивидуально-психофизиологических особенностей человека. Таким образом, психодиагностика является экспериментально-психологическим разделом дифференциальной психологии. Тестология – это наука о разработке, конструировании тестов.

Процесс тестирования, как правило, включает в себя три этапа:

1) выбор методики, адекватной целям и задачам тестирования;

2) собственно тестирование, т. е. сбор данных в соответствии с инструкцией;

3) сравнение полученных данных с «нормой» или между собой и вынесение оценки.

В связи с наличием двух способов вынесения оценки по тесту различают два типа психологического диагноза. Первый тип заключается в констатации наличия или отсутствия какого-либо признака. В этом случае полученные данные об индивидуальных особенностях психики тестируемого соотносятся с некоторым заданным критерием. Второй тип диагноза позволяет сравнивать нескольких тестируемых между собой и находить место каждого из них на определенной «оси» в зависимости от степени выраженности тех или иных качеств. Для этого проводится ранжирование всех обследуемых по степени представленности исследуемого показателя, вводятся высокий, средний, низкий и т. д. уровни изучаемых особенностей в данной выборке.

Строго говоря, психологический диагноз есть не только результат сравнения эмпирических данных с тестовой шкалой или между собой, но и итог квалифицированной интерпретации с учетом многих привходящих факторов (психического состояния тестируемого, его готовности к восприятию заданий и отчету о своих показателях, ситуации тестирования и пр.).

Психологические тесты особенно ярко демонстрируют связь способа исследования с методологическими воззрениями психолога. Например, в зависимости от предпочитаемой теории личности исследователь выбирает тип личностного опросника.

Использование тестов – неотъемлемая черта современной психодиагностики. Можно выделить несколько областей практического использования результатов психодиагностики: сфера обучения и воспитания, сфера профессионального отбора и профессиональной ориентации, консультативная и психотерапевтическая практика и, наконец, область экспертизы – медицинской, судебной и т. п.

6.2. Возникновение и развитие метода тестирования

Возникновение метода тестирования, как уже указывалось выше, произошло в конце XIX в. на основе развития экспериментальных методов для изучения психических явлений. Возможность количественной оценки психических явлений и сопоставления на этой основе результатов разных испытуемых между собой обусловила бурное развитие метода тестирования. Вместе с этим накапливались знания об индивидуально-психологических особенностях людей.

Дифференциально-психологическое изучение человека формировалось не только как следствие развития экспериментальной психологии. Дифференциальная психология «выросла» из задач, стоявших перед медицинской и педагогической практикой, где велика была потребность в дифференциации душевнобольных и умственно отсталых людей.

Разработка психологических тестов велась во многих странах Европы и в США. Первоначально в качестве тестов использовались обычные лабораторные эксперименты, однако смысл их применения был иным. В этих экспериментах изучались не различия в реакциях испытуемого на разные стимулы, а индивидуальные различия в реакциях испытуемого при соблюдении постоянных условий эксперимента.

В 1905 г. появился первый интеллектуальный тест, соответствующий современному пониманию тестов. По заказу министерства образования Франции французский психолог А. Бине разработал тест интеллекта для выявления умственно неполноценных детей, не способных обучаться в обычных школах. В 1907 г. этот тест был усовершенствован соотечественником А. Бине Т. Симоном и получил название шкалы умственного развития Бине – Симона. Разработанная шкала содержала 30 заданий, расположенных по степени возрастания трудности. Например, для ребенка трех лет требовалось: 1) показать свои глаза, нос, рот; 2) повторить предложение длиной до шести слов; 3) повторить по памяти два числа; 4) назвать нарисованные предметы; 5) назвать свою фамилию. Если ребенок решал все задания, ему предлагались задания более старшей возрастной ступени. Задания считались соответствующими определенной возрастной ступени, если их правильно выполняло большинство (80–90 %) детей данного возраста.

Шкала Бине – Симона в последующих редакциях (1908 и 1911 гг.) была переведена на английский и немецкий языки. В этих редакциях был расширен возрастной диапазон – до 13 лет, увеличено число задач и введено понятие умственного возраста. Умственный возраст определялся по успешности выполнения тестовых заданий следующим образом: сначала ребенку предлагались задания, соответствующие его хронологическому возрасту. Если он справлялся со всеми заданиями, ему предлагали задания следующей старшей возрастной группы. Если же он не выполнял задания своей возрастной группы, ему предлагались задания предшествующей младшей возрастной группы. Базовым умственным возрастом считался тот, все задания которого были выполнены ребенком. Если ребенок выполнял, кроме них, некоторые задания из последующего старшего возраста, то к его базовому умственному возрасту добавлялось несколько «умственных месяцев».

В 1912 г. немецким психологом В. Штерном было введено понятие коэффициента интеллекта (IQ), определяемого как отношение умственного возраста к хронологическому возрасту, выраженное в процентах.

Усовершенствование шкалы А. Бине было продолжено в Стэнфордском университете (США) под руководством американского психолога Л.М. Термена. В 1916 г. был предложен новый, стандартизированный вариант этой шкалы, которую стали называть шкалой Стэнфорд – Бине. Она имела два существенных отличия от предыдущих редакций. Во-первых, в ней использовался коэффициент интеллекта, а во-вторых, вводилось понятие статистической нормы. Для каждого возраста наиболее типичный, средний показатель выполнения теста равнялся 100, а статистическая мера разброса – стандартное отклонение – 16. Таким образом, все индивидуальные результаты в пределах от 84 до 116 считались нормальными. Если тестовый показатель был выше 116, ребенок считался одаренным, если ниже 84 – умственно отсталым. Шкала Стэнфорд – Бине имела впоследствии еще несколько редакций (1937, 1960, 1972, 1986 гг.). Вновь создаваемые интеллектуальные тесты до сих пор проверяются на валидность путем сопоставления с результатами этой шкалы.

В начале XX в. развитие тестирования определялось также запросами промышленности и армии. Создавались тесты для отбора в различных отраслях производства и сферы обслуживания (тесты Мюнстерберга для профотбора телефонисток, тесты Фридриха для отбора слесарей, тесты Гута для наборщиков и др.), а также для распределения новобранцев по родам войск (тесты «Армия Альфа» и «Армия Бета»). Это привело к появлению группового тестирования. Впоследствии армейские тесты были использованы в гражданских целях.

В первой половине XX в. появился целый ряд методик, направленных на дифференциальную диагностику различных типов патологии. Немецкий психиатр Э. Крепелин продолжил работу Ф. Гальтона над методикой свободных ассоциаций. Впоследствии ассоциативный эксперимент преобразовался в «метод незаконченных предложений», широко используемый до настоящего времени. В 1921 г. швейцарским психиатром Г. Роршахом был создан «тест чернильных пятен», являющийся одной из самых популярных проективных методик.

В 1935 г. американскими психологами Х. Морган и Г. Мюрреем был разработан тест тематической апперцепции (ТАТ), который в настоящее время имеет множество модификаций. Параллельно развивались теоретические основы конструирования тестов, совершенствовались методы математико-статистической обработки. Появились корреляционный и факторный анализ (Ч. Спирмен, Т.Л. Кили, Л.Л. Терстон и др.). Это позволяло разрабатывать принципы стандартизации тестов, что давало возможность создавать согласованные тестовые батареи. В итоге были предложены методики, построенные по факторному принципу (опросник Р. Кеттелла 16PF и др.), и новые тесты интеллекта (1936 г. – тест Дж. Равена, 1949 г. – тест Д. Векслера, 1953 г. – тест Амтхауэра). В это же время совершенствовались тесты профотбора (батарея GATB для армии США в 1957 г.) и клинические тесты (опросник MMPI в 1940-е гг.).

В 1950–1960 гг. произошли важные изменения в идеологии тестирования. Если раньше тесты были направлены на отсев, отбор, типизацию людей по различным категориям, то в 1950-1960-е гг. психодиагностика обратилась к нуждам и проблемам отдельной личности. Появилось огромное количество личностных опросников, цель которых – углубленное познание личности, выявление ее особенностей (опросники Г. Айзенка и др.).

Значительное количество тестов специальных способностей и достижений было создано по запросу со стороны промышленности и образования. В середине XX столетия появились критериально-ориентированные тесты.

В настоящее время в арсенале психологов насчитывается более десяти тысяч тестовых методик.

6.3. Классификация психологических тестов

Одна из наиболее удачных классификаций предложена американским психологом С. Розенцвейгом в 1950 г. Он разделил методы психодиагностики на три группы: субъективные, объективные и проективные.

Субъективные методы, к которым Розенцвейг отнес опросники и автобиографии, требуют от субъекта наблюдения за собой как за объектом. Объективные методы требуют исследования через наблюдение за внешним поведением. Проективные методы основываются на анализе реакций испытуемого на кажущийся личностно-нейтральным материал.

Американский психолог Г.У. Оллпорт предложил различать в психодиагностике прямые и непрямые методы. В прямых методах выводы о свойствах и отношениях испытуемого делаются исходя из его сознательного отчета, они соответствуют субъективным и объективным методам Розенцвейга. В непрямых методах выводы делаются на основании идентификаций испытуемого, они соответствуют проективным методам в классификации Розенцвейга.

В отечественной психологии принято подразделять все психодиагностические методики на два типа: методики высокого уровня формализации (формализованные) и малоформализованные методики (М.К. Акимова).

Для формализованных методик характерна жесткая регламентация процедуры обследования (точное соблюдение инструкций, строго определенные способы предъявления стимульного материала и т. д.); в них предусмотрены нормы или другие критерии оценки результатов. Эти методики позволяют собирать диагностическую информацию в относительно короткие сроки, количественно и качественно сравнивать результаты большого числа испытуемых.

Малоформализованные методики дают ценные сведения об испытуемом в тех случаях, когда изучаемые явления плохо поддаются объективизации (личностные смыслы, субъективные переживания) или чрезвычайно изменчивы (состояния, настроения). Малоформализованные методы требуют высокого профессионализма психолога, значительных затрат времени. Однако полностью противопоставлять эти типы методик не следует, так как в целом они дополняют друг друга.

Всю группу формализованных методик иногда называют тестами. Однако в данной классификации они включают в себя четыре класса методик: тесты, опросники, проективные техники и психофизиологические методики. К малоформализованным методикам относятся: наблюдение, беседа, анализ продуктов деятельности.

В контексте рассматриваемой темы обратимся к классификации С. Розенцвейга, представленной и детально рассмотренной в работе В.В. Никандрова и В.В. Новочадова.

Субъективные психодиагностические методики. При использовании субъективного диагностического подхода получение информации основано на самооценке исследуемым своего поведения и личностных особенностей. Соответственно, методики, основанные на использовании принципа самооценки, называют субъективными.

Субъективные методики в психодиагностике в основном представлены опросниками. В Словаре-справочнике по психодиагностике утверждается, что к опросникам относятся психодиагностические методики, задания которых представлены в виде вопросов. Однако такое представление заданий является лишь внешним признаком, объединяющим опросники, но вовсе не достаточным для отнесения методик к этой группе, поскольку в виде вопросов формулируются задания и интеллектуальных, и проективных тестов.

По процедуре использования опросники сближаются с анкетированием. И в том и в другом случае общение между исследователем и исследуемым опосредовано анкетой или опросником. Исследуемый сам читает предлагаемые ему вопросы и сам фиксирует свои ответы. Подобная опосредованность дает возможность проведения массового психодиагностического исследования с помощью опросников. Вместе с тем существует и ряд различий, не позволяющих рассматривать анкеты и опросники как синонимы. Определяющим является различие в направленности: в отличие от анкет, выполняющих функцию сбора информации любой направленности, опросники нацелены на выявление личностных особенностей, в силу чего в них на первый план выходит признак не технологический (получение ответов на вопросы), а целевой (измерение личностных качеств). Отсюда следуют различия в специфике исследовательских процедур анкетирования и тестирования с помощью опросника. Анкетирование обычно анонимно, тестирование с помощью опросника – персонифицировано. Анкетирование, как правило, формально, ответы респондента не приводят ни к каким непосредственным последствиям, тестирование – личностно. Анкетирование более свободно по процедуре сбора информации вплоть до рассылки анкет по почте, тестирование обычно подразумевает непосредственный контакт с тестируемым.

Таким образом, опросник – это тест для выявления индивидуально-психологических различий на основе самоописания их проявлений испытуемыми. А вопросник в строгом смысле слова – это совокупность последовательно задаваемых вопросов, закладываемая в анкету или опросник при их конструировании. Опросник, таким образом, включает инструкцию испытуемому, перечень вопросов (т. е. вопросник), ключи для обработки получаемых данных, сведения по интерпретации результатов.

По принципу построения различают опросники-анкеты и собственно опросники. К опросникам-анкетам относятся методики, несущие в себе элементы анкеты. Для них характерно включение вопросов не только закрытого, но и открытого типа. Обработка закрытых вопросов производится по соответствующим ключам и шкалам, результаты дополняются и уточняются информацией, получаемой с помощью открытых вопросов. Обычно в опросники-анкеты включаются вопросы на выявление социально-демографических показателей: сведений о поле, возрасте, образовании и т. п. Опросник-анкета может целиком состоять из открытых вопросов, причем иногда количество ответов на вопросы не ограничено. Кроме того, к опросникам-анкетам принято относить методики, предмет диагностики которых слабо связан с личностными характеристиками, даже в том случае, если такие методики имеют формальные признаки опросника (например, Мичиганский скрининг-тест алкоголизма).

По сфере преимущественного применения различают узкопрофильные опросники и опросники широкого применения (широкого профиля). Узкопрофильные опросники, в свою очередь, делятся по сфере преимущественного применения на клинические, профориентационные, сферы обучения, сферы менеджмента и работы с персоналом и др. Некоторые опросники созданы специально для вузовской и школьной психодиагностики (опросник диагностики уровня школьной тревожности Филлипса), психодиагностики в сфере менеджмента (опросники самооценки деловых и личностных качеств менеджеров различных уровней, выявления степени лояльности к фирме и т. п.). Иногда узкопрофильные опросники со временем становятся опросниками широкого профиля. Например, известный Миннесотский многопрофильный личностный опросник (MMPI) создавался как сугубо клинический, для выявления психических заболеваний. Затем благодаря созданию значительного количества дополнительных неклинических шкал он стал универсальным, одним из наиболее употребительных личностных опросников.

В зависимости от того, к какой категории относится исследуемое с помощью опросника явление, выделяют опросники состояний и опросники свойств (личностные опросники). Существуют также комплексные опросники.

Психические состояния ситуационно обусловлены и измеряются минутами, часами, сутками, очень редко – неделями или месяцами. Поэтому инструкции к опросникам состояний указывают на необходимость отвечать на вопросы (или оценивать утверждения) в соответствии с актуальными (а не типичными) переживаниями, отношениями, настроениями. Довольно часто опросники состояний используются для оценки эффективности коррекционных воздействий, когда диагностируются состояния до и после сеанса воздействия или до и после серии сеансов (например, опросник САН, позволяющий оценить состояние по трем параметрам: самочувствие, активность, настроение).

Психические свойства представляют собой более устойчивые явления, чем состояния. На их выявление направлены многочисленные личностные опросники. Комплексные опросники сочетают в себе признаки опросника состояний и опросника свойств. В подобном случае диагностическая информация является более полной, поскольку состояние диагностируется на определенном фоне личностных свойств, облегчающих или затрудняющих возникновение состояния. Например, опросник Спилбергера – Ханина содержит шкалу реактивной тревожности (с помощью которой диагностируется тревожность как состояние) и шкалу личностной тревожности (для диагностики тревожности как личностного свойства).

В зависимости от степени охвата свойств личностные опросники делятся на реализующие принцип черт и типологические.

Опросники, реализующие принцип черт, подразделяются на одномерные и многомерные. Одномерные личностные опросники направлены на выявление наличия либо степени выраженности одного свойства. Выраженность свойства подразумевается в каком-то диапазоне от минимально до максимально возможного уровня. Поэтому такие опросники часто называют шкалами (например, шкала тревожности Ж. Тейлор). Достаточно часто опросники-шкалы используются в целях скрининга, т. е. отсеивания испытуемых по определенному диагностируемому признаку.

Многомерные личностные опросники направлены на измерение более чем одного свойства. Перечень выявляемых свойств, как правило, зависит от специфики области применения опросника и концептуальных воззрений авторов. Так, опросник Э. Шострома, созданный в рамках гуманистической психологии, направлен на выявление таких свойств, как принятие себя, спонтанность, самоуважение, самоактуализация, способность к близким контактам и т. п. Иногда многомерные опросники служат основой для создания одномерных опросников. Например, шкала тревожности Ж. Тейлор была создана на основе одной из шкал опросника MMPI. При этом на создаваемые одномерные опросники не могут автоматически переноситься показатели надежности и валидности исходных многомерных опросников. В данном случае требуется дополнительная оценка этих характеристик производных методик.

Количество шкал в многомерных опросниках имеет определенные пределы. Так, тестирование опросником 16PF Р. Кеттелла, оценивающим свойства личности по 16 параметрам и содержащим 187 вопросов, занимает от 30 до 50 мин. Опросник MMPI содержит 10 основных шкал и три контрольные шкалы. Испытуемый должен ответить на 566 вопросов. Время работы над опросником составляет 1,5–2 ч и, пожалуй, имеет предельную продолжительность. Как показывает практика, дальнейшее увеличение количества вопросов непродуктивно, поскольку ведет к росту почти в геометрической прогрессии необходимого для ответов времени, развитию усталости и монотонии и к падению мотивации испытуемых.

Типологические опросники создаются на основе выделения личностных типов – целостных образований, не сводимых к набору отдельных свойств. Описание типа дается через характеристику усредненного или, наоборот, ярко выраженного представителя типа. Указанная характеристика может содержать значительное количество личностных свойств, которое при этом не обязательно жестко лимитировано. И тогда целью тестирования будет выявление не отдельных свойств, а близости обследуемого человека к тому или иному личностному типу, что можно сделать с помощью опросника с достаточно небольшим числом вопросов.

Ярким примером типологических опросников являются методики Г. Айзенка. Широко используется его опросник EPI, созданный в 1963 г. и направленный на выявление интроверсии-экстраверсии и нейротизма (аффективной стабильности-нестабильности). Эти две личностные характеристики представлены в виде ортогональных осей и круга, в секторах которого выделяются четыре типа личности: экстравертированный нестабильный, экстравертированный стабильный, интровертированный стабильный, интровертированный нестабильный. Для описания типов Айзенком использовано порядка 50 коррелирующих между собой разноуровневых черт: свойства нервной системы, свойства темперамента, черты характера. Впоследствии Айзенк предложил сопоставить эти типы с типами темперамента по Гиппократу и И.П. Павлову, что было реализовано при адаптации опросника в 1985 г. А.Г. Шмелевым. При создании методики экспресс-диагностики характерологических особенностей подростков Т.В. Матолиным исходные типы личности по Айзенку были разбиты на 32 более дробных типа с описанием путей психолого-педагогического воздействия, что позволяет использовать опросник в работе педагога, школьного психолога, работника службы занятости.

По оцениваемой подструктуре личности выделяют: опросники темперамента, опросники характера, опросники способностей, опросники направленности личности; смешанные опросники. Опросники каждой из групп могут быть как типологическими, так и нетипологическими. Например, опросник темперамента может быть направлен на диагностику как отдельных свойств темперамента (активности, реактивности, сензитивности, эмоциональной возбудимости и т. д.), так и на диагностику типа темперамента в целом по одной из существующих типологий.

Из опросников диагностики темперамента большую популярность получили методики В.М. Русалова, Я. Стреляу и ряд других. Опросники составлены с таким расчетом, чтобы о свойствах темперамента конкретного испытуемого можно было бы судить по его описанию своих эмоциональных и поведенческих реакций в различных жизненных ситуациях. Диагностика темперамента с помощью таких опросников не требует специального оборудования, занимает сравнительно немного времени и может быть массовой по процедуре. Основной недостаток этих тестов заключается в том, что относимые к темпераменту поведенческие проявления несут на себе отпечаток не только темперамента, но и характера. Характер сглаживает реальные проявления некоторых свойств темперамента, благодаря чему они выступают в замаскированном виде (феномен «маскировки темперамента»). Поэтому опросники темперамента дают информацию не столько о темпераменте, сколько о типичных формах реагирования испытуемого в тех или иных ситуациях.

Опросники для диагностики характера также могут быть как опросниками отдельных черт, так и опросниками типа характера в целом. Примерами типологического подхода к характеру являются опросник X. Шмишека, направленный на выявление типа акцентуации характера по типологии К. Леонгарда, и опросник ПДО (патохарактерологический диагностический опросник), выявляющий тип акцентуации характера по типологии российского психиатра А.Е. Личко. В работах немецкого психиатра К. Леонгарда можно встретить термины «акцентуация характера» и «акцентуация личности». А.Е. Личко полагает, что правильнее было бы говорить об акцентуациях только характера, потому что в действительности речь идет именно об особенностях и типах характера, а не личности.

Диагностика способностей с помощью субъективных опросников проводится редко. Считается, что дать достоверную оценку своим способностям большинство людей не в состоянии. Поэтому при оценке способностей предпочтение отдается объективным тестам, где уровень развития способностей определяется на основе результативности выполнения испытуемыми заданий тестов. Однако ряд способностей, самооценка развития которых не вызывает включения механизмов психологической защиты, можно успешно измерять и с помощью субъективных тестов, например коммуникативные способности.

Диагностика направленности личности может представлять собой определение типа направленности в целом или исследование ее компонентов, т. е. потребностей, мотивов, интересов, установок, идеалов, ценностей, мировоззрения. Из них достаточно крупные группы методик составляют опросники интересов, опросники мотивов и опросники ценностей.

Наконец, если выявляемые опросником свойства принадлежат не к одной, а к нескольким подструктурам личности, говорят о смешанном опроснике. Это могут быть адаптированные зарубежные опросники, где нет традиции проводить границы между темпераментом и характером, характером и личностью в целом. Существуют и отечественные опросники, созданные с целью комплексной диагностики, например опросник «Черты характера и темперамента» (ЧХТ).

Объективные тесты. В рамках объективного подхода диагноз выносится на основании информации об особенностях выполнения деятельности и ее результативности. Эти показатели в минимальной степени зависят от представлений испытуемого о себе (в отличие от субъективных тестов) и от мнения лица, проводящего тестирование и интерпретацию (в отличие от проективных тестов).

В зависимости от предмета тестирования существует следующая классификация объективных тестов:

Тесты личности;

Тесты интеллекта (вербальные, невербальные, комплексные);

Тесты способностей (общих и специальных;)

Тесты креативности;

Тесты достижений (тесты действия, письменные, устные).

Тесты личности, как и личностные опросники, направлены на выявление личностных особенностей, однако уже не на основе самоописания этих особенностей испытуемым, а через выполнение им ряда заданий с четко структурированной, фиксированной процедурой. Например, тест замаскированных фигур (EFT) подразумевает поиск испытуемым простых черно-белых фигур внутри сложных цветных фигур. Результаты дают информацию о перцептивном стиле личности, определяющим показателем которого авторы теста считают «поле-зависимость» или «поле-независимость».

Тесты интеллекта направлены на оценку уровня интеллектуального развития. При узкой трактовке понятия «интеллект» применяются методики, позволяющие оценить только умственные (мыслительные) особенности человека, его умственный потенциал. При широком понимании категории «интеллект» применяются методики, позволяющие характеризовать в дополнение к мышлению и другие познавательные функции (память, пространственную ориентировку, речь и др.), а также внимание, воображение, эмоционально-волевой и мотивационный компоненты интеллекта.

Измерению в тестах интеллекта подлежит как понятийное (словесно-логическое), так и образное и наглядно-действенное (предметное) мышление. В первом случае задания обычно носят вербальный (речевой) характер и предлагают испытуемому установить логические отношения, выявить аналогии, произвести классификацию или провести обобщение между различными словами, обозначающими какие-либо предметы, явления, понятия. Применяются также математические задачи. Во втором случае предлагается выполнить задания невербального (неречевого) характера: операции с геометрическими фигурами, складывание картинок из разрозненных изображений, группировка графического материала и т. п.

Конечно, диада «образное мышление – понятийное мышление» не то же самое, что диада «невербальное мышление – вербальное мышление», поскольку словом обозначаются не только понятия, но и образы и конкретные предметы, а мыслительная работа с предметами и образами требует обращения к понятиям, например при классификации или обобщении невербального материала. Тем не менее в диагностической практике вербальные методики часто соотносятся с изучением вербального интеллекта, основным компонентом которого считается понятийное мышление, а невербальные методики – с изучением невербального интеллекта, основой которого выступает образное или предметное мышление.

Учитывая сказанное, было бы корректнее говорить не об изучении видов мышления или интеллекта, а о видах применяемых методик по изучению интеллекта: вербальные – невербальные методы. К первой категории относятся такие тесты, как «Простые и сложные аналогии», «Логические связи», «Отыскание закономерностей», «Сравнение понятий», «Исключение лишнего» (в вербальном варианте), школьный тест умственного развития (ШТУР). Примеры методик второй категории: «Пиктограммы», «Классификация картинок», тест «Прогрессивные матрицы» Дж. Равена и т. п.

Как правило, в современных тестах интеллекта в одной методике совмещаются и вербальные, и невербальные задания, например в тестах А. Бине, Р. Амтхауэра, Д. Векслера. Такие тесты являются комплексными. Тест Д. Векслера (WAIS), один из самых популярных, состоит из 11 субтестов: шести вербальных и пяти невербальных. Задания вербальных субтестов направлены на выявление общей осведомленности, понятливости, легкости оперирования числовым материалом, способностей к абстрагированию и классификации, задания невербальных субтестов – на изучение сенсомоторной координации, особенностей зрительного восприятия, способностей к организации фрагментов в логическое целое и т. д. По результатам выполнения заданий вычисляются коэффициенты интеллекта: вербального, невербального и общего.

Тесты интеллекта подвергаются постоянной критике, поскольку в большинстве случаев неясно, что же они измеряют: то ли действительно умственный потенциал человека, то ли степень обученности, т. е. его знания и навыки, которые очень сильно зависят от условий развития и воспитания. Этот факт даже послужил основанием для обозначения результатов тестирования как тестовый, или психометрический, интеллект. Систематически наблюдаемые рассогласования между фактическими достижениями в умственной деятельности и тестовым интеллектом привели к введению в психодиагностическую практику понятия «несправедливых» тестов. Особенно резко эта «несправедливость» проявляется при использовании тестов, разработанных для одной общности (социальной группы, социального слоя, национальности и т. п.), в обследовании людей другой общности, с другими культурными традициями, иным уровнем образования. В психодиагностике постоянно предпринимаются попытки создать тесты интеллекта, свободные от влияния культуры (культурно-свободный тест Р. Кеттелла).

Принято считать, что классические тесты интеллекта позволяют измерять только уровень конвергентного мышления – нетворческого, «осторожного». Другой компонент интеллекта – дивергентное (творческое) мышление – подобному тестированию не поддается. Получаемые коэффициенты (IQ) не дают представления об этой стороне интеллекта, что привело к попыткам разработки специальных методов – тестов креативности (см. ниже).

Тесты способностей – это методы, направленные на оценку возможностей человека в овладении знаниями, умениями и навыками как общего, так и частного характера. В первом случае речь идет об оценке общих способностей (сенсорных, моторных, мнемических и т. д.), во втором – об оценке способностей специальных, обычно связанных с профессиональной деятельностью (математических, музыкальных, художественных, скорости чтения и т. д.).

В зависимости от задач исследования тесты способностей часто объединяются в те или иные батареи; иногда они включаются в батареи с тестами интеллекта, например для более полной оценки способностей человека при проведении профотбора и профориентации. Батарея тестов общих способностей GATB, разработанная американской Службой занятости в 1956 г., содержит 12 субтестов на вербальные и математические способности, пространственное восприятие, моторику пальцев, моторику рук и т. д. В настоящий момент батарея GATB за счет разработки ряда ее модификаций для отдельных групп профессий относится к числу наиболее широко применяемых в зарубежной профессиональной диагностике, в частности в США.

Отдельный вид способностей представляют собой творческие способности. Совокупность творческих способностей называют креативностью. В теоретическом плане не проведена четкая грань между креативностью как качеством интеллекта, как творческой способностью и как свойством личности. Поэтому в группу тестов креативности входят весьма разнообразные методики. Наиболее известны тесты Дж. Гилфорда и Е. Торренса, разработанные на рубеже 1950-1960-х гг. Тест Е. Торренса состоит из трех субтестов, позволяющих оценить уровни развития вербального, образного и звукового творческого мышления, получить представление о качественном своеобразии этих структур креативности у разных людей. Задания требуют от испытуемого продуцировать идеи в вербальной форме, в форме некоторого рисунка, изображения. В зависимости от количества и оригинальности идей судят об уровне развития креативности испытуемого.

Тесты достижений предназначены для оценки уровня овладения знаниями, умениями и навыками в какой-либо конкретной деятельности и используются преимущественно в сферах обучения и профотбора. По типу задания различают тесты действия, письменные и устные тесты.

Тесты действия выявляют степень умения выполнять действия с определенными инструментами, орудиями, материалами, механизмами и т. п., например при тестировании машинистки, сборщика деталей, водителя автомобиля и т. д. Письменные тесты представляют собой систему вопросов и возможных ответов на специальном бланке. Иногда вопросы иллюстрируются рисунками, сопровождающими вопрос. Задача испытуемого – либо выбрать правильный словесный ответ, либо отметить на графике отображение описанной в вопросе ситуации, либо найти в рисунке деталь, дающую правильное решение соответствующего вопроса. Устные тесты – это системы устных вопросов, предусматривающие обход трудностей, возникающих из-за отсутствия у испытуемого опыта в формулировании ответов. Тесты достижений используются в первую очередь в сферах обучения и профотбора. В последнее время они приобрели огромную популярность в виде разнообразных игр на радио и телевидении.

Проективные тесты. В рамках проективного диагностического подхода получение информации основано на анализе особенностей действий испытуемого с внешне нейтральным, как бы безличным материалом, становящимся в силу его слабой структурированности и неопределенности объектом проекции. Соответственно, методики, основанные на использовании принципа проекции, называются проективными (прожективными). Понятие проекции для обозначения этих методик впервые было использовано французским психологом Л.К. Франком в 1939 г. и, несмотря на неоднократные попытки изменить их название, закрепилось, став общепринятым.

Необходимость смены названия была продиктована постепенным отходом в интерпретации методик этой группы от идей психоанализа. На сегодняшний день термин «проекция» в психологии имеет два значения; 1) в психоаналитическом понимании – один из защитных механизмов, посредством которого внутренние импульсы и чувства, неприемлемые для «Я», приписываются внешнему объекту и только тогда проникают в сознание (в этом смысле термин был впервые введен в науку 3. Фрейдом в 1894 г.); 2) в непсихоаналитическом понимании – проявления личности вовне. Каждое проявление активности (эмоциональное, речевое, двигательное) несет на себе отпечаток личности в целом. Чем менее стереотипны стимулы, побуждающие к активности, тем ярче проявление личности.

Первое описание проекции как естественной тенденции людей действовать под влиянием своих потребностей, интересов и всей психической организации (причем защитные механизмы могут проявляться, а могут и не проявляться) принадлежит американскому психологу Г.А. Мюррею. Создание теоретической концепции проекции в применимом для исследования личности виде обусловило бурное развитие проективных методик, которые в настоящий момент занимают видное положение в зарубежной психодиагностической практике.

Тестирование с помощью проективных методов имеет следующие наиболее общие особенности. В методиках используется неоднозначный, слабоструктурированный стимульный материал, допускающий большое число вариантов восприятия и интерпретации. При этом предполагается, что чем слабее он структурирован, тем выше степень проекции: «Субъект, поглощенный попытками интерпретировать вроде бы ничего субъективно не значащий материал, не замечает, как раскрывает свои волнения, страхи, желания и тревоги. Таким образом значительно снижается сопротивление при раскрытии личных, иногда очень болезненных проблем». Для преодоления сопротивления испытуемого инструкция дается ему без раскрытия истинной цели, а сама процедура тестирования нередко проходит в игровой форме. Испытуемый, как правило, не ограничивается в выборе ответов, и ответы не оцениваются как «правильные» или «ошибочные». Благодаря этим особенностям проективные методики нередко используются на начальных этапах психологической работы с клиентом или в начале комплексного психологического тестирования личности, поскольку позволяют установить контакт и вызвать интерес к обследованию. Немаловажным достоинством многих проективных методик является то, что ответы испытуемых не обязательно должны даваться в вербальной форме (как в случае с опросниками), что позволяет использовать их в работе и со взрослыми, и с детьми.

Классификация проективных методов принадлежит Л.К. Франку. Он предложил различать проективные методы в зависимости от характера реакций испытуемого. В современной, дополненной классификации проективных методов различают конститутивные, конструктивные, интерпретативные, катартические, экспрессивные, импрессивные, аддитивные методики.

Конститутивные методики характеризуются ситуацией, в которой от испытуемого требуется создать некую структуру из слабоструктурированного, аморфного материала, оформить стимулы, придать им смысл. Примером методик этой группы является тест Г. Роршаха, стимульный материал которого состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными «кляксами». Испытуемому предлагается ответить на вопрос, на что, по его мнению, похоже каждое пятно. В зависимости от ответов обследуемого судят о его переживаниях, особенностях взаимодействия с окружением, реалистичности восприятия действительности, тенденциях к беспокойству и тревожности и др. Тест Г. Роршаха в высокой степени удовлетворяет ориентацию проективной психологии на использование нестереотипных стимулов. Стимульный материал данного теста не навязывает испытуемому ответов, в связи с чем он является наиболее часто используемой в зарубежной психодиагностике проективной методикой. Попыткой дальнейшего развития принципа слабоструктурированности стимульного материала является методика «Картины облаков» В. Штерна и др., где используется напоминающий облака стимульный материал, не имеющий в отличие от «пятен Роршаха» симметрии и четкого контура. Испытуемому предлагается самостоятельно отметить контуры и рассказать о том, что изображено на картинках.

Конструктивные методики подразумевают конструирование, создание из оформленных деталей осмысленного целого. Например, стимульный материал методик «Деревня» и «Тест мира» состоит из небольших по величине предметов, количество которых в разных вариантах доходит до 300. Среди них школа, больница, мэрия, церковь, торговые лавки, деревья, автомобили, фигурки людей и животных и т. п. Испытуемому предлагается по своему усмотрению построить из этих предметов деревню, в которой он хотел бы жить, либо некоторое пространство своего существования (по терминологии авторов – «малый мир»). Определяется подход испытуемого к конструированию макета, реалистичность его построения, близость к характерным для разных контингентов построениям и т. д.

Интерпретативные методики подразумевают истолкование испытуемым какого-либо события, ситуации. Примерами являются тест тематической апперцепции (ТАТ), тесты словесных ассоциаций. Стимульный материал ТАТ представляет собой набор из 30 черно-белых изображений, на которых представлены относительно неопределенные сцены, допускающие неоднозначную интерпретацию. Испытуемому предлагается составить рассказ по каждому изображению: что там происходит, что переживают действующие лица, что этому предшествовало, чем ситуация закончится. На основе рассказа испытуемого создается представление о его переживаниях, осознаваемых и неосознаваемых потребностях, конфликтах и способах их разрешения. В тестах словесных ассоциаций стимульный материал состоит из списка не связанных между собой слов, на каждое из которых испытуемый должен как можно быстрее дать первое пришедшее на ум слово-ассоциацию. Характер и время реакции ответов дают возможность выделить наиболее «эмоционально заряженные» для данного испытуемого слова-стимулы, судить о наличии тех или иных проблемных тем.

Катартические методики представляют собой осуществление игровой деятельности в специально организованных условиях. К ним относят, в частности, психодраму Я. (Дж.) Морено, рассматриваемую как проективную методику исследования личности. В ходе мини-представления, в котором испытуемый (протагонист) играет роль самого себя или воображаемого лица в значимых для себя ситуациях, проявляются его личностные особенности, а путем аффективного отреагирования в драматических ситуациях, созвучных переживаниям испытуемого, достигается терапевтический эффект (катарсис – очищение и инсайт – озарение). Методика не имеет стандартной процедуры проведения, данных о валидности и надежности, вследствие чего применяется в качестве не столько психодиагностической, сколько психотерапевтической методики в групповой психотерапии.

В экспрессивных методиках получение информации основано на анализе рисунков испытуемого. Рисунки могут быть на свободную или заданную тему. Известны рисуночные методики «Несуществующее животное» М.З. Друкаревич, «Дом – дерево – человек» Дж. Бука, «Рисунок семьи» В. Халса, «Нарисуй человека» К. Маховер, «Мой жизненный путь» И.Л. Соломина, «Детская рука, которая беспокоит» Р. Давидо, «Лица и эмоции» А. Джахез и Н. Манши, многомерный рисуночный тест Р. Блоха, тест рисования пальцами Р. Шоу и др. По утверждению Д. Харриса, автора одной из модификаций теста «Рисунок человека» Ф. Гудинаф, «рисунки могут многое сказать об аффекте, темпераменте, отношении и личности человека, который их нарисовал».

Проведение рисуночных тестов не требует больших затрат времени, обычно допускает групповую форму. Основными подвергаемыми анализу элементами рисунка являются его размер, положение на листе (вверху, внизу, в центре, в углу), поворот рисунка влево или вправо, нажим (слабый, стандартный, сильный), характеристика линий (ровные, дрожащие, прерывистые, двойные), наклон фигуры, плотность и площадь штриховки, количество и характер деталей. Как правило, рисуночные методики подразумевают дополнение рисунка рассказом испытуемого об изображенном, составление истории по рисунку, опрос испытуемого по прилагаемому перечню вопросов. Анализируются и поведение испытуемого во время выполнения задания, его высказывания, вегетативные проявления, длительность работы над рисунком. Для увеличения достоверности интерпретации желательно проводить рисуночные методики в комплексе с другими тестами, дополнять их результатами беседы и наблюдения.

Импрессивные методики подразумевают предпочтение одних стимулов (как наиболее желательных) другим. Испытуемый оказывается в ситуации, когда необходимо либо выбрать наиболее предпочтительные стимулы, либо проранжировать стимулы по степени предпочтения. Например, в тесте Л. Сонди испытуемому предъявляются 48 портретов психически больных людей, разбитых на шесть серий, с инструкцией выбрать в каждой серии по два наиболее и наименее понравившихся портрета. В зависимости от предпочтений испытуемого судят о наиболее значимых для него «диагностических областях».

Отдельную подгруппу импрессивных тестов составляют тесты цветового выбора (цветовой тест отношений А.М. Эткинда, тест цветовых метафор И.Л. Соломина, тест цветных пирамид М. Пфистера и Р. Хайсса, «Попарные сравнения» Ю.И. Филимоненко и др.). Все эти тесты базируются на тесте швейцарского психолога М. Люшера, опубликованном в 1948 г. В основе теста Люшера лежит предположение о том, что выбор цвета отражает настроение, функциональное состояние и наиболее устойчивые черты личности. Каждый цвет спектра является пусковым сигналом, вызывающим у человека разнообразные, не осознаваемые в полной мере ассоциации. Например, с красным цветом человек сталкивается преимущественно в ситуациях опасности и напряженной борьбы (это цвет крови, огня), что приводит к ассоциированию этого цвета с соответствующим для таких ситуаций состоянием нервно-психического напряжения, мобилизованности, активного действия. Соответственно, предпочитать в ситуации тестирования красный цвет будет человек активный и хорошо отдохнувший, для которого ассоциативная специфика восприятия цвета будет соответствовать его энергетическим возможностям и мотивационным установкам, отвергать – человек утомленный и заторможенный, для которого возбуждение в данный момент неуместно, идет вразрез с наличным энергопотенциалом и установками.

Аддитивные методики подразумевают произвольное завершение испытуемым стимульного материала, например завершение предложения (методики А. Пейна, Д. Сакса и С. Леви, А. Тендлера, Дж. Роттера, Б. Форера, А. Роде и др.) или завершение истории (методики Л. Дюсса, М. Тома и др.). В зависимости от характера завершений судят о потребностях и мотивах испытуемого, его отношении к семье, сексу, вышестоящим по работе и т. д.

Классификация К. Франка неоднократно критиковалась за описательность, смешение критериев, нечеткое разделение групп методов. Непонятно, например, куда отнести тесты типа «Завершение рисунка» – к экспрессивным, конститутивным или аддитивным методам. При выделении группы катартических методов произошло смещение акцента с процесса на результат (катарсис). Вряд ли достаточно обоснован выбор характера реакций испытуемого в качестве критерия построения претендующей на полноту охвата классификации проективных методов, тем более что выделенные Франком категории оказались заданы не столько характером реакций испытуемого, сколько характером самого стимульного материала и целью исследования.

В связи с этим возникает необходимость в разведении проективных тестов по нескольким критериям. В.В. Никандров и В.В. Новочадов предлагают следующую классификационную систему проективных методик:

1) по задействованной модальности (методики с визуальной, тактильной, аудио– и иной стимуляцией);

2) по характеру стимульного материала (вербальные, невербальные);

3) по типу реакции испытуемого (ассоциативные, интерпретативные, манипулятивные, свободного выбора);

4) по наличию или отсутствию готовых вариантов ответа (проективные, полупроективные).

Большинство психодиагностических методик подразумевает задействование зрительной модальности. Это является отражением особой важности роли зрения в приеме информации у современного человека: допускается, что адресация стимульного материала глазам позволяет получать ответы, достаточно полно характеризующие личность. Тем не менее существуют методики, где стимуляция предъявляется испытуемому на слух, например в тесте словесных ассоциаций, где тестируемый должен как можно быстрее дать слово-ассоциацию на произносимое психодиагностом слово-стимул. Известны также попытки создания проективных методик, обращенных к тактильным ощущениям.

По характеру стимульного материала проективные методики могут быть вербальными, где в качестве стимула выступает слово, предложение или текст, и невербальными, с предметной, цветовой, рисуночной и прочей стимуляцией. В тестах словесных ассоциаций в качестве стимулов используются отдельные слова, в методиках типа «Завершение предложений» – незаконченные предложения, в методиках типа «Завершение истории» – неполные тексты.

Принято различать следующие типы ответов испытуемых: ассоциация, интерпретация, манипуляция (по шкале действий с предметами, материалами и др., имеющей полюсами творческую и репродуктивную манипуляцию), свободный выбор (т. е. некое распределение, ранжирование стимульного материала). В соответствии с этим проективные методики предложено делить на ассоциативные, интерпретативные, манипулятивные и методики свободного выбора.

В зависимости от наличия готовых вариантов ответа различают полупроективные методики, где испытуемому предлагается выбрать один из предложенных вариантов ответа на проективную стимуляцию (в некотором смысле – аналог закрытых опросников), и собственно проективные, где такие варианты отсутствуют. Примером полупроективной методики может быть тест Л. Сонди (обычно наиболее известные тесты называются только по фамилии, здесь именно такой случай), где испытуемому предлагается выбрать в каждой серии портретов по два понравившихся и два непонравившихся. Испытуемому может не понравиться ни один портрет, а ненравящихся может быть больше, чем два, однако принудительная инструкция ставит испытуемого в определенные условия, которым он должен следовать, что накладывает определенные ограничения на проявление его личностных свойств. Безусловными плюсами полупроективных методик являются простота количественной обработки результатов, доступность перевода методик в компьютерную форму, меньшая уязвимость относительно субъективизма интерпретатора.

Общепринятым является представление о том, что проективные тесты имеют преимущество над субъективными, поскольку позволяют выявить неосознаваемые компоненты психического. Однако необходимо заметить, что эти неосознаваемые компоненты вовсе не обязательно проявятся в результатах тестирования. По мнению Г.У. Оллпорта, нормальный, адекватно приспособленный субъект при проведении проективных тестов дает ответы, аналогичные сознательному отчету в субъективных тестах, либо благодаря достаточно развитому самоконтролю никак не проявляет свои доминирующие мотивы. Поэтому проективное тестирование приобретает особое значение только тогда, «когда в проективных реакциях обнаруживается эмоционально нагруженный материал, противоречащий сознательным отчетам. И только тогда можно с уверенностью говорить о наличии или отсутствии невротических тенденций».

Компьютерное тестирование. Это относительно молодое направление психодиагностики, связанное с использованием средств электронно-вычислительной техники. Появление компьютерной психодиагностики обусловлено развитием информационных технологий. Попытки автоматизировать предъявление испытуемому стимульного материала и последующую обработку результатов предпринимались начиная с 1930-х гг., но лишь с 1970-х гг. началось подлинное развитие компьютерной психодиагностики, обусловленное появлением персональных компьютеров. С 1980-х гг. компьютерные тесты стали разрабатываться в массовых масштабах: сначала – как компьютерные версии известных бланковых методик, а в 1990-е гг. – как специальные методики, учитывающие возможности современной техники и не употребимые в бланковом виде, поскольку рассчитаны на сложный, изменяющийся в пространстве и времени стимульный материал, специфическое звуковое сопровождение и т. п. Начало XXI в. отмечено тем, что управление тестированием все чаще передается компьютеру. Если в прошлые годы автоматизировались отдельные стадии исследования, например предъявление материала, обработка данных, интерпретация результатов, то на современном этапе все чаще можно встретить программы, которые берут на себя все обследование целиком вплоть до постановки диагноза, что сводит необходимость присутствия психолога к минимуму.

Безусловными достоинствами компьютерных тестов являются: быстрое проведение; высокая скорость и безошибочность обработки; возможность безотлагательного получения результатов; обеспечение стандартных условий тестирования для всех испытуемых; четкий контроль процедуры тестирования (невозможен пропуск вопросов, при необходимости может фиксироваться время каждого ответа, что особенно важно для тестов на интеллект); возможность исключения психолога как дополнительной переменной (что имеет особое значение при проведении экспертизы); наглядность и занимательность процесса (поддержка внимания с помощью цвета, звука, игровых элементов, что наиболее важно для обучающих программ); легкая архивация результатов; возможность объединения тестов в батареи (пакеты программ) с единой итоговой интерпретацией; мобильность экспериментатора (весь инструментарий на одной дискете); возможность проведения массовых исследований (например, через Интернет).

Недостатки компьютерных тестов: сложность, трудоемкость и дороговизна разработки программ; необходимость дорогостоящей компьютерной техники; сложность использования ЭВМ в полевых условиях; необходимость специального обучения испытуемого работе с компьютерными тестами; трудности работы с невербальным материалом, особая сложность перевода в компьютерную форму проективных тестов; отсутствие индивидуального подхода к тестируемому (потеря части психодиагностической информации, получаемой в беседе и наблюдении); латентность этапов обработки и интерпретации данных (качество этих процедур полностью зависит от разработчиков программ). У некоторых испытуемых при взаимодействии с компьютером могут возникать эффекты «психологического барьера» или «сверхдоверия». Поэтому данные о валидности, надежности и репрезентативности бланковых тестов не могут быть автоматически перенесены на их компьютерные аналоги, что ведет к необходимости новой стандартизации тестов.

Недостатки компьютерных тестов вызывают настороженное отношение к ним психологов. Мало используются такие тесты в клинической психологии, где цена ошибки слишком высока. Отечественный психолог Л.С. Выготский выделял три уровня психодиагностики: 1) симптоматический (выявление симптомов); 2) этиологический (выявление причин); 3) типологический (целостная, динамическая картина личности, на основе чего строится прогноз). Компьютерная психодиагностика на сегодняшний день находится на низшем уровне – уровне симптоматического диагноза, практически не давая материала для выявления причин и вынесения прогноза.

Тем не менее, по-видимому, компьютерные тесты имеют большое будущее. Многие из перечисленных недостатков компьютерной психодиагностики наверняка будут устранены благодаря дальнейшему развитию электронной техники и совершенствованию психодиагностических технологий. Залогом такого оптимизма является нарастающий интерес науки и практики к компьютерной диагностике, в арсенале которой уже сейчас имеется свыше 1000 компьютерных тестов.

Среди существующих компьютерных тестов можно выделить следующие их виды:

1) по структуре – аналоги бланковых тестов и собственно компьютерные тесты;

2) по количеству тестируемых – тесты индивидуального и группового тестирования;

3) по степени автоматизации тестирования – автоматизирующие один или несколько этапов обследования и автоматизирующие все обследование;

4) по задаче – диагностические и обучающие;

5) по адресату – профессиональные психологические, полупрофессиональные и непрофессиональные (развлекательные).

Пользователем профессиональных компьютерных тестов является психолог, поэтому они разрабатываются специализированными лабораториями или центрами компьютерной психодиагностики. Эти тесты имеют ряд специфических особенностей: а) наличие архива (базы данных); б) наличие пароля на вход в тест или базу данных для обеспечения конфиденциальности результатов; в) развернутая интерпретация результатов с использованием профессиональных терминов, коэффициентов, с построением графиков (профилей); г) наличие информации о разработчиках методики, сведений о валидности и надежности, справочных материалов о лежащих в основе методики теоретических положениях.

Полупрофессиональные компьютерные тесты ориентированы на специалистов смежных профессий, например на педагогов, менеджеров по персоналу. Такие тесты зачастую снабжены редуцированной интерпретацией без использования специальной лексики, просты в освоении и работе. Тесты подобного уровня могут быть предназначены и для неспециалиста, рядового пользователя персонального компьютера, интересующегося психологией. Наконец, существует также большое число непрофессиональных компьютерных тестов, направленных на популяризацию психологических идей или преследующих развлекательные цели.

Пользуясь профессиональными или полупрофессиональными компьютерными тестами, необходимо соблюдать те же этические принципы, что и при бланковом тестировании. Важно не распространять результаты тестирования и защищать свои файлы паролем, особенно если у компьютера несколько пользователей. И главное – «не сотворить себе кумира», т. е. помнить, что компьютерный тест является только средством, помощником и имеет свои границы применения.

6.4. Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.

В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.

Надежность теста. Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка ретестовой надежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее.

Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75.

Валидность теста. Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее.

Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.

Существуют следующие виды валидности теста.

Очевидная валидность. Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять.

Конкретная валидность (конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства.

Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями.

Конструктная валидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

С теоретической точки зрения единственным способом установления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вычислять значение «факторных нагрузок» – коэффициенты детерминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования.

Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

6.5. Требования к разработке, проверке и адаптации тестовых методик

Известны два пути создания психодиагностических методик: адаптация известных методик (зарубежных, устаревших, с иными целями) и разработка новых, оригинальных методик.

Адаптация теста – это комплекс мероприятий, обеспечивающих адекватность теста в новых условиях применения. Выделяют следующие этапы адаптации тестов:

1) анализ исходных теоретических положений автора теста;

2) для иностранных методик – перевод теста и инструкций к нему на язык пользователя (с обязательной экспертной оценкой соответствия оригиналу);

3) проверка надежности и валидности в соответствии с психометрическими требованиями;

4) стандартизация на соответствующих выборках.

Наиболее серьезные проблемы возникают при адаптации вербальных тестов (опросников, вербальных субтестов в составе тестов интеллекта). Эти проблемы связаны с языковыми и социокультурными различиями народов разных стран. Многовариантность перевода какого-либо термина, невозможность точной передачи идиоматических оборотов – обычное явление при переводах с языка на язык. Иногда бывает настолько сложно подобрать языковые и смысловые аналоги заданий теста, что полная его адаптация становится сопоставимой с разработкой оригинальной методики.

Понятие адаптации приложимо не только к зарубежным методикам, которые предполагается использовать в условиях нашей страны, но и к устаревшим отечественным методикам. Устаревают они достаточно быстро: в связи с развитием языка и изменчивостью социокультурных стереотипов методики должны корректироваться каждые 5–7 лет, что подразумевает уточнение формулировок вопросов, коррекцию нормативов, обновление стимульного материала, пересмотр интерпретационных критериев.

Самостоятельная разработка тестовой методики обычно состоит из следующих этапов.

1. Выбор предмета (явления) и объекта исследования (контингента).

2. Выбор вида теста (объективный, субъективный, проективный), типа заданий (с предписанными ответами, со свободными ответами) и шкал (числовые, вербальные, графические).

3. Подбор первичного банка заданий. Он может осуществляться двумя путями: вопросы формулируются исходя из теоретических представлений об измеряемом явлении (факторно-аналитический принцип) или же подбираются в соответствии с их дискриминативностью, т. е. способностью отделять испытуемых по наличию требуемого признака (критериально-ключевой принцип). Второй принцип эффективен при разработке тестов отбора (например, профессионального или клинического).

4. Оценка заданий первичного банка (содержательной валидности теста, т. е. соответствия каждого из заданий измеряемому явлению, и полноты охвата изучаемого явления тестом в целом). Проводится с помощью метода экспертной оценки.

5. Предварительное тестирование, формирование банка эмпирических данных.

6. Эмпирическая валидизация теста. Проводится с помощью корреляционного анализа оценок теста и показателей по внешнему параметру изучаемого свойства (например, школьной успеваемости при валидизации теста интеллекта, врачебного диагноза при валидизации клинических тестов, данных других тестов, валидность которых известна, и др.).

7. Оценка надежности теста (устойчивости результатов к действию случайных факторов, внешних и внутренних). Наиболее часто оцениваются ретестовая надежность (соответствие результатам повторного тестирования, обычно через несколько месяцев), надежность частей теста (устойчивость результатов отдельных задач или групп задач, например по методу «четное – нечетное») и надежность параллельных форм, если таковые существуют. Методика признается надежной, если коэффициент корреляции результатов (первичного и повторного тестирования, одной и другой частей теста, одной и другой параллельных форм) составляет не менее 0,75. При более низком показателе надежности производятся корректировка заданий теста, переформулирование вопросов, снижающих надежность.

8. Стандартизация теста, т. е. приведение процедуры и оценок к общепринятым нормативам. Стандартизация оценок подразумевает преобразование нормальной или искусственно нормализованной шкалы первичных оценок (эмпирических значений изучаемого показателя) в оценки шкальные (отражающие место в распределении результатов выборки испытуемых). Виды шкальных оценок: стены (1-10), станайны (1–9), 7-оценки (10-100) и др.

9. Определение прогностической валидности, т. е. информация о том, с какой степенью точности методика позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность также определяется по внешнему критерию, но данные по нему собираются спустя некоторое время после тестирования.

Таким образом, надежность и валидность – это собирательные понятия, включающие в себя несколько видов показателей, отражающих направленность методики на предмет исследования (валидность) и объект исследования (надежность). Степень надежности и валидности отражают соответствующие коэффициенты, указываемые в сертификате методики.

Создание методики – трудоемкая работа, требующая развитой системы заказа на методики с соответствующей оплатой труда разработчиков и гонорарами за использование авторских методик.