Методы количественной и качественной обработки данных. Качественные методы обработки данных В дипломной работе студент должен показать

Собрав совокупность данных, исследователь приступает к их обработке, получая сведения более высокого уровня, называемые результатами. Он уподобляется портному, который снял мерку (данные) и теперь все зафиксированные размеры соотносит между собой, приводит в целостную систему в виде выкройки и в конечном итоге – в виде той или иной одежды. Параметры фигуры заказчика – это данные, а готовое платье – это результат. На этом этапе могут обнаружиться ошибки в замерах, неясности в согласовании отдельных деталей одежды, что требует новых сведений, и клиент приглашается на примерку, где вносятся необходимые коррективы. Так и в научном исследовании: полученные на предыдущем этапе «сырые» данные путем их обработки приводят в определенную сбалансированную систему, которая становится базой для дальнейшего содержательного анализа, интерпретации и научных выводов и практических рекомендаций. Если по обработке данных выявляются какие-либо ошибки, пробелы, несоответствия, препятствующие построению такой системы, то их можно ликвидировать и восполнить, проведя повторные замеры.

Обработка данных направлена на решение следующих задач: 1) упорядочивание исходного материала, преобразование множества данных в целостную систему сведений, на основе которой возможно дальнейшее описание и объяснение изучаемых объекта и предмета; 2) обнаружение и ликвидация ошибок, недочетов, пробелов в сведениях; 3) выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей; 4) обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса; 5) выяснение уровня достоверности, надежности и точности собранных данных и получение на их базе научно обоснованных результатов.

Если на предыдущих этапах происходит процесс увеличения разнообразия сведений (числа параметров, единичных измерений, источников и т. п.), то теперь наблюдается обратный процесс – ограничение разнообразия, приведение данных к общим знаменателям, позволяющим делать обобщения и прогнозировать развитие тех или иных психических явлений.

Рассматриваемый этап обычно связывается с обработкой количественного характера. Качественная сторона обработки эмпирического материала, как правило, только подразумевается либо вовсе опускается. Обусловлено это, видимо, тем, что качественный анализ часто ассоциируется с теоретическим уровнем исследования, который присущ последующим стадиям изучения объекта – обсуждению и интерпретации результатов. Представляется, однако, что исследование качественного характера имеет два уровня: уровень обработки данных, где проводится организационно-подготовительная работа по первичному выявлению и упорядочиванию качественных характеристик изучаемого объекта, и уровень теоретического проникновения в сущность этого объекта. Работа первого типа характерна для стадии обработки данных, а второго – для этапа интерпретации результатов. Результат в данном случае понимается как итог и количественного, и качественного преобразования первичных данных. Тогда количественная обработка есть манипуляция с измеренными характеристиками изучаемого объекта (объектов), с его «объективизированными» во внешнем проявлении свойствами. Качественная обработка – это способ предварительного проникновения в сущность объекта путем выявления его неизмеряемых свойств на базе количественных данных.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная – преимущественно, на содержательное, внутреннее его изучение.

В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала, включающих в себя категорию «анализ» корреляционный анализ, факторный анализ и т. д. Основным гом количественной обработки является упорядоченная совокупность «внешних» показателей объекта (объектов). Реализуется количественная обработка с помощью математико-статистических методов.

В качественной обработке доминирует синтетическая составляющая познания, причем в этом синтезе превалирует компонент, объединения и в меньшей степени присутствует компонент обобщения. Обобщение – прерогатива последующего этапа исследовательского процесса – интерпретационного. В фазе качественной обработки данных главное заключается не в раскрытии сущности изучаемого явления, а пока лишь в соответствующем представлении сведений о нем, обеспечивающем дальнейшее его теоретическое изучение. Обычно результатом качественной обработки является интегрированное представление о множестве свойств объекта или множестве объектов в форме классификаций и типологий. Качественная обработка в значительной мере апеллирует к методам логики.

Противопоставление друг другу качественной и количествен ной обработок (а следовательно, и соответствующих методов) довольно условно. Они составляют органичное целое. Количественный анализ без последующей качественной обработки бессмыслен, так как сам по себе он не в состоянии превратить эмпирические данные в систему знаний. А качественное изучение: объекта без базовых количественных данных – немыслимо. В научном познании. Без количественных данных качественное познание – это чисто умозрительная процедура, не свойственная современной науке. В философии категории «качество» и «количество», как известно, объединяются в категории «мера».

Единство количественного и качественного осмысления эмпирического материала наглядно проступает во многих методах обработки данных: факторный и таксономический анализы, шкалирование, классификация и др. Но поскольку традиционно в науке принято деление на количественные и качественные характеристики, количественные и качественные методы, количественные и качественные описания, не будем «святее папы Римского» и примем количественные и качественные аспекты обработки данных за самостоятельные фазы одного исследовательского этапа, которым соответствуют определенные количественные и качественные методы.

Качественная обработка естественным образом выливается в описание и объяснение изучаемых явлений, что составляет уже следующий уровень их изучения, осуществляемый на стадии интерпретации результатов. Количественная же обработка полностью относится к рассматриваемому этапу исследовательского процесса, что в совокупности с ее особой спецификой побуждает к ее более подробному изложению. Процесс количественной обработки данных имеет две фазы: первичную и вторичную. Последовательно рассмотрим их.

Рассматриваемый этап обычно связывается с обработкой количественного характера. Качественная сторона обработки эмпирического материала, как правило, только подразумевается либо вовсе опускается. Обусловлено это, видимо, тем, что качественный анализ часто ассоциируется с теоретическим уровнем исследования, который присущ последующим стадиям изучения объекта – обсуждению и интерпретации результатов. Представляется, однако, что исследование качественного характера имеет два уровня: уровень обработки данных, где проводится организационно-подготовительная работа по первичному выявлению и упорядочиванию качественных характеристик изучаемого объекта, и уровень теоретического проникновения в сущность этого объекта. Работа первого типа характерна для стадии обработки данных, а второго – для этапа интерпретации результатов. Результат в данном случае понимается как итог и количественного, и качественного преобразования первичных данных. Тогда количественная обработка есть манипуляция с измеренными характеристиками изучаемого объекта (объектов), с его «объективизированными» во внешнем проявлении свойствами. Качественная обработка – это способ предварительного проникновения в сущность объекта путем выявления его неизмеряемых свойств на базе количественных данных.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная – преимущественно, на содержательное, внутреннее его изучение. В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала, включающих в себя категорию «анализ» корреляционный анализ, факторный анализ и т. д. Основным гом количественной обработки является упорядоченная совокупность «внешних» показателей объекта (объектов). Реализуется количественная обработка с помощью математико-статистических методов.

Первичная обработка

На первой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы, а для наглядного представления данных строятся различные диаграммы и графики. Все эти манипуляции позволяют, во-первых, обнаружить и ликвидировать ошибки, совершенные при фиксации данных, и, во-вторых, выявить и изъять из общего массива нелепые данные, полученные в результате нарушения процедуры обследования, несоблюдения испытуемыми инструкции и т. п. Кроме того, первично обработанные данные, представая в удобной для обозрения форме, дают исследователю в первом приближении представление о характере всей совокупности данных в целом: об их однородности–неоднородности, компактности-разбросанности, четкости–размытости и т. д. Эта информация хорошо читается на наглядных формах представления данных и связана с понятием «распределение данных».

Под распределением данных понимается их разнесенность по категориям выраженности исследуемого качества (признака). Разнесенность по категориям показывает, как часто (или редко) в определенном массиве данных встречаются те или иные показатели изучаемого признака. Поэтому такой вид представления данных называют «распределением частот». Выраженность признака, как видели выше, может быть представлена в оценках: «есть – нет» или «равно – неравно» (номинативные данные), «больше – меньше» (порядковые данные), «настолько-то больше или меньше» (интервальные данные), «во столько-то раз больше или меньше» (пропорциональные данные). Первая категория оценок предполагает явную дискретность выраженности изучаемого признака, остальные – непрерывность (хотя бы теоретически). Проиллюстрируем это примерами.

Пример для дискретных данных

В трехтысячном трудовом коллективе были выбраны сто человек, которые давали ответ на вопрос: «какой цвет вы предпочитаете?». Предлагалось 6 вариантов: белый (Б), черный (Ч), красный (К), синий (С), зеленый (3), желтый (Ж). В данном случае каждый цвет – это самостоятельная категория выраженности признака «окраска». Допустим, цель – выбор дизайнером окраски рабочих помещений, где трудятся эти люди. Итоги опроса, зафиксированные в протоколе, подсчитали и занесли в таблицу 1 (табулировали).

Таблица 1

Итоги опроса

Частота (абсолютная частота) – это число ответов данной категории в выборке, частость (относительная частота) – это отношение частоты ко всей выборке. Под выборкой понимается все множество полученных в исследовании значений изучаемого признака (свойства, качества, состояния) объекта. В нашем примере выборка равна 100. Понятие выборки связано с понятием генеральной совокупности (или популяции), которая представляет собой все возможное множество значений изучаемого признака. В нашем примере она равна 3000. Поскольку даже ограниченные популяции обычно весьма велики, то опыты проводятся только на выборках. Поэтому встает вопрос о репрезентативности выборки, т. е. о том, можно ли результаты, полученные на выборке, переносить на всю совокупность. Для этого привлекают статистические методы доказательства репрезентативности. Таким образом, выборка есть часть генеральной совокупности. Краткое описание этих множеств производится с помощью так называемых описательных мер (мер центральной тенденции, разброса и связи), вычисление которых производится при вторичной обработке данных. Значения мер, вычисленные для генеральных совокупностей, называются параметрами, для выборок – статистиками. Параметр описывает генеральную совокупность также, как статистика – выборку. Принято обозначать статистики латинскими буквами, а параметры – греческими. Правда, в психологических исследованиях этих правил не всегда строго придерживаются.

На основании табличных данных можно построить диаграмму, где распределение представлено нагляднее:

Пример для непрерывных данных

Данные непрерывного характера можно представить веще более наглядной форме: в виде гистограмм, полигонов икривых.

В опытах В. К. Гайды, описанных в учебном пособии для студентов-психологов , участвовало 96 испытуемых. Определялся цвет последовательного образа восприятия насыщенного красного цвета. С этой целью каждый испытуемый в течение одной минуты рассматривал окрашенный в красный цвет образец, а затем переносил взгляд на белый экран, где видел круг в дополнительных цветах. Рядом с ним находился цветовой круг с разноокрашенными секторами, на котором испытуемый должен был выбрать тот цвет, который соответствовал цвету возникшего у него последовательного образа. При этом испытуемый не называл цвет, а лишь его номер в цветовом круге. Цветовой круг нормирован таким образом, что соседние цвета отличаются в нем друг от друга на одинаково замечаемую величину. Следовательно, цветовой круг можно рассматривать как интервальную шкалу. Наряду с этим цветовой круг характеризуется и еще одним свойством. В частности, можно себе представить, что между двумя соседними цветами, например между зеленовато-голубым и голубовато-зеленым, имеется еще множество не замечаемых человеческим глазом цветовых переходов. В этом смысле цветовой круг представляет собой пример непрерывной переменной. Фактически же испытуемые всегда выделяют конечное число цветовых оттенков и поэтому свой выбор останавливают на конкретном номере (или названии) цвета. В рассматриваемом эксперименте испытуемые определяли свой последовательный образ в диапазоне от № 16 – зеленовато-голубой цвет до № 23 – желтовато-зеленый. Полученные данные можно табулировать, что и сделано в таблице 2.

Таблица 2

Как видно, в построении таблиц 1 и 2 нет принципиального различия. Но разница в характере первичных данных, отображенных в обеих таблицах, все же есть, и она обнаруживается при их графическом изображении. В самом деле, рис. 2 представляет собой уже не столбиковую, а ступенчатую диаграмму, называемую гистограммой. Следует обратить внимание на то, что все участки (столбики) ступенчатой диаграммы расположены вплотную друг к другу (числовые переменные на оси абсцисс гистограммы пишут против центральной оси каждого участка).

От гистограммы легко перейти к построению частотного полигона распределения, а от последнего – к кривой распределения. Частотный полигон строят, соединяя прямыми отрезками верхние точки центральных осей всех участков ступенчатой диаграммы (рис. 3). Если же вершины участков соединить с помощью плавных кривых линий, то получится кривая распределения первичных результатов (рис. 4).

Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.

Вторичная обработка

Обработка данных психологических исследований – отдельный раздел экспериментальной психологии, тесно связанный с математической статистикой и логикой. Обработка данных направлена на решение следующих задач:

Упорядочивание полученного материала;

Обнаружение и ликвидация ошибок, недочетов, пробелов в сведениях;

Выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей;

Обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса;

Выяснение уровня достоверности, надежности и точности собранных данных и получение на их базе научно обоснованных результатов.

Различают количественную и качественную обработку данных. Количественная обработка – это работа с измеренными характеристиками изучаемого объекта, его «объективированными» свойствами. Качественная обработка представляет собой способ проникновения в сущность объекта путем выявления его неизмеряемых свойств.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная – преимущественно на содержательное, внутреннее его изучение. В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала: корреляционный анализ, факторный анализ и т. д. Реализуется количественная обработка с помощью математико-статистических методов.

В качественной обработке преобладают синтетические способы познания. Обобщение проводится на следующем этапе исследовательского процесса – интерпретационном. При качественной обработке данных главное заключается в соответствующем представлении сведений об изучаемом явлении, обеспечивающем дальнейшее его теоретическое изучение. Обычно результатом качественной обработки является интегрированное представление о множестве свойств объекта или множестве объектов в форме классификаций и типологий. Качественная обработка в значительной мере апеллирует к методам логики.

Противопоставление друг другу качественной и количественной обработки довольно условно. Количественный анализ без последующей качественной обработки бессмыслен, так как сам по себе не приводит к приращению знаний, а качественное изучение объекта без базовых количественных данных в научном познании невозможно. Без количественных данных научное познание – чисто умозрительная процедура.

Единство количественной и качественной обработки наглядно представлено во многих методах обработки данных: факторном и таксономическом анализе, шкалировании, классификации и др. Наиболее распространены такие приемы количественной обработки, как классификация, типологизация, систематизация, периодизация, казуистика.

7.2. Первичная статистическая обработка данных

Все методы количественной обработки принято подразделять на первичные и вторичные.

Первичная статистическая обработка нацелена на упорядочивание информации об объекте и предмете изучения. На этой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы. Первично обработанные данные, представленные в удобной форме, дают исследователю в первом приближении понятие о характере всей совокупности данных в целом: об их однородности – неоднородности, компактности – разбросанности, четкости – размытости и т. д. Эта информация хорошо считывается с наглядных форм представления данных и дает сведения об их распределении.

В ходе применения первичных методов статистической обработки получаются показатели, непосредственно связанные с производимыми в исследовании измерениями.

К основным методам первичной статистической обработки относятся: вычисление мер центральной тенденции и мер разброса (изменчивости) данных.

Первичный статистический анализ всей совокупности полученных в исследовании данных дает возможность охарактеризовать ее в предельно сжатом виде и ответить на два главных вопроса: 1) какое значение наиболее характерно для выборки; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных. Для решения первого вопроса вычисляются меры центральной тенденции, для решения второго – меры изменчивости (или разброса). Эти статистические показатели используются в отношении количественных данных, представленных в порядковой, интервальной или пропорциональной шкале.

Меры центральной тенденции – это величины, вокруг которых группируются остальные данные. Данные величины являются как бы обобщающими всю выборку показателями, что, во-первых, позволяет судить по ним обо всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам центральной тенденции в обработке результатов психологических исследований относятся: выборочное среднее, медиана, мода.

Выборочное среднее (М) – это результат деления суммы всех значений (X) на их количество (N).

Медиана (Me) – это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Медиана не обязательно должна совпадать с конкретным значением. Совпадение происходит в случае нечетного числа значений (ответов), несовпадение – при четном их числе. В последнем случае медиана вычисляется как среднее арифметическое двух центральных значений в упорядоченном ряду.

Мода (Мо) – это значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой. Если все значения в группе встречаются одинаково часто, то считается, что моды нет. Если два соседних значения имеют одинаковую частоту и больше частоты любого другого значения, мода есть среднее этих двух значений. Если то же самое относится к двум несмежным значениям, то существует две моды, а группа оценок является бимодальной.

Обычно выборочное среднее применяется при стремлении к наибольшей точности в определении центральной тенденции. Медиана вычисляется в том случае, когда в серии есть «нетипичные» данные, резко влияющие на среднее. Мода используется в ситуациях, когда не нужна высокая точность, но важна быстрота определения меры центральной тенденции.

Вычисление всех трех показателей производится также для оценки распределения данных. При нормальном распределении значения выборочного среднего, медианы и моды одинаковы или очень близки.

Меры разброса (изменчивости) – это статистические показатели, характеризующие различия между отдельными значениями выборки. Они позволяют судить о степени однородности полученного множества, его компактности, а косвенно и о надежности полученных данных и вытекающих из них результатов. Наиболее используемые в психологических исследованиях показатели: среднее отклонение, дисперсия, стандартное отклонение.

Размах (Р) – это интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.

Среднее отклонение (МД) – это среднеарифметическое разницы (по абсолютной величине) между каждым значением в выборке и ее средним.

где d = |Х – М |, М – среднее выборки, X – конкретное значение, N – число значений.

Множество всех конкретных отклонений от среднего характеризует изменчивость данных, но если не взять их по абсолютной величине, то их сумма будет равна нулю и мы не получим информации об их изменчивости. Среднее отклонение показывает степень скученности данных вокруг выборочного среднего. Кстати, иногда при определении этой характеристики выборки вместо среднего (М) берут иные меры центральной тенденции – моду или медиану.

Дисперсия (D) характеризует отклонения от средней величины в данной выборке. Вычисление дисперсии позляет избежать нулевой суммы конкретных разниц (d = Х – М) не через их абсолютные величины, а через их возведение в квадрат:

где d = |Х – М|, М – среднее выборки, X – конкретное значение, N – число значений.

Стандартное отклонение (б). Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии полученная величина оказывается далекой от первоначальных отклонений и потому не дает о них наглядного представления. Чтобы этого избежать и получить характеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и принимается за меру изменчивости, именуемую среднеквадратическим, или стандартным, отклонением:

где d = |Х– М|, М – среднее выборки, X– конкретное значение, N – число значений.

МД, D и? применимы для интервальных и пропорционных данных. Для порядковых данных в качестве меры изменчивости обычно берут полуквартильное отклонение (Q), именуемое еще полуквартильным коэффициентом. Вычисляется этот показатель следующим образом. Вся область распределения данных делится на четыре равные части. Если отсчитывать наблюдения начиная от минимальной величины на измерительной шкале, то первая четверть шкалы называется первым квартилем, а точка, отделяющая его от остальной части шкалы, обозначается символом Qv Вторые 25 % распределения – второй квартиль, а соответствующая точка на шкале – Q2. Между третьей и четвертой четвертями распределения расположена точка Q3. Полуквартильный коэффициент определяется как половина интервала между первым и третьим квартилями:

При симметричном распределении точка Q2 совпадет с медианой (а следовательно, и со средним), и тогда можно вычислить коэффициент Q для характеристики разброса данных относительно середины распределения. При несимметричном распределении этого недостаточно. Тогда дополнительно вычисляют коэффициенты для левого и правого участков:

7.3. Вторичная статистическая обработка данных

К вторичным относят такие методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. Вторичные методы можно подразделить на способы оценки значимости различий и способы установления статистических взаимосвязей.

Способы оценки значимости различий. Для сравнения выборочных средних величин, принадлежащих к двум совокупностям данных, и для решения вопроса о том, отличаются ли средние значения статистически достоверно друг от друга, используют t-критерий Стьюдента. Его формула выглядит следующим образом:

где М1, М2 – выборочные средние значения сравниваемых выборок, m1, m2 – интегрированные показатели отклонений частных значений из двух сравниваемых выборок, вычисляются по следующим формулам:

где D1, D2 – дисперсии первой и второй выборок, N1, N2 – число значений в первой и второй выборках.

t по таблице критических значений (см. Статистическое приложение 1), заданного числа степеней свободы (N 1 + N 2 – 2) и избранной вероятности допустимой ошибки (0,05, 0,01, 0,02, 001 и т.д.) находят табличное значение t. Если вычисленное значение t больше или равно табличному, делают вывод о том, что сравниваемые средние значения двух выборок статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.

Если в процессе исследования встает задача сравнить неабсолютные средние величины, частотные распределения данных, то используется?2критерий (см. Приложение 2). Его формула выглядит следующим образом:

где Pk – частоты распределения в первом замере, Vk – частоты распределения во втором замере, m – общее число групп, на которые разделились результаты замеров.

После вычисления значения показателя?2по таблице критических значений (см. Статистическое приложение 2), заданного числа степеней свободы (m – 1) и избранной вероятности допустимой ошибки (0,05, 0,0 ?2t больше или равно табличному) делают вывод о том, что сравниваемые распределения данных в двух выборках статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.

Для сравнения дисперсий двух выборок используется F-критерий Фишера. Его формула выглядит следующим образом:

где D 1, D 2 – дисперсии первой и второй выборок, N 1, N 2 – число значений в первой и второй выборках.

После вычисления значения показателя F по таблице критических значений (см. Статистическое приложение 3), заданного числа степеней свободы (N 1 – 1, N2 – 1) находится F кр. Если вычисленное значение F больше или равно табличному, делают вывод о том, что различие дисперсий в двух выборках статистически достоверно.

Способы установления статистических взаимосвязей. Предыдущие показатели характеризуют совокупность данных по какому-либо одному признаку. Этот изменяющийся признак называют переменной величиной или просто переменной. Меры связи выявляют соотношения между двумя переменными или между двумя выборками. Эти связи, или корреляции, определяют через вычисление коэффициентов корреляции. Однако наличие корреляции не означает, что между переменными существует причинная (или функциональная) связь. Функциональная зависимость – это частный случай корреляции. Даже если связь причинна, корреляционные показатели не могут указать, какая из двух переменных является причиной, а какая – следствием. Кроме того, любая обнаруженная в психологических исследованиях связь, как правило, существует благодаря и другим переменным, а не только двум рассматриваемым. К тому же взаимосвязи психологических признаков столь сложны, что их обусловленность одной причиной вряд ли состоятельна, они детерминированы множеством причин.

По тесноте связи можно выделить следующие виды корреляции: полная, высокая, выраженная, частичная; отсутствие корреляции. Эти виды корреляций определяют в зависимости от значения коэффициента корреляции.

При полной корреляции его абсолютные значения равны или очень близки к 1. В этом случае устанавливается обязательная взаимозависимость между переменными. Здесь вероятна функциональная зависимость.

Высокая корреляция устанавливается при абсолютном значении коэффициента 0,8–0,9. Выраженная корреляция считается при абсолютном значении коэффициента 0,6–0,7. Частичная корреляция существует при абсолютном значении коэффициента 0,4–0,5.

Абсолютные значения коэффициента корреляции менее 0,4 свидетельствуют об очень слабой корреляционной связи и, как правило, в расчет не принимаются. Отсутствие корреляции констатируется при значении коэффициента 0.

Кроме того, в психологии при оценке тесноты связи используют так называемую «частную» классификацию корреляционных связей. Она ориентирована не на абсолютную величину коэффициентов корреляции, а на уровень значимости этой величины при определенном объеме выборки. Эта классификация применяется при статистической оценке гипотез. При данном подходе предполагается, что чем больше выборка, тем меньшее значение коэффициента корреляции может быть принято для признания достоверности связей, а для малых выборок даже абсолютно большое значение коэффициента может оказаться недостоверным.

По направленности выделяют следующие виды корреляционных связей: положительная (прямая) и отрицательная (обратная). Положительная (прямая) корреляционная связь регистрируется при коэффициенте со знаком «плюс»: при увеличении значения одной переменной наблюдается увеличение другой. Отрицательная (обратная) корреляция имеет место при значении коэффициента со знаком «минус». Это означает обратную зависимость: увеличение значения одной переменной влечет за собой уменьшение другой.

По форме различают следующие виды корреляционных связей: прямолинейную и криволинейную. При прямолинейной связи равномерным изменениям одной переменной соответствуют равномерные изменения другой. Если говорить не только о корреляциях, но и о функциональных зависимостях, то такие формы зависимости называют пропорциональными. В психологии строго прямолинейные связи – явление редкое. При криволинейной связи равномерное изменение одного признака сочетается с неравномерным изменением другого. Эта ситуация для психологии типична.

Коэффициент линейной корреляции по К. Пирсону (r) вычисляется c помощью следующей формулы:

где х X от среднего выборки (Мх), у – отклонение отдельного значения Y от среднего выборки (М у), Ьх – стандартное отклонение для X, ?y – стандартное отклонение для Y, N – число пар значений X и Y.

Оценка значимости коэффициента корреляции проводится по таблице (см. Статистическое приложение 4).

При сравнении порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену (R):

где d – разность рангов (порядковых мест) двух величин, N – число сравниваемых пар величин двух переменных (X и Y).

Оценка значимости коэффициента корреляции проводится по таблице (см. Статистическое приложение 5).

Внедрение в научные исследования автоматизированных средств обработки данных позволяет быстро и точно определять любые количественные характеристики любых массивов данных. Разработаны различные программы для компьютеров, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов в психологии наибольшее распространение получили следующие: 1) комплексное вычисление статистик; 2) корреляционный анализ; 3) дисперсионный анализ; 4) регрессионный анализ; 5) факторный анализ; 6) таксономический (кластерный) анализ; 7) шкалирование. Познакомиться с характеристиками этих методов можно в специальной литературе («Статистические методы в педагогике и психологии» Стенли Дж., Гласа Дж. (М., 1976), «Математическая психология» Г.В. Суходольского (СПб., 1997), «Математические методы психологического исследования» А.Д. Наследова (СПб., 2005) и др.).

Математические методы в психологии используются как средство повышения надежности, объективности, точности получаемых данных. Эти методы становятся необходимыми, когда исследователь работает одновременно с несколькими переменными, с набором гипотез, с большим эмпирическим материалом.

К методам обработки данных относят и качественный анализ. Качественный анализ (дифференциация материала по типам, группам, вариантам) позволяет создавать классификации, типологии и т.п. Одним из обрабатывающих способов качественного анализа является психологическая казуистика – описание случаев, как наиболее типичных для данной популяции.

Генетический метод интерпретирует весь обработанный материал исследования в характеристиках развития, выделяя фазы, стадии процесса становления психических функций, свойств личности. С его помощью можно исследовать происхождение и развитие у ребенка тех или иных психических процессов, изучить, какие этапы в него включены, какие факторы на него влияют. Генетический метод включает в себя метод поперечных срезов и метод продольных срезов (лонгитюдный), применяется в возрастной и генетической психологии. Лонгитюдный метод предполагает многократные обследования одних и тех же лиц на протяжении многих лет. Метод поперечных срезов осуществляется при прослеживании и сравнении того. Как выполняются одни и те же задачи на последовательных ступенях развития ребенка.

Структурный метод интерпретирует весь обработанный материал исследования в характеристиках систем и типов связей между ними, образующих личность, социальную группу и т.д.

Теоретические методы психологического исследования : а) дедуктивный – восхождение от общего к частному, от абстрактного к конкретному; результатом становится теория, закон; б) индуктивный – обобщение фактов, восхождение от частного к общему; результатом становится гипотеза, закономерность, классификация, систематизация; в) моделирование - умозаключение от частного к частному, когда в качестве аналога более сложного объекта берется более простой и доступный для исследования; результатом становится модель объекта, процесса, состояния.

Метод моделирования . Моделирование применяется тогда, когда изучение исследуемого явления с помощью наблюдения, эксперимента, опроса затруднено в силу его сложности и недоступности, или по моральным соображениям. Такими объектами, например, являются Вселенная, Солнечная система, человек как объект психофармакологических исследований. Модели могут быть техническими, логическими, математическими, кибернетическими. В медицине и психологии модели могут быть биологическими – крысы, обезьяны, кролики. Модель является аналогом изучаемого объекта.

Качество - это совокупность свойств, указывающих, что представляет собой предмет, чем он является. Количество определяет размеры, величину этого качества. Качество традиционно раскрывается через описание признаков, а количество отождествляется с мерой, числом. Анализируя качество, исследователь определяет, к какому классу уже известных явлений принадлежит данное и в чем его специфика, затем устанавливает причинно-следственные зависимости между явлениями. Задача количественного анализа сводится к измерению и счету выявленных свойств. Разрешая ее, ищут ответ на вопрос, какая мера качества входит в установленную меру. Дополняя качественные представления о своем предмете формализованными обобщениями, педагогическая теория приобретает необходимую строгость и устойчивость.

Необходимо различать два основных направления в использовании количественных методов в педагогике: первое - для обработки результатов наблюдений и экспериментов, второе - для моделирования, диагностики, прогнозирования, компьютеризации учебно-воспитательного процесса. Методы первого направления:

- регистрация - выявление определенного качества у явлений данного класса и подсчет количества по наличию или отсутствию данного качества (например, количество успевающих и неуспевающих учеников);

- ранжирование - расположение собранных данных в определенной последовательности (убывания или нарастания зафиксированных показателей), определение места в этом ряду изучаемых объектов (например, составление списка учеников в зависимости от числа пропущенных занятий и т. п.);

- шкалирование - присвоение баллов или других цифровых показателей исследуемым характеристикам, чем достигается большая определенность. Известны четыре основных градации измерительных шкал: шкалы наименований (или номинальные); шкалы порядка (или ранговые); интервальные шкалы; шкалы отношений.

Шкалы наименований - самые «слабые», числа и другие обозначения в них используются чисто символически. Их единственная математическая характеристика - принадлежность: принадлежит ли исследуемый объект к данному классу или нет. Примерами номинальных шкал можно считать классификации по различным признакам - список специальностей, перечисление характеристик обучаемых, наименования причин неуспеваемости и т. д.

В порядковых (ранговых) шкалах устанавливается порядок следования, отношения «больше» и «меньше», общая иерархия. Примерами их применения служит ранжирование типа «выше ростом», «больше пятерок», «меньше пропусков» и т. д.

«Сильные» шкалы - интервальная и шкала отношений - обладают всеми положительными качествами «слабых» шкал, но при этом интервальная шкала предусматривает определенные расстояния между отдельными (двумя любыми) числами на шкале, а в шкале отношений, кроме того, определена еще и нулевая точка (точка отсчета). Шкалы термометров, вольтметров, конечно, «сильные».

Все более мощным преобразующим средством педагогических исследований становится моделирование . Научная модель - это мысленно представленная или материально реализованная система, которая адекватно отображает предмет исследования и способна замещать его так, что изучение модели позволяет получить новую информацию об объекте. Моделирование успешно применяется для решения важных задач оптимизации структуры учебного материала, улучшения планирования учебного процесса, управления познавательной деятельностью и учебно-воспитательным процессом, диагностики, прогнозирования, проектирования обучения.

Моделирование - сложный и противоречивый метод. По существу он служит трем полезным целям: эвристической - для классификации, обозначения, нахождения новых законов, построения новых теорий и интерпретации полученных данных; вычислительной - для решения вычислительных проблем с помощью моделей; экспериментальной - для решения проблемы эмпирической проверки (верификации) гипотезы с помощью оперирования с теми или иными моделями.

Тематические материалы: