НАЗАД Мангейм Дж., Рич Р.К. Политология. Методы исследования ВПЕРЕД.
Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
8. ШКАЛИРОВАНИЕ
Одна из проблем, наиболее часто встречающихся при планировании опроса и подготовке инструментария для него, заключается в том, каким образом следует приписывать единое репрезентативное значение или оценку (score) некоторому сложному отношению или поведению. В качестве примера рассмотрим, как можно было бы измерить предубежденность населения против студентов колледжей. Такая предубежденность может проявляться в самых разных формах в зависимости от того, на каких признаках студентов сосредоточено внимание конкретного индивида (респондента). Так, некоторые люди судят о студентах по одежде, другие – по манерам, третьи – по поведению в повседневной жизни, по социально-экономическому статусу и даже по уровню личной гигиены. У иных стереотипное мнение могло сложиться на основании всего одной-двух встреч (приятных либо нет) с какими-то конкретными студентами; а кто-то, возможно, вообще едва ли способен отличить студента от других людей. Элементы суждения могут сильно варьировать по содержанию, направленности, степени оценки, но каждый и” них представляет собой – по крайней мере потенциально – компонент более широкого понятия “предубежденность”.
Если мы хотим учесть все эти моменты, то нам надо подобрать такой инструмент, который сумеет выявлять и измерять как можно больше подобных составных элементов понятий и одновременно будет достаточно точен, чтобы позволять осмысленным образом определять степень проявления общего понятия в единичном наблюдении. Иными словами, нам нужно такое средство, которое бы улавливало и отображало понятие, подобное понятию “предубежденность”, во всех деталях, а кроме того, показывало бы нам, сколько (какая доля) этого понятия содержится в том или ином случае или ответе респондента. Одно из таких средств называется шкалированием.
Шкалирование – это процедура объединения ряда относительно узких показателей (в нашем примере это пункты [c.250] опроса, касающиеся отдельных отмеченных респондентами признаков студентов) в единую суммарную меру, которая принимается за отображение более широкого основного понятия (в нашем случае – предубежденности), частью которого является каждый отдельный признак. Так, мы могли бы измерить отношение респондента к различным видам поведения студентов (например, к тому, сколько они употребляют алкогольных напитков, или к тому, сколь шумны их вечеринки) или к манерам студентов (к тому, насколько они чванливы, самонадеянны или невнимательны к другим людям), но ни один из этих признаков в отдельности мы не могли бы принять за полноценное отображение столь широкого понятия, как предубежденность. Нам скорее следовало бы каким-то образом свести все эти меры воедино, чтобы иметь возможность делать выводы о более общей точке зрения, которую каждая из них в чем-то дополняет и отображает. Более того, нам нужно решить эту задачу так, чтобы можно было сравнивать количество предубежденности (или любого другого измеряемого нами понятия), содержащееся в ответе одного респондента, с количеством ее, содержащимся в ответе другого респондента, и в конечном итоге судить о том, кто из респондентов предубежден более.
Унифицирующая мера, отображающая определенное основное понятие, называется шкалой. Частное значение степени проявления в каждом данном случае основного понятия называется шкальной оценкой. Шкалирование, или построение шкалы, – это процедура, с помощью которой исследователь формирует шкалу и приписывает отдельным случаям оценки на этой шкале. [c.251]
ПОСТРОЕНИЕ ШКАЛЫ: ДВЕ ОСНОВНЫЕ ПРОБЛЕМЫ
Из вышеизложенного шкалирование может показаться достаточно простой, прямолинейной процедурой, когда в задачу исследователя входит просто идентифицировать ряд компонентов основного понятия, установить, каким показателем можно измерить каждый из них, затем объединить эти показатели в суммарную оценку с помощью произнесения нескольких волшебных слов или статистических заклинаний, и – раз-два! – дело сделано. К сожалению, эта видимая простота обманчива, потому что при отборе и интерпретации [c.251] компонентов шкалы нам может встретиться целый ряд подводных камней, требующих особой внимательности. С наиболее существенными из них мы уже знакомы – это проблемы, связанные с понятиями валидности (обоснованности) и надежности.
Валидность, как вы помните, – это свойство, определяемое ответом на вопрос: “Действительно ли мы измеряем именно то, что хотим измерить?” В теперешнем нашем контексте этот вопрос может быть несколько трансформирован следующим образом: “Есть ли основания полагать, что каждый из отдельных компонентов шкалы (каждый из конкретных вопросов) действительно напрямую связан с основным понятием и что все компоненты в совокупности полностью охватывают это понятие?” Иначе говоря, мы должны задаться вопросом: “А есть ли реальный смысл в том, чтобы объединять между собой ряд частных показателей, и – коли уж мы это сделали – есть ли смысл навешивать на этот ряд показателей избранный нами ярлык основного понятия?” Так, обращаясь снова к примеру со студентами, мы должны спросить себя, во-первых, действительно ли мнение человека о поведении студентов непосредственно связано с его мнением о студенческом стиле одежды или о манерах студентов, и во-вторых, действительно ли все эти мнения в совокупности отражают степень предубежденности данного лица против студентов.
Что касается надежности, то она определяется ответом на вопрос: “Вне зависимости от того, что конкретно мы измеряем, последовательно ли мы это делаем?” Применительно к шкалированию этот вопрос трансформируется в заботу о том, чтобы различные показатели, являющиеся компонентами шкалы, были связаны друг с другом последовательным и осмысленным образом. На деле нас интересует здесь не то, позволяет ли данный набор вопросов или показателей отличить яблоки от апельсинов, а скорее то, позволяет ли этот набор последовательно сортировать уже идентифицированные нами яблоки по размеру, цвету и т. п. в соответствии с некоторым стандартом. Если да, то объединение различных мер будет говорить о яблоках больше, чем любая отдельная мера. Но если наши стандарты (цвета, размера и т. п.) непоследовательны или [c.252] двусмысленны, то основанные на них наблюдения могут оказаться ложными.
Возможно, другой пример поможет сделать эти положения более понятными. Рассмотрим некую шкалу, предназначенную для того, чтобы каждый респондент выразил свое согласие или несогласие со следующими утверждениями:
1. Кубинцы дурны, и им нельзя верить
2. Французы дурны, и им нельзя верить
3. Японцы дурны, и им нельзя верить
4. Китайцы дурны, и им нельзя верить.
Давайте представим, что перед нами шкала для измерения ксенофобии, то есть страха и недоверия к иностранцам. Предположительно, чем с большим количеством утверждений согласится респондент, тем выше уровень ксенофобии, который мы можем ему приписать. Но будет ли дело обстоять именно так? Человек, полагающий, что только кубинцы дурны и им нельзя верить, утверждает это более в силу антикоммунизма, чем ксенофобии. В свою очередь человек, полагающий, что только японцы и китайцы дурны и им нельзя верить, утверждает это более в силу расизма, чем ксенофобии. И даже респондент, считающий, что все четыре группы дурны и им нельзя верить, как выясняется при ближайшем рассмотрении, страдает не ксенофобией, а скорее чувством, что все люди, или все правительства (даже той страны, где он живет) дурны и им нельзя верить. И следовательно, поскольку мы не можем с уверенностью утверждать, что эта шкала измеряет ксенофобию по существу, то эта шкала несостоятельна. И можем ли мы вообще доверять ей? Составлена ли она продуманно даже для измерения уровня ксенофобии? Страх и недоверие к китайцам, например, возможно, являются индикатором по меньшей мере двух совершенно различных особенностей, одна из которых идеологическая, вторая же имеет своей причиной расизм, и два респондента могут дать одинаковый ответ по совершенно разным причинам. И будет ли одинаковым чувство ксенофобии у антикоммуниста и расиста? Скорее всего – нет. Таким образом, механическое соединение этих конкретных пунктов с целью их соизмерения в лучшем случае будет [c.253] лишь тщетным упражнением, а в худшем – станет источником ошибочных умозаключений.
Проблемы подобного рода преодолеть не всегда просто, и ввиду этого при шкалировании нужно действовать очень внимательно, заранее все просчитывая. Тем не менее возможность представления сложного отношения или поведения в виде отдельного числа или оценки, являющаяся неоспоримым преимуществом шкалирования, служит стимулом к использованию этой методики во множестве самых разнообразных случаев. В этой главе мы обсудим четыре различных подхода к построению значимых (meaningful) шкал. При этом будут рассмотрены достоинства и недостатки каждого из них в том, что касается решения проблем валидности и надежности, а также присущие каждому из этих подходов процедуры. [c.254]
Первый и, по-видимому, наименее удовлетворительный из методов шкалирования известен под названием шкалирования по Лайкерту. Это очень простая методика, в соответствии с которой каждому респонденту предъявляется некоторая серия утверждений (пунктов), требующих от него оценочных суждений. В табл. 8.1 приведена в качестве примера типичная серия таких пунктов, которые могли бы служить мерой антистуденческой предубежденности населения1. В каждом случае респонденту предлагается сказать, согласен (или полностью согласен) он или не согласен (или полностью не согласен) с приводимым утверждением. Каждому ответу приписывается определенная числовая оценка в диапазоне от 5 до 1 (5 – “полностью согласен”, 1 – “полностью не согласен”, 3 – “не имею определенного мнения”). Чтобы получить суммарную меру предубежденности, свойственной конкретному индивиду, нужно сложить все оценки, проставленные против его ответов, и сумму разделить на число утверждений (пунктов). Так, например, респонденту, ответившему на вопросы 1–6 следующим образом: по пункту 1 – “согласен” (4), по пункту 2 – “полностью согласен” (5), по пункту 3 – “не имею определенного мнения” (3), по пункту 4 – “согласен” (4), по пункту 5 – “не согласен” (2), по пункту 6 – “согласен” (4), – будет приписана суммарная оценка 3,67 ([4+5+3+4+2+4]:6), округляемая до 4. [c.254]
=================================================================
Таблица 8.1
Типичные пункты шкалы Лайкерта
=================================================================
Против каждого из следующих утверждений укажите, пожалуйста, согласны ли Вы с ним, полностью согласны, не согласны или полностью не согласны.
1. Студенты, за редкими исключениями, все очень похожи друг на друга.
2. Со студентами сложность состоит в том, что, где бы они ни поселялись, они постепенно вносят в жизнь округи дух студенческого общежития.
3. Чтобы положить конец предубежденности людей против себя, студентам необходимо самим первым избавиться от своих вредных и раздражающих других привычек.
4. В студентах есть что-то чуждое и непонятное мне; неясно, о чем они думают, что замышляют, чем живут.
5. Студенты в большинстве своем готовы сесть вам на голову, если их вовремя не осадить.
6. Пример студентов подтверждает, что если таким людям предоставить в избытке деньги или свободу, то они начнут этим просто злоупотреблять и доставлять другим неприятности.
--------------------------------------------------------------------------------------------------------------
Источник: В сокращенном виде приводится по кн.: Adorno Th. et al. The Authoritarian Personality. – N.Y.: Harper & Row, 1950.
=================================================================
Предполагается, что, чем выше оценка, получаемая респондентом в рамках данной шкалы, тем большим количеством измеряемого признака (в нашем примере – предубежденности против студентов) он обладает. Недостаток шкал этого типа состоит в том, что мы ничего не знаем о взаимодействии между отдельными компонентами шкалы. Каждый из них действительно может измерять разные аспекты одного и того же основного признака, и на первый взгляд так оно и есть, однако мы не можем быть в этом абсолютно уверены. При использовании шкал Лайкерта в политологии исследователи часто пытаются обойти это затруднение, удостоверившись в том, что между пунктами шкалы существует высокая степень корреляции, но при этом зачастую нарушаются некоторые статистические допущения, касающиеся измерения степени корреляции. В общих чертах эта проблема будет рассмотрена в гл. 16. Однако уже здесь следует оговорить один связанный с нею момент, а именно то, каким способом определяется суммарная (средняя) оценка. Мы просто складываем оценки отдельных пунктов и делим сумму на число пунктов. Но если поближе присмотреться к типам [c.255] ответов (т. е. “полностью согласен”, “согласен” и т. д.), то мы обнаружим, что они представляют измерение на порядковом уровне. То есть они различают взаимоисключающие категории и упорядочивают их относительно друг друга (сообщают, в какой степени респондент согласен или нет с некоторым утверждением). Однако они не устанавливают известных и равных интервалов между собой (разница между “полностью согласен” и “согласен” не всегда одинакова, касается ли это разных пунктов шкалы или разных респондентов). И следовательно, бессмысленно и некорректно складывать эти числа друг с другом, не говоря уже о том, чтобы их усреднять. Более правильная (однако редко применяемая) процедура состоит в вычислении на основании ответов каждого респондента средней величины другого вида – медианы, – которая затем приписывается респонденту в качестве оценки шкалы. Способ определения медианы описан ниже, в гл. 14. [c.256]
Многие из сложностей, связанных со шкалированием по Лайкерту, могут быть при определенных условиях преодолены посредством использования более сложной методики, известной под названием шкалирования по Гуттману. Эта методика исходит из допущения, что некоторые типы поведения (и отношений) связаны друг с другом так, что следование одним из них достигается с большим трудом, чем следование другим. По-видимому, самой лучшей аналогией тут может служить пример с человеком, стоящим на лестнице-стремянке. Если человек стоит на пятой по счету от земли перекладине, то, по всей видимости, он взобрался туда, ступая сначала на первую, потом на вторую, третью, четвертую перекладины. Возможно, но менее вероятно, что этот человек перескочил при движении вверх через одну (или более) перекладину. Совсем маловероятно, чтобы он мог без особого неудобства для себя встать на пятую перекладину, ступая прямо с земли. Таким образом, данный субъект достиг пятой перекладины, проделав целую серию все более высоко расположенных движений, и мы имеем полное основание [c.256] допустить, что для достижения более высокой позиции он преодолел нижние.
Точно так же если мы знаем, что некий индивид принял участие в голосовании на президентских выборах (что, как известно из многих исследований, является одним из самых обычных и наименее обязывающих политических действий), то мы не можем с какой-либо долей уверенности утверждать, что этот человек также активно участвует в деятельности какой-либо политической организации (намного более обязывающее и менее обычное действие) или что он баллотировался на какой-либо государственный пост (одно из самых редких политических действий). Однако с другой стороны, если мы знаем о данном индивиде, что он активно участвует в деятельности какой-либо политической организации, то мы можем с достаточной уверенностью утверждать, что он также участвует и в таком менее значительном политическом действии, как голосование на выборах (хотя не можем утверждать, что он сделал и следующий шаг, а именно баллотировался кандидатом на выборах). И далее, если данный индивид баллотировался в качестве кандидата на государственный пост, то у нас есть все основания полагать, что он также принимал участие в голосовании и в деятельности некоторой политической организации. На практике подобные допущения оказываются верными не всегда, но очень часто.
Некоторые отношения связаны друг с другом очень похожим образом. Это иллюстрирует табл. 8.2, в которой представлен один из альтернативных способов измерения степени предубежденности того или иного индивида против студентов2. Процедура схожа с той, которая используется при шкалировании по Лайкерту, и состоит в том, что респондентов просят ответить, согласны они или нет с каждым пунктом (утверждением) из некоторой серии. Тому ответу, который в большей степени отражает измеряемое свойство (например, предубежденность), приписывается знак “+”, а альтернативным ответам – знак “–”. Так, к примеру, согласие с пунктом 1 будет оценено как “+” (наличие предубежденности). Тогда как несогласие с пунктом 2 получит оценку “–” (отсутствие предубежденности). Сами утверждения, как нетрудно видеть, связаны между собой таким образом, что различные ответы на них отражают степень предубежденности (или свободы от таковой) респондента. На деле, чем ближе “угроза” общения со студентами касается самого респондента или его семьи, тем ему, по-видимому, труднее освободиться от предубеждения. Это значит, что между пунктами шкалы существует, по меньшей мере в потенции, вполне логичное отношение порядка, отсутствующее в Лайкертовых шкалах.
=================================================================
Таблица 8.2
Типичные пункты шкалы Гуттмана
=================================================================
Укажите, пожалуйста, согласны Вы или не согласны с каждым из следующих утверждений:
1. Если бы мне было дано выбирать, я бы предпочел не видеть студентов в нашей округе.
2. Я не возражаю против появления студентов в нашей округе.
3. Я бы не возражал, если бы какие-нибудь студенты захотели поселиться у нас в округе.
4. Я бы не хотел, чтобы у нас в округе жили студенты.
5. Я ничего не имел бы против, если бы кто-то из нашей семьи привел к нам в гости студента.
6. Мне не понравилось бы, если бы кто-то из нашей семьи собрался сочетаться браком со студентом / студенткой.
--------------------------------------------------------------------------------------------------------------
Источник: В сокращенном виде приводится по кн.: Bogardus E. Social Distance. – Yellow Springs, Ohio: Antioch Press, 1959.
=================================================================
Более того, шкалирование по Гуттману обеспечивает не только адекватный способ вычисления степени признака, характерной для данного респондента, но и прежде всего способ оценки степени соответствия определенного набора компонентов допущению об их упорядочиваемости (assumption of ordinality). Эти способы могут быть проиллюстрированы с помощью табл. 8.3, где отображены ответы 170 гипотетических респондентов на утверждения, приведенные в табл. 8.2.
Некоторые детали этой таблицы нуждаются в пояснении. Начать с того, что пункты упорядочены в направлении слева направо в порядке возрастания числа полученных ими при ответах плюсов (+). Это число получается в результате подсчета числа (n) всех тех случаев, когда ответ на данный пункт получил оценку “+”. (В данной таблице эти числа, помеченные внизу каждого столбца, выбраны произвольным образом.) [c.258]
Основное допущение заключается в том, что число плюсов должно уменьшаться по мере возрастания трудности следования определенному типу поведения / отношения (или по мере возрастания его экстремальности). В данном примере результаты такого упорядочения совпадают с нашими ожиданиями в том смысле, что наблюдаемое упорядочение соответствует нашему изначальному упорядочению. Однако так бывает далеко не всегда.
Каждая строка таблицы представляет группу респондентов, давших на предложенные шесть пунктов вполне определенный набор ответов. Так, первая строка сверху представляет тех 10 респондентов (n=10), чьи ответы на все шесть вопросов свидетельствуют о наличии у них сильной предубежденности против студентов. Вторая строка сверху представляет тех 20 респондентов, чьи ответы указывают на наличие предубежденности по всем пунктам, кроме пункта 1, и т. д. Первые семь строк таблицы представляют те наборы ответов, которые полностью соответствуют допущению о [c.259] том, что данные шесть пунктов связаны между собой отношением порядка. Группы респондентов, для которых характерен любой из этих семи наборов ответов, называются типами идеальной шкалы (perfect scale types).
При шкалировании по Гуттману количество типов идеальной шкалы всегда на единицу больше числа пунктов данной шкалы, поскольку полное отсутствие измеряемого свойства (отсутствие предубежденности, как в строке 7) рассматривается как идеальная оценка (perfect score). Каждой идеальной оценке приписывается число от 1 до i+1, где i – количество пунктов (items) шкалы, причем 1 обозначает тех респондентов, которые в наименьшей степени обладают измеряемым свойством, а i+1 – тех из них, кто обладает им в наибольшей степени. Таким образом, каждому респонденту приписывается соответствующая оценка. Так, в нашем примере каждый из 10 респондентов строки 1 (чьи ответы отражают самую высокую степень предубежденности) получает оценку 7 (i+1 = 6+1 =7), каждый респондент из строки 2 – оценку 6 и т. д. до оценки 1, выставляемой каждому респонденту из строки 7. Эти оценки ранжируют (упорядочивают) всех респондентов соответственно степени их предубежденности против студентов.
Нам осталось объяснить строки 8, 9 и 10. Один или более ответов из этих строк не укладываются в предсказанный нами заранее порядок пунктов. На самом деле это ответы тех, кто, взбираясь по лестнице, перескочил через одну или более ступенек. О подобных наборах ответов принято говорить, что они содержат одну или более ошибок (errors). Термин “ошибка” обозначает здесь не оплошность респондента, а несоответствие данных случаев основному допущению шкалирования по Гуттману. Встречая подобные ошибки – а они вполне обычны, – мы вынуждены обратиться к следующей процедуре.
Прежде всего следует подсчитать, какое число изменений в строке минимально необходимо для того, чтобы получить идеальную оценку. К примеру, в строке 8 плюс в столбце 1 можно изменить на минус, в результате получим оценку 5; или, наоборот, изменив минус в столбце 2 на плюс, получим оценку 7. И в том, и в другом случаях мы внесли изменение [c.260] только в один пункт, поэтому мы можем сказать, что строка 8 содержит одну ошибку. Это обстоятельство отмечено в столбце под названием “Ошибка” – “Error” (e). Затем мы умножаем число ошибок (т.e. 1) на число случаев, в которых встретились данные ошибки (т.e. 30), и результат заносим в следующий столбец. И наконец, каждому случаю мы приписываем ту оценку шкалы, которую он получил бы, если бы не было ошибок (ошибки). Хотя в строке 8 всего одна ошибка, у нас имеется выбор из двух возможных исправлений – либо на оценку 5, либо на оценку 7. За исключением тех случаев, когда есть какое-то веское основание предпочесть одну из этих оценок другой, стандартная практика заключается в том, чтобы приписывать каждому из 30 респондентов ту или иную оценку шкалы (5 или 7) случайным образом.
Далее переходим к строке 9 и повторяем ту же процедуру. Здесь нам придется произвести минимум два изменения, обратив два минуса в плюсы. И опять мы отмечаем число ошибок, умножаем его на число случаев и приписываем каждому определенную оценку шкалы. Здесь, однако, возможна только одна оценка, поскольку возможен только один вариант внесения исправлений.
Затем эта же процедура повторяется для строки 10, равно как и для любых других наборов ответов, отклоняющихся от основного допущения шкалы.
Работая со строками 8, 9 и 10, мы, конечно, приписывали оценки отдельным случаям (респондентам) так, как если бы они идеально укладывались в нашу шкалу, хотя нам известно, что это не соответствует действительности. Значит, в той мере, в какой мы полагаемся на оценки шкалы, характеризующие случаи из строк 8–10, мы рискуем прийти к ошибочным выводам. Встает вопрос, сколь велик этот риск. К счастью, шкалирование по Гуттману дает нам возможность ответить на него. Вспомним, что мы отмечали общее число ошибок в шкале. Оценка риска, по сути дела, требует, чтобы мы определили величину этой общей ошибки, т. e. оценили – то ли она относительно мала и потому пренебрежима, то ли настолько велика, что делает недействительной саму шкалу. Ответить на этот вопрос позволяет вычисление статистики, называемое коэффициентом воспроизводимости по Гуттману (the Guttman coefficient of reproducibility – СR) и определяемое по следующей формуле: [c.261]
где n - число случаев в строках, содержащих ошибки,
е - число ошибок в каждой строке,
i - число пунктов шкалы,
N - общее число случаев.
Подставив соответствующие значения, получим коэффициент воспроизводимости для нашего примера:
В данной формуле величина Σn(e) обозначает общее число ошибок в шкале, тогда как величина i(N) обозначает общее число возможных ошибок, когда ни один из пунктов или респондентов не укладываются в шкалу. Таким образом, дробь говорит нам, какая доля всех возможных ошибок имела место в действительности. Вычитая эту долю ошибок из единицы, мы устанавливаем долю тех элементов (вхождений) шкалы, которые свободны от ошибок. Принято считать обоснованной любую шкалу Гуттмана с коэффициентом CR > 0,90 и выше; шкалы с более низким коэффициентом рассматриваются как сомнительные и обычно в аналитических целях не используются3.
Таким образом, мы видим, что применительно к пунктам, поддающимся естественному упорядочению по степени трудности, шкалирование по Гуттману является сильным средством, с помощью которого мы можем объединять несколько показателей в единую суммарную величину, адекватно отображающую какое-то более общее свойство (признак) респондента. [c.262]
Еще один способ вычисления суммарных мер (хотя и предназначенный для решения несколько иных задач) – это равномерное (equal-appearing) интервальное шкалирование по Терстоуну. У нас уже шла речь о том, что при формулировке вопросов, нацеленных на измерение такой, например, переменной, как социальные классы, исследователь вправе избрать способ [c.262] измерения, опирающийся на какой-то объективный критерий (уровень доходов, общественный престиж профессии и т. п.), но альтернативно он может разрешить респонденту применять свои собственные критерии оценки (спрашивая его, например, к какому социальному классу он сам себя относит). Первый подход облегчает сравнение данных, полученных от разных респондентов, тогда как второй позволяет получить, возможно, менее сравнимые, но зато более значимые данные.
Шкалирование по Терстоуну рассчитано на вторую из этих стратегий с учетом, однако, улучшенного показателя сопоставимости. Метод состоит в том, что отдельным представителям изучаемой совокупности (группы населения) предоставляется возможность фактически самим участвовать в разработке тех шкал, которые в дальнейшем будут использованы для измерения определенных свойств данной совокупности (группы) в целом. Допуская интериоризованные определения значений тех или иных показателей, метод Тёрстоуна усиливает валидность шкалы. А устраняя из рассмотрения те пункты шкалы, с которыми не согласно большинство респондентов, он усиливает также ее надежность. Метод этот довольно сложен, но после того, как мы уяснили для себя его основные цели, он будет нетруден для понимания.
Приступая к построению шкалы Тёрстоуна, исследователь прежде всего отбирает большое количество утверждений (от 50 до 100), отражающих самые различные отношения к некоторому объекту. Затем из изучаемой группы населения произвольным образом отбирается некоторое число “арбитров”. Это те люди, на которых будет опробован имеющийся список утверждений. Обычно число арбитров достигает 50 и более человек, а иногда – если позволяют возможности – и нескольких сотен.
Каждому из арбитров предъявляется 11-балльная шкала, значения которой варьируют от “одобрительного отношения” (11) до “неодобрительного отношения” (1), и стопка карточек, на каждой из которых напечатано одно утверждение из имеющегося списка. Арбитра просят внимательно прочитать каждое утверждение и в зависимости от того, как оно связано с изучаемым объектом, поместить данную карточку в одну из 11 стопок, соответствующих той или иной [c.263] оценке. Таким образом, те утверждения, которые данный арбитр рассматривает как наиболее “одобрительные” по отношению к объекту (например, к студентам), попадут в стопку 11; те, которые он оценивает как несколько менее “одобрительные”, окажутся в стопке 10, и т. д. В итоге этой процедуры исследователь будет располагать мнением каждого арбитра об оценочном значении каждого утверждения.
На следующем этапе каждому утверждению приписывается определенная обобщенная оценка шкалы, указывающая на его относительное положение на шкале; при этом, чем более “одобрительным” видится арбитрам некоторое утверждение, тем выше его оценка. Многие исследователи вычисляют оценку шкалы, приравнивая ее к среднеарифметическому, т. е. сначала складывая все частные оценки какого-либо утверждения, а затем деля сумму на число арбитров4. Более надежный способ заключается в определении в качестве оценки шкалы медианного значения для каждого утверждения (см. гл.14). На данном этапе те пункты (утверждения), которые получили у разных арбитров сильно расходящиеся оценки (например, демонстрирующие разброс в диапазоне пяти или шести категорий шкалы), устраняются из списка. Окончательно в опросный лист попадают 15–20 пунктов, по которым арбитры ближе всего сошлись в опенках. В совокупности эти пункты должны покрывать весь диапазон оценок. В табл. 8.4 приведены некоторые типичные утверждения, которые могли бы быть включены в шкалу Тёрстоуна, предназначенную для измерения различных типов отношения населения к студентам5.
Далее, на этапе интервьюирования, респондента из обследуемой выборки просят сказать, с какими из предъявленных пунктов (утверждений) он согласен или – в альтернативном порядке – какие пункты (но не более двух-трех) наиболее близки к его мнению о рассматриваемом объекте (в нашем случае – о студентах). Затем для установленных таким образом пунктов определяется медианное значение6, каковое и приписывается данному респонденту в качестве его оценки шкалы, т. е. в качестве обобщения его взглядов на объект. В том случае, если ответы респондента оказываются разбросанными по нескольким несмежным точкам шкалы, исследователь обычно делает заключение, что [c.264] либо у данного индивида нет определенного отношения к исследуемому объекту, либо его отношение отлично от того, который подразумевается в данной шкале. Но если, как это чаще случается, ответы оказываются тесно сгруппированными на каком-то одном участке шкалы, исследователь вправе сделать вывод о валидности и надежности разработанной им меры. Этим он не в последнюю очередь обязан арбитрам, сыгравшим важную роль в построении исследовательского инструмента.
=================================================================
Таблица 8.4
Типичные пункты шкалы Тёрстоуна
=================================================================
Внимательно прочитайте следующие утверждения и укажите, с какими из них Вы согласны.
1. Возможно, это малоизвестно, но среди студентов процент добровольно поступивших на воинскую службу гораздо выше, чем среди других групп населения.
2. Некоторые из студентов, без сомнения, сильно превосходят по уровню интеллекта остальных жителей нашей округи.
3. Несмотря на все свои недостатки, студенты вносят большой вклад в улучшение жизни в нашей округе.
4. Представление о студентах как о людях менее целеустремленных и менее трудолюбивых, чем другие, мало соответствует действительности.
5. Одни студенты чистоплотны, другие – нет, но средний студент по своим личным привычкам ничем не отличается от среднестатистического гражданина.
6. Когда непосредственно сталкиваешься со студентами, то обнаруживаешь, что они такие же, как остальные люди: у них есть свои недостатки, равно как и свои достоинства.
7. Хотя, несомненно, встречаются исключения, но в целом студентам свойственна ярко выраженная тенденция к клановости, к тому, чтобы держаться замкнутыми группками.
8. Хотя, конечно, каждая социальная группа вправе выделяться среди других групп, студенты все же чересчур склонны не уважать права и собственность других людей.
9. Студенты иногда пытаются входить в не предназначенные для них магазины, отели и рестораны.
10. Многие жители нашей округи относились бы к студентам лучше, если бы в их поведении было меньше самоуверенности, аморальных поступков, случаев пьянства и публичной демонстрации сексуальной распущенности.
11. Хорошо известно, что от студентов пахнет хуже, чем от других людей.
--------------------------------------------------------------------------------------------------------------
Источник: Приводится в сокращенном виде по статье: Shuman H., Harding J. Prejudice and the Norm of Rationality. // Sociometry. 1963. Vol. 27. P. 353-371.
=================================================================
[c.265]
МЕТОД СЕМАНТИЧЕСКОГО ДИФФЕРЕНЦИАЛА
Четвертый, и последний, способ шкалирования, который мы хотим обсудить, называется методом семантического дифференциала. Этот метод основан на предъявлении респонденту некоторой серии пар прилагательных, с тем чтобы выявить, как данный индивид понимает определенное понятие (или как он к нему относится). В табл. 8-5 приводится типичная серия таких пар прилагательных. Респонденту предъявляется подобный список (выписанный обычно на отдельной карточке) и предлагается оценить определенный объект (в нашем примере – студентов) по 7-балльной шкале, на полюсах которой располагаются антонимические прилагательные. Измерение такого типа допускает варьирование как интенсивности (силы), так и направленности измеряемого отношения; при этом нейтральному отношению соответствует срединная точка шкалы. Порядок расположения прилагательных внутри каждой пары определяется случайным образом, чтобы избежать сдвига в сторону ответной тенденции.
=================================================================
Таблица 8.4
Типичные пункты при построении семантического дифференциала
=================================================================
Ниже перечислен ряд словесных пар, которые можно было бы использовать для описания студентов. Между членами каждой пары стоит несколько прочерков. Пометьте крестиком тот прочерк в каждой паре, который ближе всего соответствует Вашему мнению о студентах.
Студенты - это, как правило, люди:
1) скучные |
— — — — — — — |
интересные |
Несмотря на то что некоторые исследователи делают под-разбивку таких шкал на различные более мелкие подшкалы и далее просчитывают результаты уже внутри каждой подшкалы, большинство все же сходится в том, что шкалы семантического дифференциала позволяют получать оценки несколько иного свойства, нежели другие рассмотренные нами методы. Эти шкалы пригодны в первую очередь для сравнения объектов между собой (обозначаются ли по видимости сходные объекты разными респондентами в сходных терминах?) или для формирования шкал, измеряющих более общие понятия (например, какие типы действий или взглядов рассматриваются респондентами как либеральные или консервативные?). И таким образом, метод семантического дифференциала выполняет в исследовательском процессе несколько иную и более фундаментальную задачу, чем методы Лайкерта, Гуттмана и Терстоуна, а именно помогает формированию и оцениванию дефиниций тех или иных понятий.
Следует отметить, что существуют и другие методы шкалирования, используемые в опросных исследованиях. Однако те методы, что мы рассмотрели, являются самыми широкоупотребительными и–в очерченных нами пределах – самыми эффективными. В совокупности они обеспечивают нас доступными вариантами выбора и критериями, которыми нужно руководствоваться при формировании ограниченных мер для широких основных понятий. [c.267]
Дополнительная литература
Маranell О.М. Scaling: A Sourcebook for Behavioral Scientists. – Chicago: Aldine, 1974. – Обзор многих работ по шкалированию. Anderson Lee F. et al. Legislative Roll-Call Analysis. – Evanston: Northwestern Univ. Press, 1966. – Гл.6 этой книги содержит удачное описание методики Гуттмана. McIver J.P., Carmines E.G. Quantitative Applications in the Social Sciences. – Beveriy Hills: Sage, 1981. – Глава “Одномерное шкалирование” содержит краткие, но усложненные по сравнению с нашим описания методик Лайкерта, Гуттмана и Терстоуна. О применении шкалирования см. вводный курс: Dе Vеllis R.F. Scale Development. – Newbury Park, Calif.: Sage, 1991.
Следующие книги содержат исчерпывающие описания методов шкалирования, применяющихся в социологии:
Robinson J.P., Shaver Ph. R. Measures of Social Psychological Attitudes. – Ann Arbor: Institute for Social Research, 1973. Robinson J.P. et al. Measures of Political Attitudes. – Ann Arbor Institute for Social Research, 1968. Пример построения политологической шкалы см.: Finiftеr A. Dimensions of Political Alienation. // American Political Science Review. 1970. Vol. 64. P. 389-410. [c.268]