Шкала оценки: Шкалы оценки — StartExam

Содержание

Шкалы оценки — StartExam

Предыдущий урок был посвящен созданию тестов, на текущем уроке речь пойдет о настройке шкал оценивания, с помощью которых можно выставлять итоговую оценку участникам тестирования по набранному результату.

Создание шкалы оценки

На одном из первых уроков для теста мы создали шкалу оценки по шаблону, сейчас мы изменим ее в соответствии со своими предпочтениями.

Сперва войдем в административную панель онлайн системы тестирования, войдем в проект, в нашем случае он называется «Космическое тестирование» и перейдем на вкладку Шкалы.

Перед нами доступна шкала, созданная по шаблону, с названием «Шкала оценки». Мы можем изменить ее, а можем создать новую шкалу, используя ссылку Создать шкалу.

Создадим новую шкалу. Нажимаем на ссылку Создать шкалу, перед нами открывается форма с тремя стандартными уровнями шкалы.

Сперва нам нужно присвоить название нашей шкале, назовем ее так «Насколько хорошо я знаю космос», название может быть любым, оно может ограничиваться только Вашей фантазией.

Затем нам нужно выбрать тип используемой шкалы оценивания. По умолчанию задается Процентная шкала оценки, которая будет оценивать по проценту набранных баллов. Например, если в тесте представлено 10 заданий и участник тестирования отвечает на 7, то его оценка составит 70%.

Здесь же можно выбрать балльную шкалу оценки, которая будет оценивать по количеству набранных баллов. Для ее использования нужно каждому тестовому заданию задать способ оценки результатов – сумма баллов выбранных ответов. При создании тестовых заданий, мы использовали дихотомическую оценку (0/1), которая предполагает либо правильный ответ на задание, либо неправильный, поэтому для создания шкалы будем использовать процентный тип.

Далее нужно решить сколько уровней оценивания мы будем использовать. Количество уровней в процентной шкале оценивания может быть от 1 до 100. Зададим 4 уровня оценки: плохо, удовлетворительно, хорошо и отлично. Каждому уровню присвоим интервал баллов, например, такой:

  • плохо – от 0 до 40%
  • удовлетворительно – от 41% до 60%
  • хорошо – от 61% до 80%
  • отлично – от 81% до 100%

Важно, чтобы интервалы у уровней не перекались и последний уровень оканчивался на 100%, иначе при сохранении система тестирования выдаст сообщение об ошибке.

Кроме того, для каждого уровня Вы можете задать подробное описание, которое увидит участник тестирования к своему результату.

Вот, что в итоге у нас получилось.

Если все устраивает, можно нажимать кнопку Сохранить.

Шкала оценивания сохранена и представлена с тем названием, которое мы ей присвоили на вкладке Шкалы.

Добавление шкалы оценки тесту

Шкала создана, теперь нужно назначить ее использование в нужном нам тесте. Если у Вас создано несколько тестов, то для каждого из них Вы можете задать свою шкалу оценивания и, при необходимости, менять их в любой момент.

У нас создан пока только 1 тест, но уже есть 2 шкалы и нам нужно поменять прежнюю шкалу на только что созданную. Для этого заходим во вкладку

Тесты и нажимаем ссылку Изменить возле нужного нам теста, в нашем случае теста о космонавтике.

В настройках теста переходим к вкладке Результаты и в выпадающем списке Использовать шкалу выбираем шкалу с присвоенным нами названием – Насколько хорошо я знаю космос.

После этого нажимаем кнопку Сохранить и теперь наш тест будет оцениваться по новой шкале.

Шкала оценки в действии

Для просмотра того, что у нас получилось, нам нужно перейти на страницу виртуального центра тестирования и пройти тест. Переходим на вкладку

Центры и кликаем по ссылке, указанной в столбце Веб-ссылка.

Перед нами откроется публичная страница, ссылку на которую Вы можете скопировать и отправить участникам тестирования.

Заходим в тест и отвечаем на задания. После того, как все задания будут решены, нажимаем кнопку Завершить тест.

И подтверждаем наше намерение, если оно было неслучайным.

Данные тестирования сохраняются в онлайн системе тестирования и участник тестирования видит свой результат, набранный балл и диаграмму по темам тестирования.

Настройка страницы результатов

Во вкладке Результаты в настройках теста можно задать несколько вариантов отображения, которые увидит участник тестирования. Рассмотрим эти варианты.

Возвращаемся в настройки нашего теста ТестыИзменить, вкладка Результаты.

Здесь можно задать Измеряемый показатель, это название увидит участник тестирования на странице результатов. Присвоим ему название — Знания космонавтики.

Далее идет настройка Оценивать уровень по шкале, которая задает шкалу оценивания. Ее использование мы рассмотрели выше.

Затем настройка Показать уровень и итоги теста.

Если отключить ее, то страница результатов будет выглядеть так.

Не показана ни оценка, ни описание, которые мы задавали к уровням шкалы.

Если отключить настройку Показать набранный балл и диаграмму.

Страница результатов будет выглядеть следующим образом.

Ничего лишнего, не правда ли?

Какой вид страницы результатов показывать участникам тестирования — выбирать Вам, можете поэкспериментировать.

Кроме того, Вы можете задать URL-адрес для перехода после завершения теста в соответствующем поле в настройках теста.

Это позволит Вам перенаправить участников тестирования на указанный адрес при нажатии кнопки Выйти на странице результатов тестирования.

Желаем успехов в создании собственных тестов и настройке шкал оценивания!

Пройти тест, используемый в данном уроке, можно по ссылке http://app.startexam.com/Center/Web/kosmos

шкала оценок — это… Что такое шкала оценок?

  • ШКАЛА ОЦЕНОК — методический прием, позволяющий распределять совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усредненных по группе экспертов. Простейшим… …   Профессиональное образование. Словарь

  • ШКАЛА ОЦЕНОК — прием, позволяющий распределить совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усредненных по группе экспертов …   Большой экономический словарь

  • Шкала оценок — методический прием, позволяющий распределять совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усредненных по группе экспертов …   Исследовательская деятельность. Словарь

  • ШКАЛА. ОЦЕНОК — методический прием, позволяющий распределять совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усредненных по группе экспертов. Простейшим… …   Энциклопедический словарь по психологии и педагогике

  • ШКАЛА ОЦЕНОК — (ESTIMATE SCALE) прием, позволяющий распределять совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усредненных по группе экспертов. В… …   Глоссарий терминов по грузоперевозкам, логистике, таможенному оформлению

  • ШКАЛА ЛАЙКЕРТА — (англ. Likert scale) один из 3 основных типов шкал для измерения аттитюдов, предложенный в 1932 Ренсисом Лайкертом (Ликертом). Термин «Ш. Л.» относится как к шкалам, которые были сконструированы самим Лайкертом, так и ко всем шкалам такого типа.… …   Большая психологическая энциклопедия

  • шкала — (лат. scala лестница) инструмент для измерения непрерывных свойств объекта; представляет собой числовую систему, в которой отношения между различными свойствами объектов выражены свойствами числового ряда. В психологии и социологии различные Ш.… …   Большая психологическая энциклопедия

  • Шкала равнокажущихся интервалов — Л. Тёрстоуна метод измерения в шкале интервалов психологических и социальных характеристик исследуемых. Первая шкала равнокажущихся интервалов была описана в работе 1929 года, посвященной социальному исследованию того, как люди относятся к… …   Википедия

  • Шкала интервалов Л. Терстоуна — Шкала равнокажущихся интервалов Л.Терстоуна метод измерения в шкале интервалов психологических и социальных характеристик исследуемых. Первая шкала равнокажущихся интервалов была описана в работе 1929 года, посвященной социальному исследованию… …   Википедия

  • ШКАЛА СУММАРНЫХ ОЦЕНОК — англ. scale, Likert; нем. Likert Skala. Метод (предложен Р. Лайкертом) шкалирования соц. психол., характеристик индивидов, представляющий собой адаптацию теста к измерению установки. Респондент выражает свое согласие или несогласие с каждым из… …   Энциклопедия социологии

  • Оценочные шкалы — Questionstar

    Оценочные шкалы

    Оценочные шкалы: непрерывная рейтинговая шкала

    Непрерывная шкала — Респондент оценивает объекты, проставляя отметку в любой точке линии, соединяющей одно экстремальное значение оцениваемого критерия с другим

    Оцените магазины «Пятерочка» как продуктовый супермаркет:

    Непрерывная рейтинговая шкала: пример

    Дискретные шкалы: шкала Лайкерта

    Шкала Лайкерта — Респондент указывает степень своего согласия или несогласия с утверждениями, касающимися изучаемого объекта, при помощи шкалы, обычно содержащей от пяти до семи категорий

    Укажите степень своего согласия со следующими утверждениями в отношении магазина «Перекресток»

    Обратите внимание, что четвертое утверждение обратно по отношению к другим утверждениям.
    На этапе анализа такие утверждения стоит «развернуть на 180°», чтобы все утверждения были взаимно согласованы – от худшего к лучшему или наоборот от лучшего к худшему.

    Шкала Лайкерта: пример

     

    Шкала Лайкерта: часто используемые шкалы

        Концепт                                            Описание

    Отношение Очень плохо Плохо Ни хорошо, ни плохо (нейтральное отношение) Хорошо Очень хорошо
    Важность Совершенно не важно Не важно Затрудняюсь ответить (нейтрально) Важно Очень важно
    Удовлетворенность Очень недоволен Недоволен Нейтрален Доволен Очень доволен
    Намерение совершить покупку Точно не куплю Скорее всего не куплю Равная вероятность (затрудняюсь ответить) Скорее всего куплю Точно куплю
    Частота покупок Никогда Редко Иногда В большинстве случаев Всегда
    Согласие Абсолютно не согласен Не согласен Затрудняюсь ответить Согласен Полностью согласен

    Дискретные шкалы: семантический дифференциал

    Семантический дифференциал — Шкала оценок с полюсами, имеющими противоположные друг другу смысловые значения

    На этом этапе опроса нас интересует, какие ассоциации у Вас вызывают различные супермаркеты. Ниже представлены пары противоположных по смыслу прилагательных. Пожалуйста, отметьте на сколько то или иное прилагательное описывает Ваше отношение к супермаркету «Лента».

    Обратите внимание, что вторая и четвертая пара прилагательных обратна по отношению к другим парам. На этапе анализа такие сравнительные пары стоит «развернуть на 180°», чтобы все измерения были взаимно согласованы – от худшего к лучшему или наоборот от лучшего к худшему.

    Семантический дифференциал: пример

    Самооценка, оценка людей, продуктов, марок, имиджа компании

    Синяя кривая — Профили оценок различных объектов / респондентов / сегментов

    Оранжевая кривая — Каждая точка соответствует среднему значению или медиане измерений

    Семантический дифференциал: пример

    Семантический дифференциал потребительских характеристик шампуней «Шампунь 1», «Шампунь 2» и идеального шампуня.

    Синяя кривая — Идеальный шампунь

    Оранжевая кривая — «Шампунь 1»

    Зеленая кривая —  «Шампунь 2»

    Семантический дифференциал: пример

    Дискретные шкалы: шкала Стейпла

    Шкала Стейпла — Шкала с одним утверждением в середине шкалы и значениями от -5 до +5 без нейтральной точки (нуля). Чем выше выбранное респондентом число, тем точнее утверждение описывает изучаемый объект. Обычно изображается вертикально.

    Используется как альтернатива семантическому дифференциалу, особенно когда сложно найти пару противоположных по смыслу прилагательных.

    Пожалуйста, оцените, насколько точно каждое слово или фраза описывает банк «Кредитор». Чем точнее по Вашему мнению фраза описывает банк, тем более положительное число Вам надо выбрать. Чем менее точно фраза описывает банк, тем более отрицательное число надо выбрать. Вы можете выбрать любое число от +5 для очень точных описаний до -5 для описаний, которые на Ваш взгляд очень неточны.

     

    Оценочные шкалы: обзор

    Шкала

    Базовые характеристики

    Примеры

    Достоинства

    Недостатки

     

    Непрерывные шкалы

     

    Поставить отметку на непрерывной линии

     

    Реакция на рекламный ролик

     

    Легкость построения

     

    Трудоемкость подсчета очков в ручную

     

    Дискретные шкалы

    Шкала Лайкерта  

    Указать степень согласия на интервале от 1 (абсолютно не согласен) до 5 (полностью согласен)

     Измерение отношений

     к чему-либо

    Легкость построения, понимания респондентами и применения

     

     

    Требует больше времени

    Семантический дифференциал  

    Семибалльная шкала с противоположными по смыслу полюсами

     

    Имидж марки, продукта, компании

     

    Разносторонние применения

    Спорно, являются ли данные интервальными

    Шкала Стейпла  

    Однополюсная десятибалльная шкала от -5 до +5 без нейтральной точки (нуля)

     

    Измерение отношений

    и имиджа

    Легкость построения, и применения в телефонных опросах

     

    Приводит в замешательство и часто сложна в применении

     

    Особенности построения дискретных шкал

    количество категорий Однозначно оптимального числа категорий нет,
    традиционно рекомендуется использовать от 5 до 9 категорий.
     

    сбалансированность

     

    Объективные данные можно получить только при использовании сбалансированных шкал.

     

    чётное или нечётное
    число категорий

     

    Если нейтральное отношение респондентов к объекту в принципе возможно, то стоит использовать нечетное число категорий.

     

    обязательный или необязательный ответ

     

    Если некоторые респонденты могут не иметь определенного мнения, непринудительный режим ответа может значительно улучшить качество данных.

     

    подписи категорий

     

    Есть доводы в пользу того, чтобы подписывать все или несколько категорий. Также важна «сила» прилагательных в подписи.

     

     

    Количество категорий в шкале

    Количество категорий — Однозначно оптимального числа категорий нет,  традиционно рекомендуется использовать от 5 до 9 категорий.

    + Чем больше категорий в шкале, тем более тонкие различия в оценке объектов она может регистрировать.

    — Есть предел восприятия разницы между категориями. Большинство  респондентов не может справиться более чем с несколькими категориями.

    Уровень знаний и степень вовлеченности

    • Больше категорий, если респонденты заинтересованы в оценке объекта или много знают о нем.

    Природа объекта

    • Некоторые объекты сами по себе имеют множество градаций признака.

    Метод сбора данных

    • Меньше категорий в телефонных интервью.

    Анализ данных

    • Меньше категорий для агрегации, обобщений или сравнения групп.
    • Больше для сложных статистических анализов, например корреляционных.

    Сбалансированность шкалы

      Сбалансированность — Объективные данные можно получить только при использовании сбалансированных шкал.

     Сбалансированная шкала:

    Очень хорошо

    Хорошо

    Ни хорошо, ни плохо

    Плохо

    Очень плохо

     Несбалансированная шкала:

    Очень хорошо

    Хорошо

    Скорее хорошо

    Удовлетворительно

    Плохо

    Очень плохо

     

    Чётное или нечётное количество категорий

      Чётное или нечётное число категорий — Если нейтральное отношение респондентов к объекту в принципе возможно, то стоит использовать нечетное число категорий.

    — при нечетном количестве категорий средняя точка – нейтральная категория

    — в шкалах измерения отношений эта категория привлекает значительное количество респондентов, неуверенных в своем мнении или нежелающих раскрывать его

    — это может «сдвинуть» среднее значение измерения и его дисперсию

    — нужен ли нам «контраст» в анализе?

    Обязательный ответ

      Обязательный или необязательный ответ — Если некоторые респонденты могут не иметь определенного мнения, непринудительный режим ответа может значительно улучшить качество данных.

    — вопросы без варианта «не знаю», как правило, генерируют больше информативных данных

    — действительно ли респонденты могут не иметь мнения или они не желают отвечать?

    — используйте альтернативу «не знаю» или лучше «затрудняюсь ответить» в вопросах о фактах, но не в вопросах об их отношениях к объекту исследования

    — используйте ветвление для гарантии того, что респондент «в теме»

     

    Подписи категорий

    Подписи категорий — Есть доводы в пользу того, чтобы подписывать все или несколько категорий. Также важна «сила» прилагательных в подписи.

    — различные варианты описания категорий (словесные, численные, графические) влияют на ответы

    — описание категорий должно быть на столько близко к измеряемым значениям, на сколько это только возможно

    — прописывание всех вариантов (категорий) ответа не влияет на качество и точность собираемых данных

    — «сила» прилагательных на полюсах шкалы влияет на «концентрацию» ответов

    Шкалы оценок — Справка — Let’s test

    Шкалы оценок — это инструмент для оценки результатов тестирования. С их помощью можно установить минимальный порог для прохождения тестирования, добавить оценки для различных результатов, а также разбить результат на категории (для психологических тестов). Одна шкала оценок может быть установлена одному или нескольким тестированиям в его настройках. Шкалы оценок для Вашей организации доступны на следующей странице.

    Список шкал оценок

    На странице со списком шкал оценок находится таблица со всеми шкалами Вашей организации, а также кнопка «Создать шкалу». В таблице напротив каждой шкалы оценок находятся следующие функциональные ссылки: «изменить» и «удалить».

    Редактирование шкалы

    Для создания новой шкалы оценок необходимо нажать на кнопку «Создать шкалу», чтобы изменить существующую шкалу, нажмите на ссылку «изменить» напротив соответствующей шкалы. Форма редактирования шкалы оценок состоит из трех вкладок. На вкладке «1. Основная информация» располагаются следующие поля:

    • Название — Уникальное наименование шкалы оценок, которое отражает ее суть и предназначение.
    • Тип шкалы — От типа шкалы зависит медот подсчета результата тестирования. Результат может быть подсчитан как процентное отношение правильных вопросов от общего числа вопросов или как сумма баллов за правильные ответы.
    • Балл/процент для прохождения тестирования — Установите значение, которое должен набрать пользователь за тестирование. Тестирование будет считаться пройденным, если результат выше или равен данному значению.
    • Метод подсчета баллов за тест — Для балльной шкалы оценок можно установить, каким образом будут подсчитаны баллы за весь тест. Если Вы используете в шкале категории, то можете установить, чтобы общий балл за тестирование был равен не сумме баллов за все вопросы, а только за вопросы, которые относятся к видимым категориям. Например, Вы хотите, чтобы балл за тестирование равен баллу за категорию с наибольшим количеством баллов. В настройке категорий установите только отображение одной категории в порядке уменьшения количества баллов (будет отображаться категория с наибольшим количеством баллов) и установите значение поля в «Сумма баллов по отображаемым категориям»
    • Описание — Дополнительная информация о шкале оценок.

    На вкладке «2. Оценки» Вы можете добавить оценки, которые может получить пользователь. Каждая оценка должна охватывать свой диапазон значений результата и эти диапазоны не должны пересекаться и идти в стык. Если Вы используете процентную шкалу оценок, то диапазон оценок должен начинаться с 0 и заканчиваться 100 процентами. При использовании балльной шкалы оценок Вы можете установить нижний и верхний пределы как -9999 и 9999, чтобы крайние оценки всегда попадали в него.

    Чтобы добавить оценку необходимо нажать на кнопку «Добавить оценку». Форма редактирования оценки содержит следующие поля:

    • Название — Уникальное наименование оценки. Данное значение увидит пользовать в графе «Оценка», если получит данную оценку.
    • Сообщение — Текст, который будет показан на странице результата, если пользователь получит данную оценку. Вы можете форматировать текст, добавлять изображения, видео и т. д..

    После добавления оценки, она появится в списке оценок данной шкалы. Слева от названия Вы должны установить диапазон значений, для которого выставляется данная оценка. Вы можете изменять порядок оценок, нажимая на ссылки «вверх» и «вниз».

    Для изменения существующей оценки и вызова формы редактирования необходимо нажать на ссылку «изменить» рядом с соответсвующей оценкой в списке.

    Для удаления оценки нажмите на ссылку «удалить» и подтвердите удаление в появившемся диалоговом окне.

    Если Вы желаете суммировать баллы за ответы и разделить их на несколько категорий, то добавьте данные категории в шкалу оценок. В ответах для вопросов «Выбор одного ответа» и «Выбор несколько ответов» Вы можете указать, к какой категории относится ответ.

    Для категорий могут быть установлены следующие настройки:

    • Показывать количество баллов рядом с категорией — При просмотре результата пользователь сможет увидеть, сколько баллов он набрал по каждой категории.
    • Показывать проценты рядом с категорией — При просмотре результата пользователь сможет увидеть, сколько процентов от общего результата он набрал по каждой категории.
    • Сортировка категорий — Вы можете установить порядок, в котором будут выводиться категории на странице результата. Например, если Вы хотите показать пользователю только категорию с наибольшим количество баллов, то установите данное поле в «От большего количества баллов к меньшему» и установите ограничение на показ только одной категории.
    • Отображать указанное количество категорий — Вы можете ограничить количество категорий, которые увидит пользователь при просмотре результата. Если хотите, чтобы пользователь видел все категории, оставьте поле пустым. Что категории не отображались совсем, поставьте в данное поле 0.
    • Отображать категории с количеством баллов более — При просмотре результата пользователь будет видеть только категории, для которых он набрал количество баллов больше указанного количества.

    Чтобы добавить в шкалу новую категорию, нажмите на кнопку «Добавить категорию». Форма редактирования категории состоит из следующих полей:

    • Название — Уникальное наименование категории, которое увидит пользователь при просмотре результата.
    • Сообщение — Описание или расшифровка данной категории. Справочная информация, которая будет полезна пользователю, чтобы анализировать результат тестирования.

    После заполнения всех полей для категории, сохраните ее и она появится в списке категорий шкалы. Вы можете изменить существующие категории, нажав на ссылку «изменить» и вызвав диалог редактирования категории.

    Чтобы удалить категорию, нажмите на ссылку «удалить» рядом с ней и подтвердите удаление в появившемся диалоговом окне.

    Вы также можете изменять порядок категорий, нажимая на ссылки «вверх» и «вниз». Обратите внимание, что при этом меняется порядковый номер категории. После изменения порядка следования категорий, убедитесь, что баллы за вопросы назначаются нужным категориям.

    После внесения всех изменений Вы можете сохранить шкалу и использовать ее в своих тестированиях.

    Шкала оценки тяжести состояния для пациентов с COVID-19

    Как рассчитать уровень тяжести состояния: каждый из 9 показателей (см. таблицу) нужно сравнить с порогом. Показатели делятся на 2 категории: для которых балл начисляется за превышение порога (АЧТВ, СРБ, Д-димер, глюкоза, мочевина и общие лейкоциты) и те, у которых балл начисляется за уменьшение ниже порога (гемоглобин, лимфоциты, общий белок). Далее начисленные баллы суммируются.

    ПоказательПорогБалл
    APTT (АЧТВ)> 42 sec4
    CRP (С-реактивный белок)> 146 mg/L3
    D-dimer (Д-димер)> 2149 mg/L4
    Glucose (Глюкоза)> 9 mmol/L4
    Hemoglobin (Гемоглобин)3
    Lymphocytes (Лимфоциты)3
    Total protein (Общий белок)6
    Urea (Мочевина) > 11 mmol/L5
    WBC (Общие лейкоциты)> 13,5*10^9/L4

    Итого: максимум 36 баллов

    Например, у пациента АЧТВ 45 сек, СРБ 180, Д-димер: 1000, глюкоза: 8, гемоглобин 110, лимфоциты: 0.8, общий белок: 60, мочевина 10, общие лейкоциты: 15.

    Как видно, критическое значение наблюдается у: АЧТВ (4 балла), СРБ (3 балла), гемоглобин (3 балла), общий белок (6 баллов), общие лейкоциты (4 балла). Таким образом суммарный балл составляет 4+3+3+6+4 = 20 баллов.

    Далее суммарный балл можно сопоставить с рассчитанными диапазонами и вынести вердикт о градации риска.

    Подробнее о методике расчета: https://www.medrxiv.org/content/10.1101/2021.02.09.21249859v3

    Для удобства оценки предлагаем автоматический калькулятор.

    Для корректного расчета необходимо заполнить все поля. Десятичные дроби необходимо вводить с точкой в качестве разделителя целой и дробной частей.

    Важно!

    В шкале не учитывается информация о сатурации кислородом! Даже низкий балл при дыхательной недостаточности (SpO2

    Результаты шкалы не предназначены для самостоятельного применения пациентом и должны оцениваться ТОЛЬКО врачом-специалистом с учетом результатов комплексного клинико-лабораторного обследования.

    НГТУ. Соответствие оценок

    «Отлично» – работа высокого качества, уровень выполнения отвечает всем требованиям, теоретическое содержание курса освоено полностью, без пробелов, необходимые практические навыки работы с освоенным материалом сформированы, все предусмотренные программой обучения учебные задания выполнены, качество их выполнения оценено числом баллов, близким к максимальному

    98-100

    А+

    отлично

    зачтено

    93-97

    А

    90-92

    А-

    «Очень хорошо» – работа хорошая, уровень выполнения отвечает большинству требований, теоретическое содержание курса освоено полностью, без пробелов, необходимые практические навыки работы с освоенным материалом в основном сформированы, все предусмотренные программой обучения учебные задания выполнены, качество выполнения большинства из них оценено числом баллов, близким к максимальному

    87-89

    В+

    83-86

    В

    хорошо

    80-82

    В-

    «Хорошо» – уровень выполнения работы отвечает всем основным требованиям, теоретическое содержание курса освоено полностью, без пробелов, некоторые практические навыки работы с освоенным материалом сформированы недостаточно, все предусмотренные программой обучения учебные задания выполнены, качество выполнения ни одного из них не оценено минимальным числом баллов, некоторые из выполненных заданий, возможно, содержат ошибки

    77-79

    С+

    73-76

    С

    70-72

    С-

    удовлетворительно

    «Удовлетворительно» – уровень выполнения работы отвечает большинству основных требований, теоретическое содержание курса освоено частично, но пробелы не носят существенного характера, необходимые практические навыки работы с освоенным материалом в основном сформированы, большинство предусмотренных программой обучения учебных заданий выполнено, некоторые виды заданий выполнены с ошибками

    67-69

    D+

    удовлетворительно

    зачтено

    63-66

    D

    60-62

    D-

    «Посредственно» – работа слабая, уровень выполнения не отвечает большинству требований, теоретическое содержание курса освоено частично, некоторые практические навыки работы не сформированы, многие предусмотренные программой обучения учебные задания не выполнены, либо качество выполнения некоторых из них оценено числом баллов, близким к минимальному

    50-59

    Е

    «Неудовлетворительно» (с возможностью пересдачи) – теоретическое содержание курса освоено частично, необходимые практические навыки работы не сформированы, большинство предусмотренных программой обучения учебных заданий не выполнено, либо качество их выполнения оценено числом баллов, близким к минимальному; при дополнительной самостоятельной работе над материалом курса возможно повышение качества выполнения учебных заданий

    25-49

    неудовлетворительно

    незачтено

    «Неудовлетворительно» (без возможности пересдачи) – теоретическое содержание курса не освоено, необходимые практические навыки работы не сформированы, все выполненные учебные задания содержат грубые ошибки, дополнительная самостоятельная работа над материалом курса не приведет к какому-либо значимому повышению качества выполнения учебных заданий

    0-24

    F

    Шкала SCORE — Центр диагностики и сердечно-сосудистой хирургии

    Что такое шкала SCORE?

    Шкала SCORE (Systematic COronary Risk Evaluation) разработана для оценки риска смертельного сердечно-сосудистого заболевания в течение 10 лет. Основой для шкалы послужили данные когортных исследований, проведенных в 12 странах Европы (включая Россию), с общей численностью 205 178 человек. Есть два варианта шкалы SCORE: для стран с низким риском и стран с высоким риском сердечно-сосудистых заболеваний (к ним относится Россия).

    Как пользоваться калькулятором SCORE?

    Для оценки суммарного риска смертельного сердечно-сосудистого заболевания с помощью калькулятора необходимо указать в соответствующих полях пол, возраст, уровень систолического АД, курит ли пациент и уровень общего холестерина. Полученная цифра представляет собой вероятность наступления смертельного исхода от сердечно-сосудистого заболевания в течение ближайших 10 лет, выраженную в процентах.

    Как интерпретировать результат?

    В зависимости от полученного значения риска (в процентах) пациента следует отнести в одну из следующих категорий:

    • Низкий риск – менее 5%
    • Высокий риск – 5% и более

    Когда суммарный сердечно-сосудистый риск выше рассчитанного?

    Надо иметь в виду, что суммарный риск может быть выше, чем рассчитанный с помощью калькулятора SCORE, если имеются следующие признаки:

    • Имеются признаки субклинического атеросклероза по данным ультразвукового исследования сонных артерий, электронно-лучевой или мультиспиральной компьютерной томографии
    • Выявлена гипертрофия левого желудочка (по данным ЭКГ или эхокардиографии)
    • Раннее развитие сердечно-сосудистых заболеваний у ближайших родственников
    • Снижен уровень холестерина ЛВП, повышен уровень триглицеридов, нарушена толерантность к глюкозе
    • Повышены уровни маркеров воспаления (С-реактивного белка и фибриногена)
    • При ожирении и малоподвижном образе жизни

    В каких случаях не нужно использовать калькулятор SCORE?

    Следующие категории пациентов по определению относятся к категории высокого риска, и дополнительный расчет суммарного риска по SCORE не нужен:

    • Установленный диагноз сердечно-сосудистые заболевания
    • Сахарный диабет 1 и 2 типа
    • Повышение уровня общего холестерина выше 8,0 ммоль/л или АД больше 180/110 мм рт.ст.

    Источники:

    1. Conroy RM, Pyorala K, Fitzgerald AP, et al. Estimation of ten-year risk of fatal cardiovascular disease in Europe: the SCORE project. Eur Heart J 2003;24:987-1003.
    2. European guidelines on cardiovascular disease prevention in clinical practice: third joint task force of European and other societies on cardiovascular disease prevention in clinical practice (constituted by representatives of eight societies and by invited experts). Eur J Cardiovasc Prev Rehabil. 2003;10(4):S1-S10.
    Шкала рейтинга

    : определение, типы вопросов и примеры

    Определение шкалы оценок

    Рейтинговая шкала определяется как вопрос закрытого опроса, используемый для представления отзывов респондентов в сравнительной форме по конкретным характеристикам / продуктам / услугам. Это один из наиболее распространенных типов вопросов для онлайн- и офлайн-опросов, когда респонденты должны оценивать атрибут или функцию. Рейтинговая шкала — это вариант популярного вопроса с несколькими вариантами ответов, который широко используется для сбора информации, дающей относительную информацию по определенной теме.

    Исследователи используют шкалу оценок в исследованиях, когда они намереваются связать качественный показатель с различными аспектами продукта или функции. Как правило, эта шкала используется для оценки производительности продукта или услуги, навыков сотрудников, эффективности обслуживания клиентов, процессов, выполняемых для достижения определенной цели и т. Д. Да нет.

    Типы рейтинговой шкалы

    В общих чертах рейтинговые шкалы можно разделить на две категории: порядковые и интервальные шкалы.

    Порядковая шкала — это шкала, в которой варианты ответов упорядочены. Разницу между двумя вариантами ответа невозможно вычислить, но варианты ответов всегда будут в определенном врожденном порядке. Такие параметры, как отношение или обратная связь, могут быть представлены с использованием порядковой шкалы.

    Подробнее: Порядковые данные

    Интервальная шкала — это шкала, в которой не только устанавливается порядок переменных ответа, но также вычисляется величина разницы между каждой переменной ответа.Абсолютное или истинное нулевое значение отсутствует в интервальной шкале. Температура в градусах Цельсия или Фаренгейта — самый популярный пример интервальной шкалы. Net Promoter Score, Likert Scale, Bipolar Matrix Table — одни из наиболее эффективных типов интервальной шкалы.

    Подробнее: интервальные данные

    Существует четыре основных типа рейтинговых шкал, которые можно использовать в онлайн-опросе:

    • Графическая шкала оценок
    • Цифровая рейтинговая шкала
    • Описательная рейтинговая шкала
    • Сравнительная рейтинговая шкала
    1. Графическая шкала оценок: Графическая шкала оценок показывает варианты ответов по шкале от 1 до 3, 1-5 и т. Д.Шкала Лайкерта — это популярный пример графической рейтинговой шкалы. Респонденты могут выбрать конкретный вариант в строке или шкале для отображения рейтинга. Эта рейтинговая шкала часто применяется менеджерами по персоналу для оценки сотрудников.
    2. Числовая шкала оценок: Числовая шкала оценок включает числа в качестве вариантов ответа, и не каждое число соответствует характеристике или значению. Например, визуальная аналоговая шкала или семантическая дифференциальная шкала могут быть представлены с использованием числовой рейтинговой шкалы.
    3. Описательная шкала оценок: В описательной шкале оценок респондентам подробно объясняется каждый вариант ответа. Числовое значение не всегда связано с вариантами ответов в описательной шкале оценок. Существуют определенные опросы, например, опрос удовлетворенности клиентов, в котором необходимо подробно описать все варианты ответов, чтобы каждый покупатель подробно объяснил информацию о том, что ожидается от опроса.
    4. Сравнительная рейтинговая шкала: Сравнительная рейтинговая шкала, как следует из названия, предполагает, что респонденты ответят на конкретный вопрос с точки зрения сравнения, т.е.е. на основе относительных измерений или использования других организаций / продуктов / функций в качестве справочной информации.

    Примеры шкалы оценок Вопросы Вопросы с рейтинговой шкалой

    широко используются в опросах об удовлетворенности клиентов, а также в опросах сотрудников для сбора подробной информации. Вот несколько примеров вопросов по рейтинговой шкале —

    • Степень согласованности: Организация намеревалась повысить эффективность своих сотрудников.После организации нескольких курсов и сертификации для сотрудников руководство решает провести опрос, чтобы узнать, соответствуют ли сотрудники их идеологии, лежащей в основе этих сертификатов. Они могут использовать вопрос с оценочной шкалой, такой как четная шкала Лайкерта или нечетная шкала Лайкерта, чтобы оценить степень согласия.

    • Качество обслуживания клиентов: Очень важно собирать информацию об опыте работы с клиентами. Для организаций важно собирать в режиме реального времени подробную информацию об опыте покупки продуктов или услуг.Вопрос о рейтинговой шкале, такой как шкала семантической дифференциации, может помочь руководству организации собирать и анализировать информацию об опыте работы с клиентами.
      • Семантическая дифференциальная шкала

    • Проанализируйте лояльность к бренду: Организации процветают за счет лояльности клиентов к своему бренду. Но лояльность к бренду — это фактор, который необходимо регулярно контролировать. Использование вопроса о рейтинговой шкале, например Net Promoter Score, может помочь организациям собирать в режиме реального времени подробную информацию о лояльности клиентов и узнаваемости бренда.Рейтинговый вопрос: «По шкале от 0 до 10, учитывая ваш опыт покупок, насколько вероятно, что вы порекомендуете наш бренд своим друзьям и коллегам?» может эффективно контролировать удовлетворенность и лояльность клиентов.


    Использование рейтинговой шкалы
    • Получите относительную информацию о конкретном предмете: В выборке из 1000 человек у каждого будет свой взгляд на тему.Сбор сравнительной информации об уровне удовлетворенности, частоте использования, лояльности и многих других подобных параметрах.
    • Сравните и проанализируйте данные: Исследователи могут собирать объективные данные о целевой аудитории и анализировать их с помощью программного обеспечения для онлайн-опросов, такого как QuestionPro. Если вопрос о рейтинговой шкале используется в выборке значительного размера, есть вероятность, что допустимая погрешность в полученных данных может быть уменьшена или устранена.
    • Измерьте один важный элемент продукта / услуги: Существуют опросы, в которых необходимо уделять особое внимание определенным темам, чтобы лучше понять целевой рынок.Рейтинговые шкалы могут применяться в тех случаях, когда необходимо проанализировать несколько важных элементов. Например, чтобы измерить степень согласия, частоту, удовлетворенность и т. Д.

    Преимущества рейтинговой шкалы

    • Вопросы для рейтинговой шкалы просты для понимания и выполнения.
    • Предлагает сравнительный анализ количественных данных в пределах целевой выборки, чтобы исследователи могли принимать обоснованные решения.
    • Используя графические шкалы оценок, исследователи могут легко создавать опросы, поскольку они требуют меньше всего времени на настройку.
    • Обширная информация может быть собрана и проанализирована с помощью рейтинговой шкалы.
    • Анализ полученных ответов на вопросы по рейтинговой шкале выполняется быстро и требует меньше времени.
    • Рейтинговая шкала часто считается стандартом для сбора качественной и количественной информации для исследований.

    20 бесплатных готовых примеров рейтинговой шкалы опроса

    Рейтинговая шкала — это тип закрытого вопроса опроса, в котором запрашивается отзыв или мнение респондента о каком-либо конкретном событии, продукте, услуге или бренде.Это один из наиболее часто используемых типов вопросов почти во всех анкетах и ​​опросах, которые мы находим офлайн или онлайн. Шкалы опроса могут различаться по способу представления в зависимости от целей и специфики изучаемого понятия.

    Ответы на вопросы по шкале оценок — это быстро и весело, а при внимательном анализе ответы дают много ценной информации.

    Ниже я поместил список наиболее распространенных примеров шкал опроса с пояснениями и комментариями о том, когда и как их использовать в опросе.В целях иллюстрации я использовал образцы шкалы оценок, созданные в конструкторе онлайн-опросов AidaForm, где вы можете бесплатно создавать и использовать свои традиционные или разговорные опросы.

    Используя линейные числовые шкалы, респонденты могут измерить такие вещи, как их удовлетворенность качеством предоставляемых услуг, простота использования, важность или вероятность рекомендации. NPS (Net Promoter Score) — конкретный вариант использования этого типа. Прочтите о Net Promoter Score.

    Насколько вероятно, что вы порекомендуете наш продукт?

    В отличие от линейных числовых шкал, графические весы могут не иметь чисел на шкале и могут просить респондентов выразить свое удовлетворение, выбрав соответствующее количество графических объектов — звезд, шаров, тортов.

    Наиболее часто используемые графические шкалы обозначают варианты ответов по шкале от 1 до 10 и от 1 до 5. Звездочки и числа представляют собой величину, которую можно усреднить и проанализировать аналогично линейным числовым шкалам.

    Как бы вы оценили свой опыт работы с сайтом AidaForm?

    1 — Ужасно, 3 — Нейтрально, 5 — Отлично


    Как бы вы оценили свой опыт работы со службой поддержки клиентов AidaForm?

    1 — Ужасно, 10 — Отлично

    Преимущество типа шкалы в том, что респонденты могут выбрать любое желаемое число от 0 до 100%.Более того, шкалы слайдера тоже занимательны, не так ли?

    Как бы вы оценили свой опыт работы со службой поддержки клиентов AidaForm?

    Как бы вы оценили свой опыт работы с онлайн-сервисом AidaForm?

    Насколько вас устраивает Раздел шаблонов AidaForm?

    Насколько вы довольны посещением нашего спортивного клуба сегодня?

    Классическая шкала Лайкерта просит участников согласиться или не согласиться (или одобрить / не одобрить) нескольких утверждений, связанных с предметом вашего исследования.Прочтите о шкале Лайкерта.

    Есть ли подходящий размер для шкалы Лайкерта? Ваши шкалы Лайкерта могут различаться, но предпочтительны шкалы с нечетным количеством баллов, так как они имеют среднюю точку, которая дает участникам нейтральный ответ. Четырех- или шестибалльная шкала позволяет респонденту выбирать между «за» и «против». В конце концов, вы хотели бы иметь объективные данные.

    Насколько вы согласны или не согласны с утверждениями?

    Этот тип рейтинговой шкалы очень широко используется в онлайн-опросах.Это выглядит как компактная версия четырех линейных числовых шкал вместе взятых.

    Оцените ваше отношение к каждой из марок

    1 — совсем не благоприятно, 7 — крайне благоприятно, н / д — марку не знаю

    Шаблоны опросов с примерами рейтинговой шкалы

    Вы можете добавить эти шаблоны в свою учетную запись AidaForm, настроить логотипы и тексты и начать сбор ценной бизнес-информации за пять минут.

    Ниже вы найдете два примера частотных шкал, которые выглядят по-разному, но выполняют одну и ту же задачу — сбор информации о частоте.

    Пример 1.
    Приобретая электронные товары, как часто вы делаете следующее?


    Пример 2.
    Как часто вы пользуетесь нашим продуктом?

    Эта рейтинговая шкала используется, когда количество ответов настолько велико, что респондентам становится действительно сложно оценить ответы с использованием других шкал. Обычно респондентов просят выбрать ограниченное количество вариантов.

    Какие из следующих вопросов наиболее важны для вас при поиске информации о поставщиках медицинских услуг в Интернете?

    Вы должны выбрать ПЯТЬ пунктов

    Шкала парных сравнений обычно используется для мини-ранжирования и предлагает респондентам выбрать между двумя альтернативами.Парная шкала сравнения полезна, например, чтобы узнать, какой дизайн веб-сайта или бренд больше нравится вашим клиентам.

    Какой из двух сайтов, которые вы посетили сегодня, вы предпочли?

    По сравнительной шкале участников просят оценить свои предпочтения и силу предпочтений в отношении одних и тех же представлений о двух объектах исследования. Онлайн-шкала в примере предлагает респондентам оценить свои предпочтения и интенсивность в отношении двух тарифных планов аренды автомобилей.

    Его также можно использовать для сравнения предпочтений участников по отношению к известному внешнему критерию, например известному бренду или веб-сайту (в данном примере это Amazon).

    Пример 1.
    Если подумать о следующих атрибутах тарифных планов «Бюджет» и «Корпоративный», какой из них вы предпочтете?

    1 — Настоятельно предпочитаю Budget, 3 — Ни то, ни другое, 5 — Настоятельно предпочитаю Enterprise


    Его также можно использовать для сравнения предпочтений участников в отношении известного внешнего эталона, такого как известный бренд или веб-сайт (в данном примере это Amazon).


    Пример 2.
    Думая о своем опыте использования целевого веб-сайта по сравнению с Amazon.com, как бы вы оценили следующие атрибуты?

    Шкала семантического дифференциала часто используется для измерения эмоционального отношения и убеждений. При создании шкалы очень важно использовать явно противоположные прилагательные, такие как большой и маленький. Вы можете подробнее узнать о семантических дифференциальных шкалах в нашем сообщении в блоге, посвященном этому типу шкалы опроса.

    Думая о Netflix, как бы вы оценили Netflix по каждому из следующих атрибутов?

    Контрольные списки прилагательных широко используются для оценки отношения потребителей к брендам. Это также метод, используемый в Microsoft Desirability Toolkit для проверки визуальной привлекательности. Респонденты должны выбирать из списка прилагательных, имеющих как положительную, так и отрицательную коннотацию.

    Что из следующего лучше всего описывает ваш опыт работы с AidaForm

    Респонденты должны оценить прилагательное или понятия и выразить некоторую степень интенсивности.Это выход, когда найти полярные противоположности по шкале семантического дифференциала становится действительно проблематично.

    Насколько хорошо термины описывают ваш опыт работы с сайтом German Wings?

    1 — Совсем нет, 7 — Совершенно

    Создайте свой бесплатный опрос, используя примеры рейтинговой шкалы

    Создание шкалы оценок в AidaForm занимает всего несколько минут. AidaForm — это инструмент для создания онлайн-опросов, в котором вы можете создавать опросы, делиться ими, собирать и оценивать ответы в личном кабинете.

    Зарегистрируйтесь для получения бесплатной учетной записи и создайте свои собственные шкалы опросов с помощью предварительно созданных полей «Шкала», «Матрица», «Рейтинги» и «Множественный выбор» или одного из готовых к использованию шаблонов опросов. Добавьте понравившиеся шаблоны в свою учетную запись AidaForm, просто нажав кнопку «Использовать шаблон», настройте логотипы и тексты и сразу же начните сбор ценной информации.

    Более того, AidaForm обеспечивает интеллектуальный анализ опросов, позволяющий интерпретировать и максимально использовать данные, собранные с помощью вопросов с рейтинговой шкалой.

    рейтинговых шкал или рейтинговых шкал: что вам подходит?

    Рейтинг против рейтинга: что лучше?

    Рейтинговая и рейтинговая шкалы имеют свои преимущества. Они оба также играют важную роль в опросе. Ни один из вопросов не может дать наилучших результатов сам по себе.

    Самые точные опросы сочетают оба стиля вопросов, а также вопросы с открытым ответом. Но чтобы получить максимальную отдачу от вашего опроса, нужно не только знать, какой тип вопросов использовать.Это также требует знания , когда подходит каждый стиль вопросов.

    Рейтинговые плюсы и минусы

    Рейтинговые шкалы — один из наиболее часто используемых вопросов в опросах, и не зря; Поскольку рейтинговые вопросы представляют собой вариант с несколькими вариантами ответов, они часто более ясны и понятны респондентам.

    Рейтинговые шкалы лучше всего использовать, когда вы хотите измерить эффективность чего-то или кого-то. Вопросы могут сильно различаться.

    Насколько вероятно, что вы порекомендуете наши продукты другу или коллеге?

    Оцените, насколько вы удовлетворены нашим обслуживанием клиентов.

    В какой степени наш процесс адаптации положительно повлиял на ваш успех как сотрудника?

    Рейтинговые вопросы полезны, когда вы пытаетесь определить, насколько хорошо продукт работает, как потребители относятся к новому продукту или где, по их мнению, на рынке может быть пробел.

    Одно из преимуществ рейтинговых шкал состоит в том, что они позволяют респондентам не только предлагать свои предпочтения, но и присваивать одинаковые значения нескольким элементам.

    Однако это также может быть недостатком. Некоторые респонденты никогда не выбирают самый высокий (или самый низкий) рейтинг. Другие автоматически присваивают каждому вопросу одинаковое значение.

    Ранжирование за и против

    Слабость рейтинговой шкалы также является ее сильной стороной: она заставляет потребителей придавать большее значение одному пункту, а не другому. Однако может быть несколько товаров, которые потребители ценят одинаково. Рейтинг не раскрывает эту информацию.

    Если вы пытаетесь определить, как определенные продукты сравниваются друг с другом, ранжирование — это идеальный способ задать свой вопрос.Вместо того, чтобы просто оценивать уровень удовлетворенности потребителя одним предметом , ранжирование позволяет вам увидеть уникальную ценность нескольких разных предметов вместе.

    Помните наш пример брендинга газированных напитков? Многие известные бренды газированных напитков за эти годы потратили миллионы на постоянный ребрендинг в ущерб продажам и общественному мнению.

    Этих ошибок можно избежать. Использование опросов для опроса аудитории, ориентированной на потребителей, существенно влияет на внедрение — или потенциальное внедрение — нового продукта.Предположим, например, что ваша компания по производству газированных напитков хотела бы представить несколько новых вкусов. После того, как вы завершите рейтинговый опрос, чтобы определить, какие вкусы наиболее предпочтительны, рейтинговое исследование позволит вам определить наилучший порядок выпуска новых вкусов.

    «Расположите эти три вкуса в порядке от самого любимого до наименее любимого». Поскольку вы уже знаете, что вкусы нравятся всем, рейтинг фаворитов даст вам представление о том, какой аромат выпустить первым или какой из них, вероятно, подойдет лучше всего.

    В некоторых случаях вопросы для ранжирования или сравнения снижают степень предвзятости ответа и языковой предвзятости в межкультурных опросах. Это может быть особенно полезно при определении того, как товар может быть воспринят широким кругом потребителей по всей стране и в разных регионах.

    Однако рейтинговые шкалы имеют свой набор проблем. Представьте слишком много категорий, и респонденты будут подвергнуты психологическому налогу. Вопросы остаются без ответа или ранжирование четко не продумано.

    Комбинированные усилия

    Использование комбинации вопросов в вашем опросе действительно дает наилучшие результаты.Ранжирование часто является отличным способом сузить круг данных, которые затем можно превратить в вопрос о рейтинговой шкале.

    Например, вы можете попросить своих потребителей поставить ранжировать 20 товаров, доступных в торговом автомате, от наименее к наиболее любимым. Основываясь на результатах, вы можете попросить клиентов оценить , насколько вероятно, что они купят каждый из предпочтительных товаров.

    Используя вопросы вместе, вы получите более полное представление о том, что нравится вашим потребителям, чего они хотят и как они принимают решения.

    Как получить максимальную отдачу от вашего опроса

    Когда дело доходит до исследований и разработок, ведущие компании указывают, что отзывы потребителей являются одним из наиболее важных факторов, способствующих получению максимальной отдачи от их бюджета и их продуктов.

    Как создать опрос, который поможет быстро получить полезную информацию?

    Анализ и интерпретация данных рейтинговых шкал | Автор: Кевин Ли

    Практический пример из 2 частей с использованием данных опроса об удовлетворенности студентов / клиентов

    Примечание. Код для этого сообщения можно найти здесь

    Подробный анализ шкал оценок (изображение автора)

    Рейтинг Весы — это эффективный и популярный способ определения отношения и мнения.Их легко внедрить, и они широко используются в опросах, формах обратной связи и оценках эффективности. Тем не менее, при внедрении и анализе этого, казалось бы, интуитивно понятного инструмента часто возникают злоупотребления и ошибки. Способность понимать и синтезировать информацию из рейтинговых шкал дает возможность принимать решения в постоянно меняющейся среде. Целью этой серии из двух частей является демонстрация основных концепций , необходимых для эффективного использования данных рейтинговых шкал, а также предупреждения об общих ловушках .В первой части мы начинаем с качественных соображений, которые имеют существенное значение для уместности количественного анализа , обсуждаемого во второй части.

    Знакомство с набором данных

    Мы будем использовать результаты еженедельных опросов, которые я собрал в своем классе Data Analytics, для нашего тематического исследования. Эти анонимных опросов потребовались от всех студентов на еженедельных основаниях. В инструкциях учащихся просят оценить по шкале от 1 (плохо) до 5 (хорошо) для каждого из нижеперечисленных факторов, начиная с общей оценки , для « Общая удовлетворенность, ».Наша цель — лучше понять, что студенты думают о своем опыте на протяжении всей учебной программы.

    Вопросы к форме обратной связи

    Понимание рейтинговой шкалы

    Каждая рейтинговая шкала реализована как закрытый вопрос для получения информации. От респондентов требуется присвоить оцениваемому объекту оценку в соответствии с инструкциями. При правильном использовании рейтинговые шкалы действуют как инструменты измерения для нефизических свойств .В отличие от научных инструментов, которые мы используем для измерения физических свойств (например, термометра для измерения температуры и линейки для измерения длины), рейтинговые шкалы можно использовать для измерения свойств, которые являются когнитивными по своей природе. Поскольку они абстрактны, нематериальны и сложны, их часто невозможно обобщить в одном вопросе. Вместо этого мы можем задать ряд связанных вопросов, охватывающих различные аспекты (или факторы) темы, которые мы называем «конструкцией интереса ». Ответы на эти отдельные, но связанные вопросы, скорее фундаментальный и декларативный .

    Типы рейтинговых шкал

    Существует 4 основных уровня шкал измерения для сбора данных. Каждая шкала представляет собой инкрементальных уровней измерения, т.е. каждая шкала выполняет функцию предыдущей. При анализе данных важно сначала понять, что представляют собой переменные.

    4 типа измерительных весов

    P.S. Одна из распространенных ошибок аналитики рейтинговых шкал — это предположение о том, что расстояние между вариантами одинаково.

    Типы анализа, доступные для номинальной шкалы , могут быть весьма ограничивающими из-за отсутствия числовых свойств.Их легко реализовать, но они полезны только для категориальных данных. Наиболее распространенными рейтинговыми шкалами являются порядковые или интервальные, в которых варианты выбора имеют свойство порядка ранжирования. Разница между ними может быть тонким , но значение довольно значимое с аналитической точки зрения. При принятии решения, какой из них был / должен быть реализован, мы учитываем, воспринимаются ли (все) варианты респондентами как равноудаленные .Эта неадекватность дискредитирует возможность использования параметрической статистики для порядковых шкал , но иногда может быть предпочтительнее из-за их относительной простоты использования. С другой стороны, шкала Interval Scales разрабатывает варианты, которые должны быть равномерно распределены (т. Е. Величина различий одинакова для всех вариантов), что может быть выполнено путем привязки словесных якорей к серийным номерам. Этот подход основан на интуиции людей в отношении числовой прямой и поддерживает использование среднего , стандартного отклонения , а также других статистических методов .Данные, которые мы анализируем, взяты из интервальных шкал; поэтому величина и различия вариантов выбора респондентов имеют значение, хотя это не означает, что вариант №4 вдвое сильнее, чем вариант №2 (как это было бы для шкалы отношения по шкале ).

    Измерительные приборы обладают надежностью и достоверностью

    Рейтинговые шкалы измеряют нефизические атрибуты, которые трудно определить. и не имеют стандартов для проверки; поэтому трудно понять, работают ли они так, как задумано.Эффективность рейтинговой шкалы можно оценить с помощью надежности и достоверности , как определено ниже:

    • надежности (подразумевает стабильность и согласованность ) — прибор дает тот же результат при повторном использовании.
    • Действительность (подразумевает точность ) — прибор измеряет именно то, что он должен измерять.

    Fido учит надежности и валидности

    Давайте проведем аналогию, чтобы подчеркнуть важность надежности и валидности.Предположим, мы считаем, что собаку Фидо обучили предупреждать об опасном повышении уровня сахара в крови. Они делают это, обнаруживая запах, связанный с биохимией на этих уровнях глюкозы в крови. Фидо во многих отношениях действует как инструмент измерения. Мы должны сначала оценить их надежность и валидность, прежде чем они будут сертифицированы как официальная собака, предупреждающая о диабете. Для обеспечения надежности мы хотим убедиться, что они могут постоянно подавать предупреждающие сигналы для своего товарища-человека. Они должны демонстрировать устойчивость к отвлекающим факторам из их окружения и чтобы предупредительные сигналы не были беспорядочными.Для валидности мы хотим убедиться, что их предупреждающие сигналы действительно указывают на аномальные уровни сахара в крови. Их предупреждающие сигналы должны сопровождаться чрезмерно высокими или низкими показаниями BGM (монитора глюкозы в крови), который носит пациент.

    Измерение надежности и достоверности

    Надежность и достоверность оцениваются качественно , а также количественно . Чтобы получить уверенность в оценках надежности и достоверности, наши данные должны иметь достаточный размер выборки, а также некоторую изменчивость (как показано на гистограммах ниже).Важно помнить, что рассчитываемые нами оценки в основном используются для оценки качества исследовательского метода и не обязательно для вывода о результатах.

    Распределение рейтингов по факторам исследования

    Надежность

    Надежность — это степень, в которой рейтинговая шкала дала бы те же результаты, если бы ее снова применяли в тех же условиях, то есть ее стабильность лет или согласованность лет.Без надежности мы не можем гарантировать, что данные рейтинговых шкал являются значимыми, а не (частично) случайными. Мы можем количественно оценить надежность, посмотрев на сходство между двумя (или более) наборами измерений, то есть степень согласованности e. Фактически, существует 4 типа надежности, которые сравнивают разные наборы результатов с той же рейтинговой шкалой, которая представлена ​​на диаграммах разброса ниже:

    Различные типы согласованности

    Для интервальных данных целесообразно использовать корреляцию для оценки надежности, что в целом измеряет наличие связи между двумя переменными (вместо согласия).Надежность может показать, насколько хорошо Шкала оценок противостоит внешним факторам , которые могут повлиять на способность людей точно реагировать, например, нечетким инструкциям или меткам выбора . Трудно определить порог того, что считается надежным; поэтому целесообразно изучить каждый из 4 типов надежности (при необходимости), чтобы найти и тщательно изучить доказательства ненадежности:

    • Проверка-повторная проверка надежности рассматривает согласованность результатов, полученных одними и теми же респондентами с течением времени.Он используется для оценки того, насколько хорошо рейтинговая шкала противостоит внешним факторам, таким как настроение респондентов во время опроса. Это может быть выражено как корреляция ( Пирсон ) парных результатов между опросами, проведенными в разные моменты времени, как показано на примере A) и B) . Это также известно как Внутриклассная надежность , которая предполагает, что студенты будут реагировать одинаково каждую неделю, поскольку их мнение о классе не должно существенно меняться.Увеличение времени между тестом и повторным тестированием (для уменьшения эффекта памяти ) вводит перспективу подлинных изменений с течением времени, что затрудняет наблюдение за надежностью.
    Проверка-повторная проверка надежности (надежность внутри оценщика)

    В B1) мы наносим результаты на диаграмму против самой себя, чтобы получить идеальную корреляцию. Это необходимо для моделирования, если результаты в двух временных точках были идентичными и высоконадежными. В пунктах B2) и B3) данные считаются менее надежными, о чем свидетельствует выбор респондентами постепенно различных оценок, например.грамм. ответили 4 сначала, но 3 или 5 во второй раз. Это может быть связано с различной интерпретацией инструкций или вариантов выбора, что приводит к снижению корреляции. Фактические результаты наших данных проиллюстрированы в B4) с коэффициентом корреляции ~ 0,65, что неплохо, поскольку мы ожидаем, что мнения изменятся. Стоит отметить снижение корреляции между 3-ей и 6-й неделями (как показано в C) ), вероятно, из-за разницы во времени во время зимних каникул.

    • Внутренняя согласованность , как следует из названия, обеспечивает согласованность результатов по элементам, предназначенным для измерения одной и той же конструкции.Другими словами, согласуются или противоречат ли результаты связанных вопросов в рамках опроса. Он начинается с парных корреляций ( Пирсона, ) между каждой шкалой рейтинга, как показано на примере A) и B) .
    Внутренняя согласованность

    В B) мы строим попарные корреляции между шкалами оценок с помощью тепловой карты. Неудивительно, что все индивидуальные факторы коррелировали с глобальным рейтингом «Общая удовлетворенность».Это говорит о том, что высокие оценки в факторах соответствуют высокой оценке в «общей удовлетворенности», и наоборот. Кроме того, результаты по вопросам, связанным с преподавателем (ясность, знания и вовлеченность), имели высокую корреляцию. Корреляции можно суммировать с помощью альфы Кронбаха, которая для наших данных была> 0,8. Мы увидели более низкую корреляцию между «Применять обучение вне класса» и «Знания инструктора», а также между «Применять обучение вне класса» и «Академическая поддержка», что приемлемо, поскольку они менее связаны.

    • Надежность между оценщиками рассматривает согласованность результатов разных людей. Он используется для оценки того, насколько субъективность влияет на выбор респондентов. Его можно рассчитать с помощью парных корреляций ( Пирсона, ) между респондентами, как показано на примере A) и B) . Хотя корреляции между отдельными респондентами менее важны, они в целом должны отражать некое общее согласие (что суммируется с помощью коэффициента надежности, такого как альфа Кронбаха).
    Надежность между оценщиками

    В B) мы строим попарные корреляции между студентами с помощью тепловой карты. Большинство корреляций> 0,6, за некоторыми исключениями. Небольшое количество респондентов, показывающих низкую корреляцию с другими, приемлемо, если большинство студентов могут ответить аналогичным образом.

    П.С. Использование корреляции Пирсона подходит только для интервальных данных и, в меньшей степени, для порядковых данных, поскольку оно поддерживает порядковые отношения между вариантами.Для номинальных данных соответствие может быть измерено с помощью общего процентного согласия или каппы Флейсса / Коэна.

    • Надежность параллельных (или эквивалентных) форм требует, чтобы одни и те же респонденты прошли разные версии опроса, которые должны быть эквивалентными. Как вариант, этого можно достичь, создав большой набор вопросов и случайным образом разделив их на два набора. К сожалению, у нас не было заменяемых вопросов для опроса.

    Срок действия

    Срок действия — это степень, в которой результаты шкалы рейтинга представляют то, для чего они предназначены, т.е.е. точность . Когда измерение имеет надежность, мы более уверены, что результаты представляют то, что они предполагают; следовательно, валидность основана на надежности , но сама по себе надежность недостаточна — шкала оценок может быть чрезвычайно надежной, но недействительной. Самый очевидный способ определить действительность измерения — сравнить его с эталонным тестом . Измерения, сопоставимые с эталонными, с большей вероятностью будут действительными, но, к сожалению, они не всегда существуют.Здесь мы ссылаемся на эталонный тест как на 1) — проверенный метод измерения интересующей конструкции или 2) — статистику популяции, относящуюся к интересующей конструкции. Даже если эталонный тест не является точным, сравнение поможет проверить шкалу рейтинга. Существует три типа валидности:

    • Лицевая валидность рассматривает соответствие рейтинговых шкал существующей теории и знанию измеряемой концепции. С другой стороны, Content Validity смотрит на степень, в которой опрос, кажется, охватывает все аспекты интересующей конструкции.Обе они представляют собой качественных оценок, и лучше всего достигаются путем запроса отзывов от и экспертов и участников . Кроме того, описание вопросов и вариантов выбора должно быть четким, подробным и полным, чтобы соответствовать интересующей конструкции. В контексте наших данных мы проконсультировались с экспертами в области образования, чтобы убедиться, что вопросы опроса являются исчерпывающими и тесно связаны с тем, что волнует учащихся.
    • Достоверность критерия исследует, насколько близко результаты рейтинговых шкал соответствуют результатам другого подхода, который направлен на измерение аналогичных построений.Результаты, с которыми мы сравниваем, — это критерий , критерий , который обычно исходит из установленного или широко используемого метода. Высокая корреляция между ними дает хорошее представление о том, что рейтинговые шкалы измеряют то, что предполагается. Мы хотим установить валидность рейтинговых шкал в нашем опросе, поэтому мы ищем сравнительные меры. Вместо настоящих критериев «Золотого стандарта» мы можем использовать глобальный рейтинг «Общая удовлетворенность», собранный в начале, для оценки достоверности других факторов.Разумно предположить, что рейтинги отдельных факторов вносят свой вклад и, следовательно, должны коррелировать с рейтингом удовлетворенности.
    Одновременная достоверность

    Как композит (совокупная сумма отдельных факторов), так и взвешенный композит коррелируют с общим уровнем удовлетворенности. Он известен как одновременной действительности , потому что его общая оценка удовлетворенности принимается одновременно с другими вопросами.

    Прогнозируемая валидность

    В поисках дополнительных доказательств валидности мы можем дополнить результаты нашего опроса данными из еженедельных заданий учащихся.Мы увидели, что существует высокая корреляция между «рейтингом обратной связи о домашнем задании» и количеством слов в отзывах оценивающих по отправленным учащимся заданиям. Кроме того, существует высокая корреляция между «Академической поддержкой» и оценками за задания. Это известно как прогнозируемая достоверность , поскольку эти переменные собираются позже.

    Способы подготовки к надежности и достоверности

    Мы не узнаем, насколько надежным или достоверным является опрос, пока он не будет проведен.Даже тщательно разработанные рейтинговые шкалы могут столкнуться с проблемами, если их неправильно использовать. Ниже приведены несколько советов, которые увеличивают шансы на высокую надежность и валидность:

    • Спроектируйте тщательно и учитывайте мнения других — для обеспечения успеха опроса требуется серьезное планирование, начиная с четко определенных целей, задач и даже метода сбора данных. Факторы, которые влияют на интересующую конструкцию, должны быть нанесены на карту, чтобы обеспечить включение всех соответствующих аспектов.
    • Учитывайте предпочтения / усилия респондентов — легко заполняемые вопросы обеспечивают высокую степень участия. С другой стороны, рейтинговые шкалы, которые сложно использовать или понять, вызывают у респондентов разочарование и демотивацию, что снижает качество их ответов.
    • Избегайте источников предвзятости — ниже приведены распространенные источники предвзятости, обнаруженные в рейтинговых шкалах:
    Различные источники предвзятости

    Резюме

    В этой статье мы провели качественную оценку данных рейтинговой шкалы из опроса удовлетворенности студентов / клиентов.Мы ожидаем от наших данных надежности и достоверности, но для достижения и того, и другого требуется много работы. Чтобы получить максимальную отдачу от рейтинговых шкал, мы должны провести анализ компромисса между надежностью, валидностью, дискриминирующей способностью и предпочтениями респондентов. С развитием вычислительной техники методы сбора данных становятся более гибкими, адаптивными и эффективными, чем когда-либо. Я оптимистично настроен в том, что огромные возможности этого типа исследований будут и дальше помогать организациям удовлетворять потребности своих клиентов.

    Далее мы проведем количественный анализ тех же данных. Если вам понравилась статья, я приглашаю вас подписаться на меня, чтобы вы могли получать уведомления о второй части.

    Рейтинговая шкала — обзор

    2.6 Рейтинговые шкалы

    Показатели рейтинговой шкалы обеспечивают стандартизированный формат для сбора информации о поведенческих характеристиках человека и могут применяться для детей для получения данных самоотчета или для родителей, учителей и / или или другим лицам, осуществляющим уход, для получения данных отчета информатора.Некоторые из преимуществ рейтинговых шкал — это их способность предоставлять поведенческую информацию за короткий промежуток времени, их умеренная стоимость, а также их техническая точность и практическая полезность. Рейтинговые шкалы могут использоваться для комплексной оценки потенциальных поведенческих проблем и недостатков в функционировании для скрининга, диагностики / классификации, выбора лечения / планирования вмешательства, мониторинга прогресса и оценки результатов.

    Как и в случае с большинством других форм оценивания, существуют некоторые проблемы, связанные с использованием оценочных шкал.Эти проблемы обычно подпадают под одну из двух категорий: систематическая ошибка ответа и дисперсия ошибок. Систематическая ошибка ответов относится к тенденциям в том, как респонденты реагируют на рейтинговые шкалы. Некоторыми примерами предвзятости ответа являются эффекты ореола (т. Е. Положительная или отрицательная оценка учащегося на основе характеристик, не связанных с тем, что измеряется), эффекты снисходительности или серьезности (т. ) и эффекты центральной тенденции (т. е. тенденция ставить оценки ниже среднего и избегать оценок по конечным точкам).Дисперсия ошибок относится к различиям между несколькими оценками одного и того же человека. Различные типы дисперсии ошибок включают исходную дисперсию (т. Е. Различия в рейтингах, предоставленных разными людьми), дисперсию настроек (т. Е. Различия в рейтингах в разных ситуациях), временную дисперсию (т. Е. Несогласованность оценок поведения с течением времени) и дисперсию инструмента ( т.е. различия в рейтингах по разным инструментам).

    Хотя рейтинговые шкалы являются ценным инструментом, часто возникает соблазн чрезмерно полагаться на них из-за их минимальных затрат.Хотя они эффективны, есть много вопросов, на которые они не отвечают (например, роль непредвиденных обстоятельств, связанных с окружающей средой). Хотя экологические проблемы имеют решающее значение для разработки мероприятий, эта информация обычно не предоставляется с помощью рейтинговых шкал. Кроме того, рейтинговые шкалы так же полезны, как и источники. Например, дети довольно плохо оценивают собственное деструктивное, неадекватное и неадекватное поведение; следовательно, взрослые были определены как лучший источник этой информации.С другой стороны, дети, по-видимому, лучше сообщают о своих внутренних аффективных состояниях и, как следствие, обычно лучше оценивают свои собственные депрессивные и тревожные характеристики. Однако, хотя это общие тенденции, которые следует учитывать при интерпретации рейтинговых шкал, существует значительная индивидуальная изменчивость.

    RatingScale — PsychoPy v2021.2

    win:

    A Window объект (обязательно).

    выбор:

    Список элементов, из которых субъект может выбирать. вариантов имеет приоритет над низким , высоким , точность , шкала , метки и tickMarks .

    low:

    Наименьший числовой рейтинг (целое число), по умолчанию = 1.

    high:

    Наивысший числовой рейтинг (целое число), по умолчанию = 7.

    precision:

    Части галочки, принимаемые в качестве входных данных [1, 10, 60, 100]; по умолчанию = 1 (целая галочка).Нажатие клавиши в leftKeys или rightKeys переместит маркер на одну часть галочки. precision = 60 предназначен для поддерживать рейтинги величин, зависящих от времени, при этом секунды дробные минуты (или минуты — дробные часы). На дисплее используется двоеточие (мин: сек или часы: мин) чтобы сообщить об этом участникам. Значение, возвращаемое getRating () будет долей минуты (например, 1:30 -> 1,5 или 59 секунд -> 59/60 = 0,98333). часы: мин: сек не поддерживаются.

    шкала:

    Дополнительное напоминание о том, как ответить или оценить элемент, отображается над линией; по умолчанию = ‘ = совсем нет, = чрезвычайно”. Чтобы подавить масштаб, установите scale = None .

    label:

    Текст, который будет помещен в определенные отметки, чтобы указать их значение. Могут быть только концы (если дано 2 метки), концы + середина (если дано 3 метки), или все точки (если у них такое же количество меток, как у точек).

    tickMarks:

    Список позиций, на которых должны быть размещены отметки от минимума к высокому. По умолчанию деления ставятся одинаково, по одной на целое значение.

    tickHeight:

    Вертикальная высота делений: 1.0 — высота по умолчанию (над линией), -1.0 ниже линии, а 0.0 подавляет отображение отметок. tickHeight чисто косметический, а можно быть дробным, например, 1.2.

    marker:

    Подвижный визуальный индикатор текущего выделения.В предопределенные стили: «треугольник», «круг», «свечение», «бегунок», и «зависнуть». Ползунок плавно перемещается, когда их достаточно положение экрана для перемещения, например, низкий = 0, высокий = 100. Наведение требует набора вариантов и позволяет щелкнуть напрямую на индивидуальный выбор; время пребывания не записывается. Также может быть установлен пользовательский маркер-стимул: любой объект с будут работать метод .draw () и .pos, например, visual.TextStim (win, text = '[]', units = 'norm') .

    markerStart:

    Местоположение или значение, которое должно быть предварительно выбрано при начальном отображении, числовой или один из вариантов.Может быть дробным, например, на полпути между двумя вариантами.

    markerColor:

    Цвет для использования в предварительно заданном стиле маркера, например, «DarkRed».

    markerExpansion:

    Влияет только на свечение Маркер : насколько расширять или сжиматься при движении вправо; 0 = нет, усадка отрицательная.

    singleClick:

    Включите щелчок мышью, чтобы выбрать и принять рейтинг, по умолчанию = Ложь . Допустимое нажатие клавиши также будет считаться однократным нажатием.Поле «принять» отображается, но щелчок по нему не дает никакого эффекта.

    postuple (x, y)

    Положение шкалы оценок на экране. Середина линия будет расположена на (x, y) ; по умолчанию = (0,0, -0,4) в единицах нормы

    размер:

    Насколько расширить или сузить отображение общей шкалы оценок. Размер по умолчанию = 1.0. Для большего, чем значение по умолчанию, установите размер > 1; для меньшего размера установите <1.

    stretch:

    Подобно , размер , но влияет только на горизонтальное направление.

    textSize:

    Размер текстовых элементов относительно размера по умолчанию (т.е. коэффициент масштабирования, а не точки).

    textColor:

    Цвет для меток и масштабирования текста; по умолчанию = «LightGray».

    textFont:

    Имя используемого шрифта; default = ‘Helvetica Bold’.

    showValue:

    Показать тему, их текущий выбор по умолчанию = Истинно . Игнорируется, если singleClick имеет значение True .

    showAccept:

    Показать кнопку, которую нужно щелкнуть, чтобы принять текущее значение, используя мышь; по умолчанию = Истинно .

    acceptPreText:

    Текст, отображаемый перед выбором любого значения.

    acceptText:

    Текст, отображаемый в кнопке «принять» после того, как значение был выбран.

    acceptSize:

    Ширина поля принятия относительно значения по умолчанию (е.г., 2 в два раза шире).

    acceptKeys:

    Список ключей, которые используются для принятия текущего ответа; по умолчанию = «возврат».

    leftKeys:

    Список клавиш, каждая из которых означает «перемещение влево»; по умолчанию = ‘left’.

    rightKeys:

    Список клавиш, каждая из которых означает «перемещение вправо»; по умолчанию = «право».

    respKeys:

    Список ключей, используемых для выбора вариантов в желаемом порядке.Первый элемент будет самым левым выбором, второй пункт будет следующим выбором, и так далее.

    skipKeys:

    Список ключей, которые субъект может использовать для пропуска ответа, по умолчанию = «вкладка». Чтобы требовать ответа на каждый элемент, установите skipKeys = None .

    lineColor:

    Цвет RGB, используемый для линии шкалы, по умолчанию = «Белый».

    mouseOnly:

    Требовать, чтобы субъект использовал мышь (любой ввод с клавиатуры игнорируется), по умолчанию = Ложь .Может использоваться, чтобы избежать конкуренции с другими объектами для ввода с клавиатуры.

    noMouse:

    Требовать от субъекта использовать ключи для ответа; отключить и спрятать мышь. markerStart по умолчанию будет левым концом.

    minTime:

    Количество секунд, которые должны пройти, прежде чем ответ будет принят, по умолчанию = 0,4 .

    maxTime:

    Секунды, по истечении которых ответ не может быть принят. Если maxTime <= minTime , ограничения по времени нет.По умолчанию = 0,0 (без ограничения по времени).

    исчезнуть:

    Должна ли шкала оценок исчезнуть после принятия значения. Может быть полезно при отображении нескольких шкал.

    flipVert:

    Следует ли зеркально перевернуть шкалу оценок по вертикали направление.

    рейтинговых шкал в исследовании UX: Лайкерта или семантический дифференциал?

    Шкала Лайкерта и семантический дифференциал — это два типа рейтинговых шкал, которые часто используются в опросах UX.Они часто путаются, потому что различия между ними неуловимы. Однако они проливают свет на взгляды и предпочтения несколько иначе.

    Как профессионалы UX используют вопросы по шкале оценок

    Мы часто измеряем отношения, восприятие, убеждения, предпочтения и самооценку поведения с помощью вопросов с рейтинговой шкалой. Эти типы вопросов позволяют высказать свое мнение .

    Вопросы рейтинговой шкалы появляются в различных методах исследования. Чаще всего вопросы с рейтинговой шкалой, конечно, используются в опросах.Однако вопросы с рейтинговой шкалой также часто задаются в количественных тестах юзабилити. Данные об отношениях, полученные на основе вопросов с рейтинговой шкалой, помогают нам понять, как пользователи воспринимают наш продукт или услугу, в дополнение к тому, как они выполняли данную задачу. Эти данные дают нам более полную картину общего пользовательского опыта.

    Шкала Лайкерта

    Шкала Лайкерта (произносится как Lick-urt ) названа в честь психолога Ренсиса Лайкерта, который создал метод шкалы Лайкерта в 1930-х годах.

    Весы Лайкерта согласование измерений . По шкале Лайкерта респондентов спрашивают, насколько они согласны или не согласны с набором утверждений. Общая позиция определяется после анализа всех ответов на связанные вопросы. Анкеты для оценки юзабилити, такие как шкала юзабилити системы (SUS) и стандартизированный опросник процентильного ранга взаимодействия с пользователем (SUPR-Q), используют шкалу Лайкерта. (Технически, один вопрос сам по себе не является шкалой Лайкерта, а является вопросом, использующим формат ответа типа Лайкерта.Один вопрос называется заданием Лайкерта.)

    В анкете шкалы юзабилити системы (SUS) используется шкала типа Лайкерта с 5 точками ответа по каждому пункту. SUS просит респондентов выбрать, согласны ли они с 10 различными утверждениями. Вопросы 1–3 из анкеты SUS показаны выше.

    Шкалы Лайкерта (и формат ответа типа Лайкерта) уязвимы к двум ошибкам ответа :

    1) предвзятость уступки
    2) предвзятость социальной желательности

    1. Пристрастие к уступчивости — это склонность людей соглашаться с другими. Этот феномен неудивителен — в конце концов, наша природа — быть уступчивыми. Примирение происходит потому, что участники вдохновляются положительным (или отрицательным) утверждением, с которым они должны согласиться или не согласиться. Этот тип поведения является примером эффекта кадрирования: когда подчеркивается положительный (или отрицательный) аспект ситуации, люди склонны рассматривать всю ситуацию как положительную (или отрицательную, соответственно).

    Один из способов обойти эту проблему — чередовать положительно сформулированные утверждения с отрицательными.Например, в вопроснике SUS чередуются положительные и отрицательные утверждения (как показано на рисунке выше). Однако такой подход сопряжен со своими трудностями. Сауро и Льюис (2011) обнаружили, что чередование положительно и отрицательно сформулированных утверждений может привести к путанице как среди участников (которые могут недостаточно внимательно читать утверждения, чтобы заметить чередование), так и исследователей (которые могут не осознавать, что ответы на отрицательные и положительные вопросы необходимо кодировать по-другому).

    1. Предвзятость социальной желательности — это желание сообщить о взглядах, которые будут положительно оценены другими. Когда респонденты чувствуют, что существует общепринятая позиция, они с большей вероятностью согласятся с этой позицией из опасения, что несогласие может плохо отразиться на них самих. (Например, если люди считают, что политическая корректность является общепринятой позицией, они могут неохотно сообщать о своем личном отношении, которое противоречит этой точке зрения.) Чтобы свести к минимуму эту предвзятость, не спрашивайте у респондентов их имя или другую идентифицирующую информацию.Исследователи обнаружили, что запрос имен и других идентификаторов в опросах увеличивает предвзятость социальной желательности.

    Семантический дифференциал

    Вопрос о семантическом дифференциале был введен в 1957 году Осгудом, Сучи и Танненбаумом в книге «« Измерение смысла »» и с тех пор стал популярным.

    Вопросы семантического дифференциала требуют, чтобы респонденты оценили свое отношение к , выбрав позицию по биполярной прилагательной шкале .На двух концах шкалы находятся прилагательные-антонимы (например, уродливый — красивый, легкий — трудный). Единый простой вопрос (SEQ) является примером шкалы семантического дифференциала. SEQ представляет собой 7-балльную шкалу с концами, обозначенными очень легко и, соответственно, очень сложно .

    Единый простой вопрос (SEQ) — это пример семантического дифференциала из 7 пунктов. Два биполярных конца описывают простоту взаимодействия для данной задачи.

    В большинстве приложений семантического дифференциала варианты, которые могут быть выбраны вдоль континуума, не помечены, поскольку они должны представлять абстрактные точки; однако существуют варианты, когда промежуточные точки либо пронумерованы (например,g., -3 — +3) или помечены такими словами, как очень , несколько , ни , , ни .

    Хотя исследования показали, что людям легче понимать шкалы с пометками, по сравнению с шкалами без пометок, бывает сложно подобрать правильное слово для описания промежуточной точки на шкале.

    Данные, полученные с помощью вопроса о семантическом дифференциале, являются надежными только в том случае, если выполняются два предположения. Это:

    1. Пара прилагательных истинно биполярный . Однако не всегда можно найти дихотомическую пару прилагательных.
    2. респондентов понимают дихотомию между парой и континуумом между ними. Однако, поскольку шкала не имеет маркировки, каждый вариант может интерпретироваться по-разному для нескольких респондентов.

    Сравнение Лайкерта и семантического дифференциала

    Хотя обе шкалы оценок допускают разные мнения, между ними есть тонкие различия.Ответ на семантический дифференциал требует больше когнитивных усилий, чем ответ на вопрос по шкале Лайкерта, поскольку респонденты должны абстрактно размышлять о своем отношении, чтобы выбрать вариант, в первую очередь потому, что баллы на шкале не помечены. Однако когнитивная гибкость выбора означает, что респонденты не чувствуют себя в ловушке определенного ярлыка, что возможно с помощью шкалы Лайкерта.

    В сравнительной таблице ниже показаны некоторые различия между двумя типами вопросов.

    Предметы Likert Семантический дифференциал

    Информация получена

    Согласие или несогласие с утверждениями Когда точка зрения респондента находится в континууме между двумя противоположными прилагательными
    Количество вариантов, представленных на выбор Обычно 5, но может быть целых 7 или 9 Обычно 7, но количество точек может варьироваться
    Наклейки для опций Каждая опция помечена словами.(Если будет включено больше уровней, континуум может быть не полностью обозначен, поскольку трудно резюмировать степень согласия, когда существует более двух вариантов соглашения.) Две полярные стороны помечены, но опции, как правило, не маркируются или обозначаются только числами.
    Ограничения Подвержены предвзятости уступки и предвзятости социальной желательности

    Требуется более высокий когнитивный спрос на ответ из-за немаркированных вариантов

    Полученная информация

    Пункты Лайкерта: Согласие или несогласие с утверждениями

    Семантический дифференциал: Когда точка зрения респондента находится в континууме между двумя противоположными прилагательными
    Количество вариантов, представленных на выбор

    Элементов Лайкерта: Обычно 5, но количество может достигать 7 или 9

    Семантический дифференциал: Обычно 7, но количество точек может варьироваться
    Этикетки для точек шкалы

    Товаров Лайкерта: Каждый вариант помечен словами.(Если будет включено больше уровней, весь континуум может быть не полностью обозначен, поскольку трудно резюмировать степень согласия, когда существует более двух вариантов соглашения.)

    Семантический дифференциал: Две полярные стороны помечены, но варианты обычно не помечены или помечены только числами.
    Ограничения

    Предметов Лайкерта: Затронуты предвзятостью уступчивости и предубеждением социальной желательности

    Семантический дифференциал: Требуется более высокий когнитивный спрос на ответ из-за немаркированных вариантов

    В некоторых ситуациях для заданного вопроса исследования можно использовать либо элемент Лайкерта, либо семантический дифференциал.Например, если мы хотим понять, насколько удовлетворительно использование нашего веб-сайта, мы могли бы спросить, насколько пользователь согласен или не согласен с утверждением: Веб-сайт удовлетворительно использовал . Мы также могли бы создать вопрос о семантическом дифференциале, который спрашивает: Насколько удовлетворительно было использование веб-сайта? На полюсах шкалы есть слова «удовлетворительно» и «неудовлетворительно». Оба эти вопроса помогают нам понять, как пользователи воспринимают простоту использования нашего веб-сайта.

    Однако бывают ситуации, когда использовать семантический дифференциал сложно или невозможно.Например, рассмотрите приведенные ниже утверждения, которые были представлены в виде шкалы Лайкерта в опросе практиков UX.

    • Мы не начинаем думать о решениях, пока не завершим свое открытие.
    • У нас есть время, чтобы сделать достаточно исследований, прежде чем мы начнем разрабатывать новые функции, продукты или услуги.
    • Команда, участвовавшая в открытии, все работают вместе, совместно работая.
    • Наши открытия связаны с исследованиями наших целевых пользователей.

    Преобразование вышеуказанного в семантические различия было бы невозможно без изменения типа информации, которую мы пытаемся получить от респондентов.

    Таким образом, в целом вопросы, в которых используется формат ответа типа Лайкерта, более гибкие и имеют большее количество приложений.

    Советы по использованию рейтинговых шкал в UX-опросах

    Если вы думаете об использовании шкалы оценок в своем опросе, то вот несколько советов.

    • Если вы хотите оценить простоту использования интерфейса, используйте стандартизированные анкеты удобства использования , которые были опробованы и прошли психометрическое тестирование, вместо того, чтобы создавать свои собственные.
    • Если вы не знаете, какой стиль шкалы оценок использовать, протестируйте их обе . Проведите качественный опрос лично, чтобы проверить понимание вопроса и варианты ответов. Попросите участников подумать вслух, пока они заполняют опрос. Вы также можете попробовать обе версии опроса и сравнить ответы, чтобы решить, следует ли использовать шкалу Лайкерта или шкалу семантического дифференциала. Рассмотрим аудиторию: будут ли люди изо всех сил пытаться ответить на вопрос о семантическом дифференциале или они будут склонны слишком много соглашаться?
    • Используйте существующие метки шкалы при разработке вопроса с использованием формата ответа типа Лайкерта.Придерживайтесь типичных способов выражения согласия и несогласия ( полностью согласен , согласен , ни согласен ни не согласен и т. Д.) Вместо того, чтобы изобретать колесо и создавать новые варианты ответа.
    • Убедитесь, что ваши полярные прилагательные являются истинными противоположностями при разработке шкал семантического дифференциала. Например, выбирайте общепринятые пары, такие как , интересные против , скучные , в отличие от нечетных пар, таких как круто, vs. странный . Перед проведением крупномасштабного количественного исследования протестируйте с пользователями лично, чтобы понять, воспринимаются ли пары слов как биполярные.
    • Включите дополнительные текстовые поля, чтобы вы могли получить больше информации . Вопрос типа Почему вы выбрали этот рейтинг? объединяет мыслительный процесс выбора варианта на шкале.
    • Добавьте Неприменимо вариант для тех вопросов, которые могут не относиться ко всем вашим респондентам.Этот дополнительный выбор позволяет отделить любых нейтральных респондентов от респондентов, которые не верят, что вопрос для них важен.

    Заключение

    Шкала Лайкерта и семантический дифференциал — это два типа рейтинговых шкал, которые часто используются в исследованиях UX. Оба являются опробованными и испытанными способами измерения степени мнений, связанных с опытом использования продуктов и услуг; однако они делают это несколько иначе. Выберите правильный стиль шкалы оценок, соответствующий вашим исследовательским целям, и помните об ограничениях и нюансах обоих.

    Список литературы

    Ликерт Р. (1932). Методика измерения отношения. Архив психологии , 140, 1–55.

    Осгуд, С.Э., Сучи, Дж. Дж., И Танненбаум, П. (1957). Измерение смысла . Издательство Иллинойского университета, Урбана, Иллинойс.

    Добавить комментарий