Критерий вилкоксона в excel как сделать

Непараметрические критерии. Ранговый критерий Уилкоксона

Ранее был изложен метод оценки разности между средними значениями выборок, извлеченных из двух независимых генеральных совокупностей. Если объемы выборок малы или генеральные совокупности не являются нормально распределенными, возникают две альтернативы: 1) можно применить непараметрическую процедуру, не зависящую от предположения о нормальном распределении генеральных совокупностей; 2) можно выполнить предварительную нормализацию данных, а затем применить t-критерий, использующий объединенную дисперсию. [1]

В данном заметке рассматривается критерий Уилкоксона, позволяющий оценить разность между медианами двух генеральных совокупностей. Этот критерий является весьма популярной непараметрической процедурой. По своей мощности критерий Уилкоксона мало отличается от t-критериев, использующих раздельную или суммарную дисперсии. В то же время для его использования нет необходимости предполагать, что генеральные совокупности распределены нормально. Кроме того, критерий Уилкоксона можно применять даже тогда, когда исследователю доступны лишь ранговые показатели. Эта ситуация довольно часто встречается в маркетинговых исследованиях, когда отсутствие числовых данных не позволяет применять t-критерии.

Скачать заметку в формате Word или pdf, примеры в формате Excel2013

Для того чтобы применить критерий Уилкоксона, необходимо заменить наблюдения, содержащиеся в двух выборках, имеющих объемы n1 и n2, их объединенными рангами (если исходные данные не являются рангами изначально). Количество наблюдений в обеих выборках равно n1 + n2. Наименьший ранг равен наименьшему из n1 и n2 наблюдений, второй ранг равен наименьшему из оставшихся наблюдений и так далее, пока мы не достигнем наибольшего ранга. Если несколько значений являются взаимосвязанными, необходимо заменить каждое из них средними рангами, вычисленными так, будто эти величины не зависят друг от друга.

Для удобства будем считать, что когда объемы выборок не одинаковы, число n1 меньше числа n2. Статистика рангового критерия Уилкоксона T1 равна сумме первых n1 рангов. (Если объемы выборок равны, в качестве этой статистики можно взять сумму рангов в любой группе.) Напомним, что сумма первых n последовательных натуральных чисел равна n(n + 1)/2. Следовательно, сумма статистик T1 и T2 (вычисленных по остальным n2 наблюдениям), должна быть равной n(n + 1)/2.

Сумма статистик Уилкоксона:

Проверка гипотезы осуществляется с помощью одностороннего или двустороннего критерия, в зависимости от того, какая гипотеза проверяется: о равенстве двух медиан или о том, что одна медиана больше другой (рис. 1)

Рис. 1. Нулевая и альтернативная гипотезы для одностороннего или двустороннего критерия

Здесь М1 — медиана первой генеральной совокупности, а М2 — медиана второй генеральной совокупности. Если объемы обеих выборок не превышают число 10, для определения критических значений статистики одностороннего или двустороннего критерия Т1 применяются табличные значения (рис. 2). К сожалению, в Excel не включены соответствующие функции.

Рис. 2. Нижние и верхние критические значения статистики Т1 в ранговом критерии Уилкоксона

Для двустороннего критерия при заданном уровне значимости α нулевая гипотеза отклоняется, если статистика критерия больше верхнего критического значения или меньше нижнего критического значения (рис. 3, панель А). Для одностороннего критерия, альтернативная гипотеза Н1 которого заключается в том, что М1 М2, решающее правило формулируется следующим образом: нулевая гипотеза отклоняется, если статистика Т1 больше верхнего критического значения или равна ему (рис. 3, панель В).

Рис. 3. Области принятия и отклонения гипотезы в ранговом критерии Уилкоксона

При больших объемах выборок статистика Т1 является приближенно нормально распределенной, причем ее математическое ожидание μТ1 задается формулой:

Читать еще:  Как сделать счет в 1с в excel?

а стандартное отклонение σТ1 вычисляется как:

Таким образом, стандартизованная Z-статистика критерия имеет следующий вид (критерий Уилкоксона для больших выборок):

где статистика критерия Z имеет приближенное нормальное распределение.

Эту статистику применяют, когда объем выборки выходит за пределы, предусмотренные в таблицей (рис. 2). При заданном уровне значимости α нулевую гипотезу отклоняют, когда вычисленная статистика Z попадает в критическую область.

Вернемся к ранее рассмотренному сценарию, в котором требовалось определить, равны ли средние недельные объемы продаж BLK-колы, выставленной на специализированных стеллажах и на обычных полках. Если у нас нет оснований считать, что выборки извлечены из нормально распределенных генеральных совокупностей, можно применить ранговый критерий Уилкоксона. Поскольку нам неизвестно, какая из медиан окажется больше, нулевую и альтернативную гипотезы следует сформулировать следующим образом: Н: М1 = М2, Н1: М1 ≠ М2. Для того чтобы применить ранговый критерий Уилкоксона, необходимо вычислить ранги для выборок, состоящих из n1 = 10 магазинов с обычными полками и из n2 = 10 магазинов со специализированными стеллажами (рис. 4).

Рис. 4. Вычисление объединенных рангов объема продаж BLK-колы

На следующем этапе вычисляется статистика T1, равная сумме рангов, вычисленных по меньшей выборке. Если объемы выборок равны между собой, ранги можно вычислять по любой из выборок, поскольку на окончательный результат это повлиять не может. Предположим, что для вычисления рангов используется выборка магазинов с обычными полками: T1 =СУММ(B3:B13) = 72. Для проверки ранжирования вычисляется статистика Т2 = СУММ(D3:D13) = 138. Используя формулу (1), вычислим сумму первых n = 20 рангов. Она должна быть равной Т1 + Т2:

Перейдем к проверке гипотезы, заключающейся в том, что между медианами продаж существенной разницы нет. Для этого по таблице (рис. 2) определим нижнее и верхнее критические значения статистики критерия Т1. При уровне значимости, равном 0,05, критические значения равны 78 и 132 (рис. 5). Следовательно, решающее правило выглядит так: нулевая гипотеза Н отклоняется, если Т1 ≤ 78 или Т2 ≥ 132, в противном случае гипотеза Н не отклоняется.

Рис. 5. Нижнее и верхнее критические значения для критерия Уилкоксона при n1 = 10, n2 = 10 и α = 0,05 (фрагмент таблицы с рисунка 2)

[1] Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 739–743

Онлайн расчет критерия Т-Вилкоксона

Онлайн калькулятор непараметрического критерия Т-Вилкоксона позволяет получить расчет сразу на сайте. Итоговое описание состоит из таблиц, графиков и текстовых выводов. Его можно сказать в формате Word, а таблицы в Excel.

Шаг 1. Введите название исследуемой шкалы

Шаг 1.1. Вы можете внести несколько названий шкал для исследования критерия Вилкоксона

Шаг 2. Внесите название ПЕРВОГО замера, количество человек в ней и нажмите на кнопку «Внести данные»

Шаг 2.1. Появится таблица с пустыми ячейками

Шаг 2.2. Внесите исходные данные группы

Вы можете внести данные для расчета критерия Т-Уилкоксона поочередно вручную или скопировать их из вашего Excel файла.

Шаг 3. Внесите название ВТОРОГО замера, количество человек в ней и нажмите на кнопку «Внести данные»

Шаг 3.1. Появится таблица с пустыми ячейками

Шаг 3.2. Внесите исходные данные группы

Вы можете внести данные поочередно вручную или скопировать их из вашего Excel файла.

Шаг 4. Проверяем исходные данные

Именно по ним будет осуществляться онлайн расчет всех показателей критерия Вилкоксона. В случае необходимости можно вернуться на предыдущие шаги и изменить данные.

Шаг 5. Краткий отчет

Для незарегистрированных пользователей доступен только краткий отчет-таблица в которой указано — эмпирическое значение критерия и уровень значимости.

Если вы разбираетесь в статистике, этих данных хватит вам, чтобы сделать вывод о наличии/отсутствии различий между замерами.

Шаг 5.1. Регистрация / Авторизация

Для того, чтобы получить более полный отчет с информацией о средних значениях с указание различий нужно зарегистрироваться в сервисе.

Вы можете зарегистрироваться используя свою почту или профиль ВКонтакте.

Шаг 6. Обычный отчет

После регистрации вам станет доступен более полный отчет в котором содержится информация о:

  • средних значениях в каждом замере
  • эмпирическое значении критерия
  • уровне значимости критерия
  • звездочкой в таблице указаны шкалы, по которым есть различия (в нашем примере это «Тревожность» и «Физическая агрессия»).

Также вы можете скачать итоговую таблицу в формате Excel.

Читать еще:  Как сделать сплошную линию в excel?

Вы также можете получить подробный отчет в котором будут графики и нужные текстовые описания, для этого нужно оплатить работу сервиса.

Шаг 7. Полный статистический отчет

После оплаты, в течении суток, вы сможете неограниченное количество раз запускать калькулятор и получать итоговые расчеты.

В полном отчете доступно:

  • названия шкал,
  • средние значения по каждой шкале,
  • эмпирические значения критерия,
  • уровень значимости с отметкой о наличии различий,
  • описание различий,
  • описание выраженности значений в каждой группе,
  • графики «ящики-усы»
  • возможность скачать результаты одним файлом Word c указанием всех таблиц, графиков и описаний

В случае, если результаты расчетов вас не устроят, мы гарантируем, что бесплатно внесем все необходимые правки в вашу работу.

Т-критерий Вилкоксона

Гипотезы.
H: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

Ограничения в применении Т-критерия Вилкоксона

  1. Минимальное количество испытуемых, прошедших измерения в двух условиях – 5 человек. Максимальное количество испытуемых– 50 человек, что диктуется верхней границей имеющихся таблиц.
  2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюденийn уменьшается на количество этих нулевых сдвигов. Можно обойти это ограничение, сформулировав гипотезы, включающие отсутствие изменений, например: «Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне».

Алгоритм подсчета Т-критерия Вилкоксона

  1. Составить список испытуемых в любом порядке, например, алфавитном.
  2. Вычислить разность между индивидуальными значениями во втором и первом замерах («после» – «до»). Определить, что будет считаться»типичным» сдвигом и сформулировать соответствующие гипотезы.
  3. Перевести разности в абсолютные величины и записать их отдельным столбцом (иначе трудно отвлечься от знака разности).
  4. Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.
  5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в»нетипичном» направлении.
  6. Подсчитать сумму этих рангов по формуле: Т=∑R<\sub r>, где R <\sub r>– ранговые значения сдвигов с более редким знаком.
  7. Определить критические значения Т для данного n по таблице.
    Если Тэмп. меньше или равен Ткр., сдвиг в»типичную» сторону по интенсивности достоверно преобладает.

Пример . Для проверки эффективности новой развивающей программы были созданы две группы детей шестилетнего возраста. Одна группа(экспериментальная) занималась по новой программе, вторая(контрольная) – по старой. После эксперимента дети обеих групп были протестированы по методике Керна-Йерасика(школьная зрелость). Результаты тестирования по вербальной шкале занесены в таблицу. Можно ли сделать заключение об эффективности новой программы и ее преимуществе перед старой.

Решение. Для подсчета этого критерия нет необходимости упорядочивать ряды значений по нарастанию признака.
Первый шаг в подсчете T-критерия – вычитание каждого индивидуального значения «до» из значения»после».

Критерий Вилкоксона для независимых выборок

Пример №2 . В биохимическом исследовании, проведенном методом меченных атомов, по результатам изучения 7 препаратов опытной группы получены следующие показания счетчика импульсов (в импульсах в минуту): 340, 343, 322, 332, 320, 313, 304. Результаты контрольной группы: 318, 321, 318, 301, 312.
Можно ли считать, что полученные значения опытной и контрольной групп различны α=0.05.

Решение. Сформулируем основную и альтернативную гипотезы.
H: F1(x)=F2(x) — выборки однородны; различия в результатах опытной и контрольной групп можно отнести на счет случайных воздействий.
H1: F1(x)≠F2(x) — выборки извлечены из генеральных совокупностей с разными распределениями; различие между контрольной и опытной группами существенно.
Объединим выборки и расположим полученные данные в порядке возрастания: — здесь подчеркнуты элементы второй выборки (контрольной группы). Занумеровав все элементы в порядке возрастания, получим ранговую последовательность: — подчеркнуты ранги контрольной группы.
Наблюдаемое значение статистики Вилкоксона равно
Kнабл=1+3+5,5+5,5+8=23
Критическая область является двусторонней, ее правая граница при α=0.1
,
левая граница
Клев= n2(n2+n1+1)-Kпр=5*14-44=26.
Наблюдаемое значение попадает в критическую область: Kнабл типичную сторону достоверное не преобладают.

Автоматический расчет Т — критерия Вилкоксона

Назначение Т — критерия Вилкоксона

Описание Т – критерия Вилкоксона

Гипотезы Т – критерия Вилкоксона

Ограничения в применении Т – критерия Вилкоксона

Инструкция по использованию скрипта (FAQ)

Составлено по материалам книги: Сидоренко Е. В. «Методы математической обработки в психологии». СПб.: ООО «Речь», 2007 г.

Назначение Т — критерия Вилкоксона

Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.

Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.

Описание Т – критерия Вилкоксона

Этот критерий применим в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применять Т — критерий Вилкоксона и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, скажем, от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.

Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Первоначально мы исходим из предположения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом — сдвиг в более редко встречающемся направлении.

Гипотезы Т – критерия Вилкоксона

H: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

Ограничения в применении Т – критерия Вилкоксона

1. Минимальное количество испытуемых, прошедших измерения в двух условиях — 5 человек. Максимальное количество испытуемых — 50 человек, что диктуется верхней границей имеющихся таблиц.

2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений n уменьшается на количество этих нулевых сдвигов (при условии, если флажок «Учитывать нулевой сдвиг?» не установлен). Можно обойти это ограничение (установив флажок «Учитывать нулевой сдвиг?»), сформулировав гипотезы, включающие отсутствие изменений, например: «Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне».

Автоматический расчет Т — критерия Вилкоксона

Шаг 1

Введите в первую колонку данные первого замера («До»), а во вторую колонку данные второго замера («После»). Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести расчет Т-критерия Вилкоксона.

Книга представляет собой практическое руководство для исследователей, поставивших целью статистически обосновать свои научные и практические выводы. Принцип отбора методов — ясность и простота. Методы рассматриваются на реальных примерах и сопровождаются алгоритмами и графическими иллюстрациями. Все они могут быть использованы для быстрой обработки данных. Руководство предназначено для психологов и специалистов в области социологии, педагогики, медицины, биологии, экономики.

Ссылка на основную публикацию
Adblock
detector