Меню

Ящик с усами спсс

Ящик с усами

Из Википедии, бесплатной энциклопедии

Ящик с усами, диаграмма размаха (англ. box-and-whiskers diagram or plot, box plot ) — график, использующийся в описательной статистике, компактно изображающий одномерное распределение вероятностей.

Такой вид диаграммы в удобной форме показывает медиану (или, если нужно, среднее), нижний и верхний квартили, минимальное и максимальное значение выборки и выбросы. Несколько таких ящиков можно нарисовать бок о бок, чтобы визуально сравнивать одно распределение с другим; их можно располагать как горизонтально, так и вертикально. Расстояния между различными частями ящика позволяют определить степень разброса (дисперсии) и асимметрии данных и выявить выбросы.

Содержание

Компактность представления информации [ править | править код ]

График «ящик с усами», или «ящичковая диаграмма», был разработан Джоном Тьюки в 1970-х годах. По сути, ящик с усами — это быстрый способ изучения одного или нескольких наборов данных в графическом виде. Этот график может показаться более примитивным, чем, например, гистограммы, но он имеет некоторые преимущества. Он занимает меньше места и поэтому особенно полезен для сравнения распределений между несколькими группами или наборами данных. Кроме того, ящик с усами в своей первоначальной форме прост для построения.

На графике 2 приведены два графических представления распределения одной и той же случайной величины. Сверху показана плотность распределения, а снизу ящик с усами. Видно, что ящик с усами более компактный и по нему легко можно оценить медианы, квантили, дисперсию и асимметрию в данных, а также выявить выбросы. Асимметрию данных можно увидеть не только по медиане, смещённой к какому-либо концу ящика, но и по разной длине усов, выходящих из ящика.

График «ящик с усами» очень прост для понимания и именно поэтому часто используется в различных публикациях для визуализации данных.

Построение [ править | править код ]

Границами ящика служат первый и третий квартили (25-й и 75-й процентили соответственно), линия в середине ящика — медиана (50-й процентиль). Концы усов — края статистически значимой выборки (без выбросов), и они могут определяться несколькими способами. Наиболее распространённые значения, определяющие длину «усов»:

  • Минимальное и максимальное наблюдаемые значения данных по выборке (в этом случае выбросы отсутствуют);
  • Разность первого квартиля и полутора межквартильных расстояний; сумма третьего квартиля и полутора межквартильных расстояний. В общем виде эта формула имеет вид
  • Среднее арифметическое по выборке ± одно стандартное отклонение; [источник не указан 2527 дней]
  • 9-й и 91-й процентили;
  • 2-й и 98-й процентили.

Данные, выходящие за границы усов (выбросы), отображаются на графике в виде точек, маленьких кружков или звёздочек. Иногда на графике отмечают среднее арифметическое и его доверительный интервал («зарубка» на ящике). Иногда зарубками обозначают доверительный интервал для медианы.

Читайте также:  Короткие стрижки для полненьких 2021

В связи с тем, что не существует единого общего согласия относительно того, как конкретно строить «ящик с усами», при виде такого графика необходимо искать информацию в сопроводительном тексте относительно того, по каким параметрам ящик с усами строился.

Модификации ящика с усами [ править | править код ]

Несмотря на свою простоту и удобство, первоначальная форма ящика с усами обладает и некоторыми недостатками. Один из таких существенных недостатков — отсутствие на графике информации о количестве наблюдений по выборке. Действительно, ящик с усами позволяет сравнить медианы, квартили, минимумы и максимумы по различным выборкам, но если мы захотим сделать вывод об общей медиане по всей совокупности выборок, то мы не сможем этого сделать, не прибегая к расчётам на исходных данных. В 1978 году первоначальная форма ящика с усами была модифицирована МакГиллом, Ларсеном и Тьюки. Они предложили учитывать размер выборочной совокупности, рисуя ящики разного размера, а также изобразили на графике доверительный интервал для медиан в виде расходящихся клиньев. Чем больше ящик по размерам, тем больше количество наблюдений в выборке, по которой строился этот ящик. Что касается доверительного интервала, то он представляет собой выемки на каждом из ящиков; в случае, если получившиеся выемки разных ящиков не пересекаются, их медианы статистически значимо различаются.

Иная модификация получила название «histplot» (сокр. от «histogram plot», с англ. — «график-гистограмма»). Теперь на графике отображаются плотности распределения по трём точкам: медиане, первому и третьему квартилю. Соответственно, вместо прямоугольника, «ящик» теперь представляет собой две равнобедренные трапеции, имеющие смежное основание.

Дальнейшее изменение получило название «vaseplot» (с англ. — «график-ваза») из-за визуального сходства «ящика» с вазой. На данном графике производится отображение всех плотностей вероятностей от первого до третьего квартиля. Затемнённые области представляют собой доверительный интервал медианы.

Источник статьи: http://wikizero.com/ru/%D0%AF%D1%89%D0%B8%D0%BA_%D1%81_%D1%83%D1%81%D0%B0%D0%BC%D0%B8

Диаграмма размаха («ящик с усами»)

Описание

Диаграммы размаха («ящик с усами») (Box and Whisker Plot или Box Plot) – это удобный способ визуального представления групп числовых данных через квартили.

Прямые линии, исходящие из ящика, называются «усами» и используются для обозначения степени разброса (дисперсии) за пределами верхнего и нижнего квартилей. Выбросы иногда отображаются в виде отдельных точек, находящихся на одной линии с усами. Диаграммы размаха могут располагаться как горизонтально, так и вертикально.

Диаграммы размаха, как правило, используются в описательной статистике и позволяют быстро исследовать один или более наборов данных в графическом виде. Несмотря на то, что в сравнении с гистограммой или графиком плотности, этот график может показаться примитивным, его преимущество – в экономии пространства, что особенно удобно при сравнении распределений между большим количеством групп или наборов данных.

Читайте также:  Варианты стрижек для щенка йорка

Виды наблюдений, которые можно сделать на основе ящика с усами:

Каковы ключевые значения, например: средний показатель, медиана 25го перцентиля и так далее.

Существуют ли выбросы и каковы их значения.

Симметричны ли данные.

Насколько плотно сгруппированы данные.

Смещены ли данные и, если да, то в каком направлении.

Два из наиболее распространенных варианта ящика с усами – диаграмма размаха с переменной шириной и диаграмма размаха с метками.

Источник статьи: http://datavizcatalogue.com/RU/metody/diagramma_razmaha.html

Диаграмма «ящик с усами» в статистике

Содержание:

Диаграмма «ящик с усами»

Построение диаграммы «Ящик с усами» рассмотрим на следующем примере

Задача пример №154

15 работников фирмы при сдаче экзамена по технике безопасности, получили следующие баллы:

13 9 18 15 14 21 7 10 11 20 5 18 37 16 17.

Представьте данную информацию в виде диаграммы «ящик с усами».

Решение:

1. Расположите данные в порядке возрастания, определите медиану и отметьте ее через .

2. Данные слева от медианы расположены в первой нижней половине, справа от медианы — в верхней половине. Т.е. медиана делит данные на две половинки.

3. Медианы половинок, называемые квартилями (здесь = 10, = 18), разбивают данные на 4 части.

4. Определяют изменение между квартилями = 18 — 10 = 8

5. Отметим на числовой оси наименьшее и наибольшее значения, квартили и медиану — 5 важных точек. Нарисуем прямоугольник, длина которого равна разности изменению между квартилями. Этот прямоугольник делится медианой на две части. Теперь нарисуем «усы», соединив наибольшее и наименьшее значения с соответствующими квартилями.

Мы построили диаграмму «ящик с усами» в соответствии с представленными данными. Теперь, по диаграмме, представим данные. Из диаграммы видно, что приблизительно половина, 50 % , из 15 человек набрали от 10 до 18 баллов, 25% — меньше 10 баллов и 25% — больше 10 баллов.

Разница длин левого и правого «уса» зависит от разницы значений данных в соответствующих частях.

Для построении диаграммы «ящик с усами» из заданной совокупности выделяют 5 значений:

Медиану , квартиль , значение которого меньше медианы и является медианой нижней половины, квартиль , значение которого больше медианы и является медианой верхней половины множества данных, наибольшее и наименьшее значения.

Шаги построения диаграммы «ящик с усами»

1. Проводится горизонтальная прямая.

Читайте также:  Виды коротких стрижек для девушек подростков

2. В зависимости от диапазона изменения данных проводится деление.

3. На прямой отмечают 5 значений — , , , наименьшее значение, наибольшее значение.

4. От до рисуется ящик.

5. Рисуем «усы» от : до минимального значения и от до максимального значения.

Задача пример №155

Ниже представлены данные возраста участниц женской паралимпийской команды по волейболу

24, 30, 30, 22, 25, 22, 18, 25, 28, 30, 25, 27. Представьте данные в виде диаграммы «ящик с усами».

Решение:

1. Расположим данные и найдем медиану и квартили.

2. Изобразим числовую ось и отметим эти следующие данные.

3. При помощи разности квартилей = 29 -23 = 6 нарисуем ящик и разделим его на две части (при помощи медианы). Соединим ящик с наибольшим и наименьшим значением.

4. Представление диаграммы. Возраст 50% баскетболисток между 23-29 годами, 25% меньше 23 лет, 25% — больше 29 лет. Длинными или короткими являются «усы» ящика показывает, близко ли или далеко расположены друг от друга данные внутри 25% — го интервала. Например, левый «ус» длиннее, правый — короче. Так как в 25%-интервале значения изменяются между 18-23, а в левом «усе» мы встречаем только два значения 29-30.

Данные, которые сильно отличаются от основных данных совокупности, называются выбросами. Выбросы можно определить относительно верхнего и нижнего квартиля. В этом случае выбросом считается, значение в 1,5 раза больше или меньше разности . Например, в рассмотренном нами примере нижний квартиль 23, верхний квартиль 29, разность квартилей 6. Тогда значения 23 — 1,5 • 6 = 14 и 29 + 1,5 • 6 = 38 считаются граничными значениями. Все значения, которые больше 38 и меньше 14, называются выбросами.

Эта лекция взята из раздела решения задач по математике, там вы найдёте другие лекци по всем темам математики:

Математика: полный курс решений задач в виде лекций

Другие темы которые вам помогут понять математику:

Присылайте задания в любое время дня и ночи в whatsapp.

Официальный сайт Брильёновой Натальи Валерьевны преподавателя кафедры информатики и электроники Екатеринбургского государственного института.

Все авторские права на размещённые материалы сохранены за правообладателями этих материалов. Любое коммерческое и/или иное использование кроме предварительного ознакомления материалов сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/или любой другой выгоды.

Сайт предназачен для облегчения образовательного путешествия студентам очникам и заочникам по вопросам обучения . Наталья Брильёнова не предлагает и не оказывает товары и услуги.

Источник статьи: http://natalibrilenova.ru/diagramma-yaschik-s-usami-v-statistike/

Adblock
detector