ПредишенСледващото

Box и мустак

Фигура 2. Сравнение на разпределението на плътността и кутията и мустак

Box и мустак. диаграма участък (Engl кутия и мустаци-диаграма или парцел, кутия парцел.) - графика използва в описателни статистически данни, компактно представлява едномерен разпределение на вероятностите.

Този тип на таблицата в удобна форма показва медианата (или, ако е желателно, вторична), горни и долни квартили минимална и максимална стойност на пробата и на емисиите. Няколко от тези кутии може да се направи един до друг, визуално сравнение едно разпределение на друг; те могат да се поставят както хоризонтално, така и вертикално. Разстояния между различните части на кутията позволяват да се определи степента на отклонение (дисперсия) и асиметрия на данните и установяване на емисиите.

Компактен представяне на информация

График "кутия и мустак" или "yaschichkovaya диаграма", е проектиран от Джон Tukey през 1970. В действителност, една кутия с мустаци - бърз начин за опознаването на един или повече набори от данни в графичен вид. Тази схема може да изглежда по-примитивни, отколкото, например, хистограми. но има някои предимства. Това отнема по-малко пространство и поради това е особено полезен за сравняване на разпределението между няколко групи или групи от данни. В допълнение, кутия и мустак в първоначалния си вид е просто да се изгради.

Ако Третата графика, която показва разпределението на плътността, вие наистина не може да види нищо, и го сравни с четвъртото графика, изобразяваща го с мустаци, може лесно да се изчисли средната стойност, четвъртина и измерените отклонения (дисперсия) и асиметрията в данните, както и идентифициране на емисиите. Информация асиметрия може да се види не само в средната извънматочната бременност и да е край на наказателното поле, но също така и на различни дължина на мустаци, излизащи от кутията.

График "кутия и мустак" е много проста за разбиране и затова често се използва в различни публикации за визуализация на данни.

Границите на кутията са първата и третата четвъртина (25-ти и 75-ия процент, съответно), линията в средата на кутията - медиана (50ти персентил). Краищата на мустаци - ръба на статистически значима извадка (без емисии), и те могат да бъдат определени по различни начини. Най-често срещаните стойности, които определят дължината на "мустаци":

  • минималните и максималните стойности на данни, наблюдавани в продължение на пробата (в този случай няма никакви емисии);
  • Разликата между първата четвъртина и половина интерквартилен разстояния; сумата от третата четвъртина и половина интерквартилен разстояния. Като цяло, тази формула е

където X 1> - ниска граница мустак, X 2> - горна граница мустак, Q 1> - първата четвъртина, Q 3> - третата четвърт, к - фактор, най-често използваните стойност е равна на 1.5.

  • Средноаритметичната стойност на пробата ± стандартно отклонение; [Позоваване необходими 1134 ден]
  • 9-ия и 91-тия персентили;
  • 2-ри и 98-ия персентил.

Данните, заминаващи от мустаци (емисии), се показват във вид на графика като точки или малки кръгове звездички. Понякога на графиката отбележат средното аритметично и доверителен интервал ( "вдлъбнатината" в кутията). Понякога резки представляват доверителен интервал за медианата.

Поради факта, че не съществува единна общо съгласие за това как да се изгради по-специално "кутия и мустак" при вида на такъв график е необходимо да търсите информация в придружаващия текст, за да се върху това, което параметри, включени кутия парцел.

кутия версия с мустаци

Въпреки своята простота и удобство, оригиналният вид на кутия с мустаци и има някои недостатъци. Един такъв съществени недостатъци - липса на диаграма информация за броя на наблюденията в извадката. Наистина, кутия парцела сравнява медианата, квартили, минимален и максимален за различни проби, но ако искаме да се направи заключение относно цялостната Медианата за целия набор от проби, ние не може да направи това, без да се прибягва до изчисления на суровите данни. През 1978 г., първоначалната форма на кутия с мустаци е модифициран McGill, Larsen и Tukey. Те предлагат да се вземе предвид размера на общата проба, рисуване кутии с различни размери, както и изобразен на доверителния интервал, графиката за средната под формата на разнопосочни клинове. По-големият размер кутия, по-голямата броят на наблюденията в извадката, върху който е построен в кутията. По отношение на доверителния интервал, е вдлъбнатина на всяка от кутиите; Ако получената вдлъбнатини различни кутии не се припокриват, и тяхната средна е статистически значима разлика.

Друга промяна се нарича «histplot» (скрити от «хистограма парцел», с английски език - .. "Графичен хистограма"). Сега, графиката показва разпределението на плътността от три точки: медианата, първата и третата четвъртина. Съответно, вместо на правоъгълник, на "кутия" сега е два равнобедрен трапец, имаща основа съседство.

Друга промяна е наречен «vaseplot» (с английски език -. "Графичен ваза") поради визуалната прилика на "кутията" с ваза. Тази диаграма се произвежда показване на всички вероятностни плътности между първата и третата четвъртина. Сенчестият района представляват средната доверителен интервал.

Свързани статии

Подкрепете проекта - споделете линка, благодаря!