ПредишенСледващото

точен тест на Fisher 1

От машинно обучение.

С големи проби в тази ситуация, може да се използва хи квадрат тест. Въпреки това, този тест не е подходящ, когато математически стойности очакването във всяка от клетките на таблицата с предварително определени граници е под 10: изчислено селективна дистрибуция на значимост на изпитването е само приблизително равна на теоретичната разпределението на хи-квадрат, и сближаване е недостатъчна при тези условия (които се появяват, когато размерът на пробата е малък, или данните са много неравномерно разпределени между клетките в таблицата). Фишер тест както предполага неговото име, е точна, и следователно може да се използва независимо от характеристиките на извадката. Тестът става трудно изчислима за големи извадки или добре балансирани таблици, но за щастие тя е за тези условия хи-квадрат е добре приложим.

За да направите ръчно тест изчисления само в случай, че размерът на фактор маси 2 х 2. Въпреки това, принципът за изпитване може да бъде удължен до най-общия случай на м х н маси, както и някои статистически пакети предоставят такива изчисления (понякога с помощта на метод Монте Карло. За да получите сближаване).

Това могат да бъдат подобно на следното:

За да се направи оценка на статистическата значимост на наблюдаваните данни, т.е. общата вероятност от същата или по-ясно изразен "кос" в посока на намиране на момичетата са на диета, ако се приеме нулевата хипотеза, ние трябва да се изчисли стойностите за р вероятностите за двете от тези таблици и да ги съберат. Това дава на т.нар двустранен тест; за двустранен тест, ние също трябва да помисли за таблицата, която също е изкривена в обратната посока (т.е. разгледа делото на преференциална прекарано момчета диета).

За съжаление, класификационните таблици, според това дали те са "силно изкривени" проблематично. подход се използва език за програмиране на Рч, изчисли стойността на р осигурява критерия чрез сумиране на вероятностите за всички таблици с вероятности по-малки или равни на наблюдавания вероятност масата. За маси с малък брой клетки в критерия за двустранен оценка може да се различава значително от двустранен оценки на величина, за разлика от случая с статистически данни, които имат по-симетрични разпределение на извадката.

Повечето съвременни статистически пакети изчислява точните тестове на Фишер, в някои случаи, дори когато хи-квадрат сближаване също би било приемливо. Действителни изчисленията, направени статистически софтуерни пакети обикновено се различават от тези, описани. По-специално числени проблеми могат да са резултат от големи количества факториелите. Прости, но още по-ефективни изчислителни подходи, основани на използването на гама или логаритмична функция на функцията на гама, но точното изчисляване на хипергеометричното и вероятност за биномно разпределение - с площ от настоящото изследване.

литература

  • [1] точния тест на Fisher, калкулатор
  • [2] Онлайн точния тест на Fisher, с примери
  • [3] Онлайн точния тест на Fisher, се работи с големи клетки
  • [4] mathworld.wolfram.com Разглеждане m х п разширяване точен тест на Fisher

Свързани статии

Подкрепете проекта - споделете линка, благодаря!