ПредишенСледващото

Здравейте, скъпи абонати!

Позволете ми да ви напомня, че молбите за "SPSS Синтаксис справочник на" Рецепция продължава. С обявяването на този проект може да се намери в 14-то издание на изпращане.

Осредняване на стойностите на няколко променливи

Днес ще разгледаме ситуацията е доста специфична изчисляване на средни стойности (средно стойностите на наблюдение) в продължение на няколко променливи. Тя ни помага в този синтаксис на събиране Raynal "Изчислява се средната стойност на променливата M, където m е взето от друг peremennoy.SPS". Този пример показва, отново нашите възможности гъвкаво управление на данни, свързани с езика на командния SPSS.

Ние определяме извадковите данни. Ние ще имаме с допълнителни променливи gmplans (целта си, ще стане ясно по-късно), и - 4 променливи fpr_iy1 - fpr_iy4, която ние определяме в командата DATA LIST чрез ключовата дума "ДА". Ние сме заинтересовани в изчисляването на средната стойност (средноаритметично) стойност на тези четири променливи за всеки отделен случай. Тази задача е формулирана всеки път с някои вариации.

Моля, имайте предвид, че данните СПИСЪК променлива екип написали изрично е настроен, но по подразбиране те ще получат тип Цифров формат F8.2 формат - стандартен формат на показване на числови променливи. Нов файл команда може да се пропусне, но, от друга страна, това е полезно, ако предишните неуспешни експерименти оставили серия от "висящи" висящи трансформации, които дори не могат да бъдат анулирани.

ДАННИ СПИСЪК СПИСЪК / gmplans fpr_iy1 ДА fpr_iy4.

ЗАПОЧНЕТЕ DATA
04 Яну. 3 2 1
04 Февруари 3 2 1
04 март 3 2 1
Април 4 3 2 1
0 4 3 2 1
2 4 5 6 m
1 януари м м м

През последните две наблюдения, влязъл чрез командата ЗАПОЧНЕТЕ DATA - END данни съдържа липсващите стойности. "М" Те са букви. Наличието на текстови данни за формата на променливи номер няма да се обърка SPSS - за всеки повод той ще ни даде предупреждение в прозореца на резултати, не е опит да се припише на текст стойност на числова променлива. Резултатът от всеки такъв опит ще липсва стойност в съответната променлива. Всъщност, това е, което искахме.

Ние сега разгледаме различните варианти за изчисляване на средните стойности, променливи fpr_iy1 - fpr_iy4.

1. "просто" средни стойности

За подобни задачи в SPSS има ОЗНАЧАВАТ функция аргументи са специфични числени стойности или имена на променливи, които съдържат тези стойности. Имената могат да бъдат посочени, разделени със запетая, или чрез ключовата дума "ДА". Означава, аргументите в списъка са си също може да е други функции. Разполагате с няколко примера. На първо място, важно е да се разбере функция означава ли, не се изчисли средната стойност на една променлива "от колона". Тя е средно във всеки отделен случай стойностите на променливи и специалните номера, които се съдържат в аргументите предвид. Същото, между другото, е вярно и за много други функции - SUM, MIN, MAX. изразяване


Не заменяйте променливата твърдя средната стойност на променливата fpr_iy2 цялата база данни, а просто. Той копира стойността на променливата, за всеки отделен случай. Липсващи стойности се игнорират. Още веднъж, ОЗНАЧАВА функционални стойности на отделните стойности на аргументите им за всеки обект. В този смисъл, екипът представената по-горе е еквивалентно на

Пример-целенасочено използване означава:

COMPUTE твърдя = Средно (fpr_iy1, fpr_iy2).


В този случай, усредняването за всеки обект индивидуални ценности и променливи fpr_iy1 fpr_iy2. Имайте предвид, че променлива, съдържаща липсваща стойност се изключва от изчислението. Но това не води до автоматично изключване от изчисляването на общия надзор. За последното наблюдение в този пример, в резултат на прилагането на тази функция ще бъде "1", това е само не-липсваща стойност (на променливата fpr_iy1). Разбира се, в знаменателя при изчисляване на средната аритметична стойност не е общият брой на аргументите ОЗНАЧАВАТ функция, както и броя на аргументите, с които не са липсващите стойности. Такъв имот на много функции безопасно изключват липсващите стойности е много полезна, ако наличието на пасаж не означава грешка. Имайте предвид, че в резултат на предишната команда ще бъде различен за последното наблюдение на резултата от следния израз:

Ако искате да се изчисли средната стойност на голям брой променливи, можете да използвате ключовата дума "ДА".

COMPUTE твърдя = Средно (fpr_iy1 да fpr_iy4).


Тук за използването на мързелив оценка, ние използвахме командата LIST. Тя веднага се показва резултат от изчисление на прозореца се показват резултатите.

С помощта на "до" и входните аргументи, разделени със запетаи лесно могат да бъдат комбинирани. Това означава, че в известен смисъл, празен от практическа гледна точка, пример за това изчисление на:

COMPUTE твърдя = Средно (fpr_iy1, fpr_iy1 да fpr_iy4, 3).


Тук ние се вземе предвид стойността на променливата двойно fpr_iy1 и дори добавя константа "3".

Ако не са дадени аргументи, разделени със запетая, може да бъде заместен в тяхно място други функции. Следващият пример е средните квадратни стойности на променливите и fpr_iy1 fpr_iy2:

COMPUTE твърдя = Средно (fpr_iy1 ** 2, fpr_iy2 ** 2).

Въпреки това, опитът да използвате функциите във връзка с ключовата дума "ДА" няма да работи. Програмата ще ви кажа, че е невъзможно да го направи, и отказва да вземе предвид:

COMPUTE твърдя = Средно (fpr_iy1 ** 2 до fpr_iy2 ** 2).

2. Средните стойности с необходимия минимален брой аргументи

Ако използвате функцията средната чиито аргументи са имената на множество променливи, много от които са общи липсващите стойности, можете да посочите минималния брой валидни аргументи е валидна:

COMPUTE твърдя = MEAN.2 (fpr_iy1 да fpr_iy4).

В този случай ние поискаха, че средната стойност е била разглеждана само в случай, ако има най-малко 2 nonmissing стойност. За последната програма за наблюдение на средната стойност няма да бъдат разглеждани.

3. Средната стойност на променлив брой аргументи (всъщност, примерен синтаксис на събиране)

Синтаксис осигурява решение на един много интересен проблем. Ако са налице, като в този случай, 4-те променливи, може да се изискват за всеки отделен случай, за да се изчисли средната стойност на само m, m = първият от тези променливи. И m за всяко наблюдение му (т = 0 показва, отхвърляне на изчисляване на средната стойност).

На практика такава ситуация може да възникне, например, когато променливите fpr_iy1 - fpr_iy4 съдържа някои цифри за периода от време, за 4 от стария. За всеки от периодите м наблюдения подкрепят да се промени начинът на формиране на стойностите на тези параметри (например, клиентът използва специална отстъпка, която може да повлияе на неговия обем на поръчките, в продължение на 3 месеца). Ние трябва да разберем средната стойност на резултатите за всяко наблюдение не е за всички 4 периоди, но само за посочения м.

Този пример е взета от m променливи gmplans. Например, за втори наблюдение (gmplans = 2) трябва първа средна стойност на две променливи, т.е. променливи и fpr_iy1 fpr_iy2 на.

По-рано създаден променливи, за да се отстрани е по-добре:

DELETE ПОКАЗАТЕЛИ Aver aver1.

Временно декларира входни променливи вектор. Това ще ни даде възможност да се отнасят към тях като v1 (1) - това би означавало, позоваване на първата променлива на вектора, fpr_iy1. Определяне на вектора да съществува в паметта на първия пасаж според (до команда за пускане мързелив оценка).

VECTOR v1 = fpr_iy1 ДА fpr_iy4.

Определяне на LOOP цикъл. Поради това, че рамката се извършва за всеки случай поотделно, ние можем да изберете отделни повторения (от 1 до стойността на променливите gmplans). На следващо място, с помощта на конвенционално строителство DO IF - друго - КРАЙ АКО. Ако променливата #I индекс е равен на 1, това означава, че за дадено наблюдение ние цикъл за първи път. Това е първият път, и може да е последен, ако променливите gmplans стояха стойност 1. Във всеки случай, ние копирате Заявявам променлива стойност от първата променлива вектор (fpr_iy1).

Ако # Не е равно на 1, изпълняваме две команди. Първо ние добавяме стойност #-тото променлива на вектора със стойността, която вече се съдържа в променливата Aver. Когато бях там преди пропуск или стойност v1 (#I) себе си е пропуск резултат SUM (твърдя, v1 (#I)) ще бъде равна на стойността на аргумента, без да пропуска (или е равна пас, ако и двата аргумента - празнини). Вторият екип, ние завърши изчисляването на средната стойност, в случай че #I достигнала горната граница на промените в нея (gmplans). По този начин, разделянето се извършва винаги от стойността на променливите gmplans. Ние правим до заключение, че това решение трябва да се използва с повишено внимание: неправилно прилагане ще се върне средни стойности, ако поне един от fpr_iy1 на аргументи - fpr_iy4 ще бъде пропуск! Или по-скоро, пропуски ще бъдат интерпретирани като нулева стойност, освен ако всички променливи fpr_iy1 - не съдържат fpr_iy4 липсващите стойности. В последния случай, твърдя също ще премине.

LOOP #I = 1 ДО gmplans.

- COMPUTE твърдя = v1 (#I).

- COMPUTE твърдя = SUM (твърдя, v1 (#I)).

- АКО # I = gmplans Aver = твърдя / # аз.

Следващият отбор пускаме мързелив оценка, получаване дескриптивна статистика за новосъздадената променлива Aver.

DESCRIPTIVES
ПРОМЕНЛИВИ = твърдя
/ Статистика = средна StdDev MIN MAX.

Имайте предвид, че, тъй като веригата на LOOP като променлива индекс #I използва (с мрежа), той няма да се появи в базата данни. Ако символът # във всички случаи да бъдат отстранени, ще видим до каква стойност спрях за всеки цикъл на наблюдение. Тъй като брояча се увеличава при завършване на последната команда цикъл, тази стойност ще бъде винаги равна на gmplans + 1.

Друга забележка. За наблюдение на пето променливи gmplans = 0. Това предизвиква цикъл започва с параметри LOOP #I = 1, 0. Такъв цикъл от правилата не се изпълнява. Aver променлива ще съдържа липсващата стойност.

Това е начина, по който. Всичко най-хубаво.

Ново в www.spsstools.ru на сайта

Превод и се прибавя синтактични примери:

Подкрепете проекта - споделете линка, благодаря!