In a negative correlation, as the values of one of the variables increase, the values of the second variable decrease.
Изследване на връзки между номинално измерени променливи
Хи-квадрат тест за съответствие – определя дали честотите на дадена наблюдавана категориална променлива отговарят на определено очаквано разпределение.
1. Занятие и притежание на собствен автомобил ( с условие q1=1)
2. Намерение за покупка и материално положение.
3. Намерение за покупка и занятие.
4. Образование и занятие.
5. Пол и образование.
Равнище на значимост е 0,000 означава, че нулевата хипотеза за липса на връзка между променливите се отхвърля, стойността на коефициентите показва доколко силна е връзката.
V коефициент на Крамър – мярка за връзка между две номинални променливи, основаваща се върху Хи-квадрат, стойността му варира в интервала от 0 до 1, където 0 изразява липсата на каквато и да било връзка, а 1 – силна връзка.
Фи-коефициент – основан върху хи-квадрат, за таблици с размерност 2х2 фи-коефициентът е равен на корелационния коефициент на Пиърсън и приема стойности от -1 до +1, за таблици с по-голяма размерност може да надхвърля по абсолютна стойност 1.В общия случай, при условие че коя да е от двете променливи има повече от две категории, се препоръчва да се гледа по-скоро равнището на значимост, а не коефициента.
Коефициент на контингенцията С – измерва връзката между номинално измерени променливи, основан на хи-квадрат. Коефициентът на контингенцията приема стойности от 0 до 1, без 1, има две слабости – никога не е в състояние да приеме стойност 1 и величината му зависи от размерноста на таблицата
Друг подход за изследване на корелацията между две променливи се гради върху идеята да се установи доколко честотата на едната променлива може да бъде предсказана от честотата на другата променлива., представители на този подход са ламбда коефициентът и коефициентът на несигурността.
Ламбда коефициент – мярка за връзка между две номинално измерени променливи, който показва пропорционалното свеждане в грешката, когато стойностите на независимата променлива се използват за предсказване стойностите на зависимата. При стойност 1 независимата променлива изцяло предсказва зависимата, стойност 0 означава, че независимата променлива не е от никаква полза за предсказване на зависимата.
Коефициент на несигурността – основава се на идеята за ентропията – (величина, характеризираща състоянието на една термодинамична система, т.е. изразяването на броя на възможните конфигурации или подреждания на градивните частици на системата. Ентропията е критерий за това колко близко до термодинамично равновесие е дадена система. Тя е по-голяма, когато хаосът, а следователно и неговата вероятност, са по-големи) – колкото повече стойността му клони към 1, толкова повече информация за предсказване на зависимата променлива е налице и колкото повече клони към 0, толкова повече е ненужна независимата променлива, защото информацията която предоставя за предсказването на зависимата е нищожна.
Изследване на връзки между ординално измерени променливи
Analyze-Correlate-Bivariate – Kendal-Spearman
Ординално измерени са онези променливи, чиито стойности са подредени, но не е задължително да бъдат смислени като числа
Коефициент на Кендал – приема стойности от -1 до +1, като крайните стойности могат да бъдат достигнати само при квадратни таблици, знакът на коефициентът показва посоката на корелацията, а абсолютната й величина – силата.
Коефициент ро на Спирман – едно от най-често използваните средства за измерване на корелацията между две ординално измерени променливи. По отношение на всички изследвани случаи, стойностите на променливите се подреждат от най-ниската до най-високата и после се прилага коефициентаът на Пиърсън по отношение на така получените рангове.
1. Възраст и ползване на интернет.
2. Ползване на интернет и образование.
3. Образование и материално положение.
4. Възраст и доход.
5. Чета книги/ходя на театър.
6. Отделям твърде много време за работа/Отделям време за хобита.
7. Прекарвам времето си със семейство/Посещавам нощни барове дискотеки.
Метрична корелация
Отнася се до променливи, които са измерени в силните скали, при тях числата имат същинско количествено съдържание
Проста линейна корелация
Analyze -> Correlate -> Bivariate->
За изчисляването на проста линейна корелация между две променливи се използва корелационният коефициент r на Пиърсън, примащ стойности от -1 до +1, като граничните стойности показват съвършено отрицателна или съвършено положителна връзка между променливите.
1. Доход и брой на притежаваните автомобили.
2. Доход и брой на лицата в домакинството.
3. Възраст и доход.