Məlumat

Faktor Analizinin Nəticələrini və Puanlarını Təfsir etmək Sualları

Faktor Analizinin Nəticələrini və Puanlarını Təfsir etmək Sualları

Faktor təhlilini öyrənməyə çalışıram və "nümunə ilə öyrənməyin" bir yolu olaraq saxta dəyərlər dəsti ilə IQ ballarının hesablanmasını sınamağın və çox zəif "təqlid etmənin" yaxşı bir fikir olduğunu düşündüm.

Başlamaq üçün bunu etmək niyyətindəyəm və bu metodologiyanın doğru olub olmadığını bilmirəm: bu faktor üçün yükləmələr təyin olunmuşam. İndi yükləmələrim var, nümunələrin hər biri üçün bir bal yaratmaq istəyirəm. Bu, daha sonra orta hesabla 100 standartlaşdıra biləcəyim bir bal əhalisi ilə məni tərk edəcək. Oradan normal bir paylama qurardım. Hər dəfə yeni bir nümunə alsam, bunun üçün bir nəticə yarada və paylamanın haraya düşdüyünü görə bilərəm.

Nəticələrimi əldə etmək üçün Python -un Sklearn kitabxanasından, xüsusən dəFaktor Analizisinif Mən fərq etdim kiFaktor Analizisinifdə a varhesab nümunələri ()üsul Hər bir nümunə üçün çıxan nəticə nümunənin log ehtimalına bərabərdir.

Budur suallarımdan bəziləri:

  • Nümunələrin faktor skorlarına əsaslanan bir paylama yaratmaqda yanaşmam qüsurdurmu? Praktikada bunu necə edirlər?

  • Bir nümunənin log ehtimalı istifadə etmək üçün uyğun bir baldırmı? (Əgər yoxsa, nümunə toplamaq üçün hansı alternativ yollar var?)

  • İrəli getdim və istifadə edərək puanları yaratdımhesab nümunələri ()Bütün nümunələr üçün metod, lakin -4 ilə -49 arasında dəyişir. Mənfi olmalarının bir səbəbi varmı?

  • Yalnız 1 gizli faktor axtarırsınızsa, faktorların sayını 1 olaraq təyin etmək yaxşı bir tətbiqdirmi və ya hər halda təyin edilməməlidir?

Faktor sayını 1 olaraq təyin etsəm, yükləmələr budur:

Faktor 1 dəyişən 1 0.082558 dəyişən 2 0.107940 dəyişən 3 0.199645 dəyişən 4 0.612495 dəyişən 5 0.623707

Faktorların sayını göstərmədiyim təqdirdə yükləmələr:

Faktor 1 Faktör 2 Faktör 3 Faktör 4 Faktör 5 dəyişən 1 0.263914 0.426346 -0.012893 -0.0 0.0 dəyişkən 2 0.297078 0.415269 -0.002193 0.0 -0.0 dəyişən 3 0.243590 -0.005131 0.085178 -0.0 -0.0 dəyişən 4 0.487537 -0.02487537 5 0.484462 -0.248173 -0.008902 0.0 0.0

Nümunələrin faktor skorlarına əsaslanan bir paylama yaratmaqda yanaşmam qüsurdurmu? Praktikada bunu necə edirlər?

Bunu izləmək bir qədər çətin olduğunu gördüm. Ancaq ümumilikdə, kovarians matrisinin bütün testlər arasında müsbət korrelyasiyanı nəzərdə tutduğu çox dəyişənli normal paylanmadan istifadə edərək bir sıra test ballarını təxmin edə bilməlisiniz. Bəziləri daha böyük, bəziləri daha kiçik ola bilər, amma fikir bütün qabiliyyət testlərinin əlaqəli olmasıdır. Və ümumi zehni qabiliyyət, bu cür testlər nəticəsində ortaya çıxan ilk qayğısız faktor kimi qiymətləndirilə bilər.

Bir nümunənin log ehtimalı istifadə etmək üçün uyğun bir baldırmı? (Əgər yoxsa, nümunə toplamaq üçün hansı alternativ yollar var?)

Bu, bir modeli necə qiymətləndirdiyinizə bənzəyir. Məsələn, bir faktor analitik həllini necə qiymətləndirirsiniz. Ümumiyyətlə, faktorla qənaət olunan ballar, komponent testlərində alınan balların ağırlıqlı bir birləşməsi olacaq.

R -də istifadə edə bilərsinizfaktanal

faktar (x, faktorlar, data = NULL, covmat = NULL, n.obs = NA, alt kümə, na.action, start = NULL, skorlar = c ("yox", "reqressiya", "Bartlett"), fırlanma = " varimax ", nəzarət = NULL, ...)

Baxınballarmübahisə. Bir neçə fərqli üsul var.

Mən irəli getdim və bütün nümunələr üçün score_samples () metodundan istifadə edərək skorlar yaratdım, lakin onlar -4 ilə -49 arasındadır. Mənfi olmalarının bir səbəbi varmı?

Python bilmirəm. Ümumiyyətlə, faktorla qənaət olunan ballar, adətən, z-skorları ilə ölçülür (məsələn, ortalama = 0, sd = 1).

Yalnız 1 gizli faktor axtarırsınızsa, faktorların sayını 1 olaraq təyin etmək yaxşı bir tətbiqdirmi və ya hər halda təyin edilməməlidir?

Ya yalnız bir faktoru çıxarmalısınız, ya da çıxarış faktorlarına heç bir rotasiya tətbiq etməməyinizi təmin etməlisiniz. Rotasiya olmadan birinci amil yalnız bir faktora bərabər olacaq. Döndərsəniz, variasiya çıxarılan amillər arasında bölüşdürüləcəkdir.


İcmalar

Çıxışdan sonrakı maddə, nə qədər dəyişikliyin olduğunu göstərən cəmiyyətlər cədvəlidir (yəni daha çox təhlil üçün nəzərə alınmalı olan 0,5 -dən çox olan icma dəyəri. Başqa bir halda bu dəyişənlər faktor analizindən sonrakı addımlardan silinəcəkdir). dəyişənlər çıxarılan amillərlə uçota alınmışdır. Məsələn bitdi

"Məhsulun keyfiyyəti" fərqinin 90% -i, "Məhsulun mövcudluğu" fərqinin 73,5% -i (Cədvəl 4).


Bir Faktor Analizindən İndeks Hesabını Necə Hesablamaq olar

Əsas Komponent Analizini (PCA) və ya Faktor Analizini (FA) işə salmağın ümumi səbəblərindən biri dəyişkən azalmadır.

Başqa sözlə, Anksiyete kimi bir şeyi ölçmək üçün nəzərdə tutulan 10 maddəlik bir miqyasla başlaya bilərsiniz, bunu bir sualla dəqiq ölçmək çətindir.

Analizdə hər 10 maddəni fərdi dəyişən kimi istifadə edə bilərsiniz və bəlkə də bir reqressiya modelində proqnozlaşdırıcı olaraq.

Ancaq bir ilə başa çatırsınız qarışıqlıq.

Yalnız bütün bu əmsalları şərh etməkdə çətinlik çəkməyəcəksiniz, həm də çoxsaylı xətlər probleminiz ola bilər.

Və ən əsası, təsiri ilə maraqlanmırsınız hər biri nəticənizdən asılı olaraq 10 fərdi maddə. Anksiyete təsiri ilə maraqlanırsınız bütünlüklə.

Beləliklə, FA və ya PCA kimi dəyişkən azalma texnikasına müraciət edərək, əlaqədar 10 dəyişəni Anksiyete quruluşunu təmsil edən birinə çeviririk.

FA və PCA fərqli nəzəri əsaslara və fərziyyələrə malikdir və fərqli vəziyyətlərdə istifadə olunur, lakin proseslər çox oxşardır. Bu nümunə üçün burada FA istifadə edəcəyik.

Beləliklə, yaxşı bir faktor analitik həllini uğurla hazırladığınızı söyləyin və bu 10 maddənin hamısının Anksiyete olaraq şərh edilə bilən tək bir faktoru təmsil etdiyini söyləyin. Bu 10 maddəni vahid bir indeksdə birləşdirməyin iki oxşar, lakin nəzəri cəhətdən fərqli yolları var.

Faktor Puanları

Faktor Analizi çıxışının bir hissəsi faktor yükləmələri cədvəlidir. Hər bir maddənin yüklənməsi, bu maddənin əsas faktorla nə qədər əlaqəli olduğunu göstərir.

Bəzi yükləmələr o qədər aşağı olacaq ki, bu maddəni faktorla əlaqəsi olmadığını düşünərdik və indeksə daxil etmək istəməzdik.

Ancaq kifayət qədər yüksək yüklənmiş əşyalar arasında belə, yükləmələr bir qədər dəyişə bilər. Bu yükləmələr bir -birindən çox fərqlidirsə, indeksin hər bir maddənin faktorla qeyri -bərabər əlaqəli olduğunu əks etdirməsini istəyirsiniz.

Maddələri birləşdirmək üçün bir yanaşma, indeks dəyişənini an vasitəsilə hesablamaqdır optimal çəkili Faktor Puanları adlanan maddələrin xətti birləşməsi. Hər bir maddənin çəkisi faktor yüklənməsindən qaynaqlanır. Beləliklə, hər bir maddənin faktor hesabına verdiyi töhfə, faktorla nə dərəcədə əlaqəli olduğuna bağlıdır.

Faktor skorları əslində maddələrin ağırlıqlı cəmidir. Bu ağırlıqların hamısı -1 ilə 1 arasında olduğu üçün faktor ballarının miqyası təmiz bir məbləğdən çox fərqli olacaq. Faktor skorlarını standart ağırlıqlı ortalamalar kimi düşünməyi faydalı hesab edirəm.

Faktor əsaslı ballar

İkinci, daha sadə yanaşma, çəkiləri nəzərə almadan xətti birləşməni hesablamaqdır. İstər bir məbləğ, istərsə də ortalama işləyir, ortalamalar maddələrlə eyni miqyasda olmaq üstünlüyünə malikdir.

Bu yanaşmada, hər bir faktora hansı maddələrin yükləndiyini müəyyən etmək üçün Faktor Analizini aparırsınız və sonra hər bir faktor üçün maddələri birləşdirirsiniz.

Bu yeni dəyişənin texniki adı faktor əsaslı bir hesabdır.

Faktor əsaslı ballar, yüklərin hamısının oxşar olduğu hallarda məna kəsb edir. Bu vəziyyətdə, çəkilər onsuz da çox şey etməzdi.

Hansı Puanlardan istifadə etməli?

Faktor Skorlarından istifadə etmək heç vaxt səhv deyil. Faktor yükləmələri çox fərqli olarsa, faktorun daha yaxşı bir nümayəndəsidir. Və bütün proqramlar onları tez və asanlıqla məlumat dəstinizə əlavə edəcək.

Faktor əsaslı skorların iki üstünlüyü var. Birincisi, ümumiyyətlə daha intuitivdirlər. Tədqiqat aparmayan bir auditoriya, standartlaşdırılmış optimal çəkili xətti birləşmədən daha yaxşı bir orta maddə anlaya bilər.

İkincisi, nümunələr arasında fərqlənən çəkilərdən narahat olmaq lazım deyil. Faktor yükləmələri fərqli nümunələrdə oxşar olmalıdır, lakin eyni olmayacaq. Bu faktiki faktor skorlarını təsir edəcək, lakin faktor əsaslı puanlara təsir etməyəcək.

Ancaq faktor əsaslı skorlardan istifadə etməzdən əvvəl yükləmələrin həqiqətən oxşar olduğundan əmin olun. Əks təqdirdə, faktorunuzu səhv təqdim edə bilərsiniz.


Ümumi dispersiya izah edildi

Öz dəyər əslində cəmi faktor analizinə məruz qalan maddələrin sayına bərabər olan çıxarılmış faktorların sayını əks etdirir. Növbəti maddə analizdən çıxarıla bilən bütün faktorları öz dəyərləri ilə birlikdə göstərir.

Öz dəyər cədvəli üç alt hissəyə bölünmüşdür, yəni İlkin Öz Dəyərləri, Kvadrat Yüklərin Çıxarılan Cəmləri və Kvadrat Yüklərin Cəminin Dönməsi. Təhlil və təfsir məqsədi ilə yalnız Kvadrat Yüklərin Çıxarılan Cəmləri ilə maraqlanırıq. Burada nəzərə alınmalıdır ki, birinci faktor varyansın 46.367%, ikincisi 18.471% və üçüncü 17.013% -dir. Qalan bütün amillər əhəmiyyətli deyil (Cədvəl 5).

  1. Komponent: Yuxarıdakı İcmalar Cədvəli 3 -də göründüyü kimi, Cədvəl 3 altında 1 sütunda göstərilən 8 komponent var.
  2. İlkin Öz Dəyərlər Cəmi: Ümumi dispersiya.
  3. İlkin Öz Dəyişikliklərin % -i: Hər bir amilə aid olan variasiya faizi.
  4. İlkin Öz Dəyərlər Kümülatif %: Əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.
  5. Kvadrat yüklərin hasilatı cəmi: Çıxarışdan sonra ümumi dispersiya.
  6. Kvadrat yüklərin çıxarılma məbləği % varyans: Çıxarıldıqdan sonra hər bir faktora aid olan variasiya faizi. Bu dəyər bizim üçün əhəmiyyətlidir və buna görə də bu addımda müəyyən bir məhsulu kiməsə verməyə kömək edən üç faktor olduğunu müəyyən edirik.
  7. Kvadrat Kümülatif Çıxarma Məbləği: Çıxarıldıqdan sonra əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.
  8. Kvadrat yüklərin cəminin fırlanması Cəmi: Dönüşdən sonra ümumi variasiya.
  9. Kvadrat yüklərin cəminin dəyişməsi % varyans: Rotasiya sonrası hər bir faktora aid olan variasiya faizi.
  10. Kvadrat yüklərin cəminin fırlanması Kümülatif %: Əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.

Faktor Analizi: Qısa Giriş, 2 -ci hissə –Rotasiyalar

Faktor analizinin vacib bir xüsusiyyəti, faktorların oxlarının çoxölçülü dəyişən məkan daxilində dönə bilməsidir. Bunun mənası nədir?

Sadə dillə desək, dəyişənlər və gizli faktorlar arasında ən yaxşı uyğunluğu müəyyən edərkən bir faktor təhlili proqramının etdiyi işlər: Bir faktor analizinə girən 10 dəyişənin olduğunu düşünün.

Proqram əvvəlcə dəyişənlərlə gizli faktor arasındakı ən güclü korrelyasiyanı axtarır və bunu 1 -ci Faktor halına gətirir. Vizual olaraq bunu bir ox kimi düşünmək olar (Axis 1).

Faktor təhlili proqramı sonra korrelyasiyaların ikinci dəstini axtarır və onu Faktor 2 adlandırır və s.

Bəzən, ilkin həll bir dəyişənin bir neçə faktorla güclü əlaqəsi və ya heç bir faktorla heç bir güclü əlaqəsi olmayan bir dəyişənlə nəticələnir.

Baltaların yerini faktiki məlumat nöqtələrinə daha yaxşı uyğunlaşdırmaq üçün proqram baltaları döndərə bilər. İdeal olaraq, rotasiya faktorları daha asan təfsir edəcək.

Yalnız iki ölçü (x və y oxu) olduqda fırlanma zamanı nələrin baş verdiyini görərik:

Orijinal x və y oxları qara rəngdədir. Fırlanma zamanı baltalar faktiki məlumat nöqtələrini ümumilikdə daha yaxşı əhatə edən mövqeyə keçir.

Proqramlar bir çox növ rotasiya təklif edir. Aralarındakı əhəmiyyətli bir fərq, bir -biri ilə əlaqəli və ya əlaqəsiz faktorlar yarada bilmələridir.

Korrelyasiyaya imkan verən rotasiyalar deyilir oblique rotations amillərin əlaqəli olmadığını düşünən rotasiyalar deyilir ortogonal rotasiyalar. Qrafikimiz ortogonal fırlanmanı göstərir.

Bir daha, gəlin sərvət göstəricilərini araşdıraq.

Təsəvvür edək ki, ortogonal fırlanma əvvəllər göstərildiyi kimi alınmadı. Əksinə, bu nəticəni əldə edirik:

Dəyişənlər Faktor 1 Faktor 2
Gəlir 0.63 0.14
Təhsil 0.47 0.24
Peşə 0.45 0.22
Ev dəyəri 0.39 0.25
Qonşuluqdakı ictimai parkların sayı 0.12 0.20
İllik zorakılıq cinayətlərinin sayı 0.21 0.18

Aydındır ki, heç bir dəyişən Faktor 2 -yə çox yüklənmir. Nə oldu?

İlk cəhdimiz ortogonal fırlanma olduğundan Faktor 1 və 2 -nin əlaqəli olmadığını qeyd etdik.

Ancaq yüksək "Fərdi sosial -iqtisadi statusu" (Faktor 1) olan bir insanın "Qonşuluq sosial -iqtisadi statusu" (Faktor 2) olan bir ərazidə yaşadığını da düşünmək məntiqlidir. Bu faktorlar deməkdir olmalıdır əlaqələndirmək

Nəticə etibarilə, iki faktorun iki oxu ortogonal fırlanmanın edə biləcəyindən daha yaxındır. Faktorların bir -biri ilə əlaqəli olduğu yeni nümunəmiz üçün baltaların əyri fırlanmasının görüntüsü:

Aydındır ki, iki faktor arasındakı açı indi 90 dərəcədən kiçikdir, yəni faktorlar indi əlaqəlidir. Bu nümunədə, oblique rotasiya, məlumatları ortogonal fırlanmadan daha yaxşı yerləşdirir.


Faktor təhlili

Faktor təhlili, müşahidə olunan bir çox dəyişən arasındakı korrelyasiyanı təhlil etmək və gizli faktorları araşdırmaq üçün hazırlanmış çoxfunksiyalı bir texnikadır. Bu fəsil 20 -ci əsrin əvvəllərindən bəri faktor analizinin təkamülünə və müxtəlif sahələrdə tətbiq olunan tədqiqatlara nəzər salmağa imkan verir. Bu gün faktor təhlili təkcə psixologiya sahəsində deyil, siyasət, ədəbiyyat, biologiya və tibb elmi kimi sahələrdə də geniş istifadə olunur. Məsələn, antropologiyada morfoloji biliklər insan sümüklərinin ölçülmüş əlamətləri arasındakı korrelyasiyaların təhlili və heyvan və bitkilərin ölçülmüş xüsusiyyətlərinin faktor təhlili ilə əldə edilmişdir. Fəsildə faktor təhlili modeli təqdim olunur və faktor analizində statistik nəticə çıxarılır. Faktor analizində parametr qiymətləndirmələrinin standart səhvləri üçün düsturlar mürəkkəbdir və ya qapalı formalarda ifadə oluna bilməz. Bootstrap metodlarının üstünlüklərindən biri də analitik törəmələr olmadan istifadə edilməsidir. Bununla birlikdə, faktor analizində bootstrap metodlarından istifadə etmək üçün ehtiyatlı olmaq lazımdır. Fəsil eyni zamanda faktor rotasiyası və faktor skorlarının qiymətləndirilməsinin müxtəlif üsullarını əhatə edir.


Şəxsiyyət/Xarakter Nörobiliminin Şəbəkə Analizi ilə İnteqrasiyası

3.1.1 Faktorların Təhlili

Faktor təhlili, müşahidə olunan, təzahür edən və ya ölçülən dəyişənlərə səbəb olan gizli dəyişənlər və ya "amillər" baxımından birliklərin quruluşunu konseptuallaşdırır. Faktor təhlili (və yaxından əlaqəli əsas komponentlərin təhlili) bunu, təhlildə müşahidə olunan digər dəyişənlərlə müqayisədə bir-biri ilə daha çox oxşarlığı olan müşahidə olunan dəyişənlər dəstlərini müəyyən etməklə həyata keçirir. Faktor təhlili, müşahidə olunan dəyişənlər arasında iki tərəfli birləşmələrin korrelyasiya matrisi ilə başlayır. Konseptual olaraq, faktor təhlili hansı müşahidə olunan dəyişənlərin bir araya gəldiyini müəyyən etmək üçün matrisi tarar. Bir -biri ilə güclü əlaqəli və digər qruplarda müşahidə olunan dəyişənlərlə zəif əlaqəli olan dəyişənlərin qruplarını axtarır. Daha texniki cəhətdən, müşahidə olunan dəyişənlərdə mümkün qədər çox dəyişikliyə səbəb olan faktorları çıxarır.

Kəşfiyyat amili təhlili, tez-tez təkrarlanan, irəli və irəli gedən addımlar kimi qəbul edilə bilər: hasilat, bir sıra amillərin seçilməsi, fırlanma və faktor yüklərinin və (potensial) faktor korrelyasiyalarının araşdırılması. 79 İlk addım, müşahidə olunan dəyişənlərin birləşməsini müəyyən edən bir "çıxarma metodu" tətbiq etməyi əhatə edir və bu birləşmələrə amillər deyilir. Bir neçə növ hasilat üsulu var, lakin əsas ox faktoru təhlili və əsas komponent analizi ən çox istifadə olunur. Çıxarış bir istehsal edir özünəməxsus dəyər hər bir potensial faktor üçün, müşahidə edilən dəyişənlər olduğu qədər çox potensial faktor üçün. Bir faktorun öz dəyəri, faktorla izah edilən müşahidə olunan dəyişənlərdəki fərqin miqdarı olaraq görülə bilər.

İkinci addımda, tədqiqatçılar orijinal dəyişənlər arasındakı əlaqələri adekvat şəkildə ümumiləşdirən amillərin sayına qərar verirlər. "Uyğun" amillərin sayı qeyri-müəyyən ola bilər, lakin bu prosesdə kömək edəcək əsas qaydalar var. Ümumi qaydalar ümumiyyətlə özünəməxsus dəyərlərin nisbi böyüklüyündən asılıdır, lakin qərarı məlumatlandırmaq üçün sonrakı addımlardan alınan məlumatlar istifadə edilə bilər (məsələn, faktor yüklərinin aydınlığı, 4-cü addıma baxın).

Üçüncü addımda, tədqiqatçılar faktorların psixoloji mənasını aydınlaşdırmaq üçün ümumiyyətlə "rotasiya" dan istifadə edirlər. Rotasiya istehsal etmək üçün nəzərdə tutulmuşdur sadə quruluş, hər müşahidə olunan dəyişənin bir faktor və yalnız bir faktorla (yəni "yüklənmə") güclü şəkildə birləşdiyi assosiasiya nümunəsi. İki ümumi fırlanma növü var: ortogonal fırlanma əlaqəsiz faktorlar yaradır və oblique rotasiya bir -biri ilə əlaqələndirilə bilən faktorlar yaradır.

Dördüncüsü, tədqiqatçılar əsas statistik nəticələrə, ilk növbədə faktor yükləmələrinə və (əgər varsa) interaktor əlaqələrinə əsaslanaraq psixoloji nəticələr çıxarırlar. Faktor yükləmələri, müşahidə olunan hər bir dəyişənlə hər bir faktor arasındakı əlaqəni təmsil edən dəyərlərdir. Hansı müşahidə olunan dəyişənlərin hər bir faktorla ən çox əlaqəli olduğunu qeyd edərək, tədqiqatçılar faktorların psixoloji mənasını şərh edə bilərlər. İstehsal edilə bilən bir neçə növ faktor yükləməsi var, lakin hamısı təxminən və ya hərfi mənada −1 və ya +1 -ə yaxın olan güclü birləşmələri əks etdirən korrelyativ metrik üzərindədir və 0 -a yaxın dəyərlər yox olduğunu göstərir müşahidə olunan dəyişənlə faktor arasındakı əlaqə. Tədqiqatçılar birdən çox faktor çıxarıb oblique rotasiya tətbiq etdikdə və müşahidə olunan dəyişənlərin altında yatan ölçülərin bir -biri ilə necə əlaqəli olduğunu ortaya qoyduqda interfaktor əlaqələri əldə edilir.


I. Kəşfiyyat Faktoru Analizi (EFA)

  • Giriş
    1. Həvəsləndirici nümunə: SAQ
    2. Pearson korrelyasiya düsturu
    3. Faktor analizində fərqliliyin bölünməsi
  • Çıxarıcı amillər
    1. əsas komponentlərin təhlili
    2. ümumi amil təhlili
      • əsas ox faktorinqi
      • maksimum ehtimal
      1. Sadə quruluş
      2. Ortogonal fırlanma (Varimax)
      3. Eğik (birbaşa oblimin)

      Faktor təhlili

      Faktor təhlili hər ikisi daxildir komponent təhliliümumi amil təhlili. Digər statistik metodlardan daha çox faktor təhlili, məqsədinin qarışıqlığından əziyyət çəkdi. Bu mənim təqdimatıma iki şəkildə təsir edir. Birincisi, sonrakı hissələrdə bunu necə etdiyini araşdırmadan əvvəl faktor analizinin nə etdiyini izah etmək üçün uzun bir bölmə ayırıram. İkincisi, adi təqdimat qaydasını ləğv etmək qərarına gəldim. Komponent analizi daha sadədir və əksər müzakirələr əvvəlcə onu təqdim edir. Ancaq düşünürəm ki, ümumi faktor təhlili əksər tədqiqatçıların həqiqətən həll etmək istədikləri problemləri həll etməyə yaxınlaşır. Beləliklə, əvvəlcə komponent analizini öyrənmək əslində bu problemlərin nə olduğunu anlamağa mane ola bilər. Buna görə də komponent təhlili bu fəslin sonlarında təqdim olunur.

      Hansı Faktor Analizinin Bacardığı və Yapamayacağı

      Faktor-Analiz Problemlərindən Bəzi Nümunələr

      Maraqlı bir fikir idi, amma səhv olduğu ortaya çıxdı. Bu gün College Board test xidməti, zehni qabiliyyətin ən azı üç vacib amilinin-şifahi, riyazi və məntiqi qabiliyyətlərin olduğu fikrinə əsaslanan bir sistemlə işləyir və əksər psixoloqlar bir çox digər faktorların da müəyyən edilə biləcəyinə razıdırlar.

      2. Avtonom sinir sisteminin fəaliyyətinin müxtəlif ölçülərini nəzərdən keçirin-ürək dərəcəsi, qan təzyiqi və s. Psixoloqlar təsadüfi dalğalanmalar istisna olmaqla, bütün bu tədbirlərin birlikdə yuxarı və aşağı hərəkət edib etməməsini-"aktivləşdirmə" hipotezini bilmək istəyirdilər. . Yoxsa avtonom tədbirlər qrupları birlikdə yuxarı və aşağı hərəkət edir, amma digər qruplardan ayrıdır? Yoxsa bütün tədbirlər əsasən müstəqildir? Mənim nəşr olunmamış bir analizim göstərdi ki, bir məlumat toplusunda, hər halda, məlumatlar aktivasiya hipotezinə kifayət qədər uyğun gəlir.

      3. Tutaq ki, bir çox heyvan növünə (siçovullar, siçanlar, quşlar, qurbağalar və s.) Bu yerdən hər hansı bir səs-küy-hər hansı bir səs-küy gəldikdə yemin müəyyən bir yerdə görünəcəyini öyrədirlər. Səs göründükdə o istiqamətə dönüb -dönmədiklərini görməklə müəyyən bir səsi aşkarlaya biləcəklərini deyə bilərsiniz. Sonra bir çox səsləri və bir çox növləri araşdırsanız, növlərin eşitmə itiliyinin neçə fərqli ölçüdə olduğunu bilmək istəyə bilərsiniz. Hipotezlərdən biri, onların yalnız üç ölçüdə-yüksək tezlikli səsləri, aşağı tezlikli səsləri və ara səsləri aşkar etmə qabiliyyətində-fərqlənməsidir. Digər tərəfdən, növlər eşitmə qabiliyyətlərində bu üç ölçüdən çox fərqlənə bilər. Məsələn, bəzi növlər kəskin klik kimi səsləri, digərləri davamlı hissə bənzər səsləri daha yaxşı aşkar edə bilər.

      4. Fərqli növ avtomobillərlə tanış olan 500 nəfərdən hər birinin 20 avtomobil modelinin hər birini "Bu cür avtomobilə nə qədər sahib olmaq istərdiniz?" Reytinqlərin fərqli olduğu ölçülərin sayı haqqında faydalı olaraq soruşa bilərik. Tək faktorlu bir nəzəriyyə, insanların ən bahalı modellərə ən yüksək reytinqi verdiyini irəli sürəcək. İki faktorlu bir nəzəriyyə, bəzi insanların ən çox idman modellərinə, digərlərinin isə lüks modellərə daha çox cəlb olunduğunu irəli sürəcək. Üç faktorlu və dörd faktorlu nəzəriyyələr təhlükəsizlik və etibarlılıq əlavə edə bilər. Və ya avtomobil əvəzinə yeməklər, siyasi siyasətlər, siyasi namizədlər və ya bir çox başqa obyektlə bağlı münasibətləri öyrənməyi seçə bilərsiniz.

      5. Rubenstein (1986), "Maşının necə işlədiyini anlamağı xoşlayıram" və ya "Yeni yemək növlərini sınamağı sevirəm" kimi ifadələrlə böyük bir orta məktəb şagirdlərinin razılaşmalarını təhlil edərək maraq doğurdu. . " Faktor təhlili yeddi faktoru müəyyən etdi: problem həll etmə, öyrənmə və oxumaq, təbiət elmləri, incəsənət və musiqi ilə bağlı üç ölçmə marağı və ümumiyyətlə yeni təcrübələr və pula nisbətən az marağın olduğunu göstərən bir faktor.

      Məqsəd: səbəbləri anlamaq

      1. Bu dəyişənlər arasındakı əlaqələrin quruluşunu izah etmək üçün neçə fərqli faktora ehtiyac var?
      2. Bu faktorların mahiyyəti nədir?
      3. Hipotezləşdirilmiş amillər müşahidə olunan məlumatları nə qədər yaxşı izah edir?
      4. Hər müşahidə olunan dəyişənə nə qədər sırf təsadüfi və ya unikal variasiya daxildir?

      Faktor Analizinin Mütləq Qarşı Evristik İstifadələri

      Əvvəlki nümunələr faydalı bir fərqi göstərmək üçün istifadə edilə bilər-arasında mütləqevristik faktor analizinin istifadəsi. Spearman's g kəşfiyyat nəzəriyyəsi və avtonom fəaliyyətin aktivləşdirilməsi nəzəriyyəsi, dəyişənlər arasındakı əlaqələr modelinin tam təsvirini vermək üçün fərziyyə edilən və ya fərz edilən mütləq nəzəriyyələr kimi düşünülə bilər. Digər tərəfdən, Rubenstein, maraqlanmağın yeddi əsas faktorunun siyahısının marağın tam təsvirini təqdim etdiyini heç vaxt iddia etməmişdir. Əksinə, bu faktorlar ən vacib yeddi faktor kimi görünür-bir məlumat toplusunu ümumiləşdirməyin ən yaxşı yolu. Faktor təhlili, nəticəni necə şərh etdiyinizdə ya mütləq, ya da evristik modellər təklif edə bilər.

      Faktor təhlili obyektivdirmi?

      Bənzər bir balanslaşdırma problemi, geriləmənin və varyansın analizində ortaya çıxır, lakin ümumiyyətlə fərqli işçilərin təxminən eyni nəticələrə gəlməsinə mane olmur. Bütün bunlardan sonra, əgər iki işçi eyni məlumatlara variasiya təhlili tətbiq edərsə və hər iki işçi .05 səviyyəsində əhəmiyyətli olmayan şərtləri tərk edərsə, hər ikisi də eyni təsirləri bildirəcəkdir. Ancaq faktor analizində vəziyyət çox fərqlidir. Daha sonra izah edilən səbəblərə görə, komponent analizində faktorların sayı ilə bağlı hipotezi yoxlayacaq heç bir əhəmiyyətlilik testi yoxdur, çünki bu fərziyyə adətən başa düşülür. Ümumi faktor analizində belə bir test var, lakin onun faydalılığı tez -tez qənaətbəxş şərh oluna biləcəyindən daha çox faktor verməsi ilə məhdudlaşır. Beləliklə, yalnız təfsir edilə bilən faktorları bildirmək istəyən bir işçi hələ də obyektiv sınaqdan keçir.

      Faktorların mahiyyətinin müəyyən edilməsində oxşar bir məsələ ortaya çıxır. İki işçinin hər biri 6 faktoru müəyyən edə bilər, lakin iki amil dəsti fərqli ola bilər-bəlkə də əhəmiyyətli dərəcədə. Səyahət yazıçısı bənzətməsi burada çox faydalıdır, iki yazıçı ABŞ-ı 6 bölgəyə bölə bilər, lakin bölgələri çox fərqli şəkildə təyin edə bilər.

      Başqa bir coğrafi bənzətmə, faktor analizinə daha çox paralel ola bilər, çünki bu, müəyyən ölçülə bilən məqsədə çatmaq üçün hazırlanmış kompüter proqramlarını əhatə edir. Kompüter proqramları bəzən bir dövləti coğrafi olaraq şərti olan, əhalisi təxminən bərabər olan və bəlkə də etnik mənsubiyyət ölçüləri və ya digər amillərə görə homojen olan Konqres bölgələrinə bölmək üçün istifadə olunur. Hər iki cavab ağlabatan olsa da, iki fərqli rayon yaratma proqramı çox fərqli cavablarla gələ bilər. Bu bənzətmə bir mənada çox yaxşıdır, inanırıq ki, faktor təhlili proqramları ümumiyyətlə rayon yaradan proqramlar kimi bir-birindən fərqli cavablar vermir.

      Kümelenme və Çox Ölçülüyə Qarşı Faktor Analizi

      Faktor analizinin bu metodlardan başqa bir üstünlüyü, faktor analizinin korrelyasiyaların müəyyən xüsusiyyətlərini tanıya bilməsidir. Məsələn, A və B dəyişənlərinin hər biri .7 -ni C dəyişənlə əlaqələndirər və .49 -u bir -biri ilə əlaqələndirərsə, faktor təhlili C sabit olduqda A və B -nin sıfır ilə əlaqəli olduğunu qəbul edə bilər, çünki .7 2 = .49. Çoxölçülü miqyaslama və klaster analizinin bu cür əlaqələri tanımaq qabiliyyəti yoxdur, çünki korrelyasiyalar korrelyasiya kimi deyil, ümumi "oxşarlıq tədbirləri" kimi qəbul edilir.

      Bu digər metodların heç vaxt korrelyasiya matrislərinə tətbiq edilməməsi lazım olduğunu söyləmirik, bəzən faktor təhlili ilə əldə edilə bilməyən fikirlər verirlər. Ancaq faktor analizini qəti olaraq köhnəltməmişlər. Növbəti hissədə bu məqama toxunulur.

      "Fərqləndirən" Dəyişənlərə Qarşı Faktorlar "Əsas" Dəyişənlərə

      "Fərqləndirmə" ifadəsinin mümkün bir mənası, bir çox dəyişənlərin bir -biri ilə yüksək nisbətdə əlaqəli olması, lakin vasitələrində fərqlənməsidir. Fərqli bir vəziyyətdə oxşar bir məna ortaya çıxa bilər. Eyni düşünülmüş zehni qabiliyyəti sınayan, lakin sadalanan ardıcıllıqla çətinliyi artıran bir neçə A, B, C, D testlərini nəzərdən keçirək. Sonra testlər arasında ən yüksək korrelyasiya bu siyahıdakı bitişik maddələr arasında ola bilər (rAB, rEramızdan əvvəl və rCD) ən aşağı nisbət siyahının əks ucundakı maddələr arasında olarkən (rAD). Maddələr arasındakı korrelyasiyada bu nümunəni müşahidə edən biri, testlərin "sadə bir qaydada qoyula biləcəyini" və ya "yalnız bir faktorla fərqləndiyini" söyləyə bilər, amma bu nəticənin faktor təhlili ilə heç bir əlaqəsi yoxdur. Bu testlər dəsti olardı yox yalnız bir ümumi amil var.

      A dəyişən B -ni, D -ni təsir edən C -ni təsir edərsə və bu dəyişənləri birləşdirən yeganə təsirlərdirsə, bu cür üçüncü hal yarana bilər. Bir daha, ən yüksək nisbətlər r olardıAB, rEramızdan əvvəl və rCD ən aşağı nisbət r olardıAD. Kimsə bu korrelyasiya modelini təsvir etmək üçün yuxarıda göstərilən eyni ifadələri istifadə edə bilər, bunun faktor təhlili ilə heç bir əlaqəsi yoxdur.

      • 5 fut 2 düym hündürlüyünüz varmı?
      • 5 fut 4 düym hündürlüyünüz varmı?
      • 5 fut 6 düym yüksəkliyiniz varmı?
      • Və s.
      • Millətimiz B milləti ilə tarif maneələrini azaltmalıdırmı?
      • İki mərkəzi bankımız vahid valyuta buraxmalıdırmı?
      • Ordumuz bir olmalı mı?
      • Bir millət olmaqla B milləti ilə birləşməliyikmi?

      Korrelyasiya matrisinə çoxölçülü miqyaslama tətbiq etmək, dəyişənlər arasındakı bütün bu sadə fərqlilik nümunələrini kəşf edə bilər. Beləliklə, çoxölçülü miqyaslama hansı faktorları axtarır fərqləndirmək dəyişənlər faktor təhlili faktorları axtarır altında yatmaq dəyişənlər. Ölçmə faktor analizinin heç bir şey tapmadığı yerdə sadəlik və faktor analizinin miqyaslamanın tapmadığı sadəliyi tapa bilər.

      Şübhəli bir tarix

      Əsas anlayışlar və prinsiplər

      Sadə bir nümunə

      Təsəvvür edin ki, bunlar zehni qabiliyyəti ölçən 5 dəyişən arasındakı korrelyasiyadır. Matrix R55, vahid bir ümumi faktor hipotezi ilə tam uyğun gəlir g müşahidə olunan 5 dəyişənlə korrelyasiyası müvafiq olaraq .9, .8, .7, .6 və .5 -dir. Bunun səbəbini bilmək üçün iki dəyişən arasındakı qismən korrelyasiya formulunu nəzərdən keçirin ab üçüncü dəyişəni ayırmaq g:

      Bu düstur göstərir ki, rab.g = 0 olarsa və yalnız r olarsaab = rag rbg. Bir dəyişənin ümumi amil kimi işləməsi üçün lazım olan xüsusiyyət g hər iki müşahidə olunan dəyişən arasında qismən korrelyasiyanın olması, qismən də olsa g, sıfırdır. Buna görə də korrelyasiya matrisi ümumi bir faktorla izah edilə bilər gilə müşahidə olunan dəyişənlərin bəzi korrelyasiyalarının olduğu doğrudur g, belə ki, bu korrelyasiyalardan hər hansı birinin məhsulu müşahidə olunan iki dəyişən arasındakı korrelyasiyaya bərabərdir. Ancaq R55 matrisi tam olaraq bu xüsusiyyətə malikdir. Yəni hər hansı bir diaqonal olmayan giriş rjk -nin məhsuludur jci və kcərgədəki girişlər .9 .8 .7 .6 .5. Məsələn, 1 -ci sətirdə və 3 -cü sütunda giriş .9 x .7 və ya .63 -dir. Beləliklə, R55 matrisi tək bir ümumi faktor hipotezinə tam uyğun gəlir.

      Bu nümunəni əsl korrelyasiya matrisində tapsaydıq, tam olaraq nəyi göstərərdik? Birincisi, faktorun varlığıdır nəticə çıxarıb daha çox müşahidə edildi. Əlbətdə olmazdı sübut bu 5 dəyişənin balları yalnız bir ümumi faktordan təsirlənir. Ancaq bu, müşahidə olunan korrelyasiya modelinə uyğun gələn ən sadə və ya ən uyğun olmayan hipotezdir.

      İkincisi, faktorun müşahidə olunan dəyişənlərin hər biri ilə əlaqəsini təxmin edə bilərik, buna görə də ən azından çox əlaqəli və ya əlaqəli olmadığı mənada faktorun mahiyyəti haqqında bir şey deyə bilərik. Bu nümunədə .9 .8 .7 .6 .5 dəyərləri bu təxmin edilən korrelyasiyalardır.

      Üçüncüsü, faktoru hər bir insanın dəqiq hesabını əldə etmək mənasında faktoru ölçə bilmədik. Ancaq, hər bir insanın faktorunu, müşahidə olunan dəyişənlərdəki ballarından qiymətləndirmək üçün çoxlu reqressiya metodlarından istifadə etmək istəsək, edə bilərik.

      Matrix R55, ümumi faktor analizinin praktiki olaraq mümkün olan ən sadə nümunəsidir, çünki müşahidə olunan korrelyasiyalar mümkün olan ən sadə faktor-analitik hipotezə-vahid ümumi faktor hipotezinə mükəmməl uyğun gəlir. Bəzi digər korrelyasiya matrisi tək bir ümumi faktorun hipotezinə uyğun gələ bilməz, lakin iki və ya üç və ya dörd ümumi faktorun hipotezinə uyğun gələ bilər. Faktorlar nə qədər az olarsa, hipotez də bir o qədər sadə olar. Sadə fərziyyə ümumiyyətlə daha mürəkkəb hipotezlərə nisbətən məntiqi elmi prioritetə ​​malik olduğundan, daha çox faktoru ehtiva edən fərziyyələrə nisbətən daha az faktorları ehtiva edən hipotezlərə üstünlük verilir. Yəni müşahidə olunan korrelyasiya dəsti ilə açıq şəkildə ziddiyyət təşkil etməyən ən sadə fərziyyəni (yəni ən az faktorları ehtiva edən) heç olmasa müvəqqəti olaraq qəbul edirsiniz. Bir çox yazıçı kimi icazə verərəm m hipotez edilən ümumi amillərin sayını ifadə edir.

      Riyaziyyata dərindən girmədən deyə bilərik ki, faktor təhlili hər bir dəyişəni cəm olaraq ifadə etməyə çalışır ümumiunikal porsiyalar. Bütün dəyişənlərin ortaq hissələri, ümumi amillərlə tam olaraq izah edilir və bənzərsiz hissələr bir -biri ilə ideal şəkildə mükəmməl əlaqələndirilmir. Verilən məlumatların bu şərtə uyğun olma dərəcəsi, adətən "qalıq korrelyasiya matrisi" adlandırılanların təhlili əsasında qiymətləndirilə bilər.

      Bu matrisin adı bir qədər yanlışdır, çünki matrisdəki girişlər ümumiyyətlə korrelyasiya deyildir. Şəxsi çapdan asılı olaraq hər hansı bir şübhə varsa, matrisada birinci dəyişənin özüylə, ikincisinin özü ilə "əlaqəsi" kimi diaqonal girişləri axtarın. Bu diaqonal qeydlərin hamısı tam deyilsə 1, onda çap olunan matris korrelyasiya matrisi deyil. Bununla birlikdə, diaqonal olmayan hər bir girişi iki uyğun diaqonal girişin kvadrat köklərinə bölməklə adətən bir korrelyasiya matrisinə çevrilə bilər. Məsələn, ilk iki diaqonal giriş .36 və .64 və [1,2] mövqesindəki diaqonal olmayan giriş .3 olarsa, qalıq korrelyasiya .3/(.6*.8) = 5 /8 = .625.

      Bu şəkildə tapılan əlaqələr, dəyişənlərin ümumi hissələrini hipotezə uyğunlaşdırmaq üçün dəyişənlərin "bənzərsiz" hissələri arasında icazə verilməli olan əlaqələrdir. m ümumi amillər. Bu hesablanmış korrelyasiyalar o qədər yüksəkdirsə ki, populyasiyada 0 olduğu fərziyyəsi ilə ziddiyyət təşkil edərsə, m ümumi amillər rədd edilir. Artan m həmişə bu əlaqələri aşağı salır, beləliklə məlumatlara daha uyğun bir hipotez yaradır.

      Ən sadə hipotezi (ən aşağısını) tapmaq istəyirik m) məlumatlara uyğundur. Bu baxımdan, bir faktor təhlili elmi tarixdə onilliklər və ya əsrlər boyu inkişaf etdirilən epizodlarla müqayisə edilə bilər. Yerin və digər planetlərin Günəş ətrafında hərəkət etdiyini başa düşən Kopernik, əvvəlcə orbitlərinin dairələr olduğunu fərz etdi. Kepler sonradan orbitlərin elips şəklində daha yaxşı təsvir edildiyini anladı. Bir dairə ellipsdən daha sadə bir rəqəmdir, buna görə də elmi tarixin bu epizodu sadə bir nəzəriyyə ilə başladığımız və müşahidə olunan məlumatları daha yaxşı uyğunlaşdırmaq üçün tədricən daha mürəkkəb hala gətirdiyimiz ümumi nöqtəni göstərir.

      Eyni prinsip eksperimental psixologiya tarixində də müşahidə oluna bilər. 1940 -cı illərdə eksperimental psixoloqlar, təhsil praktikasında hətta inqilab edə biləcək bütün öyrənmə prinsiplərinin labirentlərdə siçovulların öyrənilməsi ilə kəşf ediləcəyinə inanırdılar. Bu gün bu fikir gülünc şəkildə çox sadələşdirilmiş sayılır, ancaq ümumi bir elmi nöqteyi -nəzərdən sadə bir nəzəriyyə ilə başlamağın və tədricən daha mürəkkəb nəzəriyyələrə keçməyin məqsədəuyğun olduğunu göstərir, yalnız sadə nəzəriyyənin məlumatlara uyğun gəlmədiyi aydın olduqda.

      Bu ümumi elmi prinsip tək amil təhlili çərçivəsində tətbiq oluna bilər. Mümkün olan ən sadə nəzəriyyədən başlayın (ümumiyyətlə m = 1), bu nəzəriyyə ilə məlumatlar arasındakı uyğunluğu yoxlayın və sonra artırın m lazım olduğu kimi. Hər artım m daha mürəkkəb, lakin məlumatlara daha yaxşı uyğun bir nəzəriyyə hazırlayır. Verilənlərə kifayət qədər uyğun bir nəzəriyyə tapanda dayandırın.

      Hər müşahidə olunan dəyişən icma öz ümumi payı ilə, yəni ümumi amillərlə izah edilən dəyişənin nisbət nisbətinin təxmin edilən kvadratik korrelyasiyasıdır. Bir neçə fərqli dəyərlə faktor təhlili aparsanız m, yuxarıda təklif edildiyi kimi, cəmiyyətlərin ümumiyyətlə artdığını görürsünüz m. Ancaq icmalar son dəyərini seçmək üçün istifadə edilmir m. Aşağı icmalar, məlumatların hipotezə uyğun gəlmədiyinə dair bir dəlil olaraq deyil, sadəcə təhlil edilən dəyişənlərin bir -biri ilə çox az ortaq olduğuna dəlil olaraq şərh olunur. Əksər faktor təhlili proqramları əvvəlcə hər bir dəyişənin cəmiyyətliliyini həmin dəyişənlə analizdəki digər dəyişənlər arasında çoxsaylı korrelyasiya kimi qiymətləndirir, daha sonra daha yaxşı bir qiymətləndirmə tapmaq üçün iterativ prosedurdan istifadə edir.

      Faktor analizi ya korrelyasiyadan, ya da istifadə edə bilər kovaryanslar. Covariance covjk nömrələnmiş iki dəyişən arasında jk onların korrelyasiya vaxtları iki standart sapmadır: covjk = rjk sj sk, harada rjk onların əlaqəsidir və sj və sk standart sapmalardır. Bir kovaryansın çox əhəmiyyətli bir mahiyyət mənası yoxdur, ancaq sonrakı hissədə təsvir edilən çox faydalı riyazi xüsusiyyətlərə malikdir. Hər hansı bir dəyişən 1 ilə öz-özünə əlaqəli olduğundan, hər hansı bir dəyişənin özü ilə kovariansı onun sapmasıdır-standart sapmanın kvadratıdır. Bir korrelyasiya matrisi, artıq 1 standart sapmalara uyğunlaşdırılmış dəyişənlər toplusunun fərqlilik və kovariyentlik matrisi (daha qısacası, kovarians matrisi) kimi düşünülə bilər. ya korrelyasiya, ya da kovarians matrisi deməkdir. Müşahidə olunan dəyişənlərin korrelyasiyasını və ya kovarians matrisini ifadə etmək üçün R istifadə edəcəyəm. Bu qəbuledilməzdir, amma təhlil edilən matris demək olar ki, həmişə bir korrelyasiya matrisidir və daha sonra izah edildiyi kimi, R-nin ümumi faktorlu hissəsi üçün C hərfinə ehtiyacımız var.

      Matrisin parçalanması və dərəcəsi

      Faktor analizinin əsas teoremi, bütün bir kovarians matrisi üçün bənzər bir şey edə biləcəyinizdir. Bir kovarians matrisi, bir sıra amillərlə izah edilən ümumi bir C hissəsinə və bu faktorlarla izah edilməyən unikal bir hissəyə bölünə bilər. Matris terminologiyasında R = C + U, yəni R matrisindəki hər bir giriş C və U matrislərindəki müvafiq girişlərin cəmidir.

      Bərabər hüceyrə tezlikləri ilə dəyişkənliyin analizində olduğu kimi, izah edilən C komponenti daha da parçalana bilər. C, komponent matrislərinə parçalana bilər c1, c2və s., fərdi amillərlə izah olunur. Bu bir faktorlu komponentlərin hər biri cj "faktor yükləmələri" sütununun "xarici məhsulu" na bərabərdir. Nömrələr sütununun xarici məhsulu, girişə icazə verilərək meydana gələn kvadrat matrisdir jk matrisdə girişlərin məhsulu bərabərdir jk sütunda. Beləliklə, bir sütunda əvvəlki nümunədə olduğu kimi .9, .8, .7, .6, .5 yazıları varsa, onun xarici məhsulu

      Daha əvvəl bu matrisdəki diaqonal olmayan qeydləri qeyd etdim, ancaq diaqonal qeydləri deyil. C -də hər bir diaqonal girişj matris əslində bu faktorla izah edilən uyğun dəyişənin variasiya məbləğidir. Bizim nümunədə, g .9 ilk müşahidə olunan dəyişənlə əlaqələndirilir, ona görə də bu dəyişkəndəki izah edilən varyansın miqdarı .9 2 və ya .81, bu matrisdəki ilk diaqonal girişdir.

      Nümunədə yalnız bir ümumi faktor var, buna görə bu nümunə üçün C matrisi (C55 ilə ifadə olunur) C55 = c -dir.1. Buna görə bu nümunə üçün U qalıq matris (U55 ilə ifadə olunur) U55 = R55 - c1. Bu, U55 üçün aşağıdakı matrisi verir:

      Bu faktorla izah olunmayan dəyişənlərin hissələrinin kovarians matrisi. Daha əvvəl də qeyd edildiyi kimi, U55-də diaqonal olmayan bütün girişlər 0-a bərabərdir və diaqonal girişlər hər dəyişənin açıqlanmayan və ya unikal varyansının məbləğləridir.

      Çox vaxt C bir neçə matrisin cəmidir cj, bu nümunədəki kimi tək deyil. Sayı c-C -yə bərabər olan matrislər rütbə Bu nümunədəki C matrisinin C dərəcəsi 1 -dir. C dərəcəsi bu modeldəki ümumi faktorların sayıdır. Müəyyən bir rəqəm göstərsəniz m bir faktor təhlili proqramı sonra C rütbəsini bərabər edən orijinal korrelyasiya və ya kovarians matrisinə bərabər olan iki C və U matrisini çıxarır. m. Nə qədər böyük qoyursan m, yaxın C, R -yə yaxınlaşacaq m = səh, harada səh matrisdəki dəyişənlərin sayıdır, onda C -dəki hər bir giriş R -dəki müvafiq girişə tam bərabər olacaq və U sıfır matrisi olaraq qalacaq. Fikir nə qədər aşağı edə biləcəyinizi görməkdir m və hələ də C -nin R -yə ağlabatan bir yaxınlaşması var.

      Neçə hal və dəyişən var?

      Dəyişənlərin sayı ilə bağlı qaydalar faktor analizi üçün reqressiyadan çox fərqlidir. Faktor analizində hallardan daha çox dəyişənin olması qüsursuzdur. Əslində, dəyişənlər əsas faktorlara uyğun olaraq qaldıqca, daha çox dəyişən daha yaxşı olar.

      Neçə Faktor?

      Bu bölmədə müzakirə olunan iki qaydadan birincisi ümumi faktorların sayını müəyyən etmək üçün rəsmi əhəmiyyətlilik testindən istifadə edir. N nümunə ölçüsünü ifadə etsin, səh dəyişənlərin sayı və m amillərin sayı. Həmçinin R.U qalıq matrisini ifadə edir korrelyasiya matrisinə çevrilmiş, | RU| onun determinantıdır və ln (1/| RU|) bu determinantın qarşılığının təbii logarifmasıdır.

      Bu qaydanı tətbiq etmək üçün əvvəlcə G = N-1- (2p+5)/6- (2/3) m hesablayın. Sonra hesablayın

      Ln (1/| R) hesablamaq çətindirsəU|), bu ifadə çox vaxt r ilə yaxşı yaxınlaşdırılırU 2, burada toplama, R matrisindəki diaqonalın üstündəki bütün kvadrat korrelyasiyaların cəmini ifadə edirU.

      Faktorların sayını seçmək üçün bu düsturu istifadə etmək üçün başlayın m = 1 (və ya hətta m = 0) və ardıcıl olaraq artan dəyərlər üçün bu testi hesablayın m, dəyərinin əhəmiyyətsiz olduğunu gördüyünüz zaman dayandırın m ən kiçik dəyərdir m məlumatlarla ciddi şəkildə ziddiyyət təşkil etmir. Bu qaydanın əsas çətinliyi odur ki, mənim təcrübəmdə orta ölçülü nümunələrlə uğurla şərh oluna biləcəyindən daha çox faktora səbəb olur.

      Alternativ bir yanaşma təklif edirəm. Bu yanaşma bir zamanlar praktik deyildi, amma bu gün əlçatandır. Müxtəlif dəyərləri olan faktor analizlərini aparın m, rotasiya ilə tamamlayın və ən cazibədar quruluş verən birini seçin.

      Fırlanma

      Proqnozlaşdırıcıların xətti funksiyaları

      İndi düşünün ki, bir iş yoldaşı hər bir tələbənin şifahi və riyaziyyat ballarını toplayaraq AS adlandıracağım kompozit bir "akademik bacarıq" balını və VMD-yə zəng edəcəyim ikinci bir dəyişən əldə etmək üçün hər bir tələbənin şifahi və riyaziyyat balları arasındakı fərqi götürməyi təklif edir. (şifahi-riyazi fərq). İş yoldaşı, hər bir reqressiyada AS və VMD-ni orijinal şifahi və riyazi ballar əvəzinə proqnozlaşdırıcı olaraq istifadə etmək istisna olmaqla, fərdi kurslarda qiymətləri proqnozlaşdırmaq üçün eyni reqressiya dəsti ilə işləməyi təklif edir. Bu nümunədə, bu iki reqressiya ailəsindən dərs qiymətləri ilə bağlı eyni proqnozlar alacaqsınız: biri fərdi kurslarda qiymətləri şifahi və riyaziyyat skorlarından, digəri isə AS və VMD skorlarından eyni qiymətləri proqnozlaşdırır. Əslində, 3 riyaziyyat + 5 şifahi və 5 sözlü + 3 riyaziyyatdan ibarət kompozitlər qursanız və bu iki kompozitdən qiymətləri proqnozlaşdıran iki dəyişkənli çoxlu reqressiya seriyası işləsəniz eyni proqnozları alacaqsınız. Bu nümunələr hamısıdır xətti funksiyalar orijinal şifahi və riyazi balların.

      Əsas məqam, əgər varsa m proqnozlaşdırıcı dəyişənlər və siz əvəz edirsiniz m tərəfindən orijinal proqnozlaşdırıcılar m Bu proqnozlaşdırıcıların xətti funksiyalarını, ümumiyyətlə heç bir məlumat əldə etmirsiniz və itirmirsiniz-istəsəniz, xətti funksiyalardakı puanları orijinal dəyişənlərdəki puanları yenidən qurmaq üçün istifadə edə bilərsiniz. Ancaq çoxlu reqressiya, yeni bir dəyişəni (məsələn, müəyyən bir kursdakı qiymətləri) proqnozlaşdırmaq üçün əlinizdə olan hər şeyi ən optimal şəkildə (mövcud nümunədəki kvadrat səhvlərin cəmi ilə ölçülür) istifadə edir. Xətti funksiyalar orijinal dəyişənlərlə eyni məlumatları ehtiva etdiyindən, əvvəlki kimi eyni proqnozları alırsınız.

      Eyni proqnozları əldə etməyin bir çox yolu olduğunu nəzərə alsaq, bir xətti funksiyadan başqa bir dəstə istifadə etməyin bir üstünlüyü varmı? Bəli, ola biləcək bir dəst var daha sadə başqasından daha çox. Xüsusi bir xətti funksiya, bir çox dərs qiymətinin iki deyil, yalnız bir dəyişəndən (yəni bir xətti funksiyadan) proqnozlaşdırılmasına imkan verə bilər. Daha az proqnozlaşdırıcı dəyişənləri olan reqressiyanı daha sadə hesab etsək, bu sualı verə bilərik: Proqnozlaşdıran dəyişənlərin sayını minimuma endirmək mənasında eyni proqnozları verə biləcək bütün mümkün proqnozlaşdırıcı dəyişənlərdən. tipik reqressiya lazımdırmı? Bəzi sadəlik ölçüsünü maksimuma çatdıran proqnozlaşdırıcı dəyişənlərin cütlüyünə sahib olduğunu söyləmək olar sadə quruluş. Qiymətləri əhatə edən bu nümunədə, bəzi kursların qiymətlərini yalnız şifahi bir test hesabından dəqiq proqnozlaşdıra bilərsiniz və digər kursların qiymətlərini yalnız riyazi hesabdan dəqiq bir şəkildə proqnozlaşdıra bilərsiniz. Əgər belə olsaydı, bütün proqnozlar üçün hər iki testdən istifadə etdiyinizdən daha çox proqnozlarınızda "daha sadə bir quruluş" əldə edərdiniz.

      Faktor Analizində Sadə Quruluş

      Sadə quruluşun həddindən artıq vəziyyətində, hər bir X-dəyişəninin yalnız bir böyük girişi olacaq, buna görə də digərlərinin hamısı göz ardı edilə bilər. Ancaq bu, ümumiyyətlə əldə etməyinizi gözlədiyinizdən daha sadə bir quruluş olardı, real dünyada hər bir dəyişən normal olaraq yalnız bir başqa dəyişəndən təsirlənmir. Daha sonra yüklərin yoxlanılmasına əsaslanaraq amilləri subyektiv olaraq adlandırırsınız.

      Ümumi faktor analizində, rotasiya prosesi, əslində, burada nəzərdə tutduğumdan bir qədər mücərrəddir, çünki faktorlar üzrə fərdi halları bilmirsiniz. Bununla birlikdə, burada ən çox əlaqəli olan çoxsaylı reqressiya statistikası-çoxlu korrelyasiya və standart regressiya yamacları-hamısı dəyişənlərin və faktorların korrelyasiyasından hesablana bilər. Buna görə heç bir fərdi skor istifadə etmədən sadə korrelyasiyaya əsaslanan fırlanma hesablamalarını əsaslandıra bilərik.

      Faktorların əlaqəsiz qalmasını tələb edən bir fırlanma ortogonal rotasiya, digərləri isə əyri rotasiyalar. Oblique rotations tez -tez daha sadə bir quruluş əldə edir, baxmayaraq ki, nəticəni şərh edərkən amillər arasındakı əlaqələrin matrisini də nəzərə almalısınız. Təlimatlar ümumiyyətlə aydındır ki, hansıdır, amma hər hansı bir qeyri -müəyyənlik varsa, sadə bir qayda budur ki, faktor korrelyasiyalarının matrisini çap etmək qabiliyyəti varsa, fırlanma meyllidir, çünki ortogonal rotasiyalar üçün belə qabiliyyətə ehtiyac yoxdur. .

      Nümunə

      Gorsuch -dan 24 zehni qabiliyyət dəyişəninin 4 faktorunun Oblique Promax rotasiyası (1983)

      Bu cədvəl olduqca yaxşı bir sadə quruluşu ortaya qoyur. Dörd dəyişən blokunun hər birində yüksək dəyərlər (mütləq dəyərdə təxminən .4-dən yuxarı) ümumiyyətlə hamısı tək bir sütundadır-dörd blokun hər biri üçün ayrı bir sütun. Bundan əlavə, hər bir blokdakı dəyişənlərin hamısı eyni ümumi zehni qabiliyyəti ölçmək kimi görünür. Hər iki ümumiləşdirmənin əsas istisnası üçüncü blokda gəlir. Bu blokdakı dəyişənlərə həm görmə qabiliyyəti, həm də düşünmə ölçüləri daxildir və əsaslandırıcı dəyişənlər (blokdakı son dörd) ümumiyyətlə bir və ya daha çox digər sütundakı yüklərindən çox olmayan 3 -cü sütunda yüklənir. Bu, ayrı-ayrı "vizual" və "əsaslandırıcı" faktorlara səbəb ola biləcəyi ümidi ilə 5 faktorlu bir həllin sınanmağa dəyər ola biləcəyini göstərir. Cədvəl 1 -dəki faktor adları Gorsuch tərəfindən verilmişdir, lakin ikinci blokdakı dəyişənlərin araşdırılması "sadə təkrarlanan tapşırıqların" faktor 2 üçün "ədədi" dən daha yaxşı bir ad ola biləcəyini göstərir.

      Demək istəmirəm ki, hər dəyişən yükü yalnız bir amil üzərində yüksək etməyə çalışmalısınız. Məsələn, arifmetik söz problemlərini həll etmək bacarığı testi həm şifahi, həm də riyazi faktorlara çox yüklənə bilər. Eyni faktoru iki fərqli qrupa yerləşdirə bilmədiyiniz üçün bu faktor analizinin klaster təhlili ilə müqayisədə üstünlüklərindən biridir.

      Əsas Komponent Analizi (PCA)

      Əsaslar

      PCA -dakı əsas konsepsiya təmsil və ya ümumiləşdirmədir. Böyük bir dəyişən dəstini daha böyük dəsti ən yaxşı şəkildə ümumiləşdirən daha kiçik bir dəstə ilə əvəz etmək istədiyimizi düşünək. Məsələn, tutaq ki, 30 zehni testdə yüzlərlə şagirdin ballarını qeyd etmişik və bütün bu balları saxlamağa yerimiz yoxdur. (Bu, kompüter əsrində çox süni bir nümunədir, lakin PCA icad edildiyi vaxtdan əvvəl daha cazibədar idi.) Saxlama qənaətinə görə dəsti hər bir şagird üçün 5 bala endirmək istərdik ki, bundan da istifadə edə bilək. orijinal 30 skorunu mümkün qədər dəqiq şəkildə yenidən qurmaq.

      Qoy səhm cari nümunədə müvafiq olaraq orijinal və azaldılmış dəyişənlərin sayını-30 və 5-i göstərin. Orijinal dəyişənlər X, ümumiləşdirən dəyişənlər F ilə ifadə olunur. Ən sadə halda, yenidənqurma dəqiqliyimizin ölçüsü cəmidir səh X-dəyişənləri ilə X-in faktorlarından irəli gələn proqnozlar arasında çoxlu korrelyasiyalar meydana çıxdı. Daha ümumi halda, hər bir kvadrat çoxlu korrelyasiyanı müvafiq X dəyişəninin dispersiyası ilə çəkə bilərik. Hər bir dəyişənin ballarını seçdiyimiz hər hansı bir sabitlə vuraraq bu fərqləri özümüz təyin edə bildiyimiz üçün, bu, fərqli dəyişənlərə seçdiyimiz hər hansı bir ağırlığı təyin etmək qabiliyyətinə bərabərdir.

      İndi riyazi mənada yaxşı müəyyən edilmiş bir problemimiz var: azalt səh bir sıra dəyişənlər m Orijinalı ən yaxşı ümumiləşdirən dəyişənlərin xətti funksiyaları səh yeni təsvir olunan mənada. Ancaq məlum olur ki, sonsuz sayda xətti funksiyalar eyni dərəcədə yaxşı xülasələr verir. Problemi tək bir həll yolu ilə daraltmaq üçün üç şərt təqdim edirik. Birincisi, m törəmə xətti funksiyalar qarşılıqlı əlaqəsiz olmalıdır. İkincisi, hər hansı bir dəst m xətti funksiyalar daha kiçik bir dəstə üçün funksiyaları ehtiva etməlidir. Məsələn, ən yaxşı 4 xətti funksiya, ən yaxşısını daxil edən ən yaxşı 2 -ni ehtiva edən ən yaxşı 3 -dən ibarət olmalıdır. Üçüncüsü, hər bir xətti funksiyanı təyin edən kvadrat ağırlıqlar 1 -ə bərabər olmalıdır. Bu üç şərt, əksər məlumat dəstləri üçün unikal bir həll təmin edir. Tipik olaraq var səh xətti funksiyalar (adlanır əsas komponentlər) hamısını istifadə edərək əhəmiyyətini azaldır səh birincisini istifadə edərək, orijinal X skorlarının mükəmməl yenidən qurulmasını əldə edirsiniz m (harada m 1 ilə arasında dəyişir səh) bu dəyər üçün mümkün olan ən yaxşı yenidənqurma əldə edirsiniz m.

      Hər bir komponenti müəyyənləşdirin öz vektoru və ya xarakterik vektor və ya latent vektor çəkilər sütunu olaraq onu X-dəyişənlərindən meydana gətirdi. Orijinal R matrisi bir korrelyasiya matrisidirsə, hər bir komponenti təyin edin özünəməxsus dəyər və ya xarakterik dəyər və ya gizli dəyər X-dəyişənlərlə kvadratik korrelyasiyaların cəmidir. Əgər R bir kovaryans matrisi olarsa, öz dəyərini hər bir korrelyasiya müvafiq X-dəyişənin dispersiyası ilə ölçülmüş kvadratik korrelyasiyaların ağırlıqlı cəmi olaraq təyin edin. Öz dəyərlərin cəmi həmişə R -dəki diaqonal girişlərin cəminə bərabərdir.

      Nonunik həllər yalnız iki və ya daha çox özünəməxsus dəyərlər bərabər olduqda ortaya çıxır, sonra müvafiq özvektorların unikal olaraq təyin olunmadığı ortaya çıxır. Bu hal praktikada nadir hallarda ortaya çıxır və bundan sonra buna məhəl qoymayacağam.

      Hər bir komponentin öz dəyərinə komponentin izah etdiyi "variasiya miqdarı" deyilir. Bunun əsas səbəbi, öz dəyərinin kvadratik korrelyasiyaların ağırlıqlı cəmi olaraq təyin edilməsidir. Bununla birlikdə, komponent ballarının həqiqi fərqinin öz dəyərinə bərabər olduğu ortaya çıxdı. Beləliklə, PCA -da "faktorun dəyişməsi" və "faktorun izah etdiyi varyansın miqdarı" həmişə bərabərdir. Buna görə də konseptual olaraq çox fərqli miqdarlarda dayansalar da, bu iki ifadə tez -tez bir -birini əvəz edir.

      Əsas komponentlərin sayı

      1. Öz dəyərlərin cəmi = p
      giriş matrisi korrelyasiya matrisi olsaydı

      Öz dəyərlərin cəmi = giriş fərqlərinin cəmi
      giriş matrisi bir kovarians matrisi olsaydı

      2. Açıqlanan variasiya nisbəti = öz dəyər / öz dəyərlərin cəmi

      3. Üçün kvadrat faktor yükləmələrinin cəmi jci əsas komponent
      = öz dəyərij

      4. Dəyişən üçün kvadrat faktor yükləmələrinin cəmi i
      = dəyişkənlikdə izah edilən variasiya i
      = Cii (diaqonal giriş i C matrisində)
      = icmai ümumi amil analizində
      = dəyişənin dispersiyası i əgər m = səh

      5. Sütunlar arasındakı çarpaz məhsulların cəmi ij faktor yükləmə matrisi
      = Cij (giriş ij C matrisində)

      6. #3, #4 və #5 -dəki əlaqələr rotasiya sonrası hələ də doğrudur.

      7. R - C = U. Lazım gələrsə, C -də diaqonal girişləri tapmaq üçün 4 -cü qaydanı, sonra U -da diaqonal girişləri tapmaq üçün 7 -ci qaydanı istifadə etmək olar.

      İki Faktorlu Analizin Müqayisəsi

      Əslində, iki faktorlu analizin oxşarlığı ilə bağlı bir neçə fərqli sual ifadə edilə bilər. Əvvəlcə iki fərqli məlumat formatını ayırd etməliyik:

      1. Eyni dəyişənlər, iki qrup. Eyni tədbirlər kişilər və qadınlar və ya müalicə və nəzarət qrupları üzərində də edilə bilər. Bu zaman iki faktor quruluşunun eyni olub -olmadığı sual yaranır.

      2. Bir qrup, iki şərt və ya iki dəyişən dəsti. Bir test qrupuna iki test batareyası verilə bilər və iki bal toplusunun necə fərqləndiyi ilə bağlı suallar verilə bilər. Və ya eyni batareya iki fərqli şərtlə verilə bilər.

      Növbəti iki hissədə bu suallar ayrıca müzakirə olunur.

      İki Qrupda Faktor Analizlərinin Müqayisəsi

      "Bu iki qrup eyni faktor quruluşuna malikdirmi?" əslində "eyni faktorlara sahibdirlərmi?" sualından olduqca fərqlidir. Sonuncu sual "İki qrup üçün iki fərqli faktor analizinə ehtiyacımız varmı?" Sualına daha yaxındır. Məsələni başa düşmək üçün 5 "şifahi" test və 5 "riyaziyyat" testi ilə bir problem düşünün. Sadəlik üçün, iki test dəsti arasındakı bütün əlaqələrin tam sıfır olduğunu təsəvvür edin. Sadəlik üçün bir komponent analizini nəzərdən keçirin, baxmayaraq ki, eyni məqam ümumi bir faktor təhlili ilə əlaqədar edilə bilər. İndi təsəvvür edin ki, 5 şifahi test arasındakı əlaqələrin hamısı qadınlar arasında .4 və kişilər arasında .8, 5 riyazi testlər arasındakı korrelyasiyaların hamısı qadınlar arasında .8 və kişilər arasında .4dür. İki qrupda ayrı-ayrılıqda fərqli faktor quruluşları verərdi, ancaq hər bir cinsdə eyni faktorların analizi, bütün riyazi maddələr üçün 0 ağırlığa malik olan bütün şifahi maddələrin bərabər ağırlıqlı ortalaması olan "şifahi" faktoru müəyyən edərdi. "əks modelli faktor. Bu nümunədə, iki faktor quruluşu olduqca fərqli olsa da, iki cins üçün ayrı faktor analizlərindən istifadə etməklə heç bir şey əldə edilməyəcəkdir.

      İki qrup problemi ilə əlaqədar digər bir vacib məqam, A qrupu üçün 4 faktor və B qrupu üçün 4 faktor əldə edən bir təhlilin, birləşmiş qrupda 8 əldə edən bir analiz qədər çox faktora malik olmasıdır. Beləliklə, praktiki sual, təhlillərin olub -olmaması ola bilməz m iki qrupun hər birindəki faktorlar, alınan təhlildən daha çox məlumatlara uyğundur m birləşdirilmiş qrupdakı amillər. Əksinə, iki ayrı təhlili 2 -dən çıxan bir analizlə müqayisə etmək lazımdırm birləşdirilmiş qrupdakı amillər. Komponent analizi üçün bu müqayisə etmək üçün birincini toplayın m hər bir ayrı qrupdakı öz dəyərləri və bu iki cəmin ortalamasını ilk 2 -nin cəmi ilə müqayisə edinm birləşdirilmiş qrupdakı öz dəyərlər. Bu analizin iki qrup üçün ayrı -ayrı faktor analizlərinin aparılmasının daha yaxşı olacağını irəli sürməsi çox nadir hal olardı. Eyni analiz ümumi amil təhlili üçün suala ən azı təxmini bir cavab verməlidir.

      Sualın həqiqətən də iki faktor quruluşunun eyni olub -olmamasıdır. Bu sual, iki korrelyasiya və ya kovarians matrisinin eyni olub-olmadığı sualına çox oxşardır-faktor analizinə heç bir istinad edilmədən dəqiq müəyyən edilmiş bir sual. Bu fərziyyələrin sınaqları bu işin əhatə dairəsindən kənardadır, lakin iki dəyişkənlik matrisinin bərabərliyi ilə bağlı bir test Morrison (1990) və çox dəyişkənli analizlə bağlı digər əsərlərdə ortaya çıxmışdır.

      Tək Qrupda İki Dəyişən Faktor Analizinin Müqayisəsi

      İki ayrı nümunə nümunəsində olduğu kimi, tez-tez amillər baxımından ifadə olunan, lakin iki korrelyasiya və ya kovarians matrisinin bərabərliyi ilə bağlı bir sual kimi daha yaxşı ifadə olunan bir sual var-heç bir cavabı olmayan bir sual. faktor analizinə istinad. İndiki halda iki paralel dəyişən dəstimiz var, yəni A dəstindəki hər bir dəyişən B dəstində bir paralelə malikdir. Əslində, A və B dəstləri iki fərqli şəraitdə tətbiq olunan eyni ölçülər ola bilər. Sual iki korrelyasiya matrisinin və ya kovarians matrisinin eyni olub -olmamasıdır.Bu sualın faktor təhlili ilə heç bir əlaqəsi yoxdur, eyni zamanda AB korrelyasiyasının yüksək olub -olmaması sualına da çox az aiddir. A və B dəstlərindəki iki korrelyasiya və ya kovarians matrisi, AB korrelyasiyalarının yüksək və ya aşağı olmasından asılı olmayaraq bərabər ola bilər.

      Darlington, Weinberg və Walberg (1973), A və B dəstləri eyni nümunə nümunələrində ölçüldükdə, A və B dəyişən dəstləri üçün kovarians matrislərinin bərabər olduğuna dair sıfır hipotezin sınağını təsvir etdi. AB kovarians matrisinin simmetrik olduğuna inanmaq lazımdır. Məsələn, əgər A və B dəstləri 1 və 2 -ci illərdə tətbiq olunan eyni testlərdirsə, fərziyyə 1 -ci ildə X testi ilə 2 -ci ildə Y testi arasındakı kovaryansın 2 -ci ildə X testi ilə test arasındakı kovariansa bərabər olmasını tələb edir. Y il 1. Bu fərziyyəni nəzərə alaraq, iki dəstdəki paralel dəyişənlərin cəmləri və fərqlərindən ibarət olan A+B və AB adlandıracağım iki bal toplusu formalaşdıra bilərsiniz. Daha sonra məlum olur ki, orijinal sıfır hipotezi A+B dəstindəki bütün dəyişənlərin A-B dəstindəki bütün dəyişənlərlə əlaqəsi olmadığı fərziyyəsinə bərabərdir. Bu fərziyyə MANOVA ilə sınaqdan keçirilə bilər.

      SYSTAT 5 -də Faktor və Komponent Analizi

      Məlumatların daxil edilməsi

      FACTOR standart düzbucaqlı formatda məlumatları qəbul edəcək. Avtomatik olaraq bir korrelyasiya matrisini hesablayacaq və sonrakı analiz üçün istifadə edəcək. Bunun əvəzinə bir kovaryans matrisini təhlil etmək istəyirsinizsə, daxil edin

      Daha sonra bir korrelyasiya matrisini təhlil etmək istəyirsinizsə, daxil edin

      "Korrelyasiya" növü standart tipdir, buna görə yalnız korrelyasiya matrislərini təhlil etmək istəyirsinizsə bunu daxil etməyinizə ehtiyac yoxdur.

      Məlumat faktor təhlili üçün hazırlamağın ikinci yolu, CORR menyusunda korrelyasiya və ya kovarians matrisini hesablamaq və saxlamaqdır. SYSTAT, matrisin saxlandığı anda korrelyasiya və ya kovarians matrisi olub olmadığını avtomatik olaraq qeyd edəcək və bu məlumatı saxlayacaq. Sonra FACTOR avtomatik olaraq düzgün növdən istifadə edəcək.

      Üçüncü yol, çap edilmiş bir mənbədən bir korrelyasiya və ya kovarians matrisiniz varsa və bu matrisi əl ilə daxil etmək istəyirsinizsə faydalıdır. Bunu etmək üçün GİRİŞ və TİP əmrlərini birləşdirin. Məsələn, matrisi düşünək

      Cəbr, GEOMETRİ, KOMPYUTER, TRİQONOM kimi dörd dəyişən üçün kovarians matrisidir. (Normalda bundan daha əhəmiyyətli rəqəmlərə korrelyasiya və ya kovaryanslar daxil edin.) DATA moduluna yaza bilərsiniz.

      MATHA QAYD EDİN
      GİRİŞ CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM
      NÖVƏ KOÇULUĞU
      QAÇIN
      .94
      .62 .89
      .47 .58 .97
      .36 .29 .38 .87
      ÇIX

      Matrisin yalnız aşağı üçbucaq hissəsini daxil etdiyinizə diqqət yetirin. Bu nümunədə diaqonal daxil edirsiniz, ancaq bütün diaqonal girişlərin 1.0 olması üçün bir korrelyasiya matrisi daxil edirsinizsə, RUN -dan dərhal əvvəl DIAGONAL ABSENT əmrini daxil edin, sonra diaqonal qeydləri buraxın.

      Dördüncü yol, hansı etməyəcək iş, korrelyasiya və ya kovarians matrisini söz prosessoruna daxil etmək və ya taramaq, sonra matrisi SYSTAT -a daşımaq üçün SYSTAT -ın GET əmrindən istifadə etməkdir. Bu üsulda SYSTAT, TYPE matrisini düzgün qeyd etməyəcək və matrisi korrelyasiya və ya fərqlilikdən çox balların matrisi kimi qəbul edəcək. Təəssüf ki, SYSTAT çıxışı gözlədiyiniz formatda verəcək və bütün analizin səhv edildiyinə dair açıq bir əlamət olmayacaq.

      Faktor təhlili üçün əmrlər

      FAKTOR CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM

      Əsas komponentlər əvəzinə ümumi faktor analizini seçmək üçün "təkrarlanan əsas ox" üçün IPA seçimini əlavə edin. IPA bir seçimdir, lakin dəyişənlərin siyahısı yoxdur. Beləliklə, bir əmr oxuna bilər

      FAKTOR CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM / IPA

      ITER (iteration) seçimi ümumi amil analizində icmaları qiymətləndirmək üçün maksimum təkrar sayını təyin edir. SYSTAT, icma təxminlərinin şübhəli olduğunu varsayarsa, ITER = 25 olduğunu xəbərdar edərsə, İTER -i artırın. TOL seçimi, aşağıda göstərilən FACTOR -un icma təxminlərini yaxşılaşdırmağa çalışmağı dayandıracağı, TOL = .001 olan icma təxminlərində bir dəyişikliyi göstərir. PLOT seçimi, cüt amillər və ya komponentlər üçün faktor yükləmə sahələri verir. Belə sahələrin sayı m (m-1)/2-dir, əgər böyük olarsa m böyükdür. Bütün bu seçimlərdən istifadə edən bir komanda oxuya bilər

      FACTOR / IPA, TOL = .0001, ITER = 60, PLOT

      FACTOR əmrinin yeganə variantlarıdır ki, FACTOR proqramına verilən bütün digər təlimatlar ayrı əmrlər şəklində verilir.

      Faktorların sayını idarə etmək üçün istifadə edə biləcəyiniz iki əmr var: NUMBER və EIGEN. Əmr

      FAKTOR -a 4 faktor çıxarmağı tapşırır. Əmr

      FACTOR -a yuxarıdakı öz dəyərlərin sayına bərabər olan bir sıra faktorları seçməyi tapşırır .5. Beləliklə, bir korrelyasiya matrisini əmr edərkən

      amillərin sayını seçmək üçün Kaiser qaydasını tətbiq edir. Varsayılan olaraq FACTOR -un bütün mümkün faktorları əldə etməsinə səbəb olan EIGEN = 0 -dır. Həm NUMBER, həm də EIGEN əmrlərindən istifadə edirsinizsə, FACTOR hansı qaydanın daha az sayda faktor istehsal etdiyinə əməl edəcək.

      Tək sözlü SORT əmri, faktor yükləmə matrisini çap edərkən FACTOR-un dəyişənləri faktor yüklərinə görə sıralamasına səbəb olur. Xüsusilə, FACTOR -u əvvəlcə faktor 1 -də .5 -dən yuxarı yüklənən bütün dəyişənləri, sonra faktor 2 -də .5 -dən yuxarı yüklənən bütün dəyişənləri çap etməyə məcbur edəcək. əvvəlcə ən yüksək yüklənmə ilə uyğun faktor. Bu sıralama sadə bir quruluş üçün faktor quruluş matrisini araşdırmağı asanlaşdırır.

      ROTATE əmri fırlanma üsulunu seçməyə imkan verir. Seçimlər belədir

      Bu üsullar arasındakı fərqlər bu fəslin əhatə dairəsindən kənardadır. Hər halda, rotasiya faktor quruluşunun məlumatlara uyğunluğunu təsir etmir, buna görə də istəsəniz hamısını istifadə edib nəticələrini ən çox bəyəndiyiniz birini seçə bilərsiniz. Əslində, bu ümumiyyətlə edilir. Varsayılan rotasiya metodu varimaxdır, buna görə yalnız ROTATE yazmaq varimax tətbiq edir.

      Faktor analizinin nəticələrini fayllara saxlamaq üçün üç seçim var. Bunu etmək üçün FACTOR əmrindən əvvəl SAVE əmrindən istifadə edin. Əmr

      əsas komponentlərdəki puanları MYFILE adlı bir faylda saxlayır. Bu ümumi faktor təhlili ilə istifadə edilə bilməz (IPA seçimi), çünki ümumi faktor skorları müəyyən edilməmişdir. Əmr

      komponentləri təyin etmək üçün istifadə olunan əmsalları saxlayır. Bu əmsallar bir mənada faktor yükləmələrinin əksidir. Yükləmə faktorlardan asılı olaraq dəyişənləri proqnozlaşdırır, əmsallar faktorları orijinal dəyişənlər baxımından təyin edir. Bir fırlanma təyin etsəniz, əmsallar dönən komponentləri təyin edənlərdir. Əmr

      ümumi amil təhlili və ya komponent analizi ilə istifadə edilə bilən faktor yüklərinin matrisini saxlayır. Yenə də bir fırlanma təyin etsəniz, saxlanan yüklər dönən amillər üçündür.

      Çıxış

      • öz dəyərləri
      • faktor yükləmə matrisi (IPA üçün faktor nümunəsi adlanır)
      • amillərlə izah edilən fərqlilik (adətən öz dəyərlərinə bərabərdir)
      • amillərlə izah edilən variasiya nisbəti
      • ilkin icma hesablamaları
      • icma təxminlərində dəyişikliklər indeksi
      • yekun icma təxminləri
      • Giriş korrelyasiyası və ya kovarians matrisi R
      • Qalıq kovarianların matrisi-U-nun diaqonal olmayan hissəsi
      • qorxulu bir süjet
      • faktor yükləmə sahələri, bir anda iki faktor

      Nümunə

      usdata istifadə edin
      döndür = varimax
      cür
      uzun çap edin
      sayı = 2
      faktor kardio, xərçəng, pulmonar, pneu_flu, diabet, qaraciyər / ipa, süjet

      Aydınlaşdırmaq üçün bir neçə kiçik düzəliş və faktor yükləmələri istisna olmaqla, bu əmrlər aşağıdakı nəticəni verəcəkdir:

      ƏDƏBİYYATLAR

      Gorsuch, Richard L. (1983) Faktor təhlili. Hillsdale, NJ: Erlbaum

      Morrison, Donald F. (1990) Çox dəyişkən statistik metodlar. New York: McGraw-Hill.

      Rubenstein, Amy S. (1986). Zəka marağının anket tipli tədbirlərinin maddə səviyyəsində təhlili. Cornell Universiteti Doktorluq dissertasiyası.

      Galina Mikloşiçin bu məqaləsinin Belarus dilinə tərcüməsini oxumaq üçün bura vurun.


      Məzmuna Önizləmə

      Faktor təhlili daha az sayda müşahidə olunmayan (gizli) "amillər" baxımından müşahidə olunan dəyişənləri və onların kovarians quruluşunu modelləşdirmək üçün bir üsuldur. Faktorlara ümumiyyətlə müşahidə olunan bir fenomeni təsvir edə biləcək geniş anlayışlar və ya fikirlər kimi baxılır. Məsələn, müəyyən bir sosial səviyyəyə sahib olmaq istəyi istehlak davranışının çoxunu izah edə bilər. Bu müşahidə olunmayan amillər sosial alim üçün müşahidə olunan kəmiyyət ölçmələrindən daha maraqlıdır.

      Faktor təhlili ümumiyyətlə bir çox subyektiv mühakimə tələb edən kəşfiyyat/təsvir üsuludur. Modellər, metodlar və subyektivlik o qədər çevik olduğu üçün şərhlərlə bağlı mübahisələr yarana biləcəyi üçün geniş istifadə olunan və tez -tez mübahisəli bir vasitədir.

      Metod əsas komponentlərə bənzəyir, baxmayaraq ki, dərslikdə göstərildiyi kimi, faktor təhlili daha mürəkkəbdir. Bir mənada faktor təhlili əsas komponentlərin tərsinə çevrilməsidir. Faktor analizində müşahidə olunan dəyişənləri "amillərin" xətti funksiyaları olaraq modelləşdiririk. Əsas komponentlərdə, müşahidə olunan dəyişənlərin xətti birləşmələri olan yeni dəyişənlər yaradırıq. Həm PCA, həm də FA -da məlumatların ölçüsü azalır. Xatırladaq ki, PCA -da əsas komponentlərin təfsiri çox vaxt çox təmiz deyil. Xüsusi bir dəyişən, bəzən birdən çox komponentə əhəmiyyətli dərəcədə kömək edə bilər. İdeal olaraq, hər bir dəyişənin yalnız bir komponentə əhəmiyyətli dərəcədə töhfə verməsini istəyirik. Bu məqsədə doğru faktor rotasiyası adlı bir texnika tətbiq olunur. Faktor analizinin iştirak etdiyi sahələrə nümunələr arasında fiziologiya, sağlamlıq, zəka, sosiologiya və digərləri arasında ekologiya da var.


      Faktor təhlili

      Faktor təhlili hər ikisi daxildir komponent təhliliümumi amil təhlili. Digər statistik metodlardan daha çox faktor təhlili, məqsədinin qarışıqlığından əziyyət çəkdi. Bu mənim təqdimatıma iki şəkildə təsir edir. Birincisi, sonrakı hissələrdə bunu necə etdiyini araşdırmadan əvvəl faktor analizinin nə etdiyini izah etmək üçün uzun bir bölmə ayırıram. İkincisi, adi təqdimat qaydasını ləğv etmək qərarına gəldim. Komponent analizi daha sadədir və əksər müzakirələr əvvəlcə onu təqdim edir. Ancaq düşünürəm ki, ümumi faktor təhlili əksər tədqiqatçıların həqiqətən həll etmək istədikləri problemləri həll etməyə yaxınlaşır. Beləliklə, əvvəlcə komponent analizini öyrənmək əslində bu problemlərin nə olduğunu anlamağa mane ola bilər. Buna görə də komponent təhlili bu fəslin sonlarında təqdim olunur.

      Hansı Faktor Analizinin Bacardığı və Yapamayacağı

      Faktor-Analiz Problemlərindən Bəzi Nümunələr

      Maraqlı bir fikir idi, amma səhv olduğu ortaya çıxdı. Bu gün College Board test xidməti, zehni qabiliyyətin ən azı üç vacib amilinin-şifahi, riyazi və məntiqi qabiliyyətlərin olduğu fikrinə əsaslanan bir sistemlə işləyir və əksər psixoloqlar bir çox digər faktorların da müəyyən edilə biləcəyinə razıdırlar.

      2. Avtonom sinir sisteminin fəaliyyətinin müxtəlif ölçülərini nəzərdən keçirin-ürək dərəcəsi, qan təzyiqi və s. Psixoloqlar təsadüfi dalğalanmalar istisna olmaqla, bütün bu tədbirlərin birlikdə yuxarı və aşağı hərəkət edib etməməsini-"aktivləşdirmə" hipotezini bilmək istəyirdilər. . Yoxsa avtonom tədbirlər qrupları birlikdə yuxarı və aşağı hərəkət edir, amma digər qruplardan ayrıdır? Yoxsa bütün tədbirlər əsasən müstəqildir? Mənim nəşr olunmamış bir analizim göstərdi ki, bir məlumat toplusunda, hər halda, məlumatlar aktivasiya hipotezinə kifayət qədər uyğun gəlir.

      3. Tutaq ki, bir çox heyvan növünə (siçovullar, siçanlar, quşlar, qurbağalar və s.) Bu yerdən hər hansı bir səs-küy-hər hansı bir səs-küy gəldikdə yemin müəyyən bir yerdə görünəcəyini öyrədirlər. Səs göründükdə o istiqamətə dönüb -dönmədiklərini görməklə müəyyən bir səsi aşkarlaya biləcəklərini deyə bilərsiniz. Sonra bir çox səsləri və bir çox növləri araşdırsanız, növlərin eşitmə itiliyinin neçə fərqli ölçüdə olduğunu bilmək istəyə bilərsiniz. Hipotezlərdən biri, onların yalnız üç ölçüdə-yüksək tezlikli səsləri, aşağı tezlikli səsləri və ara səsləri aşkar etmə qabiliyyətində-fərqlənməsidir. Digər tərəfdən, növlər eşitmə qabiliyyətlərində bu üç ölçüdən çox fərqlənə bilər. Məsələn, bəzi növlər kəskin klik kimi səsləri, digərləri davamlı hissə bənzər səsləri daha yaxşı aşkar edə bilər.

      4. Fərqli növ avtomobillərlə tanış olan 500 nəfərdən hər birinin 20 avtomobil modelinin hər birini "Bu cür avtomobilə nə qədər sahib olmaq istərdiniz?" Reytinqlərin fərqli olduğu ölçülərin sayı haqqında faydalı olaraq soruşa bilərik. Tək faktorlu bir nəzəriyyə, insanların ən bahalı modellərə ən yüksək reytinqi verdiyini irəli sürəcək. İki faktorlu bir nəzəriyyə, bəzi insanların ən çox idman modellərinə, digərlərinin isə lüks modellərə daha çox cəlb olunduğunu irəli sürəcək. Üç faktorlu və dörd faktorlu nəzəriyyələr təhlükəsizlik və etibarlılıq əlavə edə bilər. Və ya avtomobil əvəzinə yeməklər, siyasi siyasətlər, siyasi namizədlər və ya bir çox başqa obyektlə bağlı münasibətləri öyrənməyi seçə bilərsiniz.

      5. Rubenstein (1986), "Maşının necə işlədiyini anlamağı xoşlayıram" və ya "Yeni yemək növlərini sınamağı sevirəm" kimi ifadələrlə böyük bir orta məktəb şagirdlərinin razılaşmalarını təhlil edərək maraq doğurdu. . " Faktor təhlili yeddi faktoru müəyyən etdi: problem həll etmə, öyrənmə və oxumaq, təbiət elmləri, incəsənət və musiqi ilə bağlı üç ölçmə marağı və ümumiyyətlə yeni təcrübələr və pula nisbətən az marağın olduğunu göstərən bir faktor.

      Məqsəd: səbəbləri anlamaq

      1. Bu dəyişənlər arasındakı əlaqələrin quruluşunu izah etmək üçün neçə fərqli faktora ehtiyac var?
      2. Bu faktorların mahiyyəti nədir?
      3. Hipotezləşdirilmiş amillər müşahidə olunan məlumatları nə qədər yaxşı izah edir?
      4. Hər müşahidə olunan dəyişənə nə qədər sırf təsadüfi və ya unikal variasiya daxildir?

      Faktor Analizinin Mütləq Qarşı Evristik İstifadələri

      Əvvəlki nümunələr faydalı bir fərqi göstərmək üçün istifadə edilə bilər-arasında mütləqevristik faktor analizinin istifadəsi. Spearman's g kəşfiyyat nəzəriyyəsi və avtonom fəaliyyətin aktivləşdirilməsi nəzəriyyəsi, dəyişənlər arasındakı əlaqələr modelinin tam təsvirini vermək üçün fərziyyə edilən və ya fərz edilən mütləq nəzəriyyələr kimi düşünülə bilər. Digər tərəfdən, Rubenstein, maraqlanmağın yeddi əsas faktorunun siyahısının marağın tam təsvirini təqdim etdiyini heç vaxt iddia etməmişdir. Əksinə, bu faktorlar ən vacib yeddi faktor kimi görünür-bir məlumat toplusunu ümumiləşdirməyin ən yaxşı yolu. Faktor təhlili, nəticəni necə şərh etdiyinizdə ya mütləq, ya da evristik modellər təklif edə bilər.

      Faktor təhlili obyektivdirmi?

      Bənzər bir balanslaşdırma problemi, geriləmənin və varyansın analizində ortaya çıxır, lakin ümumiyyətlə fərqli işçilərin təxminən eyni nəticələrə gəlməsinə mane olmur. Bütün bunlardan sonra, əgər iki işçi eyni məlumatlara variasiya təhlili tətbiq edərsə və hər iki işçi .05 səviyyəsində əhəmiyyətli olmayan şərtləri tərk edərsə, hər ikisi də eyni təsirləri bildirəcəkdir. Ancaq faktor analizində vəziyyət çox fərqlidir. Daha sonra izah edilən səbəblərə görə, komponent analizində faktorların sayı ilə bağlı hipotezi yoxlayacaq heç bir əhəmiyyətlilik testi yoxdur, çünki bu fərziyyə adətən başa düşülür. Ümumi faktor analizində belə bir test var, lakin onun faydalılığı tez -tez qənaətbəxş şərh oluna biləcəyindən daha çox faktor verməsi ilə məhdudlaşır. Beləliklə, yalnız təfsir edilə bilən faktorları bildirmək istəyən bir işçi hələ də obyektiv sınaqdan keçir.

      Faktorların mahiyyətinin müəyyən edilməsində oxşar bir məsələ ortaya çıxır. İki işçinin hər biri 6 faktoru müəyyən edə bilər, lakin iki amil dəsti fərqli ola bilər-bəlkə də əhəmiyyətli dərəcədə. Səyahət yazıçısı bənzətməsi burada çox faydalıdır, iki yazıçı ABŞ-ı 6 bölgəyə bölə bilər, lakin bölgələri çox fərqli şəkildə təyin edə bilər.

      Başqa bir coğrafi bənzətmə, faktor analizinə daha çox paralel ola bilər, çünki bu, müəyyən ölçülə bilən məqsədə çatmaq üçün hazırlanmış kompüter proqramlarını əhatə edir. Kompüter proqramları bəzən bir dövləti coğrafi olaraq şərti olan, əhalisi təxminən bərabər olan və bəlkə də etnik mənsubiyyət ölçüləri və ya digər amillərə görə homojen olan Konqres bölgələrinə bölmək üçün istifadə olunur. Hər iki cavab ağlabatan olsa da, iki fərqli rayon yaratma proqramı çox fərqli cavablarla gələ bilər. Bu bənzətmə bir mənada çox yaxşıdır, inanırıq ki, faktor təhlili proqramları ümumiyyətlə rayon yaradan proqramlar kimi bir-birindən fərqli cavablar vermir.

      Kümelenme və Çox Ölçülüyə Qarşı Faktor Analizi

      Faktor analizinin bu metodlardan başqa bir üstünlüyü, faktor analizinin korrelyasiyaların müəyyən xüsusiyyətlərini tanıya bilməsidir. Məsələn, A və B dəyişənlərinin hər biri .7 -ni C dəyişənlə əlaqələndirər və .49 -u bir -biri ilə əlaqələndirərsə, faktor təhlili C sabit olduqda A və B -nin sıfır ilə əlaqəli olduğunu qəbul edə bilər, çünki .7 2 = .49. Çoxölçülü miqyaslama və klaster analizinin bu cür əlaqələri tanımaq qabiliyyəti yoxdur, çünki korrelyasiyalar korrelyasiya kimi deyil, ümumi "oxşarlıq tədbirləri" kimi qəbul edilir.

      Bu digər metodların heç vaxt korrelyasiya matrislərinə tətbiq edilməməsi lazım olduğunu söyləmirik, bəzən faktor təhlili ilə əldə edilə bilməyən fikirlər verirlər. Ancaq faktor analizini qəti olaraq köhnəltməmişlər. Növbəti hissədə bu məqama toxunulur.

      "Fərqləndirən" Dəyişənlərə Qarşı Faktorlar "Əsas" Dəyişənlərə

      "Fərqləndirmə" ifadəsinin mümkün bir mənası, bir çox dəyişənlərin bir -biri ilə yüksək nisbətdə əlaqəli olması, lakin vasitələrində fərqlənməsidir. Fərqli bir vəziyyətdə oxşar bir məna ortaya çıxa bilər. Eyni düşünülmüş zehni qabiliyyəti sınayan, lakin sadalanan ardıcıllıqla çətinliyi artıran bir neçə A, B, C, D testlərini nəzərdən keçirək. Sonra testlər arasında ən yüksək korrelyasiya bu siyahıdakı bitişik maddələr arasında ola bilər (rAB, rEramızdan əvvəl və rCD) ən aşağı nisbət siyahının əks ucundakı maddələr arasında olarkən (rAD). Maddələr arasındakı korrelyasiyada bu nümunəni müşahidə edən biri, testlərin "sadə bir qaydada qoyula biləcəyini" və ya "yalnız bir faktorla fərqləndiyini" söyləyə bilər, amma bu nəticənin faktor təhlili ilə heç bir əlaqəsi yoxdur. Bu testlər dəsti olardı yox yalnız bir ümumi amil var.

      A dəyişən B -ni, D -ni təsir edən C -ni təsir edərsə və bu dəyişənləri birləşdirən yeganə təsirlərdirsə, bu cür üçüncü hal yarana bilər. Bir daha, ən yüksək nisbətlər r olardıAB, rEramızdan əvvəl və rCD ən aşağı nisbət r olardıAD. Kimsə bu korrelyasiya modelini təsvir etmək üçün yuxarıda göstərilən eyni ifadələri istifadə edə bilər, bunun faktor təhlili ilə heç bir əlaqəsi yoxdur.

      • 5 fut 2 düym hündürlüyünüz varmı?
      • 5 fut 4 düym hündürlüyünüz varmı?
      • 5 fut 6 düym yüksəkliyiniz varmı?
      • Və s.
      • Millətimiz B milləti ilə tarif maneələrini azaltmalıdırmı?
      • İki mərkəzi bankımız vahid valyuta buraxmalıdırmı?
      • Ordumuz bir olmalı mı?
      • Bir millət olmaqla B milləti ilə birləşməliyikmi?

      Korrelyasiya matrisinə çoxölçülü miqyaslama tətbiq etmək, dəyişənlər arasındakı bütün bu sadə fərqlilik nümunələrini kəşf edə bilər. Beləliklə, çoxölçülü miqyaslama hansı faktorları axtarır fərqləndirmək dəyişənlər faktor təhlili faktorları axtarır altında yatmaq dəyişənlər. Ölçmə faktor analizinin heç bir şey tapmadığı yerdə sadəlik və faktor analizinin miqyaslamanın tapmadığı sadəliyi tapa bilər.

      Şübhəli bir tarix

      Əsas anlayışlar və prinsiplər

      Sadə bir nümunə

      Təsəvvür edin ki, bunlar zehni qabiliyyəti ölçən 5 dəyişən arasındakı korrelyasiyadır. Matrix R55, vahid bir ümumi faktor hipotezi ilə tam uyğun gəlir g müşahidə olunan 5 dəyişənlə korrelyasiyası müvafiq olaraq .9, .8, .7, .6 və .5 -dir. Bunun səbəbini bilmək üçün iki dəyişən arasındakı qismən korrelyasiya formulunu nəzərdən keçirin ab üçüncü dəyişəni ayırmaq g:

      Bu düstur göstərir ki, rab.g = 0 olarsa və yalnız r olarsaab = rag rbg. Bir dəyişənin ümumi amil kimi işləməsi üçün lazım olan xüsusiyyət g hər iki müşahidə olunan dəyişən arasında qismən korrelyasiyanın olması, qismən də olsa g, sıfırdır. Buna görə də korrelyasiya matrisi ümumi bir faktorla izah edilə bilər gilə müşahidə olunan dəyişənlərin bəzi korrelyasiyalarının olduğu doğrudur g, belə ki, bu korrelyasiyalardan hər hansı birinin məhsulu müşahidə olunan iki dəyişən arasındakı korrelyasiyaya bərabərdir. Ancaq R55 matrisi tam olaraq bu xüsusiyyətə malikdir. Yəni hər hansı bir diaqonal olmayan giriş rjk -nin məhsuludur jci və kcərgədəki girişlər .9 .8 .7 .6 .5. Məsələn, 1 -ci sətirdə və 3 -cü sütunda giriş .9 x .7 və ya .63 -dir. Beləliklə, R55 matrisi tək bir ümumi faktor hipotezinə tam uyğun gəlir.

      Bu nümunəni əsl korrelyasiya matrisində tapsaydıq, tam olaraq nəyi göstərərdik? Birincisi, faktorun varlığıdır nəticə çıxarıb daha çox müşahidə edildi. Əlbətdə olmazdı sübut bu 5 dəyişənin balları yalnız bir ümumi faktordan təsirlənir. Ancaq bu, müşahidə olunan korrelyasiya modelinə uyğun gələn ən sadə və ya ən uyğun olmayan hipotezdir.

      İkincisi, faktorun müşahidə olunan dəyişənlərin hər biri ilə əlaqəsini təxmin edə bilərik, buna görə də ən azından çox əlaqəli və ya əlaqəli olmadığı mənada faktorun mahiyyəti haqqında bir şey deyə bilərik. Bu nümunədə .9 .8 .7 .6 .5 dəyərləri bu təxmin edilən korrelyasiyalardır.

      Üçüncüsü, faktoru hər bir insanın dəqiq hesabını əldə etmək mənasında faktoru ölçə bilmədik. Ancaq, hər bir insanın faktorunu, müşahidə olunan dəyişənlərdəki ballarından qiymətləndirmək üçün çoxlu reqressiya metodlarından istifadə etmək istəsək, edə bilərik.

      Matrix R55, ümumi faktor analizinin praktiki olaraq mümkün olan ən sadə nümunəsidir, çünki müşahidə olunan korrelyasiyalar mümkün olan ən sadə faktor-analitik hipotezə-vahid ümumi faktor hipotezinə mükəmməl uyğun gəlir. Bəzi digər korrelyasiya matrisi tək bir ümumi faktorun hipotezinə uyğun gələ bilməz, lakin iki və ya üç və ya dörd ümumi faktorun hipotezinə uyğun gələ bilər. Faktorlar nə qədər az olarsa, hipotez də bir o qədər sadə olar. Sadə fərziyyə ümumiyyətlə daha mürəkkəb hipotezlərə nisbətən məntiqi elmi prioritetə ​​malik olduğundan, daha çox faktoru ehtiva edən fərziyyələrə nisbətən daha az faktorları ehtiva edən hipotezlərə üstünlük verilir. Yəni müşahidə olunan korrelyasiya dəsti ilə açıq şəkildə ziddiyyət təşkil etməyən ən sadə fərziyyəni (yəni ən az faktorları ehtiva edən) heç olmasa müvəqqəti olaraq qəbul edirsiniz. Bir çox yazıçı kimi icazə verərəm m hipotez edilən ümumi amillərin sayını ifadə edir.

      Riyaziyyata dərindən girmədən deyə bilərik ki, faktor təhlili hər bir dəyişəni cəm olaraq ifadə etməyə çalışır ümumiunikal porsiyalar. Bütün dəyişənlərin ortaq hissələri, ümumi amillərlə tam olaraq izah edilir və bənzərsiz hissələr bir -biri ilə ideal şəkildə mükəmməl əlaqələndirilmir. Verilən məlumatların bu şərtə uyğun olma dərəcəsi, adətən "qalıq korrelyasiya matrisi" adlandırılanların təhlili əsasında qiymətləndirilə bilər.

      Bu matrisin adı bir qədər yanlışdır, çünki matrisdəki girişlər ümumiyyətlə korrelyasiya deyildir. Şəxsi çapdan asılı olaraq hər hansı bir şübhə varsa, matrisada birinci dəyişənin özüylə, ikincisinin özü ilə "əlaqəsi" kimi diaqonal girişləri axtarın. Bu diaqonal qeydlərin hamısı tam deyilsə 1, onda çap olunan matris korrelyasiya matrisi deyil. Bununla birlikdə, diaqonal olmayan hər bir girişi iki uyğun diaqonal girişin kvadrat köklərinə bölməklə adətən bir korrelyasiya matrisinə çevrilə bilər. Məsələn, ilk iki diaqonal giriş .36 və .64 və [1,2] mövqesindəki diaqonal olmayan giriş .3 olarsa, qalıq korrelyasiya .3/(.6*.8) = 5 /8 = .625.

      Bu şəkildə tapılan əlaqələr, dəyişənlərin ümumi hissələrini hipotezə uyğunlaşdırmaq üçün dəyişənlərin "bənzərsiz" hissələri arasında icazə verilməli olan əlaqələrdir. m ümumi amillər. Bu hesablanmış korrelyasiyalar o qədər yüksəkdirsə ki, populyasiyada 0 olduğu fərziyyəsi ilə ziddiyyət təşkil edərsə, m ümumi amillər rədd edilir. Artan m həmişə bu əlaqələri aşağı salır, beləliklə məlumatlara daha uyğun bir hipotez yaradır.

      Ən sadə hipotezi (ən aşağısını) tapmaq istəyirik m) məlumatlara uyğundur. Bu baxımdan, bir faktor təhlili elmi tarixdə onilliklər və ya əsrlər boyu inkişaf etdirilən epizodlarla müqayisə edilə bilər. Yerin və digər planetlərin Günəş ətrafında hərəkət etdiyini başa düşən Kopernik, əvvəlcə orbitlərinin dairələr olduğunu fərz etdi. Kepler sonradan orbitlərin elips şəklində daha yaxşı təsvir edildiyini anladı. Bir dairə ellipsdən daha sadə bir rəqəmdir, buna görə də elmi tarixin bu epizodu sadə bir nəzəriyyə ilə başladığımız və müşahidə olunan məlumatları daha yaxşı uyğunlaşdırmaq üçün tədricən daha mürəkkəb hala gətirdiyimiz ümumi nöqtəni göstərir.

      Eyni prinsip eksperimental psixologiya tarixində də müşahidə oluna bilər. 1940 -cı illərdə eksperimental psixoloqlar, təhsil praktikasında hətta inqilab edə biləcək bütün öyrənmə prinsiplərinin labirentlərdə siçovulların öyrənilməsi ilə kəşf ediləcəyinə inanırdılar. Bu gün bu fikir gülünc şəkildə çox sadələşdirilmiş sayılır, ancaq ümumi bir elmi nöqteyi -nəzərdən sadə bir nəzəriyyə ilə başlamağın və tədricən daha mürəkkəb nəzəriyyələrə keçməyin məqsədəuyğun olduğunu göstərir, yalnız sadə nəzəriyyənin məlumatlara uyğun gəlmədiyi aydın olduqda.

      Bu ümumi elmi prinsip tək amil təhlili çərçivəsində tətbiq oluna bilər. Mümkün olan ən sadə nəzəriyyədən başlayın (ümumiyyətlə m = 1), bu nəzəriyyə ilə məlumatlar arasındakı uyğunluğu yoxlayın və sonra artırın m lazım olduğu kimi. Hər artım m daha mürəkkəb, lakin məlumatlara daha yaxşı uyğun bir nəzəriyyə hazırlayır. Verilənlərə kifayət qədər uyğun bir nəzəriyyə tapanda dayandırın.

      Hər müşahidə olunan dəyişən icma öz ümumi payı ilə, yəni ümumi amillərlə izah edilən dəyişənin nisbət nisbətinin təxmin edilən kvadratik korrelyasiyasıdır. Bir neçə fərqli dəyərlə faktor təhlili aparsanız m, yuxarıda təklif edildiyi kimi, cəmiyyətlərin ümumiyyətlə artdığını görürsünüz m. Ancaq icmalar son dəyərini seçmək üçün istifadə edilmir m. Aşağı icmalar, məlumatların hipotezə uyğun gəlmədiyinə dair bir dəlil olaraq deyil, sadəcə təhlil edilən dəyişənlərin bir -biri ilə çox az ortaq olduğuna dəlil olaraq şərh olunur. Əksər faktor təhlili proqramları əvvəlcə hər bir dəyişənin cəmiyyətliliyini həmin dəyişənlə analizdəki digər dəyişənlər arasında çoxsaylı korrelyasiya kimi qiymətləndirir, daha sonra daha yaxşı bir qiymətləndirmə tapmaq üçün iterativ prosedurdan istifadə edir.

      Faktor analizi ya korrelyasiyadan, ya da istifadə edə bilər kovaryanslar. Covariance covjk nömrələnmiş iki dəyişən arasında jk onların korrelyasiya vaxtları iki standart sapmadır: covjk = rjk sj sk, harada rjk onların əlaqəsidir və sj və sk standart sapmalardır. Bir kovaryansın çox əhəmiyyətli bir mahiyyət mənası yoxdur, ancaq sonrakı hissədə təsvir edilən çox faydalı riyazi xüsusiyyətlərə malikdir. Hər hansı bir dəyişən 1 ilə öz-özünə əlaqəli olduğundan, hər hansı bir dəyişənin özü ilə kovariansı onun sapmasıdır-standart sapmanın kvadratıdır. Bir korrelyasiya matrisi, artıq 1 standart sapmalara uyğunlaşdırılmış dəyişənlər toplusunun fərqlilik və kovariyentlik matrisi (daha qısacası, kovarians matrisi) kimi düşünülə bilər. ya korrelyasiya, ya da kovarians matrisi deməkdir. Müşahidə olunan dəyişənlərin korrelyasiyasını və ya kovarians matrisini ifadə etmək üçün R istifadə edəcəyəm. Bu qəbuledilməzdir, amma təhlil edilən matris demək olar ki, həmişə bir korrelyasiya matrisidir və daha sonra izah edildiyi kimi, R-nin ümumi faktorlu hissəsi üçün C hərfinə ehtiyacımız var.

      Matrisin parçalanması və dərəcəsi

      Faktor analizinin əsas teoremi, bütün bir kovarians matrisi üçün bənzər bir şey edə biləcəyinizdir. Bir kovarians matrisi, bir sıra amillərlə izah edilən ümumi bir C hissəsinə və bu faktorlarla izah edilməyən unikal bir hissəyə bölünə bilər. Matris terminologiyasında R = C + U, yəni R matrisindəki hər bir giriş C və U matrislərindəki müvafiq girişlərin cəmidir.

      Bərabər hüceyrə tezlikləri ilə dəyişkənliyin analizində olduğu kimi, izah edilən C komponenti daha da parçalana bilər. C, komponent matrislərinə parçalana bilər c1, c2və s., fərdi amillərlə izah olunur. Bu bir faktorlu komponentlərin hər biri cj "faktor yükləmələri" sütununun "xarici məhsulu" na bərabərdir. Nömrələr sütununun xarici məhsulu, girişə icazə verilərək meydana gələn kvadrat matrisdir jk matrisdə girişlərin məhsulu bərabərdir jk sütunda. Beləliklə, bir sütunda əvvəlki nümunədə olduğu kimi .9, .8, .7, .6, .5 yazıları varsa, onun xarici məhsulu

      Daha əvvəl bu matrisdəki diaqonal olmayan qeydləri qeyd etdim, ancaq diaqonal qeydləri deyil. C -də hər bir diaqonal girişj matris əslində bu faktorla izah edilən uyğun dəyişənin variasiya məbləğidir. Bizim nümunədə, g .9 ilk müşahidə olunan dəyişənlə əlaqələndirilir, ona görə də bu dəyişkəndəki izah edilən varyansın miqdarı .9 2 və ya .81, bu matrisdəki ilk diaqonal girişdir.

      Nümunədə yalnız bir ümumi faktor var, buna görə bu nümunə üçün C matrisi (C55 ilə ifadə olunur) C55 = c -dir.1. Buna görə bu nümunə üçün U qalıq matris (U55 ilə ifadə olunur) U55 = R55 - c1. Bu, U55 üçün aşağıdakı matrisi verir:

      Bu faktorla izah olunmayan dəyişənlərin hissələrinin kovarians matrisi. Daha əvvəl də qeyd edildiyi kimi, U55-də diaqonal olmayan bütün girişlər 0-a bərabərdir və diaqonal girişlər hər dəyişənin açıqlanmayan və ya unikal varyansının məbləğləridir.

      Çox vaxt C bir neçə matrisin cəmidir cj, bu nümunədəki kimi tək deyil. Sayı c-C -yə bərabər olan matrislər rütbə Bu nümunədəki C matrisinin C dərəcəsi 1 -dir. C dərəcəsi bu modeldəki ümumi faktorların sayıdır. Müəyyən bir rəqəm göstərsəniz m bir faktor təhlili proqramı sonra C rütbəsini bərabər edən orijinal korrelyasiya və ya kovarians matrisinə bərabər olan iki C və U matrisini çıxarır. m. Nə qədər böyük qoyursan m, yaxın C, R -yə yaxınlaşacaq m = səh, harada səh matrisdəki dəyişənlərin sayıdır, onda C -dəki hər bir giriş R -dəki müvafiq girişə tam bərabər olacaq və U sıfır matrisi olaraq qalacaq. Fikir nə qədər aşağı edə biləcəyinizi görməkdir m və hələ də C -nin R -yə ağlabatan bir yaxınlaşması var.

      Neçə hal və dəyişən var?

      Dəyişənlərin sayı ilə bağlı qaydalar faktor analizi üçün reqressiyadan çox fərqlidir. Faktor analizində hallardan daha çox dəyişənin olması qüsursuzdur. Əslində, dəyişənlər əsas faktorlara uyğun olaraq qaldıqca, daha çox dəyişən daha yaxşı olar.

      Neçə Faktor?

      Bu bölmədə müzakirə olunan iki qaydadan birincisi ümumi faktorların sayını müəyyən etmək üçün rəsmi əhəmiyyətlilik testindən istifadə edir. N nümunə ölçüsünü ifadə etsin, səh dəyişənlərin sayı və m amillərin sayı. Həmçinin R.U qalıq matrisini ifadə edir korrelyasiya matrisinə çevrilmiş, | RU| onun determinantıdır və ln (1/| RU|) bu determinantın qarşılığının təbii logarifmasıdır.

      Bu qaydanı tətbiq etmək üçün əvvəlcə G = N-1- (2p+5)/6- (2/3) m hesablayın. Sonra hesablayın

      Ln (1/| R) hesablamaq çətindirsəU|), bu ifadə çox vaxt r ilə yaxşı yaxınlaşdırılırU 2, burada toplama, R matrisindəki diaqonalın üstündəki bütün kvadrat korrelyasiyaların cəmini ifadə edirU.

      Faktorların sayını seçmək üçün bu düsturu istifadə etmək üçün başlayın m = 1 (və ya hətta m = 0) və ardıcıl olaraq artan dəyərlər üçün bu testi hesablayın m, dəyərinin əhəmiyyətsiz olduğunu gördüyünüz zaman dayandırın m ən kiçik dəyərdir m məlumatlarla ciddi şəkildə ziddiyyət təşkil etmir. Bu qaydanın əsas çətinliyi odur ki, mənim təcrübəmdə orta ölçülü nümunələrlə uğurla şərh oluna biləcəyindən daha çox faktora səbəb olur.

      Alternativ bir yanaşma təklif edirəm. Bu yanaşma bir zamanlar praktik deyildi, amma bu gün əlçatandır. Müxtəlif dəyərləri olan faktor analizlərini aparın m, rotasiya ilə tamamlayın və ən cazibədar quruluş verən birini seçin.

      Fırlanma

      Proqnozlaşdırıcıların xətti funksiyaları

      İndi düşünün ki, bir iş yoldaşı hər bir tələbənin şifahi və riyaziyyat ballarını toplayaraq AS adlandıracağım kompozit bir "akademik bacarıq" balını və VMD-yə zəng edəcəyim ikinci bir dəyişən əldə etmək üçün hər bir tələbənin şifahi və riyaziyyat balları arasındakı fərqi götürməyi təklif edir. (şifahi-riyazi fərq). İş yoldaşı, hər bir reqressiyada AS və VMD-ni orijinal şifahi və riyazi ballar əvəzinə proqnozlaşdırıcı olaraq istifadə etmək istisna olmaqla, fərdi kurslarda qiymətləri proqnozlaşdırmaq üçün eyni reqressiya dəsti ilə işləməyi təklif edir. Bu nümunədə, bu iki reqressiya ailəsindən dərs qiymətləri ilə bağlı eyni proqnozlar alacaqsınız: biri fərdi kurslarda qiymətləri şifahi və riyaziyyat skorlarından, digəri isə AS və VMD skorlarından eyni qiymətləri proqnozlaşdırır. Əslində, 3 riyaziyyat + 5 şifahi və 5 sözlü + 3 riyaziyyatdan ibarət kompozitlər qursanız və bu iki kompozitdən qiymətləri proqnozlaşdıran iki dəyişkənli çoxlu reqressiya seriyası işləsəniz eyni proqnozları alacaqsınız. Bu nümunələr hamısıdır xətti funksiyalar orijinal şifahi və riyazi balların.

      Əsas məqam, əgər varsa m proqnozlaşdırıcı dəyişənlər və siz əvəz edirsiniz m tərəfindən orijinal proqnozlaşdırıcılar m Bu proqnozlaşdırıcıların xətti funksiyalarını, ümumiyyətlə heç bir məlumat əldə etmirsiniz və itirmirsiniz-istəsəniz, xətti funksiyalardakı puanları orijinal dəyişənlərdəki puanları yenidən qurmaq üçün istifadə edə bilərsiniz. Ancaq çoxlu reqressiya, yeni bir dəyişəni (məsələn, müəyyən bir kursdakı qiymətləri) proqnozlaşdırmaq üçün əlinizdə olan hər şeyi ən optimal şəkildə (mövcud nümunədəki kvadrat səhvlərin cəmi ilə ölçülür) istifadə edir. Xətti funksiyalar orijinal dəyişənlərlə eyni məlumatları ehtiva etdiyindən, əvvəlki kimi eyni proqnozları alırsınız.

      Eyni proqnozları əldə etməyin bir çox yolu olduğunu nəzərə alsaq, bir xətti funksiyadan başqa bir dəstə istifadə etməyin bir üstünlüyü varmı? Bəli, ola biləcək bir dəst var daha sadə başqasından daha çox. Xüsusi bir xətti funksiya, bir çox dərs qiymətinin iki deyil, yalnız bir dəyişəndən (yəni bir xətti funksiyadan) proqnozlaşdırılmasına imkan verə bilər. Daha az proqnozlaşdırıcı dəyişənləri olan reqressiyanı daha sadə hesab etsək, bu sualı verə bilərik: Proqnozlaşdıran dəyişənlərin sayını minimuma endirmək mənasında eyni proqnozları verə biləcək bütün mümkün proqnozlaşdırıcı dəyişənlərdən. tipik reqressiya lazımdırmı? Bəzi sadəlik ölçüsünü maksimuma çatdıran proqnozlaşdırıcı dəyişənlərin cütlüyünə sahib olduğunu söyləmək olar sadə quruluş. Qiymətləri əhatə edən bu nümunədə, bəzi kursların qiymətlərini yalnız şifahi bir test hesabından dəqiq proqnozlaşdıra bilərsiniz və digər kursların qiymətlərini yalnız riyazi hesabdan dəqiq bir şəkildə proqnozlaşdıra bilərsiniz. Əgər belə olsaydı, bütün proqnozlar üçün hər iki testdən istifadə etdiyinizdən daha çox proqnozlarınızda "daha sadə bir quruluş" əldə edərdiniz.

      Faktor Analizində Sadə Quruluş

      Sadə quruluşun həddindən artıq vəziyyətində, hər bir X-dəyişəninin yalnız bir böyük girişi olacaq, buna görə də digərlərinin hamısı göz ardı edilə bilər. Ancaq bu, ümumiyyətlə əldə etməyinizi gözlədiyinizdən daha sadə bir quruluş olardı, real dünyada hər bir dəyişən normal olaraq yalnız bir başqa dəyişəndən təsirlənmir. Daha sonra yüklərin yoxlanılmasına əsaslanaraq amilləri subyektiv olaraq adlandırırsınız.

      Ümumi faktor analizində, rotasiya prosesi, əslində, burada nəzərdə tutduğumdan bir qədər mücərrəddir, çünki faktorlar üzrə fərdi halları bilmirsiniz. Bununla birlikdə, burada ən çox əlaqəli olan çoxsaylı reqressiya statistikası-çoxlu korrelyasiya və standart regressiya yamacları-hamısı dəyişənlərin və faktorların korrelyasiyasından hesablana bilər. Buna görə heç bir fərdi skor istifadə etmədən sadə korrelyasiyaya əsaslanan fırlanma hesablamalarını əsaslandıra bilərik.

      Faktorların əlaqəsiz qalmasını tələb edən bir fırlanma ortogonal rotasiya, digərləri isə əyri rotasiyalar. Oblique rotations tez -tez daha sadə bir quruluş əldə edir, baxmayaraq ki, nəticəni şərh edərkən amillər arasındakı əlaqələrin matrisini də nəzərə almalısınız. Təlimatlar ümumiyyətlə aydındır ki, hansıdır, amma hər hansı bir qeyri -müəyyənlik varsa, sadə bir qayda budur ki, faktor korrelyasiyalarının matrisini çap etmək qabiliyyəti varsa, fırlanma meyllidir, çünki ortogonal rotasiyalar üçün belə qabiliyyətə ehtiyac yoxdur. .

      Nümunə

      Gorsuch -dan 24 zehni qabiliyyət dəyişəninin 4 faktorunun Oblique Promax rotasiyası (1983)

      Bu cədvəl olduqca yaxşı bir sadə quruluşu ortaya qoyur. Dörd dəyişən blokunun hər birində yüksək dəyərlər (mütləq dəyərdə təxminən .4-dən yuxarı) ümumiyyətlə hamısı tək bir sütundadır-dörd blokun hər biri üçün ayrı bir sütun. Bundan əlavə, hər bir blokdakı dəyişənlərin hamısı eyni ümumi zehni qabiliyyəti ölçmək kimi görünür. Hər iki ümumiləşdirmənin əsas istisnası üçüncü blokda gəlir. Bu blokdakı dəyişənlərə həm görmə qabiliyyəti, həm də düşünmə ölçüləri daxildir və əsaslandırıcı dəyişənlər (blokdakı son dörd) ümumiyyətlə bir və ya daha çox digər sütundakı yüklərindən çox olmayan 3 -cü sütunda yüklənir.Bu, ayrı-ayrı "vizual" və "əsaslandırıcı" faktorlara səbəb ola biləcəyi ümidi ilə 5 faktorlu bir həllin sınanmağa dəyər ola biləcəyini göstərir. Cədvəl 1 -dəki faktor adları Gorsuch tərəfindən verilmişdir, lakin ikinci blokdakı dəyişənlərin araşdırılması "sadə təkrarlanan tapşırıqların" faktor 2 üçün "ədədi" dən daha yaxşı bir ad ola biləcəyini göstərir.

      Demək istəmirəm ki, hər dəyişən yükü yalnız bir amil üzərində yüksək etməyə çalışmalısınız. Məsələn, arifmetik söz problemlərini həll etmək bacarığı testi həm şifahi, həm də riyazi faktorlara çox yüklənə bilər. Eyni faktoru iki fərqli qrupa yerləşdirə bilmədiyiniz üçün bu faktor analizinin klaster təhlili ilə müqayisədə üstünlüklərindən biridir.

      Əsas Komponent Analizi (PCA)

      Əsaslar

      PCA -dakı əsas konsepsiya təmsil və ya ümumiləşdirmədir. Böyük bir dəyişən dəstini daha böyük dəsti ən yaxşı şəkildə ümumiləşdirən daha kiçik bir dəstə ilə əvəz etmək istədiyimizi düşünək. Məsələn, tutaq ki, 30 zehni testdə yüzlərlə şagirdin ballarını qeyd etmişik və bütün bu balları saxlamağa yerimiz yoxdur. (Bu, kompüter əsrində çox süni bir nümunədir, lakin PCA icad edildiyi vaxtdan əvvəl daha cazibədar idi.) Saxlama qənaətinə görə dəsti hər bir şagird üçün 5 bala endirmək istərdik ki, bundan da istifadə edə bilək. orijinal 30 skorunu mümkün qədər dəqiq şəkildə yenidən qurmaq.

      Qoy səhm cari nümunədə müvafiq olaraq orijinal və azaldılmış dəyişənlərin sayını-30 və 5-i göstərin. Orijinal dəyişənlər X, ümumiləşdirən dəyişənlər F ilə ifadə olunur. Ən sadə halda, yenidənqurma dəqiqliyimizin ölçüsü cəmidir səh X-dəyişənləri ilə X-in faktorlarından irəli gələn proqnozlar arasında çoxlu korrelyasiyalar meydana çıxdı. Daha ümumi halda, hər bir kvadrat çoxlu korrelyasiyanı müvafiq X dəyişəninin dispersiyası ilə çəkə bilərik. Hər bir dəyişənin ballarını seçdiyimiz hər hansı bir sabitlə vuraraq bu fərqləri özümüz təyin edə bildiyimiz üçün, bu, fərqli dəyişənlərə seçdiyimiz hər hansı bir ağırlığı təyin etmək qabiliyyətinə bərabərdir.

      İndi riyazi mənada yaxşı müəyyən edilmiş bir problemimiz var: azalt səh bir sıra dəyişənlər m Orijinalı ən yaxşı ümumiləşdirən dəyişənlərin xətti funksiyaları səh yeni təsvir olunan mənada. Ancaq məlum olur ki, sonsuz sayda xətti funksiyalar eyni dərəcədə yaxşı xülasələr verir. Problemi tək bir həll yolu ilə daraltmaq üçün üç şərt təqdim edirik. Birincisi, m törəmə xətti funksiyalar qarşılıqlı əlaqəsiz olmalıdır. İkincisi, hər hansı bir dəst m xətti funksiyalar daha kiçik bir dəstə üçün funksiyaları ehtiva etməlidir. Məsələn, ən yaxşı 4 xətti funksiya, ən yaxşısını daxil edən ən yaxşı 2 -ni ehtiva edən ən yaxşı 3 -dən ibarət olmalıdır. Üçüncüsü, hər bir xətti funksiyanı təyin edən kvadrat ağırlıqlar 1 -ə bərabər olmalıdır. Bu üç şərt, əksər məlumat dəstləri üçün unikal bir həll təmin edir. Tipik olaraq var səh xətti funksiyalar (adlanır əsas komponentlər) hamısını istifadə edərək əhəmiyyətini azaldır səh birincisini istifadə edərək, orijinal X skorlarının mükəmməl yenidən qurulmasını əldə edirsiniz m (harada m 1 ilə arasında dəyişir səh) bu dəyər üçün mümkün olan ən yaxşı yenidənqurma əldə edirsiniz m.

      Hər bir komponenti müəyyənləşdirin öz vektoru və ya xarakterik vektor və ya latent vektor çəkilər sütunu olaraq onu X-dəyişənlərindən meydana gətirdi. Orijinal R matrisi bir korrelyasiya matrisidirsə, hər bir komponenti təyin edin özünəməxsus dəyər və ya xarakterik dəyər və ya gizli dəyər X-dəyişənlərlə kvadratik korrelyasiyaların cəmidir. Əgər R bir kovaryans matrisi olarsa, öz dəyərini hər bir korrelyasiya müvafiq X-dəyişənin dispersiyası ilə ölçülmüş kvadratik korrelyasiyaların ağırlıqlı cəmi olaraq təyin edin. Öz dəyərlərin cəmi həmişə R -dəki diaqonal girişlərin cəminə bərabərdir.

      Nonunik həllər yalnız iki və ya daha çox özünəməxsus dəyərlər bərabər olduqda ortaya çıxır, sonra müvafiq özvektorların unikal olaraq təyin olunmadığı ortaya çıxır. Bu hal praktikada nadir hallarda ortaya çıxır və bundan sonra buna məhəl qoymayacağam.

      Hər bir komponentin öz dəyərinə komponentin izah etdiyi "variasiya miqdarı" deyilir. Bunun əsas səbəbi, öz dəyərinin kvadratik korrelyasiyaların ağırlıqlı cəmi olaraq təyin edilməsidir. Bununla birlikdə, komponent ballarının həqiqi fərqinin öz dəyərinə bərabər olduğu ortaya çıxdı. Beləliklə, PCA -da "faktorun dəyişməsi" və "faktorun izah etdiyi varyansın miqdarı" həmişə bərabərdir. Buna görə də konseptual olaraq çox fərqli miqdarlarda dayansalar da, bu iki ifadə tez -tez bir -birini əvəz edir.

      Əsas komponentlərin sayı

      1. Öz dəyərlərin cəmi = p
      giriş matrisi korrelyasiya matrisi olsaydı

      Öz dəyərlərin cəmi = giriş fərqlərinin cəmi
      giriş matrisi bir kovarians matrisi olsaydı

      2. Açıqlanan variasiya nisbəti = öz dəyər / öz dəyərlərin cəmi

      3. Üçün kvadrat faktor yükləmələrinin cəmi jci əsas komponent
      = öz dəyərij

      4. Dəyişən üçün kvadrat faktor yükləmələrinin cəmi i
      = dəyişkənlikdə izah edilən variasiya i
      = Cii (diaqonal giriş i C matrisində)
      = icmai ümumi amil analizində
      = dəyişənin dispersiyası i əgər m = səh

      5. Sütunlar arasındakı çarpaz məhsulların cəmi ij faktor yükləmə matrisi
      = Cij (giriş ij C matrisində)

      6. #3, #4 və #5 -dəki əlaqələr rotasiya sonrası hələ də doğrudur.

      7. R - C = U. Lazım gələrsə, C -də diaqonal girişləri tapmaq üçün 4 -cü qaydanı, sonra U -da diaqonal girişləri tapmaq üçün 7 -ci qaydanı istifadə etmək olar.

      İki Faktorlu Analizin Müqayisəsi

      Əslində, iki faktorlu analizin oxşarlığı ilə bağlı bir neçə fərqli sual ifadə edilə bilər. Əvvəlcə iki fərqli məlumat formatını ayırd etməliyik:

      1. Eyni dəyişənlər, iki qrup. Eyni tədbirlər kişilər və qadınlar və ya müalicə və nəzarət qrupları üzərində də edilə bilər. Bu zaman iki faktor quruluşunun eyni olub -olmadığı sual yaranır.

      2. Bir qrup, iki şərt və ya iki dəyişən dəsti. Bir test qrupuna iki test batareyası verilə bilər və iki bal toplusunun necə fərqləndiyi ilə bağlı suallar verilə bilər. Və ya eyni batareya iki fərqli şərtlə verilə bilər.

      Növbəti iki hissədə bu suallar ayrıca müzakirə olunur.

      İki Qrupda Faktor Analizlərinin Müqayisəsi

      "Bu iki qrup eyni faktor quruluşuna malikdirmi?" əslində "eyni faktorlara sahibdirlərmi?" sualından olduqca fərqlidir. Sonuncu sual "İki qrup üçün iki fərqli faktor analizinə ehtiyacımız varmı?" Sualına daha yaxındır. Məsələni başa düşmək üçün 5 "şifahi" test və 5 "riyaziyyat" testi ilə bir problem düşünün. Sadəlik üçün, iki test dəsti arasındakı bütün əlaqələrin tam sıfır olduğunu təsəvvür edin. Sadəlik üçün bir komponent analizini nəzərdən keçirin, baxmayaraq ki, eyni məqam ümumi bir faktor təhlili ilə əlaqədar edilə bilər. İndi təsəvvür edin ki, 5 şifahi test arasındakı əlaqələrin hamısı qadınlar arasında .4 və kişilər arasında .8, 5 riyazi testlər arasındakı korrelyasiyaların hamısı qadınlar arasında .8 və kişilər arasında .4dür. İki qrupda ayrı-ayrılıqda fərqli faktor quruluşları verərdi, ancaq hər bir cinsdə eyni faktorların analizi, bütün riyazi maddələr üçün 0 ağırlığa malik olan bütün şifahi maddələrin bərabər ağırlıqlı ortalaması olan "şifahi" faktoru müəyyən edərdi. "əks modelli faktor. Bu nümunədə, iki faktor quruluşu olduqca fərqli olsa da, iki cins üçün ayrı faktor analizlərindən istifadə etməklə heç bir şey əldə edilməyəcəkdir.

      İki qrup problemi ilə əlaqədar digər bir vacib məqam, A qrupu üçün 4 faktor və B qrupu üçün 4 faktor əldə edən bir təhlilin, birləşmiş qrupda 8 əldə edən bir analiz qədər çox faktora malik olmasıdır. Beləliklə, praktiki sual, təhlillərin olub -olmaması ola bilməz m iki qrupun hər birindəki faktorlar, alınan təhlildən daha çox məlumatlara uyğundur m birləşdirilmiş qrupdakı amillər. Əksinə, iki ayrı təhlili 2 -dən çıxan bir analizlə müqayisə etmək lazımdırm birləşdirilmiş qrupdakı amillər. Komponent analizi üçün bu müqayisə etmək üçün birincini toplayın m hər bir ayrı qrupdakı öz dəyərləri və bu iki cəmin ortalamasını ilk 2 -nin cəmi ilə müqayisə edinm birləşdirilmiş qrupdakı öz dəyərlər. Bu analizin iki qrup üçün ayrı -ayrı faktor analizlərinin aparılmasının daha yaxşı olacağını irəli sürməsi çox nadir hal olardı. Eyni analiz ümumi amil təhlili üçün suala ən azı təxmini bir cavab verməlidir.

      Sualın həqiqətən də iki faktor quruluşunun eyni olub -olmamasıdır. Bu sual, iki korrelyasiya və ya kovarians matrisinin eyni olub-olmadığı sualına çox oxşardır-faktor analizinə heç bir istinad edilmədən dəqiq müəyyən edilmiş bir sual. Bu fərziyyələrin sınaqları bu işin əhatə dairəsindən kənardadır, lakin iki dəyişkənlik matrisinin bərabərliyi ilə bağlı bir test Morrison (1990) və çox dəyişkənli analizlə bağlı digər əsərlərdə ortaya çıxmışdır.

      Tək Qrupda İki Dəyişən Faktor Analizinin Müqayisəsi

      İki ayrı nümunə nümunəsində olduğu kimi, tez-tez amillər baxımından ifadə olunan, lakin iki korrelyasiya və ya kovarians matrisinin bərabərliyi ilə bağlı bir sual kimi daha yaxşı ifadə olunan bir sual var-heç bir cavabı olmayan bir sual. faktor analizinə istinad. İndiki halda iki paralel dəyişən dəstimiz var, yəni A dəstindəki hər bir dəyişən B dəstində bir paralelə malikdir. Əslində, A və B dəstləri iki fərqli şəraitdə tətbiq olunan eyni ölçülər ola bilər. Sual iki korrelyasiya matrisinin və ya kovarians matrisinin eyni olub -olmamasıdır. Bu sualın faktor təhlili ilə heç bir əlaqəsi yoxdur, eyni zamanda AB korrelyasiyasının yüksək olub -olmaması sualına da çox az aiddir. A və B dəstlərindəki iki korrelyasiya və ya kovarians matrisi, AB korrelyasiyalarının yüksək və ya aşağı olmasından asılı olmayaraq bərabər ola bilər.

      Darlington, Weinberg və Walberg (1973), A və B dəstləri eyni nümunə nümunələrində ölçüldükdə, A və B dəyişən dəstləri üçün kovarians matrislərinin bərabər olduğuna dair sıfır hipotezin sınağını təsvir etdi. AB kovarians matrisinin simmetrik olduğuna inanmaq lazımdır. Məsələn, əgər A və B dəstləri 1 və 2 -ci illərdə tətbiq olunan eyni testlərdirsə, fərziyyə 1 -ci ildə X testi ilə 2 -ci ildə Y testi arasındakı kovaryansın 2 -ci ildə X testi ilə test arasındakı kovariansa bərabər olmasını tələb edir. Y il 1. Bu fərziyyəni nəzərə alaraq, iki dəstdəki paralel dəyişənlərin cəmləri və fərqlərindən ibarət olan A+B və AB adlandıracağım iki bal toplusu formalaşdıra bilərsiniz. Daha sonra məlum olur ki, orijinal sıfır hipotezi A+B dəstindəki bütün dəyişənlərin A-B dəstindəki bütün dəyişənlərlə əlaqəsi olmadığı fərziyyəsinə bərabərdir. Bu fərziyyə MANOVA ilə sınaqdan keçirilə bilər.

      SYSTAT 5 -də Faktor və Komponent Analizi

      Məlumatların daxil edilməsi

      FACTOR standart düzbucaqlı formatda məlumatları qəbul edəcək. Avtomatik olaraq bir korrelyasiya matrisini hesablayacaq və sonrakı analiz üçün istifadə edəcək. Bunun əvəzinə bir kovaryans matrisini təhlil etmək istəyirsinizsə, daxil edin

      Daha sonra bir korrelyasiya matrisini təhlil etmək istəyirsinizsə, daxil edin

      "Korrelyasiya" növü standart tipdir, buna görə yalnız korrelyasiya matrislərini təhlil etmək istəyirsinizsə bunu daxil etməyinizə ehtiyac yoxdur.

      Məlumat faktor təhlili üçün hazırlamağın ikinci yolu, CORR menyusunda korrelyasiya və ya kovarians matrisini hesablamaq və saxlamaqdır. SYSTAT, matrisin saxlandığı anda korrelyasiya və ya kovarians matrisi olub olmadığını avtomatik olaraq qeyd edəcək və bu məlumatı saxlayacaq. Sonra FACTOR avtomatik olaraq düzgün növdən istifadə edəcək.

      Üçüncü yol, çap edilmiş bir mənbədən bir korrelyasiya və ya kovarians matrisiniz varsa və bu matrisi əl ilə daxil etmək istəyirsinizsə faydalıdır. Bunu etmək üçün GİRİŞ və TİP əmrlərini birləşdirin. Məsələn, matrisi düşünək

      Cəbr, GEOMETRİ, KOMPYUTER, TRİQONOM kimi dörd dəyişən üçün kovarians matrisidir. (Normalda bundan daha əhəmiyyətli rəqəmlərə korrelyasiya və ya kovaryanslar daxil edin.) DATA moduluna yaza bilərsiniz.

      MATHA QAYD EDİN
      GİRİŞ CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM
      NÖVƏ KOÇULUĞU
      QAÇIN
      .94
      .62 .89
      .47 .58 .97
      .36 .29 .38 .87
      ÇIX

      Matrisin yalnız aşağı üçbucaq hissəsini daxil etdiyinizə diqqət yetirin. Bu nümunədə diaqonal daxil edirsiniz, ancaq bütün diaqonal girişlərin 1.0 olması üçün bir korrelyasiya matrisi daxil edirsinizsə, RUN -dan dərhal əvvəl DIAGONAL ABSENT əmrini daxil edin, sonra diaqonal qeydləri buraxın.

      Dördüncü yol, hansı etməyəcək iş, korrelyasiya və ya kovarians matrisini söz prosessoruna daxil etmək və ya taramaq, sonra matrisi SYSTAT -a daşımaq üçün SYSTAT -ın GET əmrindən istifadə etməkdir. Bu üsulda SYSTAT, TYPE matrisini düzgün qeyd etməyəcək və matrisi korrelyasiya və ya fərqlilikdən çox balların matrisi kimi qəbul edəcək. Təəssüf ki, SYSTAT çıxışı gözlədiyiniz formatda verəcək və bütün analizin səhv edildiyinə dair açıq bir əlamət olmayacaq.

      Faktor təhlili üçün əmrlər

      FAKTOR CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM

      Əsas komponentlər əvəzinə ümumi faktor analizini seçmək üçün "təkrarlanan əsas ox" üçün IPA seçimini əlavə edin. IPA bir seçimdir, lakin dəyişənlərin siyahısı yoxdur. Beləliklə, bir əmr oxuna bilər

      FAKTOR CƏBİR, GEOMETRİYA, KOMPYUTER, TRIGONOM / IPA

      ITER (iteration) seçimi ümumi amil analizində icmaları qiymətləndirmək üçün maksimum təkrar sayını təyin edir. SYSTAT, icma təxminlərinin şübhəli olduğunu varsayarsa, ITER = 25 olduğunu xəbərdar edərsə, İTER -i artırın. TOL seçimi, aşağıda göstərilən FACTOR -un icma təxminlərini yaxşılaşdırmağa çalışmağı dayandıracağı, TOL = .001 olan icma təxminlərində bir dəyişikliyi göstərir. PLOT seçimi, cüt amillər və ya komponentlər üçün faktor yükləmə sahələri verir. Belə sahələrin sayı m (m-1)/2-dir, əgər böyük olarsa m böyükdür. Bütün bu seçimlərdən istifadə edən bir komanda oxuya bilər

      FACTOR / IPA, TOL = .0001, ITER = 60, PLOT

      FACTOR əmrinin yeganə variantlarıdır ki, FACTOR proqramına verilən bütün digər təlimatlar ayrı əmrlər şəklində verilir.

      Faktorların sayını idarə etmək üçün istifadə edə biləcəyiniz iki əmr var: NUMBER və EIGEN. Əmr

      FAKTOR -a 4 faktor çıxarmağı tapşırır. Əmr

      FACTOR -a yuxarıdakı öz dəyərlərin sayına bərabər olan bir sıra faktorları seçməyi tapşırır .5. Beləliklə, bir korrelyasiya matrisini əmr edərkən

      amillərin sayını seçmək üçün Kaiser qaydasını tətbiq edir. Varsayılan olaraq FACTOR -un bütün mümkün faktorları əldə etməsinə səbəb olan EIGEN = 0 -dır. Həm NUMBER, həm də EIGEN əmrlərindən istifadə edirsinizsə, FACTOR hansı qaydanın daha az sayda faktor istehsal etdiyinə əməl edəcək.

      Tək sözlü SORT əmri, faktor yükləmə matrisini çap edərkən FACTOR-un dəyişənləri faktor yüklərinə görə sıralamasına səbəb olur. Xüsusilə, FACTOR -u əvvəlcə faktor 1 -də .5 -dən yuxarı yüklənən bütün dəyişənləri, sonra faktor 2 -də .5 -dən yuxarı yüklənən bütün dəyişənləri çap etməyə məcbur edəcək. əvvəlcə ən yüksək yüklənmə ilə uyğun faktor. Bu sıralama sadə bir quruluş üçün faktor quruluş matrisini araşdırmağı asanlaşdırır.

      ROTATE əmri fırlanma üsulunu seçməyə imkan verir. Seçimlər belədir

      Bu üsullar arasındakı fərqlər bu fəslin əhatə dairəsindən kənardadır. Hər halda, rotasiya faktor quruluşunun məlumatlara uyğunluğunu təsir etmir, buna görə də istəsəniz hamısını istifadə edib nəticələrini ən çox bəyəndiyiniz birini seçə bilərsiniz. Əslində, bu ümumiyyətlə edilir. Varsayılan rotasiya metodu varimaxdır, buna görə yalnız ROTATE yazmaq varimax tətbiq edir.

      Faktor analizinin nəticələrini fayllara saxlamaq üçün üç seçim var. Bunu etmək üçün FACTOR əmrindən əvvəl SAVE əmrindən istifadə edin. Əmr

      əsas komponentlərdəki puanları MYFILE adlı bir faylda saxlayır. Bu ümumi faktor təhlili ilə istifadə edilə bilməz (IPA seçimi), çünki ümumi faktor skorları müəyyən edilməmişdir. Əmr

      komponentləri təyin etmək üçün istifadə olunan əmsalları saxlayır. Bu əmsallar bir mənada faktor yükləmələrinin əksidir. Yükləmə faktorlardan asılı olaraq dəyişənləri proqnozlaşdırır, əmsallar faktorları orijinal dəyişənlər baxımından təyin edir. Bir fırlanma təyin etsəniz, əmsallar dönən komponentləri təyin edənlərdir. Əmr

      ümumi amil təhlili və ya komponent analizi ilə istifadə edilə bilən faktor yüklərinin matrisini saxlayır. Yenə də bir fırlanma təyin etsəniz, saxlanan yüklər dönən amillər üçündür.

      Çıxış

      • öz dəyərləri
      • faktor yükləmə matrisi (IPA üçün faktor nümunəsi adlanır)
      • amillərlə izah edilən fərqlilik (adətən öz dəyərlərinə bərabərdir)
      • amillərlə izah edilən variasiya nisbəti
      • ilkin icma hesablamaları
      • icma təxminlərində dəyişikliklər indeksi
      • yekun icma təxminləri
      • Giriş korrelyasiyası və ya kovarians matrisi R
      • Qalıq kovarianların matrisi-U-nun diaqonal olmayan hissəsi
      • qorxulu bir süjet
      • faktor yükləmə sahələri, bir anda iki faktor

      Nümunə

      usdata istifadə edin
      döndür = varimax
      cür
      uzun çap edin
      sayı = 2
      faktor kardio, xərçəng, pulmonar, pneu_flu, diabet, qaraciyər / ipa, süjet

      Aydınlaşdırmaq üçün bir neçə kiçik düzəliş və faktor yükləmələri istisna olmaqla, bu əmrlər aşağıdakı nəticəni verəcəkdir:

      ƏDƏBİYYATLAR

      Gorsuch, Richard L. (1983) Faktor təhlili. Hillsdale, NJ: Erlbaum

      Morrison, Donald F. (1990) Çox dəyişkən statistik metodlar. New York: McGraw-Hill.

      Rubenstein, Amy S. (1986). Zəka marağının anket tipli tədbirlərinin maddə səviyyəsində təhlili. Cornell Universiteti Doktorluq dissertasiyası.

      Galina Mikloşiçin bu məqaləsinin Belarus dilinə tərcüməsini oxumaq üçün bura vurun.


      Ümumi dispersiya izah edildi

      Öz dəyər əslində cəmi faktor analizinə məruz qalan maddələrin sayına bərabər olan çıxarılmış faktorların sayını əks etdirir. Növbəti maddə analizdən çıxarıla bilən bütün faktorları öz dəyərləri ilə birlikdə göstərir.

      Öz dəyər cədvəli üç alt hissəyə bölünmüşdür, yəni İlkin Öz Dəyərləri, Kvadrat Yüklərin Çıxarılan Cəmləri və Kvadrat Yüklərin Cəminin Dönməsi. Təhlil və təfsir məqsədi ilə yalnız Kvadrat Yüklərin Çıxarılan Cəmləri ilə maraqlanırıq. Burada nəzərə alınmalıdır ki, birinci faktor varyansın 46.367%, ikincisi 18.471% və üçüncü 17.013% -dir. Qalan bütün amillər əhəmiyyətli deyil (Cədvəl 5).

      1. Komponent: Yuxarıdakı İcmalar Cədvəli 3 -də göründüyü kimi, Cədvəl 3 altında 1 sütunda göstərilən 8 komponent var.
      2. İlkin Öz Dəyərlər Cəmi: Ümumi dispersiya.
      3. İlkin Öz Dəyişikliklərin % -i: Hər bir amilə aid olan variasiya faizi.
      4. İlkin Öz Dəyərlər Kümülatif %: Əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.
      5. Kvadrat yüklərin hasilatı cəmi: Çıxarışdan sonra ümumi dispersiya.
      6. Kvadrat yüklərin çıxarılma məbləği % varyans: Çıxarıldıqdan sonra hər bir faktora aid olan variasiya faizi.Bu dəyər bizim üçün əhəmiyyətlidir və buna görə də bu addımda müəyyən bir məhsulu kiməsə verməyə kömək edən üç faktor olduğunu müəyyən edirik.
      7. Kvadrat Kümülatif Çıxarma Məbləği: Çıxarıldıqdan sonra əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.
      8. Kvadrat yüklərin cəminin fırlanması Cəmi: Dönüşdən sonra ümumi variasiya.
      9. Kvadrat yüklərin cəminin dəyişməsi % varyans: Rotasiya sonrası hər bir faktora aid olan variasiya faizi.
      10. Kvadrat yüklərin cəminin fırlanması Kümülatif %: Əvvəlki faktorlara əlavə edildikdə faktorun məcmu varyansı.

      Şəxsiyyət/Xarakter Nörobiliminin Şəbəkə Analizi ilə İnteqrasiyası

      3.1.1 Faktorların Təhlili

      Faktor təhlili, müşahidə olunan, təzahür edən və ya ölçülən dəyişənlərə səbəb olan gizli dəyişənlər və ya "amillər" baxımından birliklərin quruluşunu konseptuallaşdırır. Faktor təhlili (və yaxından əlaqəli əsas komponentlərin təhlili) bunu, təhlildə müşahidə olunan digər dəyişənlərlə müqayisədə bir-biri ilə daha çox oxşarlığı olan müşahidə olunan dəyişənlər dəstlərini müəyyən etməklə həyata keçirir. Faktor təhlili, müşahidə olunan dəyişənlər arasında iki tərəfli birləşmələrin korrelyasiya matrisi ilə başlayır. Konseptual olaraq, faktor təhlili hansı müşahidə olunan dəyişənlərin bir araya gəldiyini müəyyən etmək üçün matrisi tarar. Bir -biri ilə güclü əlaqəli və digər qruplarda müşahidə olunan dəyişənlərlə zəif əlaqəli olan dəyişənlərin qruplarını axtarır. Daha texniki cəhətdən, müşahidə olunan dəyişənlərdə mümkün qədər çox dəyişikliyə səbəb olan faktorları çıxarır.

      Kəşfiyyat amili təhlili, tez-tez təkrarlanan, irəli və irəli gedən addımlar kimi qəbul edilə bilər: hasilat, bir sıra amillərin seçilməsi, fırlanma və faktor yüklərinin və (potensial) faktor korrelyasiyalarının araşdırılması. 79 İlk addım, müşahidə olunan dəyişənlərin birləşməsini müəyyən edən bir "çıxarma metodu" tətbiq etməyi əhatə edir və bu birləşmələrə amillər deyilir. Bir neçə növ hasilat üsulu var, lakin əsas ox faktoru təhlili və əsas komponent analizi ən çox istifadə olunur. Çıxarış bir istehsal edir özünəməxsus dəyər hər bir potensial faktor üçün, müşahidə edilən dəyişənlər olduğu qədər çox potensial faktor üçün. Bir faktorun öz dəyəri, faktorla izah edilən müşahidə olunan dəyişənlərdəki fərqin miqdarı olaraq görülə bilər.

      İkinci addımda, tədqiqatçılar orijinal dəyişənlər arasındakı əlaqələri adekvat şəkildə ümumiləşdirən amillərin sayına qərar verirlər. "Uyğun" amillərin sayı qeyri-müəyyən ola bilər, lakin bu prosesdə kömək edəcək əsas qaydalar var. Ümumi qaydalar ümumiyyətlə özünəməxsus dəyərlərin nisbi böyüklüyündən asılıdır, lakin qərarı məlumatlandırmaq üçün sonrakı addımlardan alınan məlumatlar istifadə edilə bilər (məsələn, faktor yüklərinin aydınlığı, 4-cü addıma baxın).

      Üçüncü addımda, tədqiqatçılar faktorların psixoloji mənasını aydınlaşdırmaq üçün ümumiyyətlə "rotasiya" dan istifadə edirlər. Rotasiya istehsal etmək üçün nəzərdə tutulmuşdur sadə quruluş, hər müşahidə olunan dəyişənin bir faktor və yalnız bir faktorla (yəni "yüklənmə") güclü şəkildə birləşdiyi assosiasiya nümunəsi. İki ümumi fırlanma növü var: ortogonal fırlanma əlaqəsiz faktorlar yaradır və oblique rotasiya bir -biri ilə əlaqələndirilə bilən faktorlar yaradır.

      Dördüncüsü, tədqiqatçılar əsas statistik nəticələrə, ilk növbədə faktor yükləmələrinə və (əgər varsa) interaktor əlaqələrinə əsaslanaraq psixoloji nəticələr çıxarırlar. Faktor yükləmələri, müşahidə olunan hər bir dəyişənlə hər bir faktor arasındakı əlaqəni təmsil edən dəyərlərdir. Hansı müşahidə olunan dəyişənlərin hər bir faktorla ən çox əlaqəli olduğunu qeyd edərək, tədqiqatçılar faktorların psixoloji mənasını şərh edə bilərlər. İstehsal edilə bilən bir neçə növ faktor yükləməsi var, lakin hamısı təxminən və ya hərfi mənada −1 və ya +1 -ə yaxın olan güclü birləşmələri əks etdirən korrelyativ metrik üzərindədir və 0 -a yaxın dəyərlər yox olduğunu göstərir müşahidə olunan dəyişənlə faktor arasındakı əlaqə. Tədqiqatçılar birdən çox faktor çıxarıb oblique rotasiya tətbiq etdikdə və müşahidə olunan dəyişənlərin altında yatan ölçülərin bir -biri ilə necə əlaqəli olduğunu ortaya qoyduqda interfaktor əlaqələri əldə edilir.


      Bir Faktor Analizindən İndeks Hesabını Necə Hesablamaq olar

      Əsas Komponent Analizini (PCA) və ya Faktor Analizini (FA) işə salmağın ümumi səbəblərindən biri dəyişkən azalmadır.

      Başqa sözlə, Anksiyete kimi bir şeyi ölçmək üçün nəzərdə tutulan 10 maddəlik bir miqyasla başlaya bilərsiniz, bunu bir sualla dəqiq ölçmək çətindir.

      Analizdə hər 10 maddəni fərdi dəyişən kimi istifadə edə bilərsiniz və bəlkə də bir reqressiya modelində proqnozlaşdırıcı olaraq.

      Ancaq bir ilə başa çatırsınız qarışıqlıq.

      Yalnız bütün bu əmsalları şərh etməkdə çətinlik çəkməyəcəksiniz, həm də çoxsaylı xətlər probleminiz ola bilər.

      Və ən əsası, təsiri ilə maraqlanmırsınız hər biri nəticənizdən asılı olaraq 10 fərdi maddə. Anksiyete təsiri ilə maraqlanırsınız bütünlüklə.

      Beləliklə, FA və ya PCA kimi dəyişkən azalma texnikasına müraciət edərək, əlaqədar 10 dəyişəni Anksiyete quruluşunu təmsil edən birinə çeviririk.

      FA və PCA fərqli nəzəri əsaslara və fərziyyələrə malikdir və fərqli vəziyyətlərdə istifadə olunur, lakin proseslər çox oxşardır. Bu nümunə üçün burada FA istifadə edəcəyik.

      Beləliklə, yaxşı bir faktor analitik həllini uğurla hazırladığınızı söyləyin və bu 10 maddənin hamısının Anksiyete olaraq şərh edilə bilən tək bir faktoru təmsil etdiyini söyləyin. Bu 10 maddəni vahid bir indeksdə birləşdirməyin iki oxşar, lakin nəzəri cəhətdən fərqli yolları var.

      Faktor Puanları

      Faktor Analizi çıxışının bir hissəsi faktor yükləmələri cədvəlidir. Hər bir maddənin yüklənməsi, bu maddənin əsas faktorla nə qədər əlaqəli olduğunu göstərir.

      Bəzi yükləmələr o qədər aşağı olacaq ki, bu maddəni faktorla əlaqəsi olmadığını düşünərdik və indeksə daxil etmək istəməzdik.

      Ancaq kifayət qədər yüksək yüklənmiş əşyalar arasında belə, yükləmələr bir qədər dəyişə bilər. Bu yükləmələr bir -birindən çox fərqlidirsə, indeksin hər bir maddənin faktorla qeyri -bərabər əlaqəli olduğunu əks etdirməsini istəyirsiniz.

      Maddələri birləşdirmək üçün bir yanaşma, indeks dəyişənini an vasitəsilə hesablamaqdır optimal çəkili Faktor Puanları adlanan maddələrin xətti birləşməsi. Hər bir maddənin çəkisi faktor yüklənməsindən qaynaqlanır. Beləliklə, hər bir maddənin faktor hesabına verdiyi töhfə, faktorla nə dərəcədə əlaqəli olduğuna bağlıdır.

      Faktor skorları əslində maddələrin ağırlıqlı cəmidir. Bu ağırlıqların hamısı -1 ilə 1 arasında olduğu üçün faktor ballarının miqyası təmiz bir məbləğdən çox fərqli olacaq. Faktor skorlarını standart ağırlıqlı ortalamalar kimi düşünməyi faydalı hesab edirəm.

      Faktor əsaslı ballar

      İkinci, daha sadə yanaşma, çəkiləri nəzərə almadan xətti birləşməni hesablamaqdır. İstər bir məbləğ, istərsə də ortalama işləyir, ortalamalar maddələrlə eyni miqyasda olmaq üstünlüyünə malikdir.

      Bu yanaşmada, hər bir faktora hansı maddələrin yükləndiyini müəyyən etmək üçün Faktor Analizini aparırsınız və sonra hər bir faktor üçün maddələri birləşdirirsiniz.

      Bu yeni dəyişənin texniki adı faktor əsaslı bir hesabdır.

      Faktor əsaslı ballar, yüklərin hamısının oxşar olduğu hallarda məna kəsb edir. Bu vəziyyətdə, çəkilər onsuz da çox şey etməzdi.

      Hansı Puanlardan istifadə etməli?

      Faktor Skorlarından istifadə etmək heç vaxt səhv deyil. Faktor yükləmələri çox fərqli olarsa, faktorun daha yaxşı bir nümayəndəsidir. Və bütün proqramlar onları tez və asanlıqla məlumat dəstinizə əlavə edəcək.

      Faktor əsaslı skorların iki üstünlüyü var. Birincisi, ümumiyyətlə daha intuitivdirlər. Tədqiqat aparmayan bir auditoriya, standartlaşdırılmış optimal çəkili xətti birləşmədən daha yaxşı bir orta maddə anlaya bilər.

      İkincisi, nümunələr arasında fərqlənən çəkilərdən narahat olmaq lazım deyil. Faktor yükləmələri fərqli nümunələrdə oxşar olmalıdır, lakin eyni olmayacaq. Bu faktiki faktor skorlarını təsir edəcək, lakin faktor əsaslı puanlara təsir etməyəcək.

      Ancaq faktor əsaslı skorlardan istifadə etməzdən əvvəl yükləmələrin həqiqətən oxşar olduğundan əmin olun. Əks təqdirdə, faktorunuzu səhv təqdim edə bilərsiniz.


      Faktor təhlili

      Faktor təhlili, müşahidə olunan bir çox dəyişən arasındakı korrelyasiyanı təhlil etmək və gizli faktorları araşdırmaq üçün hazırlanmış çoxfunksiyalı bir texnikadır. Bu fəsil 20 -ci əsrin əvvəllərindən bəri faktor analizinin təkamülünə və müxtəlif sahələrdə tətbiq olunan tədqiqatlara nəzər salmağa imkan verir. Bu gün faktor təhlili təkcə psixologiya sahəsində deyil, siyasət, ədəbiyyat, biologiya və tibb elmi kimi sahələrdə də geniş istifadə olunur. Məsələn, antropologiyada morfoloji biliklər insan sümüklərinin ölçülmüş əlamətləri arasındakı korrelyasiyaların təhlili və heyvan və bitkilərin ölçülmüş xüsusiyyətlərinin faktor təhlili ilə əldə edilmişdir. Fəsildə faktor təhlili modeli təqdim olunur və faktor analizində statistik nəticə çıxarılır. Faktor analizində parametr qiymətləndirmələrinin standart səhvləri üçün düsturlar mürəkkəbdir və ya qapalı formalarda ifadə oluna bilməz. Bootstrap metodlarının üstünlüklərindən biri də analitik törəmələr olmadan istifadə edilməsidir. Bununla birlikdə, faktor analizində bootstrap metodlarından istifadə etmək üçün ehtiyatlı olmaq lazımdır. Fəsil eyni zamanda faktor rotasiyası və faktor skorlarının qiymətləndirilməsinin müxtəlif üsullarını əhatə edir.


      İcmalar

      Çıxışdan sonrakı maddə, nə qədər dəyişikliyin olduğunu göstərən cəmiyyətlər cədvəlidir (yəni daha çox təhlil üçün nəzərə alınmalı olan 0,5 -dən çox olan icma dəyəri. Başqa bir halda bu dəyişənlər faktor analizindən sonrakı addımlardan silinəcəkdir). dəyişənlər çıxarılan amillərlə uçota alınmışdır. Məsələn bitdi

      "Məhsulun keyfiyyəti" fərqinin 90% -i, "Məhsulun mövcudluğu" fərqinin 73,5% -i (Cədvəl 4).


      Məzmuna Önizləmə

      Faktor təhlili daha az sayda müşahidə olunmayan (gizli) "amillər" baxımından müşahidə olunan dəyişənləri və onların kovarians quruluşunu modelləşdirmək üçün bir üsuldur. Faktorlara ümumiyyətlə müşahidə olunan bir fenomeni təsvir edə biləcək geniş anlayışlar və ya fikirlər kimi baxılır. Məsələn, müəyyən bir sosial səviyyəyə sahib olmaq istəyi istehlak davranışının çoxunu izah edə bilər. Bu müşahidə olunmayan amillər sosial alim üçün müşahidə olunan kəmiyyət ölçmələrindən daha maraqlıdır.

      Faktor təhlili ümumiyyətlə bir çox subyektiv mühakimə tələb edən kəşfiyyat/təsvir üsuludur. Modellər, metodlar və subyektivlik o qədər çevik olduğu üçün şərhlərlə bağlı mübahisələr yarana biləcəyi üçün geniş istifadə olunan və tez -tez mübahisəli bir vasitədir.

      Metod əsas komponentlərə bənzəyir, baxmayaraq ki, dərslikdə göstərildiyi kimi, faktor təhlili daha mürəkkəbdir. Bir mənada faktor təhlili əsas komponentlərin tərsinə çevrilməsidir. Faktor analizində müşahidə olunan dəyişənləri "amillərin" xətti funksiyaları olaraq modelləşdiririk. Əsas komponentlərdə, müşahidə olunan dəyişənlərin xətti birləşmələri olan yeni dəyişənlər yaradırıq. Həm PCA, həm də FA -da məlumatların ölçüsü azalır. Xatırladaq ki, PCA -da əsas komponentlərin təfsiri çox vaxt çox təmiz deyil. Xüsusi bir dəyişən, bəzən birdən çox komponentə əhəmiyyətli dərəcədə kömək edə bilər. İdeal olaraq, hər bir dəyişənin yalnız bir komponentə əhəmiyyətli dərəcədə töhfə verməsini istəyirik. Bu məqsədə doğru faktor rotasiyası adlı bir texnika tətbiq olunur. Faktor analizinin iştirak etdiyi sahələrə nümunələr arasında fiziologiya, sağlamlıq, zəka, sosiologiya və digərləri arasında ekologiya da var.


      Faktor Analizi: Qısa Giriş, 2 -ci hissə –Rotasiyalar

      Faktor analizinin vacib bir xüsusiyyəti, faktorların oxlarının çoxölçülü dəyişən məkan daxilində dönə bilməsidir. Bunun mənası nədir?

      Sadə dillə desək, dəyişənlər və gizli faktorlar arasında ən yaxşı uyğunluğu müəyyən edərkən bir faktor təhlili proqramının etdiyi işlər: Bir faktor analizinə girən 10 dəyişənin olduğunu düşünün.

      Proqram əvvəlcə dəyişənlərlə gizli faktor arasındakı ən güclü korrelyasiyanı axtarır və bunu 1 -ci Faktor halına gətirir. Vizual olaraq bunu bir ox kimi düşünmək olar (Axis 1).

      Faktor təhlili proqramı sonra korrelyasiyaların ikinci dəstini axtarır və onu Faktor 2 adlandırır və s.

      Bəzən, ilkin həll bir dəyişənin bir neçə faktorla güclü əlaqəsi və ya heç bir faktorla heç bir güclü əlaqəsi olmayan bir dəyişənlə nəticələnir.

      Baltaların yerini faktiki məlumat nöqtələrinə daha yaxşı uyğunlaşdırmaq üçün proqram baltaları döndərə bilər. İdeal olaraq, rotasiya faktorları daha asan təfsir edəcək.

      Yalnız iki ölçü (x və y oxu) olduqda fırlanma zamanı nələrin baş verdiyini görərik:

      Orijinal x və y oxları qara rəngdədir. Fırlanma zamanı baltalar faktiki məlumat nöqtələrini ümumilikdə daha yaxşı əhatə edən mövqeyə keçir.

      Proqramlar bir çox növ rotasiya təklif edir. Aralarındakı əhəmiyyətli bir fərq, bir -biri ilə əlaqəli və ya əlaqəsiz faktorlar yarada bilmələridir.

      Korrelyasiyaya imkan verən rotasiyalar deyilir oblique rotations amillərin əlaqəli olmadığını düşünən rotasiyalar deyilir ortogonal rotasiyalar. Qrafikimiz ortogonal fırlanmanı göstərir.

      Bir daha, gəlin sərvət göstəricilərini araşdıraq.

      Təsəvvür edək ki, ortogonal fırlanma əvvəllər göstərildiyi kimi alınmadı. Əksinə, bu nəticəni əldə edirik:

      Dəyişənlər Faktor 1 Faktor 2
      Gəlir 0.63 0.14
      Təhsil 0.47 0.24
      Peşə 0.45 0.22
      Ev dəyəri 0.39 0.25
      Qonşuluqdakı ictimai parkların sayı 0.12 0.20
      İllik zorakılıq cinayətlərinin sayı 0.21 0.18

      Aydındır ki, heç bir dəyişən Faktor 2 -yə çox yüklənmir. Nə oldu?

      İlk cəhdimiz ortogonal fırlanma olduğundan Faktor 1 və 2 -nin əlaqəli olmadığını qeyd etdik.

      Ancaq yüksək "Fərdi sosial -iqtisadi statusu" (Faktor 1) olan bir insanın "Qonşuluq sosial -iqtisadi statusu" (Faktor 2) olan bir ərazidə yaşadığını da düşünmək məntiqlidir. Bu faktorlar deməkdir olmalıdır əlaqələndirmək

      Nəticə etibarilə, iki faktorun iki oxu ortogonal fırlanmanın edə biləcəyindən daha yaxındır. Faktorların bir -biri ilə əlaqəli olduğu yeni nümunəmiz üçün baltaların əyri fırlanmasının görüntüsü:

      Aydındır ki, iki faktor arasındakı açı indi 90 dərəcədən kiçikdir, yəni faktorlar indi əlaqəlidir. Bu nümunədə, oblique rotasiya, məlumatları ortogonal fırlanmadan daha yaxşı yerləşdirir.


      I. Kəşfiyyat Faktoru Analizi (EFA)

      • Giriş
        1. Həvəsləndirici nümunə: SAQ
        2. Pearson korrelyasiya düsturu
        3. Faktor analizində fərqliliyin bölünməsi
      • Çıxarıcı amillər
        1. əsas komponentlərin təhlili
        2. ümumi amil təhlili
          • əsas ox faktorinqi
          • maksimum ehtimal
          1. Sadə quruluş
          2. Ortogonal fırlanma (Varimax)
          3. Eğik (birbaşa oblimin)


          Videoya baxın: Sizdən gələn sual: Konvergent və Divergent təfəkkür (Yanvar 2022).