Kazalo:
- Opredelitev - Kaj pomeni analiza glavnih komponent (PCA)?
- Tehopedia razlaga analizo glavnih komponent (PCA)
Opredelitev - Kaj pomeni analiza glavnih komponent (PCA)?
Analiza glavnih komponent (PCA) je tehnika, ki se uporablja za identifikacijo manjšega števila nekoreliranih spremenljivk, poznanih kot glavne komponente iz večjega niza podatkov. Tehnika se pogosto uporablja za poudarjanje variacij in zajem močnih vzorcev v naboru podatkov. Karl Pearson, ki ga je izumil leta 1901, je glavna komponentna analiza orodje, ki se uporablja v prediktivnih modelih in raziskovalnih analizah. Analiza glavnih komponent velja za uporabno statistično metodo in se uporablja na področjih, kot so stiskanje slike, prepoznavanje obrazov, nevroznanost in računalniška grafika.
Tehopedia razlaga analizo glavnih komponent (PCA)
Analiza glavnih komponent pomaga olajšati raziskovanje in vizualizacijo podatkov. Je preprosta neparametrična tehnika črpanja informacij iz zapletenih in zmede podatkovnih nizov. Analiza glavnih komponent je osredotočena na največjo količino odstopanja z najmanjšim številom glavnih komponent. Ena od glavnih prednosti, ki je povezana z analizo glavne komponente, je, da ko v zadevnih podatkih najdemo vzorce, se podpira tudi stiskanje podatkov. Eden uporablja analizo glavnih komponent za odpravo števila spremenljivk ali kadar je preveč napovedovalcev v primerjavi s številom opazovanj ali za izogibanje večkolinearnosti. Tesno je povezana s kanonično korelacijsko analizo in uporablja pravokotno transformacijo, da pretvori nabor opazovanj, ki vsebujejo korelirane spremenljivke, v niz vrednosti, znanih kot glavne sestavine. Število glavnih komponent, uporabljenih pri analizi glavnih komponent, je manjše ali enako manjšemu številu opazovanj. Analiza glavnih komponent je občutljiva na relativno skaliranje prvotno uporabljenih spremenljivk.
Analiza glavnih komponent se pogosto uporablja na številnih področjih, kot so tržne raziskave, družbene vede in v panogah, kjer se uporabljajo velike množice podatkov. Tehnika lahko pomaga tudi pri zagotavljanju spodnje dimenzijske slike izvirnih podatkov. Pri analizi glavnih komponent je potrebnih le minimalnih naporov za zmanjšanje zapletenega in zmede nabora podatkov v poenostavljen nabor koristnih informacij.
