Kazalo:
Opredelitev - Kaj pomeni karakterizacija?
Karakterizacija je metodologija velikih podatkov, ki se uporablja za ustvarjanje opisnih parametrov, ki učinkovito opisujejo značilnosti in obnašanje določene podatkovne postavke. To se nato uporabi v nenadzorovanih algoritmih učenja, da bi našli vzorce, grozde in trende, ne da bi vključevali oznake razredov, ki imajo lahko pristranskost. Uporablja se pri analizi grozdov in celo pri globokem učenju.
Tehopedija razlaga karakterizacijo
Karakterizacija velikih podatkov je tehnika za pretvorbo surovih podatkov v koristne informacije, ki se uporablja v algoritmih strojnega učenja in rudarjenja podatkov. Karakterizacija v bistvu ustvari zgoščene predstavitve ne glede na vsebino informacij, ki se skriva znotraj podatkov. Zato ga lahko uporabimo kot sredstvo za merjenje in spremljanje dogodkov, sprememb in novega nastajajočega vedenja v velikih dinamičnih pretokih podatkov.
Nekaj prednosti karakterizacije:
- Lahko ustvari uporabne meritve za sledenje in merjenje dogodkov in nepravilnosti v naborih podatkov
- Ustvari majhne predstavitve bistvenih informacij
- Hitro izvede pretvorbo podatkov v informacijo, kar industriji približa popolno preobrazbo med podatki in znanjem.
- Uporabna je za indeksiranje in označevanje določenih predmetov, dogodkov in drugih funkcij v zbirki podatkov
