Kazalo:
Opredelitev - Kaj pomenijo umazani podatki?
Umazani podatki se nanašajo na podatke, ki vsebujejo napačne informacije. Uporablja se lahko tudi pri sklicevanju na podatke, ki so v pomnilniku in še niso naloženi v zbirko podatkov. Popolna odstranitev umazanih podatkov iz vira je nepraktična ali skoraj nemogoča.
Naslednji podatki se lahko štejejo za umazane podatke:
- Zavajajoči podatki
- Podvojeni podatki
- Nepravilni podatki
- Netačni podatki
- Neintegrirani podatki
- Podatki, ki kršijo poslovna pravila
- Podatki brez posplošenega oblikovanja
- Nepravilno poudarjeni ali črkovani podatki
Tehopedia razlaga umazane podatke
Poleg nepravilnega vnosa podatkov se zaradi neprimernih načinov upravljanja in shranjevanja podatkov lahko ustvarijo tudi umazani podatki. Spodaj je razloženo nekaj umazanih podatkov:
- Nepravilni podatki - Če želite zagotoviti, da so podatki veljavni ali pravilni, mora biti vnesena vrednost v skladu z veljavnimi vrednostmi polja. Na primer, vrednost, vnesena v mesečno polje, mora biti od 1 do 12, starost posameznika pa mora biti manjša od 130. Pravilnost vrednosti podatkov je mogoče programsko uveljaviti s pomočjo preglednic pregledovanja ali s preverjanjem urejanja.
- Nenatančni podatki - Mogoče je, da je vrednost podatkov lahko pravilna, ni pa natančna. Včasih je praktično preučiti druge datoteke ali polja in ugotoviti, ali je vrednost podatkov natančna glede na kontekst, ki ga uporabljamo. Kljub temu pa je mogoče natančnost pogosto potrditi le z ročnim preverjanjem.
- Kršitve poslovnih pravil - Podatki, ki kršijo poslovna pravila, so druga vrsta umazanih podatkov. Na primer, datum veljavnosti mora biti vedno pred datumom izteka veljavnosti. Drug primer kršitve poslovnih pravil je lahko pacientova zavarovalna zavarovalnica Medicare, kadar je bolnik še vedno pod upokojitveno starostjo in ni upravičen do Medicare.
- Neskladni podatki - Nenadzorovano odpuščanje podatkov vodi do neskladnosti podatkov. Vsaka organizacija vpliva na neskladne in ponavljajoče se podatke. To je še posebej značilno za podatke o strankah.
- Nepopolni podatki - Podatki z manjkajočimi vrednostmi so glavna vrsta nepopolnih podatkov.
- Podvojeni podatki - Podvojeni podatki se lahko pojavijo zaradi večkratnih predložitev, nepravilnega združevanja podatkov ali napake uporabnika.
Da bi izboljšali kakovost podatkov in preprečili umazane podatke, bi morale organizacije vključiti metodologije za zagotovitev popolnosti, veljavnosti, doslednosti in pravilnosti podatkov.
