Domov Novice Kaj je predobdelava podatkov? - definicija iz tehopedije

Kaj je predobdelava podatkov? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni predhodna obdelava podatkov?

Predobdelava podatkov je tehnika rudarjenja podatkov, ki vključuje pretvorbo surovih podatkov v razumljiv format. Podatki iz resničnega sveta so pogosto nepopolni, nedosledni in / ali manjkajo določenega vedenja ali trendov in verjetno vsebujejo veliko napak. Predobdelava podatkov je preizkušen način reševanja takšnih vprašanj. Predobdelava podatkov pripravi neobdelane podatke za nadaljnjo obdelavo.


Predobdelava podatkov se uporablja v aplikacijah, ki temeljijo na bazi podatkov, kot so upravljanje odnosov s strankami in aplikacije, ki temeljijo na pravilih (na primer nevronske mreže).

Techopedia razlaga predobdelavo podatkov

Med predobdelavo podatkov gre skozi več korakov:

  • Čiščenje podatkov: Podatki se očistijo s postopki, kot so izpolnjevanje manjkajočih vrednosti, glajenje hrupnih podatkov ali odpravljanje neskladnosti v podatkih.
  • Integracija podatkov: Podatki z različnimi predstavitvami so sestavljeni in znotraj njih se rešujejo konflikti.
  • Preoblikovanje podatkov: Podatki so normalizirani, združeni in posplošeni.
  • Zmanjšanje podatkov: Ta korak je namenjen predstavitvi zmanjšane zastopanosti podatkov v podatkovnem skladišču.
  • Diskretizacija podatkov: vključuje zmanjšanje števila vrednosti neprekinjenega atributa z deljenjem obsega atributnih intervalov.
Kaj je predobdelava podatkov? - definicija iz tehopedije