Kazalo:
Opredelitev - Kaj pomeni spletni rudarjenje?
Spletno rudarjenje je postopek uporabe tehnik in algoritmov za pridobivanje podatkov za pridobivanje informacij neposredno iz spleta z izvlečenjem iz spletnih dokumentov in storitev, spletne vsebine, hiperpovezav in strežniških dnevnikov. Cilj spletnega rudarjenja je iskati vzorce spletnih podatkov z zbiranjem in analizo informacij, da bi dobili vpogled v trende, industrijo in uporabnike na splošno.Techopedia razlaga spletno rudarjenje
Spletno rudarjenje je veja podatkovnega rudarjenja, ki se osredotoča na svetovni splet kot primarni vir podatkov, vključno z vsemi njegovimi komponentami iz spletne vsebine, strežniških dnevnikov in vsega vmes. Vsebina podatkov, izkopanih iz spleta, je lahko zbirka dejstev, ki naj bi jih vsebovale spletne strani in so lahko sestavljene iz besedila, strukturiranih podatkov, kot so seznami in tabele, in celo slike, video in zvok.
Kategorije spletnega rudarjenja:
- Rudarjenje spletnih vsebin - to je postopek pridobivanja koristnih informacij iz vsebine spletnih strani in spletnih dokumentov, ki so večinoma besedilne, slike in avdio / video datoteke. Tehnike, uporabljene v tej disciplini, so bile v veliki meri črpane iz obdelave naravnega jezika (NLP) in iskanja informacij.
- Spletna struktura rudarjenja - To je postopek analize vozlišč in povezovalne strukture spletnega mesta z uporabo teorije grafov. Iz tega je mogoče pridobiti dve stvari: strukturo spletnega mesta glede na to, kako je povezana z drugimi spletnimi mesti in dokumentacijsko strukturo samega spletnega mesta glede povezave vsake strani.
- Spletna uporaba rudarjenja - to je postopek pridobivanja vzorcev in informacij iz dnevnikov strežnikov, s katerim pridobite vpogled v uporabnikovo aktivnost, vključno s tem, od kod uporabniki, koliko je kliknilo element na spletnem mestu in vrste dejavnosti, ki se izvajajo na spletnem mestu.
