V:
Zakaj je matrika zmede uporabna v ML?
A:Obstaja več načinov, kako govoriti o tem, zakaj je matrika zmede koristna pri strojnem učenju (ML) - vendar je eden najpreprostejših načinov razložiti, da je matrika zmede vir za vizualizacijo podatkov.
Matrica zmede gledalcem omogoča, da na prvi pogled vidijo rezultate uporabe klasifikatorja ali drugega algoritma. Z uporabo preproste tabele za prikaz analitičnih rezultatov matrika zmede v bistvu spušča vaše rezultate v bolj prebavljiv pogled.
Matrica zmede uporablja določeno terminologijo za urejanje rezultatov. Obstajajo resnični pozitivni in resnični negativi ter lažni pozitivni in lažni negativi. Za bolj zapleteno matriko zmede ali tisto, ki temelji na primerjalni klasifikaciji, se lahko te vrednosti prikažejo kot dejanski in predvideni razredi za dva različna predmeta.
Ne glede na pomensko terminologijo so rezultati razvrščeni v kvadratno (ali pravokotno) tabelo.
Ta pogled analitikom olajša, da vidijo, kako natančen je bil algoritem pri razvrščanju rezultatov. (Preberite nove generatorje, da sodobni algoritmi delujejo na ASCII Art.)
Uporabnost matrike zmede je povezana s kompleksnostjo projektov ML in s tem, kako se informacije oblikujejo in posredujejo uporabnikom. Predstavljajte si niz linearnih rezultatov, ki vključujejo lažne pozitivne, lažne negativne, resnične pozitivne in resnične negative. (Preberite Strojno učenje 101.)
Uporabnik bi moral vse te linearne rezultate tabelotirati v graf, da bi razumel, kako algoritem deluje in kako natančen je. Z matriko zmede so te informacije preprosto predstavljene v zmogljivem vizualnem modelu.
Recimo, da stroj zahteva, da razvrsti 20 slik, od tega pet sadja in pet zelenjave. Če ima matrika zmede naslednjo vsebino (zgoraj levo v smeri urinega kazalca): 7, 5, 3, 5, potem iz matrice je razvidno, da je bilo sedem pravilno označenih kot zelenjava, tri pa pravilno razvrščene kot sadje.
Ostalih 10, kot je predstavljeno, so rezultati, ko program ni pravilno določil slike.
Matrika zmede bo uporabna pri vseh vrstah analitike ML. Z opazovanjem tega vira lahko uporabniki ugotovijo, kako rešiti težave, kot so dimenzionalnost in prekomerno opremljanje, ter druge načine za optimizacijo algoritma.