V:
Kaj je bolje, platforma ali algoritem strojnega učenja na AWS?
A:Danes številna podjetja integrirajo rešitve strojnega učenja v svoje orodje za analitiko za izboljšanje upravljanja blagovnih znamk, izboljšanje uporabniške izkušnje in povečanje operativne učinkovitosti. Modeli strojnega učenja so osnovna sestavina rešitev strojnega učenja. Modeli se usposabljajo z uporabo matematičnih algoritmov in velikih nizov podatkov za zanesljive napovedi. Dva pogosta primera napovedi sta (1) določitev, ali niz finančnih transakcij kaže na goljufijo ali (2) ocenjevanje potrošnikovega občutka okoli izdelka na podlagi vložkov, zbranih iz družbenih medijev.
Amazon SageMaker je popolnoma upravljana storitev, ki razvijalcem in podatkovnim znanstvenikom omogoča gradnjo, usposabljanje in uporabo modelov strojnega učenja. V SageMaker-ju lahko uporabite algoritme "out of the box" ali pa pojdite po lastni poti za bolj prilagojeno rešitev. Obe izbiri sta veljavni in služita enako dobro kot osnova za uspešno rešitev strojnega učenja.
(Opomba urednika: Tukaj lahko vidite druge alternative SageMakerju.)
Aktualni algoritmi SageMaker vključujejo priljubljene, zelo optimizirane primere za razvrščanje slik, obdelavo naravnega jezika itd. Celoten seznam najdete tukaj .
- Prednosti zunaj okvira: Ti algoritmi so bili vnaprej optimizirani (in se nenehno izboljšujejo). Hitro ste lahko pripravljeni, tečete in uporabljate. Poleg tega je na voljo samodejna nastavitev hiperparametrov AWS.
- Nepomembna vprašanja: Neprekinjene izboljšave, omenjene zgoraj, ne bodo prinesle tako predvidljivih rezultatov, kot če bi imeli popoln nadzor nad izvajanjem svojih algoritmov.
Če ti algoritmi niso primerni za vaš projekt, imate na voljo tri druge možnosti: (1) Amazonova knjižnica Apache Spark, (2) koda Python po meri (ki uporablja TensorFLow ali Apache MXNet) ali (3) "prinesite svoje", kamor ste so v bistvu neobremenjeni, vendar boste morali ustvariti Dockerjevo sliko, da boste usposobili in uporabili svoj model (to lahko storite s pomočjo navodil tukaj ).
Pristop privoščite sebi ponuja popolno svobodo. To se lahko zdi privlačno za podatkovne znanstvenike, ki so že sestavili knjižnico prilagojene in / ali lastniške algoritmične kode, ki morda ni predstavljena v trenutnem naboru izven škatle.
- Predložite svoje-lastne prednosti: Omogoča popoln nadzor nad celotnim programom znanosti o podatkih skupaj z uporabo lastniškega IP-ja.
- Upoštevajte: Dockerization je potreben za usposabljanje in služenje nastalemu modelu. Vključitev algoritmičnih izboljšav je vaša odgovornost.
Ne glede na izbiro algoritma je SageMaker na AWS pristop, ki ga je vredno razmisliti, glede na to, koliko pozornosti je z vidika podatkov o znanosti usmerjeno v enostavnost uporabe. Če ste kdaj poskusili migrirati projekt strojnega učenja iz lokalnega okolja v gostitelja, boste prijetno presenečeni nad tem, kako brezhiben je SageMaker. In če začnete iz nič, ste že nekaj korakov bližje svojemu cilju, glede na to, koliko jih je že na dosegu roke.