V:
Kako lahko nove zmogljivosti strojnega učenja omogočijo kopanje dokumentov o zalogah za finančne podatke?
A:Eno izmed vznemirljivih novih meja strojnega učenja in AI je, da se znanstveniki in inženirji lotijo različnih načinov uporabe popolnoma novih vrst virov za napovedovanje gibanja zalog in naložbenih rezultatov. To je izjemen menjalnik iger v finančnem svetu in bo zelo globoko spremenil naložbene strategije.
Ena izmed temeljnih idej za razširitev tovrstnih zalog je računalniška lingvistika, ki vključuje modeliranje naravnega jezika. Strokovnjaki raziskujejo, kako uporabiti besedilne dokumente, od vložitev SEC do pisem delničarjev do drugih obrobnih virov, ki temeljijo na besedilu, da bi izboljšali ali prilagodili analizo zalog ali razvili povsem nove analize.
Prosti prenos: Strojno učenje in zakaj je pomembno |
Pomembna izjava o omejitvi odgovornosti je, da je vse to izvedljivo le s povsem novimi napredki nevronskih mrež, strojnim učenjem in analizo naravnega jezika. Pred nastopom ML / AI so računalniške tehnologije večinoma uporabljale linearno programiranje za "branje" vhodov. Besedilni dokumenti so bili preveč nestrukturirani, da bi bili uporabni. Toda z napredkom, doseženim v analizi naravnih jezikov v zadnjih nekaj letih, znanstveniki ugotavljajo, da je mogoče "rudariti" naravni jezik za merljive rezultate ali z drugimi besedami, rezultate, ki jih je mogoče na nek način izračunati.
Nekateri najboljši dokazi in najbolj uporabni primeri tega izhajajo iz različnih disertacij in doktorskega dela, ki so na voljo na spletu. V prispevku "Aplikacije strojnega učenja in računalniške jezikoslovja v finančni ekonomiji", objavljenega aprila 2016, Lili Gao z lahkoto razloži ustrezne procese, značilne za rudarjenje vložkov korporacije SEC, klice delničarjev in sporočila družbenih medijev.
"Črpanje pomembnih signalov iz nestrukturiranih in velikodimenzionalnih besedilnih podatkov ni lahka naloga, " piše Gao. "Vendar pa se z razvojem strojnega učenja in računalniške jezikovne tehnike lahko opravi obdelava in statistična analiza besedilnih dokumentov in številne aplikacije statistične analize besedila v družboslovju so se izkazale za uspešne." Iz Gaove razprave o modeliranju in umerjanju v povzetku celoten razvit dokument kaže, kako nekatere tovrstne analize podrobno delujejo.
Drugi viri za aktivne projekte vključujejo strani, kot je ta kratek projekt GitHub, in ta vir IEEE govori posebej o pridobivanju dragocenih finančnih informacij iz "analize občutkov na Twitterju."
Zaključek je v tem, da uporaba teh novih modelov NLP spodbuja hitre inovacije pri uporabi vseh vrst besedilnih dokumentov, ne le za finančno analizo, temveč tudi za druge vrste vrhunskih odkritij, ki zamegljujejo tradicionalno uveljavljeno črto med "jezikom" in "podatki."