Kazalo:
SQL on Hadoop je skupina analitičnih aplikacijskih orodij, ki združujejo poizvedovanje in obdelavo podatkov v slogu SQL z najnovejšimi elementi ogrodja podatkov Hadoop. Pojav SQL na Hadoopu je pomemben razvoj za obdelavo velikih podatkov, saj širšim skupinam ljudi omogoča uspešno delo z okvirom za obdelavo podatkov Hadoop z izvajanjem SQL poizvedb o ogromni količini velikih podatkov, ki jih Hadoop obdeluje. Očitno okvir Hadoop prej ni bil tako dostopen ljudem, zlasti kar zadeva njegove možnosti poizvedovanja. Na podlagi razvoja je bilo v delu več orodij, ki obljubljajo izboljšanje produktivnosti podjetij pri kakovosti in hitrosti obdelave in analize velikih podatkov. Prav tako ni treba veliko vlagati v učenje orodja, kot bi to moralo storiti tradicionalno znanje SQL.
Opredelitev SQL na Hadoopu
SQL on Hadoop je skupina aplikacij, ki omogoča zagon poizvedb v slogu SQL na velikih podatkih, ki jih gosti Hadoop okvir za obdelavo podatkov. Očitno so poizvedovanje, iskanje in analiza podatkov postale lažje z dodajanjem SQL na Hadoop. Ker je bil SQL prvotno zasnovan za relacijske baze podatkov, ga je bilo treba spremeniti v skladu z modelom Hadoop 1, ki vsebuje MapReduce in sistem Hadoop Distributed File System (HDFS) ter model Hadoop 2, ki nima MapReduce in HDFS.
Eden prvih prizadevanj za združevanje SQL s Hadoopom je povzročil ustvarjanje podatkovnega skladišča Hive s programsko opremo HiveQL, ki bi lahko poizvedbe v slogu SQL prevedla v opravila MapReduce. Po tem je bilo razvitih več aplikacij, ki bi lahko opravile podobna dela. Med poznejšimi orodji so izstopali Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) in Tez (Hive on Tez).