Nykymaailmassa Apache Hadoop on saavuttanut suuren merkityksen yhteiskunnassa. Sen vaikutus on laajentunut eri alueille ja synnyttänyt keskustelua, keskustelua ja pohdintaa sen tärkeydestä ja vaikutuksista. Poliittisesta kulttuurisfääriin Apache Hadoop:stä on tullut yleistä kiinnostavaa aihetta, joka ei jätä ketään välinpitämättömäksi. Tässä artikkelissa tutkimme Apache Hadoop:n monia puolia analysoimalla sen kehitystä ajan myötä ja sen vaikutusta ihmisten jokapäiväiseen elämään. Lisäksi tarkastelemme Apache Hadoop:n ympärillä olevia eri näkökulmia ja tarjoamme täydellisen yleiskatsauksen sen vaikutuksista tämän päivän yhteiskuntaan.
Apache Hadoop | |
---|---|
Kehittäjä | Apache Software Foundation |
Kehityshistoria | |
Vakaa versio | 3.4.0 () |
Tiedot | |
Alusta | Alustariippumaton |
Ohjelmointikielet | Java |
Lisenssi | Apache 2 |
Aiheesta muualla | |
hadoop.apache.org | |
Versiohallinta |
Hadoop on Apache Software Foundationin avoimen lähdekoodin ohjelmisto suurien hajautettujen tietomäärien käsittelyyn. Projekti on kehitetty ns. Big data prosessointiin.
Hadoop-järjestelmän komponentit ovat:
Hadoopin MapReduce ja HDFS komponenttien konseptit perustuvat Googlen julkaisemiin papereihin Google MapReduce ja Google File System (GFS) komponenteista.
MapReduce on ohjelmointimalli, joka kerää tietoja avain/arvoparien perusteella (map toiminto) ja sulauttaa väliarvot samalle avaimelle (reduce toiminto).
Altior-yhtiön mukaan vuonna 2014 yli puolet Fortune 50 -listan yrityksistä käytti Hadoopia. Hadoop-markkinoiden arvoksi laskettiin globaalisti 1,5 miljardia dollaria vuonna 2012. Vuonna 2019 uutisoitiin Hadoop-markkinoiden pienentymisestä. Hadoopia on kutsuttu liian monimutkaiseksi ja asiakkaat eivät ole olleet tyytyväisiä. Useat Hadoop-käyttäjät ovat myöhemmin siirtyneet pilvipalveluihin omista useiden petatavujen järjestelmistä: suorituskyvyn sanotaan olevan tärkein ja kustannuksien toiseksi tärkein. Hadoop-perheeseen kuuluvat ohjelmistot kuten Apache Spark jatkavat vielä alkuperäisen Hadoopin ollessa "kuollut".
Facebook kehitti Hiven käsittelemään suuria tietojoukkoja, jotka ovat tallennettu Hadoopilla. Hive on abstraktio Hadoopin MapReducelle ja sisältää oman kyselykielen HiveQL. Clouderan kehittämä Impala kehitettiin ratkaisemaan rajoitteet Hadoop Sql:n käsittelyssä ja kyselyjä Hadoop-klustereista.