V tomto článku se ponoříme do vzrušujícího světa Velká data, prozkoumáme jeho původ, vývoj a různé aplikace dnes. Od svého dopadu na společnost až po svůj význam v profesionální oblasti, Velká data zanechal nesmazatelnou stopu v různých aspektech našeho každodenního života. Postupem času hrál Velká data zásadní roli v historii a ovlivňoval kultury, trendy a hnutí po celém světě. Prostřednictvím hluboké analýzy prozkoumáme, jak Velká data formoval svět, který známe, a zanechal trvalý otisk v našem chápání reality. Připravte se objevovat fascinující aspekty Velká data a způsob, jakým nadále utváří naši současnost a budoucnost.
Velká data (anglicky big data, česky někdy veledata) jsou podle jedné z možných definic soubory dat, jejichž velikost je mimo schopnosti zachycovat, spravovat a zpracovávat data běžně používanými softwarovými prostředky v rozumném čase. Často bývá v textech na dané téma používáno i v češtině přímo big data jako pojem označující technickou kategorii, tedy bez překladu.
Velké objemy dat jsou nyní (2013) obvykle ukládány v datových skladech. Do datových skladů jsou ukládány z různých zdrojů a existujících informačních systémů pomocí procedur ETL. Většinou jde již o data ve strukturované podobě. Data jsou do datového skladu přenášena v předem daných cyklech a následně je nad nimi provedena analýza již připravenými algoritmy. Dalším běžným způsobem je provádění dalších analýz a výpočtů na vyžádání. Obvykle se v datových skladech pracuje s daty o objemu terabytů.
Na rozdíl od toho se v big datech hovoří o objemech dat v petabytech. Petabyte je 1 000 000 000 000 000 bytů, tedy 1015 bytů. Jde tedy o objemy o tři řády větší. Problematikou zpracování velkých objemů dat zabývají například i VLDB a XLDB.
Kategorie big data nelze zjednodušit na prosté zvětšení nároků na zpracování většího objemu dat. Jde i o jejich další charakteristiky. V literatuře je používán pojem 3V z počátečních písmen anglických slov volume, velocity a variety charakterizujících big data. Některé zdroje přidávají i čtvrté V pro veracity.
Známým nástrojem pro zpracování big dat je Hadoop. Nejde ale o nástroj řešící problematiku big dat úplně. Jde jen o jeden z nástrojů pro big data a navíc jde o opensourceový software, což může být pro některé zákazníky problematické. Proto více IT firem, které dodávají nástroje a řešení pro big data používá sice Hadoop, ale jen jako základ pro některý z jimi dodávaných nástrojů pro zpracování big dat.