Big data

I dagens värld är Big data en fråga som har blivit allt mer aktuell i samhället. Sedan dess uppkomst har Big data varit föremål för debatt och intresse, genererat motstridiga åsikter och väckt nyfikenhet hos såväl experter som lekmän. Oavsett om det beror på dess inverkan på det dagliga livet, dess historiska relevans eller dess inflytande inom olika områden, har Big data etablerat sig som ett ämne av globalt intresse. I den här artikeln kommer vi att utforska de olika aspekterna av Big data och diskutera dess betydelse i det aktuella sammanhanget.

Big data utgörs av digitalt lagrad information av sådan storlek (vanligen terabyte och petabyte), att det är svårt att bearbeta den med traditionella databasmetoder. Big data innefattar tekniker för very large databases (VLDB), datalager (data warehouse) och informationsutvinning (data mining). Termen big data fick sitt genomslag under 2009. Ingen svensk översättning har blivit etablerad, men stora datamängder har använts.

Stora datamängder skapas bland annat inom meteorologi, bioinformatik, genomik, fysik, miljöforskning, handel, avancerade simuleringar, försvaret och vid kommunikationstjänster med många användare, som mobiltelefoni, webbtjänster som Youtube, Flickr, Twitter, Facebook och Google. I många fall skapas datamängderna kontinuerligt (i realtid) och måste även analyseras i realtid.

Framväxten av dessa stora datamängder beror på möjligheten att samla in (bland annat via Internet och digitalkameror) och lagra information (på hårddiskar), och svårigheten att hantera dem beror på att den traditionella tekniken för databaser inte har utvecklats lika fort. Två slag av angreppssätt för big data har varit NoSQL-databaser (som programvaran MongoDB) och ramverket map-reduce (som bland annat implementeras med programvaran Apache Hadoop).

Källor

  1. ^ White, Tom. (2009) (på engelska). Hadoop: the definitive guide. Sebastopol, CA: O'Reilly. sid. 3. Libris 11805459. ISBN 978-0-596-52197-4