Alla pratar om “Big Data” – men vad handlar det egentligen om?

TeknikArtikel Big Data är modeordet nr 1 just nu. I en serie artiklar kommer vi att belysa olika aspekter av fenomenet. Först ut behandlar vi Big Data med tekniken i fokus.

Big Data är ett föränderligt begrepp som beskriver en omfattande mängd strukturerad, semi-strukturerad och ostrukturerad data som har potential att bearbetas för att få fram information.

Big Data kan karakteriseras av den extrema mängden data, de många olika typerna av data och hastigheten med vilken data måste bearbetas. Även om Big Data inte hänvisar till någon viss mängd, är begrepp som ofta används; petabyte och exabyte, som till stor del inte kan integreras lätt.

Eftersom Big Data tar för mycket tid och kostar för mycket pengar för att lägga i en traditionell relationsdatabas för analys, har nya metoder för att lagra och analysera data framkommit som förlitar sig mindre på strukturen och kvaliten. Istället aggregeras rådata med utökad metadata i en pool och intelligenta program använder komplexa algoritmer för att leta efter repeterbara mönster.

Stora datamängder är ofta förknippat med cloud computing eftersom analysen av stora datamängder i realtid kräver en plattform som Hadoop. Detta för att lagra stora datamängder över ett distribuerat kluster och använda MapReduce för att samordna, kombinera och bearbeta data från flera källor.

Trots att efterfrågan på Big Data-analyser är hög, råder det för närvarande brist på forskare och andra bedömare som har erfarenhet av att arbeta med Big Data i en distribuerad, open source-miljö. Olika tillverkare har i brist på detta skapat Hadoop-lösningar för att hjälpa företag att dra nytta av den halvt strukturerade och ostrukturerade data de äger.

Nästa Big Data-artikel handlar om hur företag kan utveckla sina affärer med hjälp av smarta Big Data-lösningar.

Tags: Big Data, Lagring