Mis on granulaarsus vol 1?

Granulaarsus näitab kui detailne või peeneks jaotatud mingi info, süsteem või nähtus on. Ehk kui “suurte tükkidena” või “väikeste tükkidena” me midagi käsitleme?

Kasutatakse veel mõisteid nagu kõrge ja madal granulaarsus. Et asi selgem oleks, kasutame päeva kirjeldamise näidet.

Madal/ jäme/ low granulaarsus → üldistatud, suuremad ja laiemad osad. Käisin koolis ja õppisin.
Kõrge/ peen/ high granulaarsus → väga detailne, palju väikseid osi. Käisin koolis, esimeseks tunniks oli matemaatika, lahendasime võrrandeid. Vahetunnis rääkisin sõbraga. Sellele järgnes ajalugu jne.

Järgnevalt näiteid andmeinseneeriast.

Ajaline granulaarus

Kõrge: Iga ostu sündmus eraldi kirjena (timestamp sekunditäpsusega) 2026-03-30 10:03:12 – klient ostis kohvi 2.50€.
Madal: Päeva või kuu koond 2026-03-30 – kohvimüügi kogusumma 1250€.

Ruumiline granulaarsus

Kõrge: GPS koordinaadid (lat/lon) 58.3639, 25.5977.
Madal: Linn või riik Viljandi / Eesti.

Andmemudeli granulaarsus

Kõrge: Iga klikisündmus eraldi user_id, page_view, timestamp.
Madal: Sessiooni või kasutaja tasemel user_id/total_page_views = 15.

Äriline näide

Kõrge: Üksik tellimus: toode/kogus/hind/klient.
Madal: Müük kategooria kaupa: elektroonika: 50 000€ kuus.

Andemeinseneerias on granulaarsus faktitabeli koostamisel võtmetähtsusega. Alguses soovitatakse alustada võimalikult kõrge granulaarsuse astmega. Selliseid andmeid on võimalik alati grupeerida või ühendada. Madala granulaarsusega andmeid on pea võimatu detailsemaks tagasi viia.

Kirjutamisel on kasutatud tehisaru abi.