Granulaarsus näitab kui detailne või peeneks jaotatud mingi info, süsteem või nähtus on. Ehk kui “suurte tükkidena” või “väikeste tükkidena” me midagi käsitleme?
Kasutatakse veel mõisteid nagu kõrge ja madal granulaarsus. Et asi selgem oleks, kasutame päeva kirjeldamise näidet.
- Madal/ jäme/ low granulaarsus → üldistatud, suuremad ja laiemad osad. Käisin koolis ja õppisin.
- Kõrge/ peen/ high granulaarsus → väga detailne, palju väikseid osi. Käisin koolis, esimeseks tunniks oli matemaatika, lahendasime võrrandeid. Vahetunnis rääkisin sõbraga. Sellele järgnes ajalugu jne.
Järgnevalt näiteid andmeinseneeriast.
Ajaline granulaarus
- Kõrge: Iga ostu sündmus eraldi kirjena (timestamp sekunditäpsusega) 2026-03-30 10:03:12 – klient ostis kohvi 2.50€.
- Madal: Päeva või kuu koond 2026-03-30 – kohvimüügi kogusumma 1250€.
Ruumiline granulaarsus
- Kõrge: GPS koordinaadid (lat/lon) 58.3639, 25.5977.
- Madal: Linn või riik Viljandi / Eesti.
Andmemudeli granulaarsus
- Kõrge: Iga klikisündmus eraldi user_id, page_view, timestamp.
- Madal: Sessiooni või kasutaja tasemel user_id/total_page_views = 15.
Äriline näide
- Kõrge: Üksik tellimus: toode/kogus/hind/klient.
- Madal: Müük kategooria kaupa: elektroonika: 50 000€ kuus.
Andemeinseneerias on granulaarsus faktitabeli koostamisel võtmetähtsusega. Alguses soovitatakse alustada võimalikult kõrge granulaarsuse astmega. Selliseid andmeid on võimalik alati grupeerida või ühendada. Madala granulaarsusega andmeid on pea võimatu detailsemaks tagasi viia.
Kirjutamisel on kasutatud tehisaru abi.