Architectuurscan Gegevens, Analytics & BI (GABI)

Uit ROSA Wiki
Naar navigatie springen Naar zoeken springen


De architectuurscan is uitgevoerd op 27 juni 2023. Zie voor meer informatie, waaronder de adviezen die naar aanleiding van de scan door de Architectuurraad zijn uitgebracht, het adviesdeel en het [ bevindingendeel].

ROSA onderdeelBevindingen uit project: GABIRelatie met ROSA (Groen: ROSA, geel: GABI)
Werkingsgebied

Het werkingsgebied van GABI wordt in de Pitch beschreven als het gehele onderwijsdomein. In paragraaf 2.1 van de PrSA document wordt het doel van BI gedefinieerd als het helpen van DUO om informatie-inzichten te verkrijgen die kunnen worden gebruikt om de prestaties te verbeteren en rechtmatigheid aan te tonen. Uit verder onderzoek naar de drijvende factor achter GABI, de wet WRO, blijkt dat alle onderwijsraden worden geraakt door de invoering van de wet en dus ook door invoering van GABI, wat onderdeel gaat worden van de uitvoering van de wet.

GABI lijkt een realisatie van de Onderwijsgegevensplatform ketenarchitectuur die eerder is gescand en behandeld tijdens AR 14 april 2022. In die scan was het werkingsgebied onduidelijk en leek het vooral om een DUO architectuur te gaan. De uitwerking van de architectuur van GABI in de brondocumenten lijkt deze aanname te bevestigen.

Fullyconformant.png

Fully conformant - De uitwerking van ROSA Werkingsgebieden benadrukt het belang van het duidelijk definiëren van het gebied waarbinnen een bepaalde architectuur of systeem opereert. Op het moment van scannen is de architectuur van GABI vooral op de context van DUO gericht, maar de wet WRO, waarvan GABI de uitvoering gaat ondersteunen, heeft bredere implicaties die direct impact hebben op in ieder geval alle onderwijsraden.
Ketendomeinen en -processen

In paragraaf 3.3 van het Project Start Architectuur (PrSA) document is een functiemodel uitgewerkt. Uit dit model blijkt dat het voornamelijk gaat om interne processen van DUO. Dit beeld is consistent met de bedrijfsarchitectuurmodellen die zijn opgenomen in de begeleidende Project Start Architectuur documenten.

Zie bevinding werkingsgebied WRO artikel 23. Een verstrekking van basisgegevens is toegestaan voor zover dit noodzakelijk is voor de ondersteuning van onderwijsinstellingen en samenwerkingsverbanden bij hun verantwoording omtrent de kwaliteit, toegankelijkheid of doelmatigheid van het onderwijs. In WRO artikel 10 staat: “De basisgegevens omvatten, naast de identificerende gegevens, bedoeld in artikel 9, in elk geval gegevens met betrekking tot: a.de onderwijsinstelling waar de onderwijsdeelnemer is of was ingeschreven; b.de datum van in- en uitschrijving bij de desbetreffende onderwijsinstelling.”

Consistent.png

Consistent - GABI is nog opzoek naar de implicaties die uitvoering van de wet WRO heeft op ROSA ketenprocessen. Uit analyse van de context van GABI, wet WRO, is de definitie van basisgegevens af te leiden. Deze basisgegevens hebben betrekking op gegevens die in de Edustandaard afspraak Doorstroommonitor worden verwerkt. De tekst van de WRO stelt dat deze gegevens alleen nog maar worden verstrekt aan de onderwijsraden, wanneer sprake is van een specifieke doelbinding.

Daarom is een directe relatie te leggen met in ieder geval het ketendomein "Organisatie van het onderwijs". In het speciaal wordt in ieder geval het ketenproces Doorstroom monitoren geraakt. Waarschijnlijk heeft GABI bredere impact dan alleen op dit ketenproces.

Scenario
Onbepaald.png

Onbepaald - GABI beschrijft niet een directe relatie met ketenprocessen in de ROSA. Mogelijk zou wel een relatie met scenario's die het ketenproces Doorstroom monitoren weergeven mogelijk zijn. Deze scenario's worden nog uitgewerkt in de ROSA.
Governance

De PrSA (3.5) bevat bedrijfsprincipes. Principe BP07 geeft aan dat DUO zich inzet voor transparantie door stakeholders op verschillende momenten in het proces te informeren. Dit omvat voorafgaande informatie, updates tijdens het proces, en achteraf inzage in relevante informatie. DUO informeert stakeholders ook over het procesverloop, de regels, de gebruikte gegevens en het (mogelijke) resultaat van de gevraagde dienst.

Volgens Artikel 23 van de Wet register onderwijsdeelnemers kunnen basisgegevens worden verstrekt aan verschillende onderwijsverenigingen, waaronder de Vereniging PO-Raad te Utrecht, de vereniging VO-raad te Utrecht, de vereniging MBO Raad te Woerden, de Vereniging Hogescholen te Den Haag, en de Vereniging Universiteiten van Nederland te Den Haag.

In het PrSA komen de termen “leverancier”, "bronhouder” en “data provider” op meerdere plekken terug. Basisgegevens kunnen worden verstrekt aan verschillende onderwijsverenigingen volgens wet WRO, De PrSA van GABI benoemt deze organen niet. Ze worden alleen kort benoemd in de PSA documenten voor SANE en MDP.

Nonconformant.png

Explain - Het ROSA ontwerpkader "Betrokken belanghebbenden." benadrukt het belang van het betrekken van alle relevante stakeholders in het proces. In het PrSA document wordt dit principe erkend en wordt aangegeven dat DUO zich inzet voor transparantie door stakeholders op verschillende momenten in het proces te informeren. Echter, de termen "leverancier", "bronhouder" en "data provider" komen op meerdere plekken in het document terug, maar het wordt niet duidelijk wie dit precies zijn.

Daarnaast is het opmerkelijk dat, hoewel de Wet register onderwijsdeelnemers aangeeft dat basisgegevens kunnen worden verstrekt aan verschillende onderwijsverenigingen, deze organen niet expliciet worden genoemd in de PrSA van GABI. Ze worden alleen kort benoemd in de PSA documenten voor SANE en MDP. Dit kan worden gezien als een gebied voor verbetering in termen van transparantie en duidelijkheid voor alle betrokken stakeholders.

IBP

In het Project Start Architectuur (PrSA) document, specifiek in sectie 4.4, wordt het principe van "Gegevens bij de bron" en "Enkelvoudig beheer, meervoudig gebruik" benadrukt. Dit principe is in lijn met Artikel 23 van de Wet register onderwijsdeelnemers (WRO), waarin staat dat persoonsgegevens kunnen worden verwerkt indien dit noodzakelijk is voor de genoemde doelen.

Verder wordt in het PrSA document, onder principe BP05, gesteld dat de stakeholders van DUO erop kunnen vertrouwen dat informatie, en de onderliggende gegevens, goed worden beschermd. Dit omvat bescherming tegen inbreuken op de beschikbaarheid, integriteit, vertrouwelijkheid, duurzame toegankelijkheid en rechtmatig gebruik tijdens de verwerking van informatie en onderliggende gegevens.

De gegevensbeveiliging wordt ingevuld door verschillende services, waaronder de Minimaliseren gegevens service (Enterprise Data Hub), Meta-gegevens service (Metadata Publicatie), Gegevens kwaliteit service (Enterprise Data Hub), en Gebruikersomgeving beheer service (SANE).

Compliant.png

Compliant - In het PrSA document wordt het principe van "Gegevens bij de bron" en "Enkelvoudig beheer, meervoudig gebruik" benadrukt, wat in lijn is met het ROSA ontwerpkader "Gegevens worden niet langer bewaard dan strikt noodzakelijk".

Daarnaast wordt in het PrSA document, onder principe BP05, gesteld dat de stakeholders van DUO erop kunnen vertrouwen dat informatie, en de onderliggende gegevens, goed worden beschermd. Dit omvat bescherming tegen inbreuken op de beschikbaarheid, integriteit, vertrouwelijkheid, duurzame toegankelijkheid en rechtmatig gebruik tijdens de verwerking van informatie en onderliggende gegevens. Dit is in lijn met het ROSA ontwerpkader "Transparantie over maatregelen", waarbij ketenpartijen transparant zijn over de genomen privacy- en beveiligingsmaatregelen.

Interoperabiliteit

In het Project Start Architectuur (PrSA) document worden twee principes benadrukt: "Gegevens enkelvoudig en uniform beschreven" en "Gegevensbeschrijvingen van de bron" (PrSA, 4.4). Deze principes onderstrepen het belang van het hebben van duidelijke definities voor gegevens. Voorbeelden hiervan zijn de definities voor Access Management (PrSA, 5.2): "Het vaststellen dat een subject (persoon of systeem) de juiste rechten om een object te benaderen" en Identity Management: "Het beheren van de identiteiten van gebruikers, hun rollen, autorisaties en authenticatiegegevens."

Het PrSA document (sectie 1.1) inventariseert de kaders, principes, richtlijnen, standaarden en normen die relevant zijn voor het project en schetst de implicaties van deze kaders voor de oplossing die het project gaat realiseren. Een specifiek principe dat wordt benadrukt is dat DUO standaardiseert processen, gegevens en ondersteunende applicaties en IT technologie, en daarbij open standaarden gebruikt en aansluit op referentiearchitecturen van de overheid, in dit geval specifiek HORA / HOSA (PrSA, 3.6). Ook wordt gezegd dat MIM wordt toegepast. Welke Edustandaard afspraken worden geraakt wordt niet duidelijk uit de documentatie.

Nonconformant.png

Explain - De definities lijken niet in frictie te zijn met het ROSA begrippen identity and access management in dit geval, maar het is duidelijk dat nog niet direct gebruik is gemaakt van begrippen hieruit in het PrSA. Dit heeft daarom een explain relatie met Hanteer begrippen uit het ROSA begrippenkader

Uit de documenten wordt niet duidelijk hoe precies op HORA en HOSA wordt aangesloten. Ook is het niet duidelijk hoe de ROSA wordt toegepast of hoe gebruik wordt gemaakt van andere Edustandaard afspraken. Dit kan leiden tot onduidelijkheden en inconsistenties in de implementatie en het gebruik van de principes en standaarden. Is er bijvoorbeeld relatie met de Doorstroommonitor (DSM) - Doorstroommonitor 6.0. Dit heeft raltie met ROSA ontwerpkaders Sluit aan op ketenprocesuitwerkingen in ROSA en Hanteer de stappen uit de AMIGO-aanpak.

IAA

Het PrSA (5.2) document beschrijft drie afzonderlijke functies die in samenhang ook wel worden aangeduid met Identity and Access Management (IAM): Identificatie, Authenticatie en Autorisatie. Hoewel deze functies duidelijk worden gedefinieerd, is het niet duidelijk hoe ze in de praktijk worden geïmplementeerd en hoe ze met elkaar samenwerken om een veilige en efficiënte toegangscontrole te waarborgen.

Onbepaald.png

Onbepaald - Het wordt niet uit de documentatie duidelijk of een passend afspraken stelsel voor IAA wordt gehanteerd dat aansluit bij de onderwijsketen.
M2M Interactie
Onbepaald.png

Onbepaald - Er zijn nog geen ontwerpkaders uitgewerkt in de ROSA op het gebied van M2M
H2M Interactie
Onbepaald.png

Onbepaald - Er zijn nog geen ontwerpkaders uitgewerkt in de ROSA op het gebied van H2M.
Zeggenschappen en gegevenssoorten

In de brondocumenten van het GABI worden gegevens niet nader gespecificeerd. Echter, door de verwijzing naar de Wet register onderwijsdeelnemers (WRO), kan worden afgeleid dat het waarschijnlijk gaat om de volgende gegevenssoorten: Basisgegevens deelname, Basisgegevens persoon, en Basisgegevens resultaat.

Er bestaat een doorstroommonitor afspraak (https://www.edustandaard.nl/standaard_afspraken/doorstroommonitor/doorstroommonitor-6-0/), beheerd door de Werkgroep Doorstroommonitor. In de doorstroommonitor staat dat gegevens worden aangeleverd door DUO. Dit kan mogelijk geraakt worden door WRO artikel 23, indien het hier gaat om basisgegevens. In de specificatie van de Doorstroommonitor (https://www.edustandaard.nl/app/uploads/2017/05/Specificatie-6.0-van-de-afspraak-Doorstroommonitor.pdf) staat bij de definitie van deelnemerkenmerken dat het om gegevens gaat met betrekking tot de onderwijsinstelling waarbij een onderwijsdeelnemer was ingeschreven en de datum van in- en uitschrijving.

Dit komt overeen met WRO artikel 10, dat stelt dat de basisgegevens, naast de identificerende gegevens, in elk geval gegevens omvatten met betrekking tot de onderwijsinstelling waar de onderwijsdeelnemer is of was ingeschreven, en de datum van in- en uitschrijving bij de desbetreffende onderwijsinstelling.

Onbepaald.png

Onbepaald - Aangezien basisgegevens niet expliciet worden benoemd als de scope van GABI kunnen ook de Zeggenschappen niet verder uitgewerkt worden.
Referentiecomponenten en ketenvoorzieningen

In het PrSA document (sectie 4.2) worden drie soorten applicaties onderscheiden, elk met hun specifieke verantwoordelijkheden:

  1. Bron gegevens platformen: Deze zijn verantwoordelijk voor de extractie van gegevens uit de oorspronkelijke bron en de integratie van deze bronnen met de Data Hub.
  2. Distributie platformen: Deze zijn verantwoordelijk voor de distributie van gegevens naar de afnemende platformen. Ze voeren ook de benodigde transformaties uit om de gegevens geschikt te maken voor de afnemers, waaronder gegevensharmonisatie (transformatie), mastering en verrijking met metadata.
  3. Afnemer platformen: Deze zijn verantwoordelijk voor het gebruik van de gegevens uit de distributie platformen. Dit kan bijvoorbeeld een gebruikersinterface zijn voor metadata zoals een begrippencatalogus of een gegevenscatalogus, of een gevirtualiseerde omgeving die wordt gebruikt om gegevens te gebruiken met behulp van visualisatietools of programmeertools.
Onbepaald.png

Onbepaald - De GABI-afnemersplatformen, die verantwoordelijk zijn voor het gebruik van de gegevens uit de distributieplatformen, kunnen mogelijk een relatie hebben met de ketenvoorzieningen Vensters en XBRL Onderwijsportaal.

Vensters is een voorziening die onderwijsbesturen en hun onderwijsaanbieders ondersteunt om op transparante wijze verantwoording af te leggen over hun onderwijs. Het bestaat uit modules waarmee gebruikers zelf de regie hebben op informatievoorziening en verantwoording. Dit kan mogelijk een raakvlak hebben met de afnemersplatformen van GABI, die ook gericht zijn op het gebruik van gegevens voor verschillende doeleinden.

XBRL Onderwijsportaal ondersteunt de digitale aanlevering van de jaarcijfers door onderwijsbesturen. Dit kan ook een raakvlak hebben met de afnemersplatformen van GABI, die mogelijk ook betrokken zijn bij het beheer en gebruik van dergelijke gegevens.

Echter, aangezien de verbinding met het ketenproces doorstroom monitoren niet expliciet is gelegd in de GABI-documenten, is dit een aanname van wat de architectuur zou kunnen zijn, niet van wat de architectuur van GABI nu is. Daarom is de relatie met deze ketenvoorzieningen op dit moment onbekend.