Architectuurscan Ontsluiting RIO-gegevens

Uit ROSA Wiki
(Doorverwezen vanaf Architectuurscan Ontsluiting RIO-gegevens)
Naar navigatie springen Naar zoeken springen


De architectuurscan is uitgevoerd op 30 juni 2020. Zie voor meer informatie, waaronder de adviezen die naar aanleiding van de scan door de Architectuurraad zijn uitgebracht, het adviesdeel en het [ bevindingendeel].

ROSA onderdeelBevindingen uit project: Ontsluiting RIO-gegevens als LODRelatie met ROSA (Groen: ROSA, geel: Ontsluiting RIO-gegevens als LOD)
Werkingsgebied

Het werkingsgebied van RIO-LOD omvat het gehele onderwijsdomein (§2.1, p.4 PSA, § 2.3 Scope PSA). Zie ook de eerder uitgevoerde scan op het RIO register en beheer (https://www.wikixl.nl/wiki/rosa/index.php/Architectuurscan_RIO_register_en_beheer).

Compliant.png

Compliant - Het werkingsgebied van RIO-LOD omvat (net als het RIO register) het gehele onderwijsdomein.
Toepassingsgebied

Het ontsluiten van RIO-gegevens als Linked Open Data.

Doel is tweeledig:

  1. Min of meer gestandaardiseerde halfproducten bieden zodat willekeurige applicatiebouwers effectief en efficiënt eindproducten kunnen samenstellen voor een veelheid van stakeholders als burgers, onderwijsaanbieders en anderen. (§2.1 PSA) -> developersperspectief
  2. Optimale ontsluiting voor externe afnemers, op 1 manier aangeboden voor iedereen met een ontsluiting zo dicht mogelijk bij de bron (memo). -> afnemersperspectief

Er wordt wel gehint richting het afnemersperspectief in bijvoorbeeld de beheerarchitectuur (p.28), maar er worden geen specifieke afnemers benoemd en welke interactie die hebben met de linked data.

De vorm is ontsluiting van RIO als Linked Open Data (LOD), waarmee RIO voor iedereen toegankelijk is.

Compliant.png

Compliant - RIO-LOD heeft direct betrekking op de ketenfuncties Informatieverwerking en Informatiestandaardisatie, en gedeeltelijk op Identificatie en toegang en Informatiebeveiliging en privacy

Vanuit afnemersperspectief zijn alle overige ketenfuncties ook relevant, immers op alle plaatsen waar instellings- en opleidingsinformatie gebruikt wordt is RIO in beeld als de bron van die data.

Bovensectorale samenwerking

§ 2.2 PSA: REST API Design Rules (aka Nederlandse API Strategie); Forum Standaardisatie. Daarmee werkt dit project toe naar het publiceren van zogenaamde sectorale registers in lijn met de stelselcatalogus van de overheid, naast de basisregistraties als BPR en BAG.

Externe gebruikers kunnen realtime details ophalen op basis van een vastgehouden (gecachete) webidentiteit/URI (§ 2.4 PSA) -> Eenmalige registratie, meervoudig gebruik; data wordt niet rondgepompt

In de PSA (§2.2) wordt de hoofddoelstelling van RIO LOD benoemd. Deze kan worden samengevat als het verbeteren van de “Developer Experience (DX)”.

“Scholen beschrijven zelf hun eigen wereld” (PSA §2.2) -> eenheid in verscheidenheid

Effecten op (interne) processen van de afnemers van de gegevens zijn niet omschreven in de PSA. (-> koppelen niet kantelen)

Consistent.png

Consistent - Hoewel niet expliciet benoemd, is de relatie met de ROSA-principes “Een gezamenlijke basisinfrastructuur” en “Eenheid in verscheidenheid” af te leiden uit de PSA .

RIO-LOD ondersteunt eenmalige registratie, meervoudig gebruik van instellings- en opleidingsaanbodgegevens.

“Compliancy” met NORA en ROSA wordt genoemd als een “business driver” in §2.2 van de PSA. Dit sluit aan bij de ROSA basisprincipes: “Aansluiten bij NORA” en “Digitaal doen we het zo”.

DUO zorgt voor aansluiting op Basisregistraties (PSA §3.1.1)

IBP

Privacygevoelige of anderszins vertrouwelijke data zijn buiten scope (PSA §2.3)

Data moeten ‘van goede kwaliteit’ zijn. (PSA §2.2). Daaronder valt in ieder geval de integriteit van de gegevens.

Een eis voor de LOD API is een hoge standaard beschikbaarheid. (PSA §2.4) Dit sluit aan bij het ontwerpkader “Continuïteit van de dienstverlening”.

Compliant.png

Compliant - Privacygevoelige informatie wordt buiten Scope verklaard (PSA §2.3) voor RIO LOD.

Er wordt aangegeven dat data van goede kwaliteit moet zijn. (PSA §2.2) Hiervoor is ROSA ontwerpkader “Voorkom aantasting van integriteit” belangrijk, maar er wordt niet direct naar gerefereerd.

Een eis voor de LOD API is een hoge standaard beschikbaarheid, maar deze wordt nog niet gehaald. Wat een hoge beschikbaarheid inhoudt is nog niet genoeg omschreven.

IAA

IAA speelt niet voor raadplegen, wel voor beheer van RIO-data.

In §3.3 van de PSA wordt gesteld dat data zonder beperkingen door iedereen mag worden gebruikt, maar dat wijzigingen niet gedaan mogen worden door onbevoegden.

Irrelevant.png

Irrelevant - Het wijzigen van RIO data is niet in scope van deze scan, aangezien het hier alleen gaat over de ontsluiting van RIO-LOD.
Gegevensuitwisseling in de keten

Gegeven uit RIO worden via 3 routes ontsloten:

  1. REST-API / LOD (fair use bevragingen; niet voor synchronisatie van gehele register)
  2. SPARQL-endpoint (directe bevragingen op LOD; kan tijdelijk worden afgekoppeld bij te grote bevragingen)
  3. Webservice direct op RIO (niet via LOD; specifiek voor één use case met near-realtime operationele eisen)

PSA §2.2: Niet alleen de data, ook het logisch model van RIO wordt, in samenhang, gepubliceerd op het web. Allereerst betekent dit dat de data zelfverklarend is. Herinterpretaties en misverstanden van de data worden tot een minimum beperkt. Verder zijn ook de integriteitsregels voor de betreffende data voor iedereen waarneembaar en bruikbaar om de juistheid, volledigheid en actualiteit van de data geautomatiseerd te valideren. Scholen beschrijven zelf hun eigen wereld (herkenbare namen, daadwerkelijke locaties, opleidingsprofielen e.d.) en leveren dat aan bij RIO. Door middel van deze ontsluiting wordt dat direct zichtbaar op het web of middels een RIO raadplegende applicatie. Hierdoor kan de school zijn eigen werk controleren. En dat kan in feite iedereen. De datakwaliteit verbetert met een feedbackloop.

paragraaf 3.3: “Gebruikers mogen verwachten dat ze webapplicaties kunnen bouwen” -> alleen webapplicaties? Geen gebruik van RIO-data in andere systemen / datalandschap van school?

Voor specifieke toepassingen die hoge eisen stellen aan actualiteit (met name voorziening VVA) is op dit moment een (tijdelijke?) alternatieve workaround via onderwijsdata.duo.nl.

In §2.4 van de PSA wordt genoemd dat het doel is dat ontsloten data hoogst actueel is. Naamswijzigingen, het sluiten van een fixus opleiding en dergelijke in RIO zijn dan op secondeschaal toegankelijk. Uit toelichtende gesprekken blijkt dit in praktijk lastig te realiseren. Een actualiteit op minuten- in plaats van secondeschaal is realistischer.

De PSA benoemt datakwaliteit als speerpunt (p. 5). De PSA duidt het begrip ‘datakwaliteit’ slechts beperkt,refererend aan een ‘feedback loop’ (p.6) waarmee de datakwaliteit verbetert. Verder wordt daarover opgemerkt dat de integriteitsregels voor de betreffende data voor iedereen waarneembaar en bruikbaar zijn om de juistheid, volledigheid en actualiteit van de data geautomatiseerd te valideren.

Consistent.png

Consistent - Ontsluiting van RIO gegevens via Linked Open Data geeft invulling aan het ROSA ontwerpkader “Openbare registergegevens worden ontsloten als Linked Open Data”. Voor één use case is een aparte webservice rechtstreeks op RIO ingericht buiten LOD om.

De LOD-URIs kennen een eigen levenscyclus. Afnemers moeten daarop voorbereid zijn (ihb wanneer URIs vervallen).

Semantiek uit RIO-modellen heeft raakvlakken met semantiek in andere uitwisselingen. Linked data kan een manier zijn om die semantiek ook over uitwisselingen heen traceerbaar te maken. Hier ligt een relatie met bijvoorbeeld AMIGO (‘virtuele modellenrepository’).

Ketenprocessen

Met het ontsluiten van RIO data als LOD wil DUO de “developer experience” verbeteren voor ontwikkelaars. (PSA §2.2) Aangezien RIO data een ondersteunende rol speelt bij vrijwel alle onderwijsprocessen (PSA §2.1) zal dit vrijwel alle ketenprocessen raken.

In de memo wordt het doel genoemd “optimale ontsluiting voor externe afnemers”, dit doel wordt niet direct genoemd in de PSA. Het wordt niet duidelijk uit de PSA of uit de memo hoe deze twee doelen in relatie met elkaar staan.

Developers zullen niet de enige afnemers zijn, want er is een impact op alle ketenprocessen. Alleen in strikt technische zin zijn de developers de ‘afnemers’, want zij ‘praten’ tegen de API aan. De eindgebruikers zien het resultaat daarvan, maar niet de technische implementatie.

Onbepaald.png

Onbepaald - Met het ontsluiten van RIO data als LOD wil DUO de “developer experience” verbeteren voor ontwikkelaars. (PSA §2.2) Aangezien RIO data een ondersteunende rol speelt bij vrijwel alle onderwijsprocessen (PSA §2.1) zal dit vrijwel alle ketenprocessen raken.


Het project wordt vooral gepositioneerd als technologische verandering, effecten op (interne) processen van de afnemers van de gegevens worden buiten beschouwing gelaten.

Zeggenschappen en gegevenssoorten

Zeggenschap over gegevens ligt bij onderwijsinstellingen zelf (PSA §2.2).

Compliant.png

Compliant - Zeggenschap over gegevens ligt bij onderwijsinstellingen zelf (PSA §2.2). Dit ligt aan de kant van het RIO-register, niet bij RIO-LOD,

RIO LOD heeft verder betrekking op de zeggenschappen “Beschikbaar stellen” en “Inzien”. DUO stelt RIO data beschikbaar via Linked data endpoints aan iedere afnemer die gebruik wil maken van deze data.

Bouwstenen en voorzieningen

§1.2 p.3 PSA Het vervangen van bestaande ontsluitingen op basis van BRIN.

Vanwege de zin “Gebruikers mogen verwachten dat ze webapplicaties kunnen bouwen” (paragraaf 3.3 van de PSA) lijkt de ontsluiting van RIO-gegevens zich te beperken tot webapplicaties. Er zijn echter ook andersoortige systemen binnen het applicatielandschap van een onderwijsinstelling waarvoor RIO-data relevant kan zijn.

Compliant.png

Compliant - Op alle plaatsen waar nu nog (informatie uit) BRIN wordt gebruikt, zal RIO gebruikt moeten gaan worden.
Governance

Afnemers en hun belangen zijn nog niet in kaart gebracht. In de memo staat wel als één van de vervolgstappen genoemd “Stakeholders en hun producten en verwachtingen leren kennen”.

Nonconformant.png

Explain - Uitgangspunt voor het ROSA ontwerpgebied governance is dat alle belangen worden afgewogen; daarvoor moeten alle belangen en belanghebbenden in kaart zijn gebracht.
Implementatie

Er worden pilots met scholen uitgevoerd. De uitvoering, status en resutaten van die pilots zijn in de PSA niet verder beschreven.

N.v.t. -