Rhyddhau Data Agored

Rydw i wedi blogio o’r blaen ar sut y mae Swyddfa Archwilio Cymru yn ystyried herio ein defnydd presennol o ddata a thechnoleg fel rhan o’r prosiect Archwilio sydd ar Flaen y Gad. Roedd fy rhan i o’r brosiect yn edrych ar sut rydyn ni’n mynd i’r afael â data.

Sut mae Data Agored yn ffitio i mewn i gaffael data?

Mae’r diagram isod yn dangos y rhesymeg y tu ôl i fy ngwaith i. Yn fy marn i, mae rhaid i ni rannu’r data sydd gennym er mwyn i ni ddatblygu ein perthynas â’r cyrff sy’n gleientiaid fel y gallwn gasglu data’n effeithiol. Mae rhan o hyn ynglŷn â “bod y newid yr ydych chi’n dymuno ei weld.” Mae rhai pobl yn meddwl bod archwilwyr yn bobl sy’n ymwrthod â risg, ond yn y Gyfnewidfa Arferion Da rydym wedi gweld ein bod ni’n galluogi eraill i wneud yr un peth pan fyddwn yn gweithio mewn ffordd wahanol. Mae nifer o awdurdodau lleol wedi adrodd yn ôl inni am sut y maen nhw wedi gallu herio cyfyngiadau’r gwefannau a’r cyfryngau cymdeithasol y maen nhw’n cyrchu oherwydd y ffordd rydyn ni’n rhannu gwybodaeth. Drwy sicrhau bod data ar gael yn agored, gallwn ddangos mai ychydig o risg sydd yna, cyn belled â bod y broses yn cael ei rheoli’n dda.

Fel y soniais yn fy nodyn gwreiddiol, roedd dod o hyd i set ddata priodol yn fwy heriol nag yr oeddwn wedi disgwyl, gan nad oes gennym yr hawl i rannu’r data yr ydym yn ei gasglu o bob cleient yn ystod ein harchwiliadau. Fodd bynnag, ar ôl ychydig o ymchwil, canfuom y data y tu ôl i Adroddiad Datganiadau Ariannol Llywodraeth Leol, sef adroddiad ar gyfrifon cyrff llywodraeth leol. Roedd hwn yn ddata diogel i’w ryddhau oherwydd ei fod eisoes ar gael ar wefan pob cyngor fel rhan o’u cyfrifon, ond ni yw’r unig sefydliad sy’n casglu’r data hwn. Dadansoddir y data yn yr adroddiad ar sail genedlaethol, ond drwy ryddhau’r set ddata gallwn alluogi cynghorau a rhanddeiliaid eraill sydd â diddordeb i edrych ar y data fesul sir, a chymharu a chyferbynnu eu cyfrifon yn erbyn eraill. Defnyddir y data gan Swyddfa Archwilio Cymru i gefnogi gwaith archwilio lleol ac ar gyfer meincnodi cyffredinol. Mae’r adroddiad ei hun yn edrych ar ansawdd y cyfrifon, ac mae’n seiliedig ar y data sy’n cael ei ryddhau cyn gwelliannau — nid ydym yn olrhain addasiadau cyfnodau blaenorol.

Sut aethom o gwmpas gwneud y data hwn yn agored?

Ein man cychwyn oedd taenlen a ddefnyddiwn yn fewnol sy’n cynnwys y setiau data sy’n dyddio’n ôl i 2008–09. Roeddem ychydig yn siomedig i ffeindio mas bod y gofynion ar awdurdodau lleol i ddarparu’r data hwn yn y strwythur hwn bellach wedi newid ac felly na fydd data cymharol ar gael y flwyddyn nesaf. Fodd bynnag, roedd y set ddata hon yn brawf da ar gyfer ein dull. Yn y tymor hirach, byddai’n werth inni edrych ar sut y gallem wneud data di-dor ar gael er mwyn lleihau baich y gofynion adrodd. Mae gan Lucy Knight o Gyngor Sir Dyfnaint enghraifft ddefnyddiol yn ei darlith amser cinio ar gyfer y Sefydliad Data Agored ar ‘Gwneud i Ddata Agored Ddigwydd mewn Llywodraeth Leol’.

Fe wnaethom ddefnyddio blogbost Hendrik Grothuis ar wneud data’n agored a Rhestr Wirio Defnyddwyr y Sefydliad Data Agored fel canllawiau bras ar gyfer y broses. Ein cam cyntaf wrth lanhau’r data oedd gweld pa ddata yr oedd gennym yr hawl i’w rannu, a pha ddata oedd eisoes ar gael o ffynonellau eraill. Fe wnaethom benderfynu gael gwared ar y data a oedd eisoes ar gael drwy StatsCymru er mwyn osgoi dyblygu, ond pe baech chi’n meddwl am ddefnyddio rhai o’r rhain, efallai y bydd y rhain yn fan cychwyn da:

Wedyn fe wnaethom ddefnyddio CSV Lint i weld a oedd y ffeil yn ddarllenadwy. Roeddem yn falch o ddarganfod bod gennym ffeil ddilys, ond canfuom hefyd ffyrdd y gallem ei gwella. Fe wnaethom droi’r set ddata o gwmpas fel bod yr eitemau data yn mynd yn llorweddol a’r blynyddoedd yn mynd yn fertigol. Fe wnaethom hefyd greu gwerth nwl i ddangos lle nad oedd y data ar gael. Roedd ymchwil sydyn ar Google yn ddigon inni ddarganfod sut i nodi celloedd gwag.

Fel sefydliad sector cyhoeddus yng Nghymru, mae’n ofynnol inni sicrhau bod y data ar gael yn ddwyieithog, ac felly fe wnaethom ei anfon at y cyfieithwyr i wneud yn siŵr fod pob term technegol yn hollol gywir gennym.

Cyhoeddi’r data

Pan ddaeth yn fater o gyhoeddi’r data, fe wnaethom benderfynu ei gyhoeddi fel rhan o’r blogbost yma ar flog Y Gyfnewidfa Arfer Da. Byddai’r set ddata yn edrych yn unig iawn ar lwyfan Data Agored ar hyn o bryd, ond y gobaith yw y gallwn nodi setiau data eraill y gallwn eu rhyddhau wrth symud ymlaen. Buom yn edrych ar lwyfannau posibl y gellid eu defnyddio, gan gynnwys dewisiadau ffynhonnell agored fel CKAN a DKAN (y byddai’r ddau ohonynt yn integreiddio gyda’n System Rheoli Cynnwys Drupal), yn ogystal â llwyfannau sy’n seiliedig yn y cwmwl fel Socrata. Fel sefydliad rydym yn symud i’r cwmwl pan fydd hynny’n gwneud synnwyr, ond efallai bod pethau y gallem eu dysgu oddi wrth Barth Arloesi Archwilio’r Alban, a sefydlwyd i alluogi eu staff i roi prawf ar feddalwedd a llwyfannau newydd mewn gofod sy’n cael ei reoleiddio’n ysgafn. Mae hyn yn rhoi’r cyfle i staff roi prawf ar ffyrdd newydd o weithio.

Fel y nodwyd yn ein gweminar ddiweddar ar Safonau Agored, rydym wedi dewis cyhoeddi’r data mewn CSV yn hytrach na ffurf berchnogol fel Excel. Mae hyn yn golygu y gall gael ei ddefnyddio gan amrywiaeth eang o feddalwedd, a, gobeithio, gan amrywiaeth mor eang o bobl â phosibl.

Bellach, ein cyfrifoldeb ni yw sicrhau bod modd canfod y data hwn drwy ei dagio’n effeithiol, a byddwn hefyd yn rhoi cyhoeddusrwydd i’r set ddata drwy’r rhwydweithiau yr ydym wedi eu hadeiladu drwy ein gwaith blaenorol ar Ddata Agored. Ein her nesaf yw ffeindio mas sut y defnyddir y data. Felly, os byddwch yn defnyddio’r set ddata, byddem wrth ein bodd i gael eich adborth ar y fformat ac i gael gwybod sut y gwnaethoch ei defnyddio.

Dysgu o Lywodraeth Cymru

Roedd Llywodraeth Cymru yn gymorth mawr drwy gydol fy ngwaith ar y Prosiect Archwilio sydd ar Flaen y Gad. Fe wnaethon nhw rannu pethau yr oeddent wedi eu dysgu o’u gwaith nhw, ac fe wnaethom hefyd fynychu cyfarfodydd gyda’n gilydd i ddysgu mwy am ddulliau Cyngor Caerdydd a Chyngor Sir Fynwy. Roedd yn ddiddorol iawn clywed bod staff Llywodraeth Cymru eu hunain yn defnyddio StatsCymru i rannu ac i gasglu data gan ei fod yn agored ac yn dryloyw. Mae hyn yn rhywbeth i ni feddwl amdano ar ein siwrne ein hunain — sut allwn ni wneud data yn fwy hygyrch ar gyfer rhanddeiliaid mewnol ac allanol.

Fe wnaethom ddefnyddio ymagwedd Llywodraeth Cymru tuag at Metadata fel templed ar gyfer ein gwaith ein hunain. Set o ddata yw Metadata sy’n disgrifio ac yn rhoi gwybodaeth am ddata arall, ac mae’n wirioneddol bwysig oherwydd ei bod yn rhoi cyd-destun o gwmpas y data sy’n cael ei rannu. Gellwch weld y Metadata ar waelod y neges hon ochr yn ochr â dolen gyswllt at y data ei hun.

Adborth

Mae eich adborth am ein dull yn bwysig iawn. Gan mai prawf cychwynnol yw hwn o sut y gallem wneud data yn agored ac yn barod i’w rannu, fe fyddwn yn defnyddio’ch adborth i ddylanwadu ar sut y gallai’r agenda yma symud ymlaen. Rydym yn awyddus iawn i edrych ar sut y gallwn wneud gwell defnydd o ddata er mwyn cynorthwyo gwasanaethau cyhoeddus i wella, a hefyd i fod yn gyson o ran ein ffordd ni o weithredu’n ddigidol. Mae Archwilydd Cyffredinol Cymru yn trafod galluogi arloesedd drwy risgiau sydd wedi eu rheoli’n dda o flaen pob un o’n digwyddiadau rhannu dysgu. Rydym yn bwriadu rhannu ein dysgu ni ein hunain fel y gall pobl ddysgu oddi wrth ein profiadau, hyd yn oed os maen nhw’n brofiadau gwael. Rydym o hyd yn dweud nad oes diben ailddyfeisio’r olwyn. Drwy weithio mewn ffordd agored a thryloyw, rydym yn gobeithio y gall sefydliadau adeiladu ar yr hyn yr ydym ni’n ei wneud fel y gallant rannu data mor effeithiol â phosibl er mwyn gwella’r gwasanaethau y maent yn eu darparu.

Set Data: Datganiadau Ariannol Llywodraeth Leol

Metadata

Geirfa

Cafodd y blogbost yma ei gyhoeddi’n wreiddiol ar flog Cyfnewidfa Arfer Da Swyddfa Archwilio Cymru.