Gaois

Decoding Hidden Heritages

I samhradh na bliana 2021 bronnadh maoiniú ar Gaois faoi scéim an AHRC-IRC chun tionscadal a thosnú ar an bPríomhbhailiúchán Lámhscríbhinní ó chartlann Choimisiún Bhéaloideasa Éireann, UCD. Is é Decoding Hidden Heritages ainm an tionscadail sin agus is í an obair digitithe atá ar bun mar chuid den tionscadal seo ar lámhscríbhinní an Phríomhbhailiúcháin a bheidh faoi chaibidil sa bhlagmhír seo.

Meastar go bhfuil tuairim is 700,000 leathanach lámhscríofa sa Príomhbhailiúchán Lámhscríbhinní, rud a fhágann go bhfuil sé ar cheann de na bailiúcháin d’ábhar béaloidis is mó in iarthar na hEorpa. Ba dhúshlán nach beag don digitiú é seo muna mbeadh an teicneolaíocht AI chun uathaithint peannaireachta a bheith forbartha ag Transkribus le cúpla bliain anuas, teicneolaíocht ar a bhfuil Decoding Hidden Heritages ag brath go mór agus a lámhálann don tionscadal a chuid innill aitheanta peannaireachta féin a dhéanamh ó bhonn bunaithe ar scríobhaithe ar leith sa bhailiúchán.

Ó thosnaigh ár dtaighdeoirí ag obair leis an mbogearra Transkribus i dtosach Dheireadh Fómhair, d’éirigh linn trí cinn d’innill aitheanta peannaireachta a dhéanamh a oibríonn ar ráta cruinnis 95%+, ceann do Sheosamh Ó Dálaigh, ceann do Sheán Ó hEochaidh agus ceann do Liam Mac Coisdealbha, triúr de na bailitheoirí is díograisí a bhí ag obair don Choimisiún.

Seosamh Ó Dálaigh i mbun béaloideas a bhailiú ó Thomás Mac Gearailt (Paróiste Márthain, Corca Dhuibhne) agus lámhscríbhinn a bhreac sé síos ó thaifead a dhein sé ar Thadhg Ó Guithín (Baile na hAbha, Dún Chaoin, Corca Dhuibhne) á tras-scríobh in Transkribus.

Tras-scríobh cruinn dílis do leathanach na lámhscríbhinne, do pheannaireacht agus do chanúint an bhailitheora a theastaíonn ó Transkribus chun an t-inneall a thraenáil. Fuarthas gur leor tuairim is leathcheád leathanach a thras-scríobh ar an gcuma seo chun samhail peannaireachta a thraenáil ar ráta cruinnis cuíosach sásúil (90%+). Is é an cur chuige atá ag an tionscadal ina dhiaidh seo ná roinnt mhór leathanach a thras-scríobh go huathoibríoch, iad a cheartú de réir a chéile le cabhair ó mheitheal mac léinn agus cúntóirí taighde (Emma McGee, Kate Ní Ghallchóir agus Róisín Byrne) agus na samhlacha teangan a aththraenáil ar bhunachar níos fairsinge sonraí, rud a thug samhlacha teangan níos cruinne fós dúinn (~95%). Tugann torthaí eatramhacha na hoibre seo dóchas dúinn go mbeidh sé ar chumas an tionscadail ráta cruinnis níos airde fós a bhaint amach sna míonna amach romhainn, rud a ligfeadh dúinn cuid mhaith den Phríomhbhailiúchán Lámhscríbhinní a thras-scríobh go huathoibríoch nach mór de dhroim oíche.

Cuar foghlama na samhlacha teangan a deineadh le Transkribus go dtí seo: Seán Ó Dálaigh (clé), Seán Ó hEochaidh (lár) agus Liam Mac Coisdealbha (deas).

Tá lámhscríbhinní an Phríomhbhailiúcháin ar na téacsanna is mó go bhfuil rian na gcanúintí le breithniú iontu i mórchorpas litríocht na Nua-Ghaeilge. Is é an cur chuige agus na modhanna eagarthóireachta a bhí curtha chun cinn ag Séamus Ó Duilearga féin, an fear a bhunaigh An Cumann um Béaloideas Éireann sa bhliain 1927, agus atá le feiscint i Leabhar Sheáin Í Chonaill (1948) a bhuaileann linn sa Phríomhbhailiúchán. Ní fearr cur síos ar an gcur chuige seo ná na focail a bhreac an Duileargach féin síos i réamhrá an leabhair sin:

Ní raibh ionnam ach úirlis sgríte don tseanachaí: níor atharuíos siolla dá nduairt sé, ach gach aon ní a sgrí chô maith agus d’fhéadfainn é. (S. Ó Duilearga, Leabhar Sheáin Í Chonaill, xxiv)

Is beag leabhar a foilsíodh ó shin a fhanann chomh dílis do chanúint an chainteora agus a d’fhan Leabhar Sheáin Í Chonaill, ina bhfaightear foirmeacha ar nós bheadh saé in áit bheadh sé, nó buaileav in áit buaileadhfáilthiú in áit fáiltiú. Ar an gcuma chéanna atá teanga na lámhscríbhinní sa Phríomhbhailiúchán ar an mórgóir agus canúintí, nó idióileictí fiú, na bhfaisnéiseoirí le braistint go láidir iontu. Cuir i gcás do in áit go i gcanúint daoine áirithe i gCorca Dhuibhne, mar a bhreac Seosamh Ó Dálaigh síos ó Thadhg Ó Guithín (Baile na hAbha, Dún Chaoin).

Tá trácht ar an bhfeiniméan canúnach seo ag Diarmuid Ó Sé i nGaeilge Chorca Dhuibhne. (§619)

Bíodh is gur saibhre lámhscríbhinní an bhailiúcháin seo de bharr na mionphointí canúnacha a bhí na bailitheoirí a bhreacadh síos agus iad i mbun tras-scríbhneoireachta, is de dheasca éagsúlacht seo na teangan sa chorpas trí chéile nach bhfuil sé mar aidhm ag an tionscadal aon mhórshamhail peannaireachta amháin a dhéanamh chun an bailiúchán go léir a thras-scríobh. Lena chois sin, ní hamháin go bhfuiltear ag plé le canúintí éagsúla ach táthar ag plé le bailitheoirí difriúla narbh ionann a gcuid peannaireachta ná na gnásanna a bhí acu chun na canúintí a litriú. Fágann sin corpas Nua-Ghaeilge ilchineálach nach fuirist a dhigitiú go huathoibríoch agus gur gá tabhairt faoi go cáiréiseach agus i dtaca le staidéar canúineolaíochta a chuireann síos ar na mionphointí teangan a fhaightear ann.

Údar: Andrea Palandri