Gaois

13.5 milliún focal i gCorpas na Gaeilge Comhaimseartha

Blog post is available in Irish only

Rinneadh cur síos sa bhlagmhír seo ar Chorpas na Gaeilge Comhaimseartha nuair a seoladh é i mí Aibreáin anuraidh. Ní raibh ach 5.3 milliún focal sa chorpas an tráth úd ach táimid ag cur le hábhar an chorpais ó shin i leith – idir ábhar úr a bhailiú agus a thiomsú agus ábhar atá sa chorpas cheana a nuashonrú.

Cuimsítear raon leathan téacsanna sa chorpas, téacsanna a foilsíodh ó thús an 21ú haois. Ina measc siúd, áirítear téacsanna a foilsíodh ar líne amháin (e.g. Beo!, Nuacht RTÉ, Tuairisc.ie, Meon Eile agus NÓS); téacsanna a foilsíodh in irisí agus i nuachtáin éagsúla (e.g. Feasta, an tUltach, Seachtain, Comhar agus The Irish Times) mar aon le hábhar ó mhórfhoilsitheoirí Gaeilge (e.g. Cois Life, Cló Iar-Chonnacht, Cló Mhaigh Eo agus Éabhlóid). Tá 13.5 milliún focal sa chorpas anois agus táimid fós ag cur leis. Bheadh an-spéis againn cloisteáil ó shealbhóirí cóipchirt eile a bhfuil ábhar digiteach Gaeilge acu. Is féidir dul i dteagmháil linn ag gaois@dcu.ie.

Is féidir cuardach simplí a dhéanamh trí fhocal nó trí fhrása a chur sa bhosca cuardaigh ar an leathanach baile. Gintear liosta torthaí ón gcorpas agus léirítear an focal nó an frása cuardaigh i bhfoirm samplaí comhthéacsúla. Tá sé ar intinn againn cur le feidhmiúlacht an chorpais amach anseo, mar shampla, forbairt a dhéanamh ar an gcuardach agus ar an gcaoi a léirítear na torthaí cuardaigh, anailís a dhéanamh ar théarmaí coitianta sa chorpas, seánraí na bhfoinsí sa chorpas a rianú, etc. – i ndiaidh a chéile a dhéantar na caisleáin, áfach!

Is minic a bhaintear úsáid as corpais chun scrúdú a dhéanamh ar úsáid téarmaí nó frásaí. Anuas air sin, déantar anailís ar theacht i bhfeidhm téarmaí nua agus dul i léig cinn eile. Sampla maith is ea an téarma Brexit de théarma nua atá tar éis teacht chun cinn le déanaí. Faightear go leor samplaí spéisiúla de na leaganacha uile a úsáidtear i nGaeilge mar a léirítear sa bhosca thíos.

Téarma Líon amas sa chorpas
Brexit 226
Breatimeacht 74
Bréalú 14
Sasamach 14

Reáchtáladh searmanas insealbhaithe an Uachtaráin Trump an tseachtain seo caite agus faightear go leor samplaí úsáide den téarma ‘insealbhú’ i gcomhthéacs na polaitíochta i gCorpas na Gaeilge Comhaimseartha. Beidh sé spéisiúil anailís a dhéanamh ar chomhthéacs na dtagairtí ina luaitear an téarma ‘insealbhú’ nuair a dhéanfar nuashonrú ar an ábhar i gceann cúpla mí!

Is féidir taighde a dhéanamh ar an gcaoi a n-úsáidtear focail áirithe trí leas a bhaint as an gcuardach simplí sa chorpas. Mar shampla, glactar leis an dá leagan ghinideacha den ainmfhocal ‘talamh’ ar Téarma.ie – ‘talún’ agus ‘talaimh’. Ach is léir ó fhanaise an chorpais go bhfuil an lámh in uachtar ag ‘tálún’ faoi láthair. Bain leas as an gcorpas tú féin agus déan cuardach inniu!

Talún’ (1,263 amas)

Talaimh’ (127 amas)