Over het GCND

Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is het eerste corpus van gesproken Nederlandse dialecten. Het project beoogt de ontsluiting van een unieke collectie van dialectopnames uit 768 verschillende plaatsen in België, het noorden van Frankrijk en het zuiden van Nederland bij in het algemeen weinig mobiele en laagopgeleide sprekers geboren rond 1900. Al die opnames werden gemaakt door dialectologen aan de Gentse Universiteit en 740 van die opnames werden opgenomen tussen 1963 en 1976. De Gentse collectie wordt binnen het GCND aangevuld met nieuwe opnames (28 opnames uit Brussel, Vlaams-Brabant en Limburg) en opnames van het Meertens Instituut (73 opnames uit het zuiden van Nederland).

Voor het GCND worden de opnames volgens een nieuw ontwikkeld transcriptieprotocol getranscribeerd – hoogdringend in tijden van snel vorderend dialectverlies! – om vervolgens met bestaande tools taalkundig verrijkt te worden met informatie over de woordsoort van de individuele woorden (‘pos-tags’) en met informatie over de syntactische functies van de woordgroepen en hun onderlinge relatie (‘parsing’).

In vergelijking met bestaande datacollecties over de Nederlandse dialecten is het GCND uniek omdat het alleen spontane spraak bevat. Aangezien de dialectopnames een historisch stadium van de taal representeren (in het geval van het Frans-Vlaams zelfs de laatste getuigenissen van een inmiddels nagenoeg uitgestorven taalvariëteit) en de opnames nu eindelijk doorzoekbaar zullen worden, zal het GCND het mogelijk maken (i) taalveranderingsprocessen geografisch in kaart te brengen, (ii) de functionaliteit van dialectkenmerken kwantitatief te onderzoeken en (iii) nieuwe, voorheen onopgemerkte en dus onbevraagde structuren op te sporen. Audio, transcripties en annotaties worden vrij online beschikbaar en doorzoekbaar gemaakt. Het GCND zal zo een historisch dialectcorpus zonder weerga vormen.

Funding

2020-2024: FWO Middelzware onderzoeksinfrastructuur I.0.101.20N

2018-2020: FWO Navorserskrediet 1.5.310.18N aan A. Breitbarth (pilootproject)

2018-2021: FWO Postdoctoraal mandaat junior 1.2.P79.19N aan M. Farasyn (Frans-Vlaamse opnames)

2021-2024: FWO Postdoctoraal mandaat senior 1.2.P79.22N aan M. Farasyn (Frans-Vlaamse opnames)

2019-2021: Subsidies provincies Zeeland, West-Vlaanderen en Oost-Vlaanderen (pilootproject)

Gebruik van het GCND

Het GCND is nog steeds onder constructie. Het zal gehost worden door het Instituut voor de Nederlandse Taal (INT). Details over hoe het corpus geconsulteerd kan worden, volgen later.