Home

Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is een taalkundig geannoteerd corpus gebaseerd op een bestaande collectie van dialectopnames uit de jaren 60 en 70: Stemmen uit het Verleden. Het corpus voorziet een met het geluid gealigneerde transcriptie in twee lagen (één dichter bij het dialect en één dichter bij de standaardtaal) die voorzien zijn van tags voor part-of-speech-tags en syntaxis. Het doel van het corpus is om grootschalig onderzoek naar syntactische bijzonderheden van de zuidelijk-Nederlandse dialecten mogelijk te maken.

Het GCND is een middelzwaar infrastructuurproject van het Fonds Wetenschappelijk Onderzoek – Vlaanderen (FWO).