Présentation

La Banque de Données Langue Corse (BDLC) est un outil scientifique conçu afin d’illustrer et d’étudier la variation linguistique du corse dans l’espace – en incluant les parlers corses de Gallura et la communauté alloglotte de Bunifaziu (ligurien) – et dans le temps. Les données présentes dans la base sont le produit d’enquêtes de terrain et ont été recueillies auprès de locuteurs natifs.

Responsables scientifiques : Marie-José Dalbera-Stefanaggi & Stella Retali-Medori

Bref historique

La Banque de Données Langue Corse (BDLC) a été créée en 1986. Cette banque de données s’est articulée dès sa création avec le programme du Nouvel Atlas Linguistique et Ethnographique de la Corse (NALC), projet confié à l’Université de Corse en 1981 par le CNRS. La BDLC a été mise en ligne, dans une version simplifiée, en 2009 grâce à un financement de l’UMR LISA 6240 (http://www.bdlc.univ-corse.fr). Depuis 2006, autour du programme NALC-BDLC a été également mise en œuvre une collection intitulée Detti è usi di paesi, Matériaux et analyses extraits de la Banque de Données Langue Corse.

Méthodologie et objectifs

Les participants au programme NALC-BDLC collectent sur l’ensemble du territoire insulaire – mais aussi à la Maddalena et en Gallura (Sardaigne) – des données linguistiques en lien avec des savoir-faire et des traditions culturelles corses. Les enquêteurs procèdent à des entretiens à l’aide de questionnaires thématiques. Ils interrogent des personnes dépositaires des variétés linguistiques héritées, c’est-à-dire acquises naturellement. En outre, les témoins choisis pour les enquêtes ont aussi pratiqué les activités sur lesquelles ils sont interrogés.

Les entretiens sont ensuite dépouillés : le lexique est transcrit en phonétique puis en forme graphique ; les textes sont transcrits en forme graphique. L’ensemble des transcriptions vise à refléter au plus près les formes recueillies. Les données sont ensuite saisies dans la base où elles font l’objet d’une première série d’analyses en ce qui concerne le lexique.

Les fiches sont ventilées selon les thématiques et localités dont elles relèvent, et elles sont alors mises en ligne où elles sont consultables sous forme de listes ou de cartes (cf. infra). A ce jour (2020), environ 120 000 fiches lexicales sont accessibles sur Internet ainsi que des documents iconographiques. Plus d’un millier d’ethnotextes est à à disposition du public. D’autres enquêtes, terminées ou en cours sont dépouillées progressivement et seront accessibles à terme. Les ethnotextes, ainsi que les documents iconographiques, constituent un fonds de valeur ethnographique et permettent d’illustrer le lien langue – culture.

Il faut d’ailleurs souligner que la démarche du programme NALC-BDLC, qui vise à recueillir, conserver et restituer des données linguistiques et ethnographiques répond aux recommandations de l’UNESCO en matière de préservation et de restitution du patrimoine immatériel de l’humanité. En outre, sur le plan local, ces travaux font écho à une demande politique et sociale en direction de la connaissance et de la réappropriation de la langue.

Le programme NALC-BDLC assure donc un rôle mémoriel et patrimonial important. Mais il est avant tout un outil au service de la recherche en Sciences du Langage. En effet, les données du NALC et de la BDLC sont le matériau stimulant de productions scientifiques importantes au sein de notre laboratoire et au-delà. Parmi les acquis concédés par la réalisation du NALC et de la BDLC, on peut évoquer la contribution fondamentale apportée à la description du corse. Selon un principe acquis dans le domaine de la Géolinguistique, la variation synchronique d’une langue, qui s’inscrit dans l’espace, est généralement un reflet du temps. Ainsi, au travers de la production scientifique ont pu être réalisées des descriptions de l’évolution du corse depuis sa source latine sur le plan phonétique, sur le plan morphologique mais aussi sur le plan lexical. Si la variation lexicale permet d’éclairer la façon dont l’histoire a marqué la langue de son empreinte, elle révèle aussi des processus lexicaux profonds au travers des images qui se cachent derrière la formation du lexique et de l’évolution du sens. Les analyses menées sur ces phénomènes linguistiques permettent d’éclairer le fonctionnement du corse, et de poser ainsi les jalons d’une langue en devenir.

Rayonnement international

Le programme NALC-BDLC s’inscrit dans des travaux de plus large envergure :

  • l’Atlas Linguistique des Côtes de l’Arc Nord Occidental de la Méditerranée (ALCANOM)
  • l’Atlas Linguistique Roman (ALiR)
  • l’Atlas Linguarum Europae (ALE)
  • l’Atlante Linguistico Mediterraneo (ALM).

La participation à ces atlas transnationaux implique un traitement des données par l’analyse étymologique et motivationnelle et non la simple transmission de faits bruts.

En outre, les matériaux du NALC et de la BDLC sont insérés dans des chantiers lexicographiques italo-romans et romans, en particulier le du Dictionnaire Dialectal et Étymologique des Parlers Corses en préparation ainsi que le développement du Traitement Automatique des Langues (TAL) appliqué au corse (financement CPER, 2020-2022).

expand_less