Outils

Un concordancier pour les textes corses

Un concordancier est un logiciel qui permet de rechercher, dans un corpus de textes, des mots ou des expressions à partir de requêtes plus ou moins complexes.

Le résultat de la recherche, la concordance, reprend les occurrences trouvées dans le corpus, accompagnées de leur contexte gauche et droit.

Ce type d'application est particulièrement utile pour étudier la langue car il permet de s'appuyer sur des éléments concrets, attestés dans le corpus.

 

Le concordancier des ethnotextes de la BDLC

La BDLC propose l'accès aux ethnotextes contenus dans la base par l'intermédiaire d'un concordancier. Celui-ci permet une personnalisation du corpus sur la base de plusieurs métadonnées (thèmes, localités, etc.)

Les données actuellement disponibles correspondent aux ethnotextes contenus dans la BDLC.

Cette interface a été mise en place grâce à la collaboration du Cental (Centre de Traitement Automatique du Langage, UCLouvain, Belgique).

 

Accès direct : https://bdlc.univ-corse.fr/concord/

Le concordancier du Corpus Canopé de Corse (CCdC)

Par le biais d’une convention avec Canopé, et afin de développer le TAL au service du corse nous avons pu constituer un corpus constitué de 72 documents – partiellement ou totalement en corse – correspondant à plusieurs typologies de textes (manuels, littérature enfantine etc.).
Ces documents ont été traités dans le cadre d’un concordancier spécifique conçu à la façon de celui qui est disponible pour les ethnotextes de la BDLC, créé en collaboration avec le Cental.
Le Corpus Canopé de Corse (CCdC) a été versé sur Ortolang et est disponible au lien suivant : https://bdlc.univ-corse.fr/concord_ccdc/