Introduction et description :
Cette interface permet d'explorer le corpus CCdC, un ensemble de textes en langue corse - oeuvres littéraires (adulte, jeunesse, enfants) et documents relatifs au patrimoine et à l'histoire - issus du fonds documentaire de
Canopé de Corse.
En savoir plus... [Afficher/Cacher]
Le corpus CCdC a été développé dans le cadre du projet « Un outil linguistique au service de la Corse et des Corses : la Banque de Données Langue Corse (BDLC) » (financé par le programme CPER), et plus spécifiquement des développements en TAL (Traitement Automatique des Langues) qui y sont menés. Ce projet a entre autres pour objectif de constituer et mettre à disposition des ressources linguistiques, dont ce corpus et ce concordancier sont un exemple.
La majorité du contenu est en corse, mais d’autres langues – le français en particulier – peuvent apparaître ponctuellement. La taille du corpus, pour cette version initiale, est de 507 215 mots (comptage effectué à l’aide de l’outil wc sous Linux) répartis dans 40 documents.
Le corpus CCdC a été publié sur la plateforme Ortolang sous une licence Creative Common (CC BY-NC-SA 4.0). Pour plus de détails sur la création du corpus, veuillez consulter la documentation. Des informations relatives aux travaux en TAL sur le corse sont disponibles dans la bibliographie proposée dans cette documentation ou sur la page du projet.
Si vous utilisez ce concordancier et/ou le corpus, merci de mentionner cette page et de citer les éléments suivants :
- Documentation : Laurent Kevers (2022). CCdC - Le Corpus Canopé de Corse. Rapport, UMR 6240 CNRS LISA - Université de Corse, 12/12/2022.
- Corpus : Laurent Kevers, Connor MacLean (2023). Corpus Canopé de Corse (CCdC) [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr, v1, https://hdl.handle.net/11403/corpus-canope-de-corse/v1.
Mode d'emploi rapide :
- La portée d'une recherche peut être ajustée en sélectionnant une ou plusieurs métadonnées (cadres ci-dessous).
- Introduisez un terme dans le champ de recherche situé sous les cadres de métadonnées. Vous pouvez également utiliser le formulaire de recherche avancée.
- Les lignes de la concordance peuvent être triées sur l'occurence, le contexte gauche et/ou le contexte droit.
- Pour une introduction plus détaillée, vous pouvez consulter le manuel disponible pour le concordancier BDLC, qui est construit à partir du même système [MANUEL].
Mise à jour des données : 01/2023.