Depuis janvier 2019, le programme BDLC travaille au développement d'outils et de ressources pour mettre en oeuvre le Traitement Automatique du Langage (TAL) appliqué à la langue corse.
Celui-ci a pu être développé à la faveur d'un financement pour le programme de recherches "Un outil au service de la Corse et des Corses: la Banque de Données langue Corse (BDLC)" dans le cadre réalisé du Contrat de Plan Etat-Région (CPER) 2015 – 2020 et dans le cadre du projet ANR-21-CE27-0004 DIVITAL soutenu par l’Agence Nationale de la Recherche."
L'objectif est de créer et de mettre à disposition de la communauté scientifique et du grand public, une boîte à outils pour le TAL corse contenant des ressources et des outils de base. Nous proposerons donc progressivement un ensemble de démonstrations et de ressources mises au point par notre équipe, entre autres : corpus corses, articles électronique, détection de langue, interface de recherche et de consultation de textes lemmatisés, etc.
Pour plus de détails, ou pour faire référence à nos travaux, vous pouvez consulter la liste de publications ci-dessous.
Pour nous contacter : kevers_l AT univ-corse.fr
 
Kevers L. (2022) CoSwID, a Code Switching Identification Method Suitable for Under-Resourced Languages. 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under-Resourced Languages (SIGUL2022 @LREC2022), European Language Resources Association, Jun 2022, Marseille, France. pp.112-121. [SIGUL Proceedings] [HAL]
 
Kevers L. (2022). L'identification de langue, un outil au service du corse et de l'évaluation des ressources linguistiques. Traitement Automatique des Langues, 2021, 62 (3), Diversité Linguistique, pp.13-37. [TAL] [HAL]
 
Retali-Medori S. et Kevers L. (2022). La morphologie dans la Banque de Données Langue Corse : bilan et perspectives, Corpus, 23 | 2022, DOI : 10.4000/corpus.7115. [DOI] [HAL]
 
Kevers L., Retali-Medori S., Tognotti A.G. (2021). A Survey of Language Technologies Resources and Tools for Corsican. Research Report. UMR 6240 CNRS LISA - Université de Corse. [HAL]
 
Kevers L., Retali-Medori S. (2020). Towards a Corsican Basic Language Resource Kit. In : Proceedings of The 12th Language Resources and Evaluation Conference (LREC 2020), p.2726-2735. 11–16 May 2020, Marseille, France. [Article] [Article (ACLWeb)] [Actes LREC]
 
Kevers L., Retali-Medori S. (2019). Copyright in the context of tooling up Corsican and other less-resourced languages. In : International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide, International Year of Indigenous Languages – IYIL 2019. [Article] [Actes LT4ALL]
 
Kevers L., Retali-Medori S., Guéniot F., Tognotti A.G. (2019). Tooling up a less-resourced language with NLP : the example of Corsican and the BDLC. In : International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide, International Year of Indigenous Languages – IYIL 2019. [Poster] [Actes LT4ALL]
 
Kevers L., Guéniot F., Tognotti A.G. et Retali-Medori S. (2019). Outiller une langue peu dotée grâce au TALN : l’exemple du corse et de la BDLC. In : Actes de la 26e conférence sur le Traitement automatique des langues naturelles (TALN). Toulouse, juillet 2019. [Article] [Poster] [Article (ACLWeb)] [Actes TALN]