<?xml version="1.0" encoding="UTF-8"?>
<TEI
change="metopes_publication#openedition"
xmlns="http://www.tei-c.org/ns/1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xi="http://www.w3.org/2001/XInclude"
xmlns:xhtml="http://www.w3.org/TR/xhtml/strict"
xmlns:ns="http://www.tei-c.org/ns/1.0"
xmlns:mathml="http://www.w3.org/1998/Math/MathML"
xmlns:loext="urn:org:documentfoundation:names:experimental:office:xmlns:loext:1.0"
xmlns:dcr="http://www.isocat.org/ns/dcr"
xmlns:aid5="http://ns.adobe.com/AdobeInDesign/5.0/"
xmlns:aid="http://ns.adobe.com/AdobeInDesign/4.0/"
><teiHeader
><fileDesc
><titleStmt
><title
type="main"
>DeepFLE : l’intelligence artificielle pour prédire et décrire le(s) niveau(x) du CECRL d’un texte</title
><author
role="aut"
><name
>Simona Ruggia</name
><affiliation
><ref
target="#aff01"
type="affiliation"
></ref
></affiliation
><idno
type="IDREF"
>076080692</idno
><idno
type="ISNI"
>0000000359037505</idno
><idno
type="HAL"
>simona-ruggia</idno
></author
></titleStmt
><editionStmt
><edition
><date
>2022-03-10T08:51:00</date
></edition
></editionStmt
><publicationStmt
><ab
type="papier"
><dimensions
><dim
type="pagination"
>103-109</dim
></dimensions
><date
>01/05/2021</date
></ab
><idno
type="book"
></idno
><ab
type="lodel"
><date
>01/05/2021</date
></ab
></publicationStmt
><sourceDesc
><p
>Version Métopes : 2.3</p
><p
>Written by OpenOffice</p
></sourceDesc
></fileDesc
><encodingDesc
><tagsDecl
><rendition
scheme="css"
xml:id="none"
>color:black;</rendition
></tagsDecl
></encodingDesc
><profileDesc
><langUsage
><language
ident="fr-FR"
></language
></langUsage
><textClass
><keywords
scheme="keyword"
xml:lang="fr"
><list
><item
>didactique du FLE</item
><item
>intelligence artificielle</item
><item
>deep learning</item
><item
>niveau de langue</item
><item
>CECRL</item
></list
></keywords
><keywords
scheme="keyword"
xml:lang="en"
><list
><item
>French as a foreign language didactics</item
><item
>artificial intelligence</item
><item
>deep learning</item
><item
>language levels</item
><item
>CEFRL</item
></list
></keywords
><keywords
scheme="subject"
xml:lang="fr"
><list
><item
>Compte-rendu</item
></list
></keywords
></textClass
></profileDesc
><revisionDesc
><change
when="2022-03-10T09:01:00"
who="Etienne Nadji"
>Révision</change
></revisionDesc
></teiHeader
><text
xml:id="text"
><front
><titlePage
><docTitle
><titlePart
style="T_3_Article"
type="main"
>DeepFLE : l’intelligence artificielle pour prédire et décrire le(s) niveau(x) du CECRL d’un texte</titlePart
></docTitle
><docAuthor
style="txt_auteur"
>Simona Ruggia</docAuthor
><byline
style="auteur_Courriel"
><email
><ref
target="mailto:simona.ruggia@univ-cotedazur.fr"
>simona.ruggia@univ-cotedazur.fr</ref
></email
></byline
><byline
style="auteur_Institution"
><affiliation
xml:id="aff01"
>Maître de conférences / HDR en didactique du FLE à l’université Côte d’Azur. Elle est responsable de l’axe 3 : « Corpus et didactique des langues » de l’équipe « Logométrie. Corpus, traitements, modèles » au sein du laboratoire « Bases, Corpus, Langage » UMR 7320/CNRS/UCA. Ses travaux de recherche portent sur la didactique du FLE en l’adossant à l’étude outillée de corpus numériques et en faisant appel aux atouts de l’intelligence artificielle.</affiliation
></byline
></titlePage
><div
type="resume_motscles"
><p
style="txt_Resume"
>Cette contribution se penche sur les atouts de l’intelligence artificielle en didactique du FLE en présentant les fonctionnalités de DeepFLE : une plateforme capable d’évaluer et de décrire le(s) niveau(x) d’un texte en français.</p
><p
style="txt_Motclef"
>Mots-clés : didactique du FLE, intelligence artificielle, deep learning, niveau de langue, CECRL</p
><p
style="txt_Resume_italique"
xml:lang="en"
>This contribution examines the strengths of artificial intelligence in teaching French as a foreign language by presenting the features of DeepFLE: a platform capable of evaluating and describing the level (s) of a text in French.</p
><p
style="txt_Motclef_italique"
>Keywords : French as a foreign language didactics, artificial intelligence, deep learning, language levels, CEFR</p
><p
style="txt_Motclef_italique"
>Rubrique : Compte-rendu</p
></div
></front
><body
><div
type="chapitre"
xml:id="mainDiv"
><div
type="section1"
><head
style="T_1"
subtype="level1"
>Introduction</head
><p
style="txt_Normal"
>L’intelligence artificielle<note
n="1"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn1"
><p
>L’Intelligence artificielle est une branche de l’informatique fondamentale.</p
></note
> (I.A.), nouvel atout de nombreuses disciplines, offre :</p
><quote
rend="quotation"
style="txt_Citation"
>aux chercheurs en analyse de corpus [des possibilités nouvelles] en donnant à voir des représentations du texte originales, en objectivant des parcours de lecture heuristiques, en faisant émerger de nouveaux observables linguistiques. (Mayaffre et Vanni, 2021, p.10)</quote
><p
style="txt_Normal"
>Les potentialités de l’I.A. nous ont permis d’envisager de nouvelles pistes de recherche en didactique du français langue étrangère (FLE) qui ont mené à la création d’un outil d’analyse de textes innovant et performant : la plateforme DeepFLE<note
n="2"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn2"
><p
><ref
target="http://deeptext.unice.fr/FLE"
><hi
rend="underline"
style="typo_souligne"
>http://deeptext.unice.fr/FLE</hi
></ref
>. Cette plateforme est en libre accès.</p
></note
> qui est capable de prédire et de décrire les spécificités du ou des niveau(x) d’un texte<note
n="3"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn3"
><p
>À l’instar du CECRL, nous considérons un texte comme une « séquence discursive (orale et/ou écrite) » (Conseil de l’Europe, 2001, p.15). Actuellement, la plateforme reconnaît le niveau des textes oraux, prochainement elle reconnaîtra aussi celui des textes écrits.</p
></note
> oral en français selon les échelles du <hi
rend="italic"
style="typo_Italique"
>Cadre Européen Commun de Référence pour les langues</hi
> (CERCL) (Conseil de l’Europe, 2001 ; 2018). Dans cette contribution, nous présenterons la méthodologie adoptée ainsi que les fonctionnalités de la plateforme DeepFLE.</p
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>Une méthodologie interdisciplinaire</head
><p
style="txt_Normal"
>Le caractère innovant et interdisciplinaire de nos recherches<note
n="4"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn4"
><p
>Ce travail a bénéficié d'une aide du gouvernement français, gérée par l'Agence Nationale de la Recherche au titre du projet Investissements d’Avenir UCAJEDI portant la référence n° ANR-15-IDEX-01.</p
></note
> réside dans la méthodologie adoptée qui fait dialoguer la didactique du FLE, l’Intelligence Artificielle (IA) et l’analyse des données textuelles (ADT). Pour ce qui est de l’ADT, la méthode exploitée est la lecture contrôlée et assistée par l’analyse statistique des données textuelles, que nous appelons à l’instar de Mayaffre, la <hi
rend="italic"
style="typo_Italique"
>logométrie</hi
>, une méthode qui prend « une valeur heuristique plus que probatoire : interroger plutôt que prouver, interpréter autant qu’établir » (2010, p.12).</p
><p
style="txt_Normal"
>Ainsi, la didactique du FLE et notamment les ouvrages de référence tels que le CECRL (Conseil de l’Europe, 2001, 2018), les <hi
rend="italic"
style="typo_Italique"
>Référentiels pour le français</hi
> (Beacco et al<hi
rend="italic"
style="typo_Italique"
>.</hi
>, 2004, 2008, 2011 ; Beacco, Porquier, 2007 ; Riba, 2016) et les manuels de FLE constituent le point de départ pour l’étude de la description des caractéristiques des textes en fonction des six niveaux de langue, allant de A1 à C2. Le <hi
rend="italic"
style="typo_Italique"
>deep learning</hi
> et plus particulièrement le modèle de <hi
rend="italic"
style="typo_Italique"
>deep learning </hi
>: <hi
rend="italic"
style="typo_Italique"
>Text Deconvolution Saliency</hi
> (Vanni et al.,<hi
rend="italic"
style="typo_Italique"
> </hi
>2018 ; 2020) et la logométrie enrichissent et complètent la description des niveaux des textes, mais surtout en permettent l’évaluation. D’une part, le modèle TDS « implémente l’analyse prédictive du <hi
rend="italic"
style="typo_Italique"
>deep learning</hi
> à l’analyse descriptive grâce à une extraction des passages-clés » (Ruggia 2019, p.83) en fournissant « une évaluation de leur pertinence interprétative » (Vanni et al., 2018, p.460). D’autre part, la logométrie grâce à l’analyse statistique met au jour des observables linguistiques complexes susceptibles de caractériser un locuteur ou un discours.</p
><p
style="txt_Normal"
>Cette méthodologie a permis de vérifier notre hypothèse de recherche, à savoir « le TDS est capable d’extraire les caractéristiques de textes en français et, plus précisément, il est capable d’extraire les saillances qui marquent un changement de niveau selon le CECRL » (Ruggia, 2019, p.82). Pour ce faire, nous avons d’abord constitué un corpus d’entraînement<note
n="5"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn5"
><p
>Le corpus nécessaire pour le <hi
rend="italic"
style="typo_Italique"
>deep learning</hi
> se nomme corpus d’entraînement ou d’apprentissage.</p
></note
> indispensable pour l’apprentissage profond. Ce corpus constitué de six classes<note
n="6"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn6"
><p
>En <hi
rend="italic"
style="typo_Italique"
>deep learning,</hi
> on appelle « classes » les différentes parties du corpus à identifier.</p
></note
>, soit 100 000 occurrences<note
n="7"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn7"
><p
>Les occurrences correspondent aux formes graphiques (mots) et aux ponctèmes (signes de ponctuation).</p
></note
> minimum pour chaque classe, correspondant aux six niveaux du CECRL, comprend des textes oraux (monologues et interactions) extraits de nombreux manuels de FLE qui s’inscrivent dans l’approche actionnelle<note
n="8"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn8"
><p
>Ces ouvrages ont été publiés entre 2005 et 2018. Pour une description détaillée du corpus, voir Ruggia et Vanni (Sous presse) et Ruggia (2020).</p
></note
>. Ensuite, nous avons analysé la véridicité des résultats du TDS, en comparant les passages-clés<note
n="9"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn9"
><p
>Un passage-clé est « une unité de surcroit textométrique ; c’est-à-dire une unité dont la pertinence est calculable et l’extraction automatique » (Vanni et al<hi
rend="italic"
style="typo_Italique"
>.</hi
> 2018, p.461).</p
></note
> détectés pour la reconnaissance d’un ou des niveaux d’un texte, avec les inventaires des <hi
rend="italic"
style="typo_Italique"
>Référentiels pour le français</hi
> (Beacco et al., 2004, 2008, 2011 ; Beacco, Porquier, 2007 ; Riba, 2016). Enfin, grâce à la logométrie nous avons cherché la distribution statistique de ces passages-clés, ce qui a permis non seulement de prouver les résultats du TDS mais aussi d’attribuer des observables linguistiques aux diverses classes de niveau (Ruggia, 2020).</p
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>La plateforme DeepFLE</head
><p
style="txt_Normal"
>DeepFLE, premier résultat d’une recherche en cours dont nous avons brièvement illustré supra le protocole méthodologique, a été créée pour tous les acteurs du FLE, aussi bien pour les chercheurs en didactique que pour les enseignants, évaluateurs, concepteurs de manuels et apprenants. L’utilisateur peut obtenir en quelques secondes la prédiction et la description du ou des niveau(x) d’un texte oral en français.</p
><p
style="txt_Normal"
>Concrètement, il suffit de copier-coller dans la fenêtre « entrez votre texte » le texte que l’on souhaite faire analyser et de cliquer sur « détection du niveau », comme l’illustre la figure 1.</p
><figure
><graphic
url="../icono/br/ruggia_1.png"
></graphic
><head
style="titre_figure"
>Figure 1 : Prédiction et description des niveaux d’un texte avec DeepFLE</head
></figure
><p
style="txt_Normal"
>Grâce au modèle de <hi
rend="italic"
style="typo_Italique"
>deep learning </hi
>intégré, la plateforme détecte les passages-clés du texte soumis qui correspondent à un ou plusieurs niveaux. Les résultats de la prédiction s’affichent aussi bien sous forme de diagramme type radar que de score attribué. Dans le cas de la figure 1, le texte soumis est reconnu à 88.89% de niveau A2 et à 11.11% de niveau B1<note
n="10"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn10"
><p
>Ces résultats montrent la finesse de l’analyse. Un texte a un niveau global mais sauf pour les textes de niveau A1 il comporte toujours un ou plusieurs passages d’un niveau inférieur ou supérieur.</p
></note
>. La description des spécificités lexicales, grammaticales et morphosyntaxiques est visible grâce aux couleurs attribuées à certains marqueurs des passages-clés :</p
><figure
><graphic
url="../icono/br/ruggia_2.gif"
></graphic
><head
style="titre_figure"
>Figure 2 : Prédiction et description d’un passage-clé de niveau A1 avec DeepFLE</head
></figure
><p
style="txt_Normal"
>Cette analyse descriptive<note
n="11"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn11"
><p
>L’analyse descriptive est possible grâce à la lemmatisation préalable des textes qui a été effectuée avec TREE TAGGER.</p
></note
> (figure 2) met en évidence la nature des marqueurs qui ont fortement contribué à la prédiction du niveau. Dans cet exemple, « et » (en bleu) a été détecté en tant que mot, donc pour sa forme graphique, et « il » (en vert) en tant que lemme. En orange sont indiquées les catégories grammaticales sous forme de codes, ici « VER :pper »<note
n="12"
place="foot"
style="txt_Note"
type="standard"
xml:id="ftn12"
><p
>La liste des codes grammaticaux utilisés est consultable sur la plateforme.</p
></note
> correspondant au verbe au participé passé « été ». En cliquant sur « précédent » et « suivant », on peut naviguer dans le texte, en visualisant les autres passages-clés analysés.</p
><p
style="txt_Normal"
>DeepFLE exploite la dernière version du TDS, à savoir le TDS pondéré qui « attribue un score à chaque mot (chaque <hi
rend="italic"
style="typo_Italique"
>token</hi
>) pour chaque classe » (Vanni et al. 2020, p.7). Ainsi, le TDS de chaque mot ou <hi
rend="italic"
style="typo_Italique"
>token</hi
> « peut être soit positif soit négatif selon la classe observée en sortie et en fonction du fait que le <hi
rend="italic"
style="typo_Italique"
>token</hi
> a servi ou au contraire desservi cette classe » (<hi
rend="italic"
style="typo_Italique"
>ibid</hi
>.).</p
><p
style="txt_Normal"
>Cette fonctionnalité, accessible en cliquant sur le lien « plus d’infos » au-dessous de chaque passage-clé, comme le montre l’exemple de la figure 3,</p
><p
style="txt_Normal"
>est illustrée par un tableau (figure 4) du taux d’activation des marqueurs du passage sélectionné.</p
><figure
><graphic
url="../icono/br/ruggia_3.gif"
></graphic
><head
style="titre_figure"
>Figure 3 : Prédiction et description d’un passage-clé de niveau A2</head
></figure
><figure
><graphic
url="../icono/br/ruggia_4.gif"
></graphic
><head
style="titre_figure"
>Figure 4 : Tableau du taux d’activation des marqueurs d’un passage-clé de niveau A2</head
></figure
></div
><div
type="section1"
><head
style="T_1"
subtype="level1"
>Bilan et perspectives</head
><p
style="txt_Normal"
>La puissance de l’Intelligence Artificielle ainsi que les nombreuses recherches sur ses exploitations possibles sont aujourd’hui un atout incontournable. En didactique du FLE, son utilisation pour la prédiction et la description automatique de(s) niveau(x) d’un texte selon les échelles du CECRL a déjà fourni des résultats très satisfaisants, comme le prouve la plateforme DeepFLE, dont nous souhaitons développer les fonctionnalités et optimiser l’analyse en poursuivant nos recherches et en constituant de nouveaux corpus d’entraînement.</p
></div
></div
></body
><back
><div
type="bibliographie"
><head
style="T_1"
>Références</head
><listBibl
><bibl
style="txt_Bibliographie"
>Beacco, J.C. et al. (2004). <hi
rend="italic"
style="typo_Italique"
>Niveau B2 pour le français, un référentiel</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Beacco, J.C. et al. (dir.). (2008). <hi
rend="italic"
style="typo_Italique"
>Niveau A2 pour le français, un référentiel</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Beacco, J.C. et al. (dir.). (2011). <hi
rend="italic"
style="typo_Italique"
>Niveau B1 pour le français, un référentiel</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Beacco, J.C. et Porquier R. (2007). <hi
rend="italic"
style="typo_Italique"
>Niveau A1 pour le français, un référentiel</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Conseil de l’Europe. (2001). <hi
rend="italic"
style="typo_Italique"
>Cadre Européen Commun de Référence pour les langues : apprendre, enseigner, évaluer</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Conseil de l’Europe. (2018). <hi
rend="italic"
style="typo_Italique"
>Cadre Européen Commun de Référence pour les Langues : volume complémentaire avec des nouveaux descripteurs</hi
>. <ref
target="https://rm.coe.int/cecr-volume-complementaire-avec-de-nouveaux-descripteurs/16807875d5"
>https://rm.coe.int/cecr-volume-complementaire-avec-de-nouveaux-descripteurs/16807875d5</ref
></bibl
><bibl
style="txt_Bibliographie"
>Mayaffre, D. (2010). <hi
rend="italic"
style="typo_Italique"
>Vers une herméneutique matérielle numérique. Corpus textuels, logométrie et langage politique</hi
>, [Habilitation à Diriger des Recherches]. Université Nice Sophia Antipolis.</bibl
><bibl
style="txt_Bibliographie"
>Mayaffre, D. et Vanni, L. (2021). (dir.). L’intelligence artificielle des textes. Des algorithmes à l’interprétation. Honoré Champion.</bibl
><bibl
style="txt_Bibliographie"
>Riba, P. (2016). <hi
rend="italic"
style="typo_Italique"
>Niveaux C1 / C2 pour le français. Eléments pour un référentiel</hi
>. Didier.</bibl
><bibl
style="txt_Bibliographie"
>Ruggia, S. (2019). Le deep learning : un outil pour la didactique du FLE ?. <hi
rend="italic"
style="typo_Italique"
>Dialettica pedagogica</hi
>. 1, 79-106.</bibl
><bibl
style="txt_Bibliographie"
>Ruggia, S. (2020). Caractériser un texte en français : les passages-clés des niveaux A1 et A2 du CECRL. <hi
rend="italic"
style="typo_Italique"
>Actes des 15</hi
><hi
rend="sup italic"
style="typo_Exposant_Italic"
>èmes </hi
><hi
rend="italic"
style="typo_Italique"
>Journées internationales d’Analyse statistique des Données Textuelles</hi
>, 1-11. <ref
target="http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/RUGGIA_JADT2020.pdf"
>http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/RUGGIA_JADT2020.pdf</ref
>.</bibl
><bibl
style="txt_Bibliographie"
>Ruggia, S. et Vanni, L. (Sous presse). DeepFLE : la plateforme pour évaluer le niveau d’un texte selon le CECRL. <hi
rend="italic"
style="typo_Italique"
>Dialogues et Cultures</hi
>.</bibl
><bibl
style="txt_Bibliographie"
>Vanni, L. et al. (2018). Text Deconvolution Saliency (TDS): a deep tool box for linguistic analysis. Actes du 56th Annual Meeting of the Association for Computational Linguistics, 548–557. <ref
target="https://doi.org/10.18653/v1/P18-1051"
><hi
rend="underline"
style="typo_souligne"
>https://doi.org/10.18653/v1/P18-1051</hi
></ref
></bibl
><bibl
style="txt_Bibliographie"
>Vanni, L. et al. (2020). Hyperdeep : deep learning descriptif pour l’analyse de données textuelles. <hi
rend="italic"
style="typo_Italique"
>Actes des 15</hi
><hi
rend="sup italic"
style="typo_Exposant_Italic"
>èmes </hi
><hi
rend="italic"
style="typo_Italique"
>Journées internationales d’Analyse statistique des Données Textuelles</hi
>, 1-12. <ref
target="http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/VANNI_CORNELI_LONGREE_MAYAFFRE_PRECIOSO_JADT2020.pdf"
>http://lexicometrica.univ-paris3.fr/jadt/JADT2020/jadt2020_pdf/VANNI_CORNELI_LONGREE_MAYAFFRE_PRECIOSO_JADT2020.pdf</ref
>.</bibl
></listBibl
></div
></back
></text
></TEI
>
