Master Traitement Automatique des Langues (TAL/NLP)

Liste chronologique des étapes d’admission
Etape
Candidature via une plateforme en ligne
Modalités
Dossier via une plateforme Web (Parcours Sup, e-candidat, mon master, site web organisme de formation)
Lieu
transmission de documents (courrier postal ou électronique, dépôt sur un site web)
Point de contact
Bloc de compétences
Libellé descriptif du bloc
PROBABILITÉS, STATISTIQUES ET ALGORITHMES POUR L’IA
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
CORPUS POUR L’ÉCRIT ET LOGIQUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
OUTILS ET ENJEUX DU DÉVELOPPEMENT TAL
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
SPÉCIALISATION ILPC
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Libellé descriptif du bloc
SPÉCIALISATION LI
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Libellé descriptif du bloc
PROJET ET LANGUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
APPRENTISSAGE AUTOMATIQUE ET IA SYMBOLIQUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
CORPUS POUR L’ORAL ET OUTILS FORMELS
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Libellé descriptif du bloc
CORPUS POUR L’ORAL ET LINGUISTIQUE APPLIQUÉE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Libellé descriptif du bloc
TRAITEMENT DES DONNÉES LANGAGIÈRES
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
LINGUISTIQUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
PROJET ET LANGUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
FONDAMENTAUX TAL
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
OUVERTURES
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
SPÉCIALISATION ILPC
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
SPÉCIALISATION LI
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
PROJET ET LANGUE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Libellé descriptif du bloc
STAGE
Peut être suivi de manière indépendante sous réserve d’avoir les compétences pré-requises
Non
Qualification associée inscrite au RNCP ou Répertoire spécifique
Non
Ce bloc est
Niveau de diplôme minimum pour accéder à l’action via une VAPP
Caractéristiques de l’action
Publics ciblés
Etudiant en poursuite d'études
Etudiant en réorientation
Métier(s) ciblé(s)
Description détaillée
Niveau de diplôme minimum requis
Bac+3 / Niveau 6
Diplôme délivré
Master
Support d’informations (présentation, programme, …)
Déroulement de l’action
Type(s) de parcours concerné(s)
Licence / Bachelor+ Master / Mastère
Modalité(s)
Durée globale
2.00
Unité
Année(s)
En Alternance
Non
Précision
Dans le cas des étudiants sans alternance
Nombre d’heures en entreprise
700
Modalité
Précisions (fréquence, période, …)
Le second semestre du M2 est dédié à un stage, soit en entreprise, soit en laboratoire, se concluant par une présentation de mémoire devant un jury.
Unité
Mois
Durée globale
2.00
Unité
Année(s)
En Alternance
Non
Précision
Dans le cas des étudiants avec alternance (contrat de professionnalisation ou contrat d'apprentissage)
Nombre d’heures en entreprise
2450
Précisions (fréquence, période, …)
Périodes de 4 semaines de cours / 4 semaines en entreprise en fonction du calendrier imposé par l'IDMC. La période dédiée au stage obligatoire du M2 se traduit par des semaines de présence en entreprise ininterrompues. Les étudiants effectuant une alternance sont exemptés des projets.
Alternance sur une durée de
2.00
Unité
Année(s)
Précisions sur les outils
Mise à disposition d'infrastructures par l'IDMC :
- Grid 5K (infrastructure à grande échelle pour simuler et tester des applications complexes.)
- Cluster ENACT (un label d'excellence et un ensemble de moyens pour l'écosystème de formation, recherche et innovation en IA du Grand Est.)

Outils :
- Python (+ libraries Python: ​​pandas, scikitlearn, scipy, NLTK, etc)
- Github
- Shell
- LaTeX
- TTC TermSuite
- Huggingface
- MLflow
Raison sociale
IDMC - Institut des sciences du Digital - Management & Cognition
Points de contact
Zone(s) géographique(s) gérée(s) par le contact pour l'action
Lorraine : Meurthe-et-Moselle (54)
Fonction
Responsable administratif
Responsable du suivi des apprenants
Civilité
Monsieur
Prénom
Alexandre
Nom
Ruaux-Andrique
Téléphone
0000000000
Adresse
13 rue Michel Ney
Contact interne de l’organisme pour les processus de gestion du Numéric’Emploi
Off
Affichage média(s) de contact dans le répertoire
Bloc de compétence
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
PROBABILITÉS ET STATISTIQUES
Thème(s) abordé(s) dans le module
Ce cours reprend les propriétés mathématiques fondamentales de la probabilité et des statistiques, en couvrant les méthodes classiques d'analyse de données et en introduisant des techniques plus complexes telles que les SVM et l'analyse discriminatoire, avec des applications pratiques utilisant des données réelles et le logiciel R.
Titre du module
PROGRAMMATION PYTHON
Thème(s) abordé(s) dans le module
Ce cours est conçu pour offrir une introduction complète à Python pour les débutants et pour approfondir les compétences en Python afin de résoudre des problèmes complexes et développer des applications de haut niveau en utilisant diverses bibliothèques pour les apprenants avancés.
Cours / Topos en synchrone (heures)
30.00
Travaux dirigés en synchrone (heures)
30.00
Nom du bloc de compétence
8699
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
CORPUS POUR L’ÉCRIT
Thème(s) abordé(s) dans le module
Ce cours se concentre sur les méthodes et techniques utilisées en TAL pour la création et l'exploitation de corpus écrits, en introduisant la linguistique de corpus, les critères de construction de corpus, la collecte de données sur le web, la gestion de différents formats de documents et les procédures d'annotation à plusieurs niveaux, ainsi que les logiciels d'exploitation des données.
Titre du module
LOGIQUE
Thème(s) abordé(s) dans le module
Ce cours a pour objectif de familiariser les étudiants avec les concepts et méthodes fondamentaux de la logique formelle, en présentant la syntaxe et la sémantique de la logique propositionnelle et du calcul des prédicats, avant d'aborder le lambda-calcul et la logique d'ordre supérieur.
Cours / Topos en synchrone (heures)
25.00
Travaux dirigés en synchrone (heures)
25.00
Nom du bloc de compétence
8710
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
ÉTHIQUE EN TAL
Thème(s) abordé(s) dans le module
Ce cours introduit les étudiants aux questions éthiques en TAL, notamment la confidentialité des données, les biais algorithmiques, la manipulation de l'information et l'impact sociétal, à travers des discussions et des études de cas qui favorisent la prise de conscience éthique nécessaire pour concevoir des systèmes TAL responsables et agir de manière éthique dans leurs futurs travaux liés à l'IA.
Titre du module
OUTILS POUR GESTION DE PROJET
Thème(s) abordé(s) dans le module
Ce cours se concentre sur les outils pratiques essentiels pour une gestion de projet efficace, en apprenant aux étudiants à utiliser des plateformes comme Git, à travailler en ligne de commande en Shell, à collaborer sur des projets complexes et à utiliser LaTeX pour la documentation, leur permettant de gérer des projets en TAL de manière professionnelle et collaborative.
Titre du module
INTRODUCTION GÉNÉRALE AU TAL
Thème(s) abordé(s) dans le module
Ce cours offre une introduction complète aux concepts fondamentaux du TAL, tout en explorant la relation entre le TAL, l'informatique et la linguistique, et en abordant l'impact écologique de ces avancées.
Cours / Topos en synchrone (heures)
25.00
Travaux dirigés en synchrone (heures)
25.00
Nom du bloc de compétence
8711
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
LINGUISTIQUE GÉNÉRALE, PHONÉTIQUE, SÉMANTIQUE, MORPHOLOGIE, SYNTAXE
Thème(s) abordé(s) dans le module
Ce cours, destiné aux étudiants ayant un profil technique, propose un aperçu de la linguistique générale, abordant des questions allant de la linguistique de terrain à la psycholinguistique, chaque module couvrant les concepts fondamentaux des sous-disciplines linguistiques.
Cours / Topos en synchrone (heures)
25.00
Travaux dirigés en synchrone (heures)
25.00
Nom du bloc de compétence
8712
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
INFORMATIQUE FONDAMENTALE
Thème(s) abordé(s) dans le module
Ce cours, destiné aux étudiants ayant un parcours en linguistique, explore les compétences informatiques essentielles pour le TAL et la linguistique computationnelle. En couvrant des concepts clés tels que les grammaires, les graphes, les arbres, les automates et les expressions régulières, les étudiants apprendront à modéliser et analyser la structure des langues naturelles, définir des règles de production, représenter des informations hiérarchiques et résoudre des problèmes liés au TAL.
Cours / Topos en synchrone (heures)
25.00
Travaux dirigés en synchrone (heures)
25.00
Nom du bloc de compétence
8713
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
PROJET TRANSVERSE
Thème(s) abordé(s) dans le module
Le projet permet aux étudiants de travailler sur un thème libre de leur choix, les guidant dans l'identification des compétences interdisciplinaires nécessaires à un projet en TAL tout en leur fournissant des outils pratiques et conceptuels pour la gestion de projet.
Titre du module
ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
Thème(s) abordé(s) dans le module
Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
Cours / Topos en synchrone (heures)
10.00
Travaux dirigés en synchrone (heures)
34.00
Nom du bloc de compétence
8714
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
APPRENTISSAGE AUTOMATIQUE
Thème(s) abordé(s) dans le module
Ce cours introduit les modèles bayésiens pour couvrir les principes fondamentaux de l'apprentissage automatique, y compris la supervision, la classification et l'optimisation, tout en abordant des scénarios industriels. Il met l'accent sur les aspects concrets et les meilleures pratiques pour l'utilisation des méthodes d'apprentissage automatique, telles que l'analyse des données, le prétraitement, la visualisation, la mesure de la qualité et la gestion de grands corpus et de flux de données.
Titre du module
IA SYMBOLIQUE
Thème(s) abordé(s) dans le module
Le cours d'IA Symbolique se concentre sur les approches « centrées sur la connaissance » de l'IA, c'est-à-dire les méthodes de résolution de problèmes, de support à la décision et d'apprentissage basées sur la représentation explicite et formalisée de la connaissance. À partir des systèmes traditionnels basés sur la connaissance et des méthodologies d'ingénierie des connaissances associées, le cours aborde les méthodes et technologies liées au web sémantique, y compris les graphes de connaissances et les ontologies.
Cours / Topos en synchrone (heures)
30.00
Travaux dirigés en synchrone (heures)
30.00
Nom du bloc de compétence
8715
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
CORPUS POUR LA PAROLE
Thème(s) abordé(s) dans le module
Ce cours couvre les modalités de la parole, y compris le son, les images faciales et les gestes, ainsi que les dispositifs technologiques pour la collecte de données et les contraintes techniques et éthiques associées.
Titre du module
LANGAGES FORMELS
Thème(s) abordé(s) dans le module
Ce cours couvre les fondements théoriques des grammaires et langages formels, leurs relations et connexions avec les machines et algorithmes de reconnaissance.
Titre du module
CALCULABILITÉ ET COMPLEXITÉ
Thème(s) abordé(s) dans le module
Ce cours aborde la calculabilité et la complexité algorithmique, en se concentrant sur les machines de Turing, les fonctions non calculables, les problèmes indécidables, les mesures de complexité (espace, temps) et les classes de complexité distinctes (P, PSPACE, NP, EXPTIME).
Cours / Topos en synchrone (heures)
35.00
Travaux dirigés en synchrone (heures)
35.00
Nom du bloc de compétence
8716
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
CORPUS POUR LA PAROLE
Thème(s) abordé(s) dans le module
Ce cours couvre les modalités de la parole, y compris le son, les images faciales et les gestes, ainsi que les dispositifs technologiques pour la collecte de données et les contraintes techniques et éthiques associées.
Titre du module
MORPHOPHONOLOGIE
Thème(s) abordé(s) dans le module
Ce cours passe en revue brièvement les principales théories phonologiques, puis explore la construction lexicale d'un point de vue formel et étudie des cas spécifiques pour expliquer des incohérences sémantiques apparentes par le biais d'une analyse morphophonologique.
Titre du module
RELATION LEXIQUE-SYNTAXE ET POLYSÉMIE
Thème(s) abordé(s) dans le module
Ce cours explore les propriétés sémantiques et syntaxiques des noms désignant des événements, qu'ils soient dérivés ou non dérivés. Il se concentre sur la manière dont les noms déverbaux héritent des caractéristiques syntaxiques et sémantiques de leurs bases.
Cours / Topos en synchrone (heures)
35.00
Travaux dirigés en synchrone (heures)
35.00
Nom du bloc de compétence
8717
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
STOCKAGE ET RÉCUPÉRATION DE DONNÉES
Thème(s) abordé(s) dans le module
Ce cours familiarise les étudiants avec les techniques de récupération et d'analyse de données provenant de diverses sources (fichiers Excel, bases de données, web, tweets) et formats (XML, HTML, OWL, CSV, JSON).
Titre du module
ANALYSE DE DONNÉES
Thème(s) abordé(s) dans le module
Ce cours couvre les techniques de traitement, d'analyse et de visualisation des données. Il explique le prétraitement et la synthèse des données, les méthodes prédictives et les techniques de visualisation. De plus, il introduit des bibliothèques Python pour l'apprentissage statistique, telles que pandas, scikit-learn et SciPy.
Titre du module
RÉSEAUX DE NEURONES
Thème(s) abordé(s) dans le module
Ce cours introduit les réseaux de neurones, en se concentrant sur leur utilisation en apprentissage automatique et intelligence artificielle. Il couvre les concepts de base, les architectures usuelles, et les outils pour une implémentation rapide et simple.
Cours / Topos en synchrone (heures)
30.00
Travaux dirigés en synchrone (heures)
30.00
Nom du bloc de compétence
8718
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
PROSODIE, PHONÉTIQUE, SÉMANTIQUE, MORPHOLOGIE, SYNTAXE
Thème(s) abordé(s) dans le module
Ce cours explore des aspects clés de la linguistique, en se concentrant sur la prosodie, la phonétique, la morphologie, la syntaxe et la sémantique.
Cours / Topos en synchrone (heures)
30.00
Travaux dirigés en synchrone (heures)
30.00
Nom du bloc de compétence
8719
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
PROJET TUTORÉ
Thème(s) abordé(s) dans le module
Les étudiants de M1 réalisent un projet tutoré en groupe pour acquérir une première expérience en gestion de projet et se familiariser avec les équipes et les thématiques de laboratoire. Les étudiants doivent travailler environ une demi-journée par semaine sur des sujets introduits au semestre précédent.
Titre du module
ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
Thème(s) abordé(s) dans le module
Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
Titre du module
STAGE
Thème(s) abordé(s) dans le module
Cela permet aux étudiants d'effectuer un stage dans un laboratoire ou une entreprise entre le M1 et le M2.
Cours / Topos en synchrone (heures)
6.00
Travaux dirigés en synchrone (heures)
24.00
Nom du bloc de compétence
8720
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
RÉSEAUX DE NEURONES
Thème(s) abordé(s) dans le module
Ce cours offre un aperçu de l'apprentissage automatique basé sur les réseaux de neurones, abordant des sujets allant des perceptrons multicouches aux architectures avancées telles que les réseaux déterministes/probabilistes, les réseaux convolutifs et les réseaux récurrents.
Titre du module
TRAITEMENT DE L’ÉCRIT
Thème(s) abordé(s) dans le module
Ce cours présente les méthodes d'apprentissage et les bibliothèques spécialisées (par exemple, NLTK, Giza) utilisées pour modéliser diverses sous-tâches et applications dans le traitement des textes écrits, en mettant l'accent sur la traduction automatique et l'algorithme Expectation-Maximisation.
Titre du module
LANGUES PEU DOTÉES
Thème(s) abordé(s) dans le module
Ce cours se concentre sur l'étude et la préservation des langues peu dotées, explorant les défis liés au maintien de la diversité linguistique et à la revitalisation des langues en danger par le biais de stratégies sociolinguistiques, éducatives et technologiques.
Titre du module
GÉNÉRATION
Thème(s) abordé(s) dans le module
Ce cours explore la génération de texte comme un élément clé des grands modèles de langage, en se concentrant sur la génération de contenu à partir de données et de textes, y compris la simplification et le résumé automatique, tout en introduisant diverses approches symboliques, probabilistes et statistiques.
Titre du module
RESSOURCES LEXICALES
Thème(s) abordé(s) dans le module
Ce cours présente les principaux types de ressources lexicales informatisées, y compris les dictionnaires électroniques, les bases de données lexicales, les ontologies lexicales et les embeddings basés sur des transformers, en s'appuyant sur des concepts fondamentaux de lexicologie.
Titre du module
DIALOGUE, CHATBOT ET SYSTÈMES DE QUESTIONS-RÉPONSES
Thème(s) abordé(s) dans le module
Ce cours explore les avancées récentes en interaction homme-machine et couvre les principes de conception fondamentaux, les méthodes de développement et les aspects techniques sous-jacents.
Cours / Topos en synchrone (heures)
56.00
Travaux dirigés en synchrone (heures)
56.00
Nom du bloc de compétence
8721
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
MODÈLES SYNTAXIQUES
Thème(s) abordé(s) dans le module
Ce cours présente les concepts fondamentaux des formalismes grammaticaux symboliques pour décrire la syntaxe et l'interface syntaxe-sémantique en langue naturelle, en se concentrant sur divers systèmes formels tels que les grammaires catégorielles, les grammaires d’arbres adjoints et les grammaires fonctionnelles lexicales.
Titre du module
SÉMANTIQUE ET DISCOURS
Thème(s) abordé(s) dans le module
Ce cours introduit diverses méthodes pour représenter le sens des expressions complexes au niveau de la phrase, en se concentrant sur le lambda-calcul et la logique d'ordre supérieur, et en explorant comment le sens des expressions complexes est construit à partir de leurs composants, ainsi que des phénomènes dans le discours qui nécessitent des considérations contextuelles et hiérarchiques.
Titre du module
RECONNAISSANCE ET SYNTHÈSE DE LA PAROLE
Thème(s) abordé(s) dans le module
Ce cours explore les méthodes de conversion de la parole en texte et de génération de parole naturelle à partir de texte, tout en abordant les principes de la reconnaissance automatique de la parole et la conception de systèmes de synthèse vocale efficaces pour diverses applications.
Titre du module
TRAITEMENT DU SIGNAL
Thème(s) abordé(s) dans le module
Ce cours enseigne les fondements théoriques et les applications pratiques des techniques de signal audio, y compris l'acquisition, le prétraitement, l'analyse, et des sujets avancés tels que les transformations de Fourier et le filtrage adaptatif pour des applications telles que la reconnaissance de la parole et la détection de motifs audio.
Titre du module
ONTOLOGIE
Thème(s) abordé(s) dans le module
Ce cours examine la relation entre les niveaux lexical et ontologique, en se concentrant sur le traitement des termes polylexicaux dans des domaines spécialisés, en utilisant le logiciel TTC TermSuite pour l'analyse et la classification, et en explorant les ressources terminologiques et leur lien avec les données ouvertes liées.
Titre du module
SYSTÈMES INTELLIGENTS
Thème(s) abordé(s) dans le module
Ce cours se concentre sur les aspects d'apprentissage automatique des systèmes de recommandation, en particulier ceux basés sur les données d'utilisation des réseaux sociaux, guidant les étudiants dans l'évaluation de ces systèmes à travers des études de cas et fournissant une boîte à outils logicielle pour des expérimentations indépendantes.
Cours / Topos en synchrone (heures)
59.00
Travaux dirigés en synchrone (heures)
59.00
Nom du bloc de compétence
8722
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
GRANDS MODÈLES DE LANGUES
Thème(s) abordé(s) dans le module
Ce cours plonge les étudiants dans les grands modèles de langage, explorant leur architecture, leurs mécanismes d'entraînement et leurs applications pratiques pour générer un texte grammaticalement correct et sémantiquement pertinent, tout en favorisant des compétences d'évaluation critique pour mesurer l'efficacité des modèles dans divers contextes.
Titre du module
APPROCHES SYMBOLIQUES POUR LA DÉCOUVERTE DE CONNAISSANCES
Thème(s) abordé(s) dans le module
Ce cours initie les étudiants aux techniques avancées d'extraction symbolique des connaissances à partir de données textuelles non structurées.
Titre du module
RAISONNEMENT EN IA
Thème(s) abordé(s) dans le module
Ce cours explore la philosophie et les concepts de l'intelligence artificielle symbolique, en se concentrant sur les représentations symboliques, les règles de raisonnement et la modélisation cognitive, tout en analysant les forces et les limites de l'IA symbolique et des approches hybrides, ainsi que les questions éthiques liées à ces systèmes.
Titre du module
ROBUSTESSE DE LA PAROLE
Thème(s) abordé(s) dans le module
Ce cours se concentre sur la robustesse des systèmes de reconnaissance vocale, abordant la variabilité de la parole, les accents régionaux, le bruit de fond et les déformations acoustiques, tout en enseignant aux étudiants à identifier les vulnérabilités et à améliorer la fiabilité des systèmes dans des situations réelles à travers des études de cas pratiques.
Titre du module
ANALYSE D’OPINION ET MULTILINGUISME
Thème(s) abordé(s) dans le module
Ce cours se concentre sur l'analyse des opinions et le multilinguisme en traitant des données textuelles dans diverses langues, en explorant des techniques telles que les corpus comparables, les méthodes d'alignement de documents, et en enseignant aux étudiants à détecter les opinions à l'aide d'algorithmes d'apprentissage avancés.
Cours / Topos en synchrone (heures)
47.00
Travaux dirigés en synchrone (heures)
47.00
Nom du bloc de compétence
8723
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
INGÉNIERIE DE LA REQUÊTE
Thème(s) abordé(s) dans le module
Ce cours présente la méthode de programmation technique pour la génération de prompts. Les étudiants appliqueront ces méthodes pour générer différents niveaux de complexité de prompts pour les principaux grands modèles de langage.
Titre du module
TRAITEMENT DE L'ORAL
Thème(s) abordé(s) dans le module
Ce cours explore le lien entre la phonétique, la phonologie et le traitement automatique de la parole, couvrant des techniques avancées en reconnaissance vocale, synthèse, analyse de la prosodie, et abordant des défis tels que la variabilité de la prononciation, les accents régionaux et la gestion du bruit de fond.
Titre du module
PRAGMATIQUE
Thème(s) abordé(s) dans le module
Ce cours explore la pragmatique linguistique, en se concentrant sur la communication efficace à travers des concepts tels que la référence, la présupposition, l'implicature et les actes de langage, tout en les reliant à des représentations formelles en sémantique et en théorie du discours.
Titre du module
LEXICOLOGIE
Thème(s) abordé(s) dans le module
Ce cours introduit la lexicologie et la lexicographie, en se concentrant sur l'analyse synchronique et diachronique, les différences entre elles, et la traduction de la recherche lexicologique en descriptions de dictionnaires.
Titre du module
TERMINOLOGIE
Thème(s) abordé(s) dans le module
Ce cours se concentre sur la terminologie, enseignant aux étudiants à identifier, extraire et normaliser les termes spécifiques à un domaine, tout en explorant les méthodes de construction de bases de données terminologiques et d'alignement des terminologies multilingues.
Titre du module
INGÉNIERIE DU DIALOGUE
Thème(s) abordé(s) dans le module
Ce cours présente les définitions des modèles linguistiques de dialogue, la construction d'un corpus, la définition d'un système d'annotation et la production d'une ressource utilisable pour les chatbots.
Cours / Topos en synchrone (heures)
47.00
Travaux dirigés en synchrone (heures)
47.00
Nom du bloc de compétence
8724
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
DÉVELOPPEMENT DE LOGICIEL (PROJET)
Thème(s) abordé(s) dans le module
Ce cours se concentre sur le développement des compétences essentielles en programmation et en ingénierie logicielle, enseignant aux étudiants à concevoir, développer et tester des logiciels à travers des projets pratiques, tout en les familiarisant avec les méthodes de développement Agile et les meilleures pratiques en matière de qualité du logiciel.
Titre du module
ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
Thème(s) abordé(s) dans le module
Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
Titre du module
ÉTHIQUE, RECHERCHE ET ENTREPRISE
Thème(s) abordé(s) dans le module
Ce cours forme les étudiants à respecter les droits des participants concernant la collecte de données, le stockage et la publication de données personnelles, tout en explorant les dimensions éthiques dans la recherche académique et d'entreprise, en abordant les dilemmes liés à la confidentialité des données, à la cybersécurité et à l'intelligence artificielle.
Cours / Topos en synchrone (heures)
20.00
Travaux dirigés en synchrone (heures)
44.00
Nom du bloc de compétence
8725
Etape(s) concernée(s)
Phase de rattachement du bloc de compétence
Connaissances requises
Connaissances, Savoir-faire, Savoir-être abordés
Titre du module
STAGE
Thème(s) abordé(s) dans le module
Le second semestre du M2 est dédié à un stage, soit en entreprise, soit en laboratoire, se concluant par une présentation de mémoire devant un jury.
Apprentissage et travaux pratiques en autonomie / asynchrone (heures)
700.00
Nom du bloc de compétence
8726
Etape(s) concernée(s)
Précisions sur les moyens techniques
Mise à disposition d'infrastructures par l'IDMC :
- Grid 5K (infrastructure à grande échelle pour simuler et tester des applications complexes.)
- Cluster ENACT (un label d'excellence et un ensemble de moyens pour l'écosystème de formation, recherche et innovation en IA du Grand Est.)

Outils :
- Python (+ libraries Python: ​​pandas, scikitlearn, scipy, NLTK, etc)
- Github
- Shell
- LaTeX
- TTC TermSuite
- Huggingface
- MLflow
Label attribué
Non
Période(s) de démarrage d’une session (promotion)
Adresse
IDMC — Institut des Sciences du Digital, Management et Cognition, Pôle Herbert Simon, 13 Rue Michel Ney, 54000 Nancy, FRANCE
Mois de début
Nombre minimum d’apprenants par session
10
Nombre maximum d’apprenants par session
50
Domaine de compétences du diplôme
Présentation générale
Avec la prolifération des données numériques, la formation d’ingénieur·e·s et de chercheur·e·s capables de les valoriser est devenue un enjeu majeur, tant en termes d’opportunités commerciales (e-commerce, systèmes de recommandation, résumé automatique, traduction multilingue, etc.) que de bouleversements sociétaux (e-éducation, analyse d’opinions, prédiction de comportements, etc.).

Le Traitement Automatique des Langues (TAL), aussi appelé Natural Language Processing (NLP), est à la croisée de l’informatique, des mathématiques, de la linguistique et de l’intelligence artificielle. Son objectif est de créer des modèles informatiques capables de comprendre et de reproduire des langues naturelles (comme le français, l'arabe, le chinois, etc.), à l’opposé des langages formels utilisés en programmation ou en mathématiques.

Étudier le TAL/NLP, c’est relever un défi scientifique fascinant qui s’appuie sur :

- La linguistique : comprendre les règles qui régissent une langue et modéliser les schémas linguistiques.
- L’informatique : développer des modèles convertissant le texte en données et interpréter du contenu textuel ou des paroles.
- L’intelligence artificielle : utiliser des probabilités et statistiques aux réseaux de neurones, en passant par le machine learning.
- Les méthodes formelles : appliquer la logique et les mathématiques aux programmes informatiques.

Master Traitement Automatique des Langues (TAL/NLP)

Cursus : Enseignement supérieur (Universités, Ecoles d'ingénieur, Ecoles privées,...)
Parcours : Licence / Bachelor+ Master / Mastère
Toutes les informations affichées dans cette page sont communiquées à titre indicatif et sont non contractuelles. Veuillez contacter l’organisme de formation pour toute vérification.
  • Avec la prolifération des données numériques, la formation d’ingénieur·e·s et de chercheur·e·s capables de les valoriser est devenue un enjeu majeur, tant en termes d’opportunités commerciales (e-commerce, systèmes de recommandation, résumé automatique, traduction multilingue, etc.) que de bouleversements sociétaux (e-éducation, analyse d’opinions, prédiction de comportements, etc.).

    Le Traitement Automatique des Langues (TAL), aussi appelé Natural Language Processing (NLP), est à la croisée de l’informatique, des mathématiques, de la linguistique et de l’intelligence artificielle. Son objectif est de créer des modèles informatiques capables de comprendre et de reproduire des langues naturelles (comme le français, l'arabe, le chinois, etc.), à l’opposé des langages formels utilisés en programmation ou en mathématiques.

    Étudier le TAL/NLP, c’est relever un défi scientifique fascinant qui s’appuie sur :

    - La linguistique : comprendre les règles qui régissent une langue et modéliser les schémas linguistiques.
    - L’informatique : développer des modèles convertissant le texte en données et interpréter du contenu textuel ou des paroles.
    - L’intelligence artificielle : utiliser des probabilités et statistiques aux réseaux de neurones, en passant par le machine learning.
    - Les méthodes formelles : appliquer la logique et les mathématiques aux programmes informatiques.
    • Phase : Année 1

      PROBABILITÉS, STATISTIQUES ET ALGORITHMES POUR L’IA
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 60.0 heure(s) dont 60.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 30.0
      • Cours / Topos en synchrone (heures) : 30.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • PROBABILITÉS ET STATISTIQUES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours reprend les propriétés mathématiques fondamentales de la probabilité et des statistiques, en couvrant les méthodes classiques d'analyse de données et en introduisant des techniques plus complexes telles que les SVM et l'analyse discriminatoire, avec des applications pratiques utilisant des données réelles et le logiciel R.
      • PROGRAMMATION PYTHON
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours est conçu pour offrir une introduction complète à Python pour les débutants et pour approfondir les compétences en Python afin de résoudre des problèmes complexes et développer des applications de haut niveau en utilisant diverses bibliothèques pour les apprenants avancés.
      CORPUS POUR L’ÉCRIT ET LOGIQUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 50.0 heure(s) dont 50.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 25.0
      • Cours / Topos en synchrone (heures) : 25.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • CORPUS POUR L’ÉCRIT
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours se concentre sur les méthodes et techniques utilisées en TAL pour la création et l'exploitation de corpus écrits, en introduisant la linguistique de corpus, les critères de construction de corpus, la collecte de données sur le web, la gestion de différents formats de documents et les procédures d'annotation à plusieurs niveaux, ainsi que les logiciels d'exploitation des données.
      • LOGIQUE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours a pour objectif de familiariser les étudiants avec les concepts et méthodes fondamentaux de la logique formelle, en présentant la syntaxe et la sémantique de la logique propositionnelle et du calcul des prédicats, avant d'aborder le lambda-calcul et la logique d'ordre supérieur.
      OUTILS ET ENJEUX DU DÉVELOPPEMENT TAL
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 50.0 heure(s) dont 50.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 25.0
      • Cours / Topos en synchrone (heures) : 25.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • ÉTHIQUE EN TAL
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours introduit les étudiants aux questions éthiques en TAL, notamment la confidentialité des données, les biais algorithmiques, la manipulation de l'information et l'impact sociétal, à travers des discussions et des études de cas qui favorisent la prise de conscience éthique nécessaire pour concevoir des systèmes TAL responsables et agir de manière éthique dans leurs futurs travaux liés à l'IA.
      • OUTILS POUR GESTION DE PROJET
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours se concentre sur les outils pratiques essentiels pour une gestion de projet efficace, en apprenant aux étudiants à utiliser des plateformes comme Git, à travailler en ligne de commande en Shell, à collaborer sur des projets complexes et à utiliser LaTeX pour la documentation, leur permettant de gérer des projets en TAL de manière professionnelle et collaborative.
      • INTRODUCTION GÉNÉRALE AU TAL
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours offre une introduction complète aux concepts fondamentaux du TAL, tout en explorant la relation entre le TAL, l'informatique et la linguistique, et en abordant l'impact écologique de ces avancées.
      SPÉCIALISATION ILPC
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire pour un parcours de spécialisation au sein de l'action
      Formation - Volume horaire : 50.0 heure(s) dont 50.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 25.0
      • Cours / Topos en synchrone (heures) : 25.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • LINGUISTIQUE GÉNÉRALE, PHONÉTIQUE, SÉMANTIQUE, MORPHOLOGIE, SYNTAXE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours, destiné aux étudiants ayant un profil technique, propose un aperçu de la linguistique générale, abordant des questions allant de la linguistique de terrain à la psycholinguistique, chaque module couvrant les concepts fondamentaux des sous-disciplines linguistiques.
      SPÉCIALISATION LI
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire pour un parcours de spécialisation au sein de l'action
      Formation - Volume horaire : 50.0 heure(s) dont 50.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 25.0
      • Cours / Topos en synchrone (heures) : 25.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • INFORMATIQUE FONDAMENTALE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours, destiné aux étudiants ayant un parcours en linguistique, explore les compétences informatiques essentielles pour le TAL et la linguistique computationnelle. En couvrant des concepts clés tels que les grammaires, les graphes, les arbres, les automates et les expressions régulières, les étudiants apprendront à modéliser et analyser la structure des langues naturelles, définir des règles de production, représenter des informations hiérarchiques et résoudre des problèmes liés au TAL.
      PROJET ET LANGUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 44.0 heure(s) dont 44.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 34.0
      • Cours / Topos en synchrone (heures) : 10.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • PROJET TRANSVERSE
        • Type de module : obligatoire
        • Thèmes abordés :
          Le projet permet aux étudiants de travailler sur un thème libre de leur choix, les guidant dans l'identification des compétences interdisciplinaires nécessaires à un projet en TAL tout en leur fournissant des outils pratiques et conceptuels pour la gestion de projet.
      • ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
      APPRENTISSAGE AUTOMATIQUE ET IA SYMBOLIQUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 60.0 heure(s) dont 60.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 30.0
      • Cours / Topos en synchrone (heures) : 30.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • APPRENTISSAGE AUTOMATIQUE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours introduit les modèles bayésiens pour couvrir les principes fondamentaux de l'apprentissage automatique, y compris la supervision, la classification et l'optimisation, tout en abordant des scénarios industriels. Il met l'accent sur les aspects concrets et les meilleures pratiques pour l'utilisation des méthodes d'apprentissage automatique, telles que l'analyse des données, le prétraitement, la visualisation, la mesure de la qualité et la gestion de grands corpus et de flux de données.
      • IA SYMBOLIQUE
        • Type de module : obligatoire
        • Thèmes abordés :
          Le cours d'IA Symbolique se concentre sur les approches « centrées sur la connaissance » de l'IA, c'est-à-dire les méthodes de résolution de problèmes, de support à la décision et d'apprentissage basées sur la représentation explicite et formalisée de la connaissance. À partir des systèmes traditionnels basés sur la connaissance et des méthodologies d'ingénierie des connaissances associées, le cours aborde les méthodes et technologies liées au web sémantique, y compris les graphes de connaissances et les ontologies.
      CORPUS POUR L’ORAL ET OUTILS FORMELS
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire pour un parcours de spécialisation au sein de l'action
      Formation - Volume horaire : 70.0 heure(s) dont 70.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 35.0
      • Cours / Topos en synchrone (heures) : 35.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • CORPUS POUR LA PAROLE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours couvre les modalités de la parole, y compris le son, les images faciales et les gestes, ainsi que les dispositifs technologiques pour la collecte de données et les contraintes techniques et éthiques associées.
      • LANGAGES FORMELS
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours couvre les fondements théoriques des grammaires et langages formels, leurs relations et connexions avec les machines et algorithmes de reconnaissance.
      • CALCULABILITÉ ET COMPLEXITÉ
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours aborde la calculabilité et la complexité algorithmique, en se concentrant sur les machines de Turing, les fonctions non calculables, les problèmes indécidables, les mesures de complexité (espace, temps) et les classes de complexité distinctes (P, PSPACE, NP, EXPTIME).
      CORPUS POUR L’ORAL ET LINGUISTIQUE APPLIQUÉE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire pour un parcours de spécialisation au sein de l'action
      Formation - Volume horaire : 70.0 heure(s) dont 70.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 35.0
      • Cours / Topos en synchrone (heures) : 35.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • CORPUS POUR LA PAROLE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours couvre les modalités de la parole, y compris le son, les images faciales et les gestes, ainsi que les dispositifs technologiques pour la collecte de données et les contraintes techniques et éthiques associées.
      • MORPHOPHONOLOGIE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours passe en revue brièvement les principales théories phonologiques, puis explore la construction lexicale d'un point de vue formel et étudie des cas spécifiques pour expliquer des incohérences sémantiques apparentes par le biais d'une analyse morphophonologique.
      • RELATION LEXIQUE-SYNTAXE ET POLYSÉMIE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours explore les propriétés sémantiques et syntaxiques des noms désignant des événements, qu'ils soient dérivés ou non dérivés. Il se concentre sur la manière dont les noms déverbaux héritent des caractéristiques syntaxiques et sémantiques de leurs bases.
      TRAITEMENT DES DONNÉES LANGAGIÈRES
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 60.0 heure(s) dont 60.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 30.0
      • Cours / Topos en synchrone (heures) : 30.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • STOCKAGE ET RÉCUPÉRATION DE DONNÉES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours familiarise les étudiants avec les techniques de récupération et d'analyse de données provenant de diverses sources (fichiers Excel, bases de données, web, tweets) et formats (XML, HTML, OWL, CSV, JSON).
      • ANALYSE DE DONNÉES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours couvre les techniques de traitement, d'analyse et de visualisation des données. Il explique le prétraitement et la synthèse des données, les méthodes prédictives et les techniques de visualisation. De plus, il introduit des bibliothèques Python pour l'apprentissage statistique, telles que pandas, scikit-learn et SciPy.
      • RÉSEAUX DE NEURONES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours introduit les réseaux de neurones, en se concentrant sur leur utilisation en apprentissage automatique et intelligence artificielle. Il couvre les concepts de base, les architectures usuelles, et les outils pour une implémentation rapide et simple.
      LINGUISTIQUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 60.0 heure(s) dont 60.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 30.0
      • Cours / Topos en synchrone (heures) : 30.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • PROSODIE, PHONÉTIQUE, SÉMANTIQUE, MORPHOLOGIE, SYNTAXE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours explore des aspects clés de la linguistique, en se concentrant sur la prosodie, la phonétique, la morphologie, la syntaxe et la sémantique.
      PROJET ET LANGUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M1)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 30.0 heure(s) dont 30.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 24.0
      • Cours / Topos en synchrone (heures) : 6.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • PROJET TUTORÉ
        • Type de module : obligatoire
        • Thèmes abordés :
          Les étudiants de M1 réalisent un projet tutoré en groupe pour acquérir une première expérience en gestion de projet et se familiariser avec les équipes et les thématiques de laboratoire. Les étudiants doivent travailler environ une demi-journée par semaine sur des sujets introduits au semestre précédent.
      • ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
      • STAGE
        • Type de module : optionnel
        • Thèmes abordés :
          Cela permet aux étudiants d'effectuer un stage dans un laboratoire ou une entreprise entre le M1 et le M2.
    • Phase : Année 2

      FONDAMENTAUX TAL
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 112.0 heure(s) dont 112.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 56.0
      • Cours / Topos en synchrone (heures) : 56.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • RÉSEAUX DE NEURONES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours offre un aperçu de l'apprentissage automatique basé sur les réseaux de neurones, abordant des sujets allant des perceptrons multicouches aux architectures avancées telles que les réseaux déterministes/probabilistes, les réseaux convolutifs et les réseaux récurrents.
      • TRAITEMENT DE L’ÉCRIT
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours présente les méthodes d'apprentissage et les bibliothèques spécialisées (par exemple, NLTK, Giza) utilisées pour modéliser diverses sous-tâches et applications dans le traitement des textes écrits, en mettant l'accent sur la traduction automatique et l'algorithme Expectation-Maximisation.
      • LANGUES PEU DOTÉES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours se concentre sur l'étude et la préservation des langues peu dotées, explorant les défis liés au maintien de la diversité linguistique et à la revitalisation des langues en danger par le biais de stratégies sociolinguistiques, éducatives et technologiques.
      • GÉNÉRATION
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours explore la génération de texte comme un élément clé des grands modèles de langage, en se concentrant sur la génération de contenu à partir de données et de textes, y compris la simplification et le résumé automatique, tout en introduisant diverses approches symboliques, probabilistes et statistiques.
      • RESSOURCES LEXICALES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours présente les principaux types de ressources lexicales informatisées, y compris les dictionnaires électroniques, les bases de données lexicales, les ontologies lexicales et les embeddings basés sur des transformers, en s'appuyant sur des concepts fondamentaux de lexicologie.
      • DIALOGUE, CHATBOT ET SYSTÈMES DE QUESTIONS-RÉPONSES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours explore les avancées récentes en interaction homme-machine et couvre les principes de conception fondamentaux, les méthodes de développement et les aspects techniques sous-jacents.
      OUVERTURES
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 118.0 heure(s) dont 118.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 59.0
      • Cours / Topos en synchrone (heures) : 59.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • MODÈLES SYNTAXIQUES
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours présente les concepts fondamentaux des formalismes grammaticaux symboliques pour décrire la syntaxe et l'interface syntaxe-sémantique en langue naturelle, en se concentrant sur divers systèmes formels tels que les grammaires catégorielles, les grammaires d’arbres adjoints et les grammaires fonctionnelles lexicales.
      • SÉMANTIQUE ET DISCOURS
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours introduit diverses méthodes pour représenter le sens des expressions complexes au niveau de la phrase, en se concentrant sur le lambda-calcul et la logique d'ordre supérieur, et en explorant comment le sens des expressions complexes est construit à partir de leurs composants, ainsi que des phénomènes dans le discours qui nécessitent des considérations contextuelles et hiérarchiques.
      • RECONNAISSANCE ET SYNTHÈSE DE LA PAROLE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours explore les méthodes de conversion de la parole en texte et de génération de parole naturelle à partir de texte, tout en abordant les principes de la reconnaissance automatique de la parole et la conception de systèmes de synthèse vocale efficaces pour diverses applications.
      • TRAITEMENT DU SIGNAL
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours enseigne les fondements théoriques et les applications pratiques des techniques de signal audio, y compris l'acquisition, le prétraitement, l'analyse, et des sujets avancés tels que les transformations de Fourier et le filtrage adaptatif pour des applications telles que la reconnaissance de la parole et la détection de motifs audio.
      • ONTOLOGIE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours examine la relation entre les niveaux lexical et ontologique, en se concentrant sur le traitement des termes polylexicaux dans des domaines spécialisés, en utilisant le logiciel TTC TermSuite pour l'analyse et la classification, et en explorant les ressources terminologiques et leur lien avec les données ouvertes liées.
      • SYSTÈMES INTELLIGENTS
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours se concentre sur les aspects d'apprentissage automatique des systèmes de recommandation, en particulier ceux basés sur les données d'utilisation des réseaux sociaux, guidant les étudiants dans l'évaluation de ces systèmes à travers des études de cas et fournissant une boîte à outils logicielle pour des expérimentations indépendantes.
      SPÉCIALISATION ILPC
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 94.0 heure(s) dont 94.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 47.0
      • Cours / Topos en synchrone (heures) : 47.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • GRANDS MODÈLES DE LANGUES
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours plonge les étudiants dans les grands modèles de langage, explorant leur architecture, leurs mécanismes d'entraînement et leurs applications pratiques pour générer un texte grammaticalement correct et sémantiquement pertinent, tout en favorisant des compétences d'évaluation critique pour mesurer l'efficacité des modèles dans divers contextes.
      • APPROCHES SYMBOLIQUES POUR LA DÉCOUVERTE DE CONNAISSANCES
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours initie les étudiants aux techniques avancées d'extraction symbolique des connaissances à partir de données textuelles non structurées.
      • RAISONNEMENT EN IA
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours explore la philosophie et les concepts de l'intelligence artificielle symbolique, en se concentrant sur les représentations symboliques, les règles de raisonnement et la modélisation cognitive, tout en analysant les forces et les limites de l'IA symbolique et des approches hybrides, ainsi que les questions éthiques liées à ces systèmes.
      • ROBUSTESSE DE LA PAROLE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours se concentre sur la robustesse des systèmes de reconnaissance vocale, abordant la variabilité de la parole, les accents régionaux, le bruit de fond et les déformations acoustiques, tout en enseignant aux étudiants à identifier les vulnérabilités et à améliorer la fiabilité des systèmes dans des situations réelles à travers des études de cas pratiques.
      • ANALYSE D’OPINION ET MULTILINGUISME
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours se concentre sur l'analyse des opinions et le multilinguisme en traitant des données textuelles dans diverses langues, en explorant des techniques telles que les corpus comparables, les méthodes d'alignement de documents, et en enseignant aux étudiants à détecter les opinions à l'aide d'algorithmes d'apprentissage avancés.
      SPÉCIALISATION LI
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 94.0 heure(s) dont 94.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 47.0
      • Cours / Topos en synchrone (heures) : 47.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • INGÉNIERIE DE LA REQUÊTE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours présente la méthode de programmation technique pour la génération de prompts. Les étudiants appliqueront ces méthodes pour générer différents niveaux de complexité de prompts pour les principaux grands modèles de langage.
      • TRAITEMENT DE L'ORAL
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours explore le lien entre la phonétique, la phonologie et le traitement automatique de la parole, couvrant des techniques avancées en reconnaissance vocale, synthèse, analyse de la prosodie, et abordant des défis tels que la variabilité de la prononciation, les accents régionaux et la gestion du bruit de fond.
      • PRAGMATIQUE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours explore la pragmatique linguistique, en se concentrant sur la communication efficace à travers des concepts tels que la référence, la présupposition, l'implicature et les actes de langage, tout en les reliant à des représentations formelles en sémantique et en théorie du discours.
      • LEXICOLOGIE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours introduit la lexicologie et la lexicographie, en se concentrant sur l'analyse synchronique et diachronique, les différences entre elles, et la traduction de la recherche lexicologique en descriptions de dictionnaires.
      • TERMINOLOGIE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours se concentre sur la terminologie, enseignant aux étudiants à identifier, extraire et normaliser les termes spécifiques à un domaine, tout en explorant les méthodes de construction de bases de données terminologiques et d'alignement des terminologies multilingues.
      • INGÉNIERIE DU DIALOGUE
        • Type de module : obligatoire au sein d'un parcours de spécialisation
        • Thèmes abordés :
          Ce cours présente les définitions des modèles linguistiques de dialogue, la construction d'un corpus, la définition d'un système d'annotation et la production d'une ressource utilisable pour les chatbots.
      PROJET ET LANGUE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 64.0 heure(s) dont 64.0 heure(s) en synchrone
      • Travaux dirigés en synchrone (heures) : 44.0
      • Cours / Topos en synchrone (heures) : 20.0
      Modalité de validation :
      • Contrôle de connaissances
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • DÉVELOPPEMENT DE LOGICIEL (PROJET)
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours se concentre sur le développement des compétences essentielles en programmation et en ingénierie logicielle, enseignant aux étudiants à concevoir, développer et tester des logiciels à travers des projets pratiques, tout en les familiarisant avec les méthodes de développement Agile et les meilleures pratiques en matière de qualité du logiciel.
      • ANGLAIS OU FRANÇAIS (COURS DE LANGUE)
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours offre aux étudiants le choix entre l'anglais scientifique ou le français, visant à renforcer leurs compétences linguistiques en fonction de leurs profils et besoins au sein du programme de Master. Des groupes spécifiques au niveau sont proposés.
      • ÉTHIQUE, RECHERCHE ET ENTREPRISE
        • Type de module : obligatoire
        • Thèmes abordés :
          Ce cours forme les étudiants à respecter les droits des participants concernant la collecte de données, le stockage et la publication de données personnelles, tout en explorant les dimensions éthiques dans la recherche académique et d'entreprise, en abordant les dilemmes liés à la confidentialité des données, à la cybersécurité et à l'intelligence artificielle.
      STAGE
      Caractéristique du bloc
      • Etape du parcours : Cycle Master/Mastère (M2)
      • Ce bloc est : obligatoire
      Formation - Volume horaire : 700.0 heure(s) dont 0.0 heure(s) en synchrone
      • Apprentissage et travaux pratiques en autonomie / asynchrone (heures) : 700.0
      Modalité de validation :
      • Exposé
      • Rapport de projet
      Prérequis nécessaire(s) pour suivre le bloc :
      • Connaissances acquises lors d'une action précédente du parcours OU par le diplôme prérequis
      Module(s) :
      • STAGE
        • Type de module : obligatoire
        • Thèmes abordés :
          Le second semestre du M2 est dédié à un stage, soit en entreprise, soit en laboratoire, se concluant par une présentation de mémoire devant un jury.
    • Planification

      Mode de planification
      • Sessions planifiées de manière récurrente
      Période(s) de démarrage d’une session (promotion)

      Lorraine : Meurthe-et-Moselle (54)
      • Lieu : IDMC — Institut des Sciences du Digital, Management et Cognition, Pôle Herbert Simon, 13 Rue Michel Ney, 54000 Nancy, FRANCE
      • Début de session en Septembre
      • Nombre minimum d’apprenants par session : 10
      • Nombre maximum d’apprenants par session : 50

    • Modalités n°1

      Durée globale 2.0 année(s)
      Précision : Dans le cas des étudiants sans alternance
      Proportion de l'action pouvant être réalisé à distance : Pas d'activités en synchrone (face à face pédagogique)
      Immersion en entreprise :
      • Nombre d'heure en entreprise : 700
      • Modalité : Stage(s)
      • Précisions : Le second semestre du M2 est dédié à un stage, soit en entreprise, soit en laboratoire, se concluant par une présentation de mémoire devant un jury.
    • Modalités n°2

      Durée globale 2.0 année(s)
      Précision : Dans le cas des étudiants avec alternance (contrat de professionnalisation ou contrat d'apprentissage)
      Proportion de l'action pouvant être réalisé à distance : Pas d'activités en synchrone (face à face pédagogique)
      Immersion en entreprise :
      • Nombre d'heure en entreprise : 2450
      • Modalité : Contrat d'alternance, alternance sur une durée de 2.0 année(s)
      • Précisions : Périodes de 4 semaines de cours / 4 semaines en entreprise en fonction du calendrier imposé par l'IDMC. La période dédiée au stage obligatoire du M2 se traduit par des semaines de présence en entreprise ininterrompues. Les étudiants effectuant une alternance sont exemptés des projets.
    • Validation de l'action

      Contrôle continu, projet, validation de stage avec soutenance devant un jury
    • Modalité pédagogique

      • Cours / Topo
      • Auto-formation en parcours guidé et entraide avec les autres apprenants
      • Auto-formation approfondissement / acquisition de connaissances (self service, hors temps formation)
      • Recherche individuelle sans assistance d'un tuteur
      • Révision / Consolidation des connaissances (en autonomie guidée : check liste, mini tests, …)
      • Travaux individuels animés et dirigés par un enseignant ou professionnel d'entreprise
      • Travaux individuels en autonomie avec suivi par un enseignant / professionnel d'entreprise
      • Travaux individuels en autonomie et entraide avec les autres apprenants
      • Travaux Pratiques en groupe encadrés par enseignant / professionnel d’entreprise
      • Travaux pratiques en groupe réalisés en autonomie
      • Projet individuel
      • Projet en groupe
      • Compte-rendu des activités pratiquées
      • Formalisation structurée des travaux (rapport de projet)
      • Immersion en entreprise pour mise en pratique des compétences en contexte professionnel
      • Visite d’entreprises et/ou témoignages de professionnels Métier
      • Coaching de suivi de la progression individuelle des stagiaires
    • Outils pédagogiques

      • Plateforme technique pour les exercices
      • Poste de travail et périphériques informatiques
      • Guide pratique sur un cas concret pour les projets
      • Banque de médias contenant des documents, des tutos vidéos, …
    • Précisions sur les outils

      Mise à disposition d'infrastructures par l'IDMC : - Grid 5K (infrastructure à grande échelle pour simuler et tester des applications complexes.) - Cluster ENACT (un label d'excellence et un ensemble de moyens pour l'écosystème de formation, recherche et innovation en IA du Grand Est.) Outils : - Python (+ libraries Python: ​​pandas, scikitlearn, scipy, NLTK, etc) - Github - Shell - LaTeX - TTC TermSuite - Huggingface - MLflow
    • Moyens techniques

      • Poste de travail informatique de type PC au centre de formation
      • Poste de travail (PC portable, tablette, ...) appartenant au stagiaire
      • PC portable prêté au stagiaire uniquement s'il n'en a pas
      • Plateforme de serveurs, container, ... (à préciser)
      • Plateforme équipements réseau informatique
      • Equipements réseaux de proximité (wifi, switch, …)
      • Plateforme équipements pour informatique industrielle (cobot, robot, capteurs, …)
      • Plateforme de logiciels en lien avec les thèmes technologiques ou méthodologiques de l'action
    • Etape n°1 - Candidature via une plateforme en ligne

      Modalité : Dossier via une plateforme Web (Parcours Sup, e-candidat, mon master, site web organisme de formation)
      Lieu : transmission de documents (courrier postal ou électronique, dépôt sur un site web)
      Point de contact : [email protected]
      Déroulement :