En science des données, il est courant d’avoir à traiter des données ayant du contenu textuel et de les exploiter. Un défi majeur est de rendre ces données exploitables : c’est l’objet du Traitement Automatique du Langage Naturel (ou Natural Language Processing). L’émergence des approches utilisant l’apprentissage automatique a été bénéfique pour le traitement automatique du texte, néanmoins il est primordial de comprendre le fonctionnement de ces méthodes et d’analyser les différentes options qu’elles offrent.