|
||||
Des fonctions pour faire de l’analyse textuelle sous RLa fonction anatext permet de faire un dénombrement des mots, des segments de deux ou trois mots d’une variable textuelle d’une base ou d’un fichier texte. La fonction wordcount permet de compter un mot ou une expression dans une variable textuelle.
Utilisation d’anatext Avec un fichier texte : Avec une variable textuelle : Options : x: Variable textuelle à analyser. textfile : Indication du fichier texte (.txt) à analyser. sep : Indicateur du séparateur de ligne dans le fichier txt. septxt : Si vous avez plusieurs textes à comparer, il existe désormais une nouvelle options : septxt="" où vous indiquez votre séparateur de texte (que vous aurez utilisé préalablement dans votre fichier pour séparer vos textes). Le mieux est de mettre une suite de caractère comme "$$$" ou "###" qui n’est pas constituée de signes de ponctuation (déjà éliminés) et qui n’est pas présent dans votre fichier. La casse, est la casse finale (tout en majuscule par défaut). Cette variable permet la construction d’une variable de numérotation des textes t$text$numtxt dans le tableau lexical entier. upcase : Texte mis en majuscule. del.punctuation: Suppression de la ponctuation. del.accents: Suppression des accents. keep Conserver une variable de la base de données max.merge.size=50000 Taille maximale du tableau lexical entier pour laquelle on refusionne pour chaque mot sa fréquence dans le corpus. CODE DES FONCTIONS simplelag <-function(x,mylag=1,outside=NA) anatext <- function (x,textfile=NULL,sep="\n",upcase=TRUE,del.punctuation=TRUE, |
English |
Français
Actualités
![]() OgO: plus ici|more here [Work in progress] Godechot, Olivier and Ulysse Lojkine. Intensification through outsourcing ...: plus ici|more here [Presentations] ...: plus ici|more here [Peer-reviewed articles] Godechot, Olivier, Mirna Safi, and Matthew Soener. 2025. “Organisational Intersectionality: Do Gender and Migration Status Inequalities Reinforce or Offset ...: plus ici|more here [Books] Palier, Bruno et al.. 2023. Que sait-on du travail?, [What do we know about work?], Presses de Sciences ...: plus ici|more here [Peer-reviewed articles] Godechot, Olivier, Donald Tomaskovic-Devey, István Boza, Lasse Folke Henriksen, Are Skeie Hermansen, Feng Hou, Jiwook Jung, Naomi Kodama, ...: plus ici|more here [Working papers] Neumann, Nils, Olivier Godechot, Lasse Folke Henriksen, Are Skeie Hermansen, Feng Hou, Naomi Kodama, Zoltán Lippényi, Silvia Maja Melzer, ...: plus ici|more here [Data] Données et scripts pour les fissures de la digue républicaine Dans notre article "Les fissures de la digue républicaine", nous ...: plus ici|more here [Data] Replication package for the Great Separation The Great Separation is based on fine-grained administrative data that cannot be published ...: plus ici|more here [Home] Recherches en cours: plus ici|more here |
|||
Système d'aide à la publication sur Internet |