La banque de données de textes latins - Méthode

La méthode du LASLA selon laquelle est traité chacun des mots-formes apparaissant dans un texte latin a été décrite à plusieurs reprises dans diverses revues, notamment dans les articles suivants :


Ces articles, déjà anciens, font état de techniques qui ont été abandonnées, mais la méthode linguistique est restée la même. En regard de chaque mot, on enregistre sur support informatique les données suivantes :

  • le lemme, c’est-à-dire le mot tel qu’il figure dans le dictionnaire choisi comme ouvrage de référence (le choix s’est porté sur le Lexicon totius latinitatis de Forcellini, éd. de Corradini, Padoue, 1864) : pour les verbes, c’est la première personne du singulier de l’indicatif présent qui fait fonction de lemme, pour les substantifs, c’est la forme du nominatif singulier, pour les adjectifs, c’est le nominatif masculin singulier, etc. ;

  • un indice permettant de distinguer différents lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent (ET 1 = adverbe,ET 2 = conjonction de coordination ; la lettre N en regard de ROMA signale un nom propre) ;

  • la forme telle qu’elle apparaît dans le texte ;

  • la référence qui est conforme aux règles de l’ars citandi ;

  • l’analyse morphologique complète sous un format alphanumérique ; c’est-à-dire pour un substantif, la déclinaison, le cas et le nombre, pour un verbe, la conjugaison, la voix, le mode, le temps, la personne et le nombre ;

  • pour les verbes, des indications syntaxiques ; les propositions principales sont distinguées des subordonnées, lesquelles sont classées par type de subordonnants. Ainsi, on peut, par exemple, établir une liste de tous les verbes subordonnés au subjonctif présent introduits par si et bien entendu les dénombrer.

    Les fichiers se présentent donc comme suit :

LEMME INDICE FORME RÉFÉRENCE MORPHO. SYNT.
VRBS   URBEM 41 001 0001 001 001 13C00  
ROMA N ROMAM 41 001 0001 002 002 11C00  
AB   A 41 001 0001 003 003 70600  
PRINCIPIVM   PRINCIPIO 41 001 0001 004 004 12F00  
REX   REGES 41 001 0001 005 005 13J00  
HABEO   HABUERE 41 001 0001 006 006 52L14 &
LIBERTAS   LIBERTATEM 41 001 0001 007 007 13C00  
ET 2 ET 41 001 0001 008 008 81000  
CONSVLATVS   CONSULATUM 41 001 0001 009 009 14C00  
LVCIVS N L. 41 001 0001 010 010 12A00  
BRVTVS N BRUTUS 41 001 0001 011 011 12A00  
INSTITUO   INSTITUIT 41 001 0001 012 012 53C14 &


L’analyse morphologique est entièrement codée par un programme informatique (une description détaillée de ce programme est publiée dans l’article suivant : Joseph Denooz, « Recherches sur le traitement automatique de la langue latine », dans Revue de l’organisation internationale pour l’étude des langues anciennes par ordinateur, 1973, 1, p. 1-89). Pour urbem, l’analyse 13C signifie que ce mot est un substantif de la 3e déclinaison à l’accusatif singulier. La forme verbale habuere est analysée 52L14, ce qui signifie verbe (5) de la 2e conjugaison à la voix active (2), 3e personne du pluriel (L), indicatif (1) parfait (4). Le signe & signifie que habuere est un verbe de proposition principale.

Comme on le constate c’est une description formelle, lexicologique et morphologique, qui est donnée pour chaque mot. Dans certains cas, le nombre d’informations pour une forme atteint la dizaine. Ainsi pour une forme telle que regnante, on indique les données de référence, le lemme, la catégorie grammaticale, la conjugaison, la voix, le cas, le nombre, le mode, le temps et le genre. Enfin, on précisera éventuellement qu’il s’agit d’un ablatif absolu.