PersPred est le premier lexique multilingue (persan, français, anglais) des verbes composés (prédicats complexes ou locutions verbales) du persan en accès libre. Il a été conçu dans le cadre du projet ANR-DFG PERGRAM (2008-2012) et de l’opération LR4.1 de l’axe 6 « Ressources linguistiques » du Labex EFL, par les chercheurs de l’UMR Mondes iranien et indien (CNRSSorbonne nouvelleINALCOEPHE). La version actuelle contient environ 1500 entrées et 25 champs annotés pour chaque combinaison. L’objectif, à terme, est de mettre à la disposition des chercheurs et à tous ceux qui s’intéressent au persan pour diverses raisons (traduction, enseignement, applications automatiques), une ressource lexicale richement annotée et la plus exhaustive possible dédiée aux locutions verbales du persan.

Le lexique verbal du persan est essentiellement composé de locutions verbales, appelées également « verbes composés », « constructions à verbe support » ou, plus récemment, « prédicats complexes ». Cette caractéristique s’explique par le fait que la conversion des noms et des adjectifs en verbes, procédé morphologique abondamment utilisé dans des langues telles que l’anglais (ex. comb (n.) > comb (v.), short (adj.) > shorten (v.)) et le français (ex. balai (n.) > balayer (v.), court (adj.) > raccourcir (v.)), a cessé d’être productif en persan au détriment de la construction syntaxique des lexèmes verbaux, c’est-à-dire la combinaison d’un verbe (support) et d’un élément non verbal (nom, adjectif, adverbe, préposition…), ex. gomân kardan `supposer’ (litt. ‘supposition faire’), derâz kešidan `s’allonger’ (litt. ‘long tirer’). Ainsi, dans la plupart des cas, un verbe simple en anglais ou en français se traduit par une locution verbale en persan. Le persan ne dispose que d’environ 250 verbes simples, dont seulement la moitié est usitée, alors que le nombre des locutions verbales s’élève à quelques milliers et ne cesse d’augmenter.

Or, malgré cette omniprésence, peu d’attention a été accordée à la nécessité d’élaboration d’un lexique de ces combinaisons (sous forme de dictionnaires traditionnels ou électroniques). A cet égard, PersPred est une ressource unique en son genre qui vise à combler la lacune existante. Il propose non seulement un inventaire des locutions verbales du persan, mais également un ensemble très riche d’informations syntaxiques (valence, appariement des arguments et les fonctions grammaticales, variantes diathétiques…) et sémantiques (groupements sémantiques des prédicats) encodées pour chaque entrée. En outre, PersPred fournit également la traduction en anglais et en français de chaque locution, ainsi que celle de ces composantes. Chaque locution est illustrée à l’aide d’un ou plusieurs exemples attestés, tirés de la littérature, de la presse écrite ou d’Internet. L’originalité de PersPred réside dans les regroupements sémantiques des prédicats permettant notamment de rendre compte de la productivité de ces combinaisons et de faciliter ainsi l’intégration de nouveaux prédicats complexes.

Toutes ces caractéristiques font de PersPred un outil lexicographique approprié pour diverses applications telle que la traduction, le traitement automatique, l’enseignement, mais également une ressource linguistique exploitable pour la recherche sur diverses questions théoriques.

Lien vers Archive.org (sauvegarde du site de PersPred : 16 janvier 2021)