Communiqué de presse : Elena Ferrante

English translation here

Détermination par stylométrie
de l’auteur probable du corpus Ferrante : Domenico Starnone

Les livres signés sous le pseudonyme Elena Ferrante sont commentés dans l’actualité (le New York Times, le Corriere della SeraIl Sole 24 Ore, L'Express, et encore le New York Times). 

Personne n’a pu rencontrer l’auteur de ces ouvrages. Le succès récent des traductions anglaises renforce l’intérêt que suscite ce corpus. Plusieurs noms ont été avancés comme auteur possible de ces livres. Des analyses, principalement de statistiques linguistiques, ont été conduites pour déterminer l’auteur du corpus Ferrante.

Ce communiqué d’OrphAnalytics présente la stylométrie du corpus Ferrante obtenue par comparaison d’usage d’unités élémentaires de texte. Les éléments apportés permettent de mettre en perspective les résultats des analyses linguistiques. Cette statistique stylistique confirme les hypothèses étayées par des analyses linguistiques concernant l’identité de l’auteur du corpus Ferrante.

Le journaliste Paolo di Stefano du Corriere della Sera nous a résumé plusieurs propositions d’auteurs possibles publiant sous le pseudonyme Ferrante. La candidature qui revient de façon récurrente est celle de Domenico Starnone, avancée par l’intuition de Luigi Galella

Cette hypothèse a été testée par une méthode qui exploite les algorithmes de compression de données, afin de mesurer la quantité d'information complexe. Cette approche a été développée par des chercheurs de l’université La Sapienza de Rome : le professeur de physique Vittorio Loreto associé à Andrea Baronchelli. Ils ont pu ainsi mesurer la fiabilité de l’hypothèse formulée par Galella en utilisant un logiciel développé avec des collègues de mathématiques : selon eux, Domenico Starnone serait l’auteur du corpus Ferrante. 

Les résultats d'un groupe de recherche en linguistique indiquent également que Starnone pourrait porter le nom de plume Ferrante. 

Notre stylométrie permet de challenger cette proposition qui est refusée publiquement par Starnone. Ne disposant que de textes traduits par Anita Raja, et n’ayant donc pas de textes personnels de sa part, nous ne pouvons pas nous déterminer sur la possibilité qu’elle soit l’auteur du corpus Ferrante. Nous le ferons cependant pour un autre nom déjà proposé comme auteur possible du corpus : Erri de Luca. 

Sélection des livres pour l’analyse stylométrique

Afin de se prononcer sur le style utilisé par les ouvrages signés Elena Ferrante, huit livres disponible en e-books ont été choisis : les trois premiers romans (L'amore molesto, E/O, 1992, I giorni dell'abbandono, E/O, 2002, La figlia oscura, E/O, 2006) et les quatre de la tétralogie (L'amica geniale, E/O, 2011, Storia del nuovo cognome, volume secondo, E/O, 2012, Storia di chi fugge e di chi resta, volume terzo, E/O, 2013, Storia della bambina perduta, volume quarto, E/O, 2014). Un essai a encore été sélectionné : La frantumaglia, E/O, 2003. Un livre pour enfant a été écarté : La spiaggia di notte, E/O, 2007. Ces livres ont été comparés aux ouvrages d’autres auteurs.

Domenico Starnone apparaît régulièrement comme l’un des auteurs possibles du corpus Ferrante. Cinq derniers livres de Starnone disponibles en e-books ont été sélectionnés : Spavento, Einaudi, 2009, Fare scene. Una storia di cinema, Minimum fax, 2010, Autobiografia erotica di Aristide Gambía, Einaudi, 2011, Condom, Einaudi, 2013, Lacci, Einaudi, 2014. A part son deuxième roman, les autres romans (13/19) ne sont pas disponibles en e-book.

Domenico Starnone a également écrit quinze essais, sept entre 1981 et 1994 et huit entre 2002 et 2006. Il a produit trois contes entre 2008 et 2013. La deuxième période d’essai de Starnone recouvre la publication en 2003 de l’essai de Ferrante qui explique sa démarche La frantumaglia 2003. La publication du conte pour enfant La spiaggia di notte, 2007, précède d’une année la publication du premier conte de Starnone (trois contes entre 2008 et 2011). Il apparaît donc que les publications de l’essai et du conte signé Ferrante correspondent aux périodes de publication d’ouvrages similaires de Starnone.

La femme de Domenico Starnone, Anita Raja, est régulièrement citée comme l’auteur qui se cache sous le pseudonyme de Ferrante. Elle a travaillé comme traductrice dans la maison d’édition qui publie les œuvres de Ferrante : jusqu’en 2011, elle a traduit une auteure Christa Wolf. Elle n’a jamais publié de roman sous son nom.

Sept livres d’Erri de Luca disponibles en e-book ont été rajoutés pour la comparaison avec les livres de Ferrante et de Starnone : Il contrario di uno, Feltrinelli, 2003, Sulla traccia di Nives, Feltrinelli, 2005, Il cielo in una stalla, Feltrinelli, 2008, Il piu e il meno, Feltrinelli, 2015, La parola contraria, Feltrinelli, 2015, La faccia delle nuvole, Feltrinelli, 2016, La Natura Esposta, Feltrinelli, 2016.

Les ouvrages d'autres auteurs susceptibles d’avoir rédigé le corpus seront comparés ultérieurement. 

L’approche algorithmique d’analyse textuelle

Dérivée de la recherche en séquences génomiques, une approche algorithmique d’analyse de texte a été développée par l’entreprise OrphAnalytics, mesurant l’usage de patterns élémentaires de texte (patterns de lettres ou de syllabes, tempo/rythme de la phrase) dans et entre les mots, dans et entre les phrases. Un catalogue d’usage de patterns est établi pour chaque fragment de texte, la comparaison de ces catalogues permet de mesurer la conservation de style le long d’un document. 

Ne requérant pas de compétences linguistiques dans une langue, cette approche a été utilisée avec succès pour la comparaison de livres écrits dans différentes langues : par exemple les romans noirs en suédois de la série Millénium. Le logiciel PATOA (Programme d’Analyses Textuelles d’OrphAnalytics) permet de distinguer le nuage de points des trois premiers volumes de Millénium écrits par Stieg Larsson (publiés après la mort de ce dernier) du nuage de points formé du quatrième volume rédigé par David Lagercrantz (plus de dix ans après la mort de Larsson) et de deux romans de ce dernier, complètement indépendants de la série. Voir la figure Millénium publiée dans l’article du Tages Anzeiger.

L’analyse de Millénium montre que le signal perçu par le logiciel est indépendant du sujet du roman et du vocabulaire associé : le logiciel capte le style personnel de l’auteur dans un genre littéraire marqué par des choix d’écriture caractéristiques d’un idiolecte, i.e. de la façon de parler ou d’écrire propre à un individu : e.g. tournures de phrase.

Les analyses

Notre approche illustre la similitude de styles d’écriture par la proximité de symboles dans les représentations graphiques de nos analyses stylométriques. Dans la Figure 1, le corpus de Ferrante présente deux styles différents : un nuage de symboles rouges pour les trois premiers livres, et un nuage de symboles bleus pour la tétralogie de L’amica geniale


Figure 1 : Analyse stylométrique des sept livres du corpus de Ferrante en italien : les deux dimensions de variance maximale dans l’analyse multivariée comparent l’usage de pattern de lettres. Chaque symbole représente l’entier ou un fragment de texte d’environ 100'000 caractères. Les ouvrages suivants signés Elena Ferrante sont analysés : les trois premiers romans en rouges, i.e. L'amore molesto, triangles, I giorni dell'abbandono, losanges, La figlia oscura, ronds, et les quatre de la tétralogie en bleu, i.e. L'amica geniale, triangles, Storia del nuovo cognome, losanges, Storia di chi fugge e di chi resta, ronds, Storia della bambina perduta, carrés. Plus les symboles sont proches, plus le style de leurs textes est similaire.

Cette distinction entre deux styles des romans d’Elena Ferrante est maintenue dans l’analyse des textes traduits en anglais (Figure 2). 


Figure 2 : Analyse stylométrique des traductions en anglais de sept livres du corpus de Ferrante : les deux dimensions de variance maximale dans l’analyse multivariée comparent l’usage de pattern de lettres. Chaque symbole représente l’entier ou un fragment de texte d’environ 100'000 caractères. Les traductions des ouvrages Signés Elena Ferrante suivants sont analysés. les trois premiers romans en rouges, i.e. Troubling Love, 2006, triangles, The Days of Abandonment, 2005, losanges, The Lost Daughter, 2008, ronds, et les quatre de la tétralogie en bleu, i.e. My Brilliant Friend, 2012, triangles, The Story of a New Name, 2013, losanges, Those Who Leave and Those Who Stay, 2014, ronds, The Story of the Lost Child, 2015, carrés.

Ce résultat peut s’expliquer selon deux propositions : soit chaque style serait représentatif d’un auteur différent, soit un même auteur serait capable d’écrire dans deux styles différents, et de s’y tenir, signe de maturité professionnelle. Pour trancher entre ces deux hypothèse, il est nécessaire d’introduire dans ces analyses des ouvrages d’un ou de plusieurs auteurs, e.g. Starnone et De Luca. L’analyse présentée en Figure 3 ajoute aux textes de la Figure 1 l’essai La frantumaglia de Ferrante (en rose), quatre volumes de Starnone (en orange) et sept volumes de De Luca (en gris). La distance entre les deux styles de Ferrante, plus petite qu’entre les ouvrages de Starnone ou entre les textes de De Luca, est un indice clair qu’un même auteur signe les deux styles des romans de Ferrante. 

Figure 3 : Analyse stylométrique des livres en italien de Ferrante, de Starnone et de De Luca : les deux dimensions de variance maximale dans l’analyse multivariée comparent l’usage de pattern de lettres. Chaque symbole représente l’entier ou un fragment de texte d’environ 100'000 caractères. Aux ouvrages de la Figure 1 sont associés l’essai signé Elena Ferrante, La frantumaglia, pentagone rose, les ouvrages de Domenico Starnone en orange, Condom, triangles, Spavento, losanges, Fare scene. Una storia di cinema, ronds, Autobiagrafia erotica di Aristide Gambía, carrés, Lacci, triangles inversés, ainsi que les ouvrages de Erri De Luca en gris, Il contrario di uno, triangles, Sulla traccia di Nives, losanges, Il cielo in una stalla, ronds, Il piu e il meno, carrés, La parola contraria, triangles inversés, La faccia delle nuvole, pentagones, La Natura Esposta, hexagones. 

La Figure 3 montre que De Luca a un style éloigné de Ferrante. Il est donc peu probable que De Luca écrive sous le pseudonyme Ferrante. Par contre le style de Starnone est très proche de Ferrante : à chaque style de Ferrante est associé le style similaire d’un ouvrage de Starnone. On retrouve aux limites du nuage de symboles orange Starnone les nuages rouge et bleu des deux styles des romans de Ferrante, ainsi que le nuage rose de l'essai de Ferrante qui parle de sa vie et de son métier d'écrivaine.

En conclusion, le style de Starnone, stylométriquement très proche de celui de Ferrante, permet de sérieusement envisager que Domenico Starnone pourrait être l’auteur écrivant sous le pseudonyme Elena Ferrante. Ce résultat confirme ceux obtenus par des comparaisons de compression du texte et d’analyses linguistiques. Afin de pouvoir vérifier notre observation, une analyse de l’ensemble du corpus de Starnone doit être réalisée, demandant la digitalisation de l’ensemble de son œuvre.

Une confirmation des résultats serait également assurée par la comparaison de livres d’autres écrivains proposés comme auteur du corpus Ferrante. Nous nous tenons à disposition pour tester les hypothèses du public. Nous attendons également un retour des lecteurs du corpus sur notre observation de l’utilisation des deux styles rouge et bleu partageant les romans de Ferrante (Figures 1 à 3).

Cette analyse illustre aux italophones la capacité de l’approche d’OrphAnalytics dans un cadre de recherche littéraire. Elle a servi avec succès pour produire une expertise authentifiant des contrats dans le cadre d’un jugement demandé à un tribunal arbitral international. Actuellement les premières applications concernent l’authentification de documents rédigés dans différentes langues académiques afin de s’assurer de l’absence de ghostwriting dans la rédaction de ces textes. Enfin, OrphAnalytics, lance textuellement transparent, le premier projet d’analyses stylométriques disponibles au public. En publiant la stylométrie de son œuvre, un écrivain affiche ainsi publiquement sa volonté de transparence : une écriture autonome, sans l’aide d’un tiers.

Pour OrphAnalytics SA, le 11 octobre 2016,

Guy Genilloud                                                      Claude-Alain Roten
Chef de projet                                                      Directeur


Dans la presse