Peut-on écrire avec la voix ? La littératie dans l'écriture vocescrite

Plan de l'article

 

Auteur

Clotilde Chevet

CHEVET Clotilde

Doctorante en Sciences de l'Information et de la Communication  
GRIPIC UR-1498
                          
CELSA Sorbonne Université
77 Rue de Villiers
92200 Neuilly-sur-Seine
France
  

 

Citer l'article

Chevet, C. (2023). Peut-on écrire avec la voix ? Revue Intelligibilité du numérique, 4|2023. [En ligne] https://doi.org/10.34745/numerev_1926

 

 

Résumé : Peut-on écrire avec la voix ? Cet article présente des pistes de réponses à travers l’étude de la dictée numérique, que nous proposons de considérer comme une écriture vocescrite, autrement dit une écriture par la voix. Il s’agit de montrer en quoi celle-ci mobilise une littératie (corporelle et linguistique) particulière, et ne peut donc être considérée comme une simple délégation du geste à la machine. S’appuyant sur l’analyse d’entretiens qualitatifs menés auprès d’usagers de la dictée numérique, notre article est organisé en trois temps. Nous commençons par un détour historique afin de comprendre comment les organes de l’écriture ont été questionnés au cours du temps, évinçant petit à petit le corps au profit de la machine écrivante. Nous nous demandons ensuite en quoi la conceptualisation d’une écriture vocescrite implique une redéfinition du geste d’écriture et comment celle-ci, en permettant de nouveaux usages, s’ouvre à de nouveaux scripteurs. Nous nous penchons enfin sur le partage de la littératie entre la machine et l’usager et sur le rôle de l’énonciation computationnelle dans la production du texte final.

Mots-clés : oralité, écriture vocescrite, littératie, dictée numérique, corps.

Abstract : Can we write with our voice? This article presents some possible answers through the study of voice dictation, which we propose to consider as vocescript writing, in other words writing by voice. We will analyse how it requires a particular literacy (bodily and linguistic), and cannot therefore be considered as a simple delegation of gesture to the machine. Based on the analysis of qualitative interviews conducted with users of voice dictation, our article is organised in three stages. We begin with a historical section in order to understand how the organs of writing have been questioned over time, gradually displacing the body in favour of the machine. We will then ask ourselves how the conceptualisation of vocescript writing implies a redefinition of the writing gesture and how this writing, by allowing new uses, opens up to new writers. We will analyse the sharing of literacy between the machine and the user and the role of computational enunciation in the production of the final text.

Key-words : orality, voice writing, literacy, digital dictation, body.

 

Introduction

« Pouvez-vous me dire si j’arrive à écrire ; pouvez-vous me dire si mon corps est mon corps ? » François Matheron, L’homme qui ne savait plus écrire.

Peut-on écrire avec la voix ? Cette question qui anime notre recherche doctorale rejoint celles soulevées par François Matheron dans L’homme qui ne savait plus écrire (2018). Suite à un AVC, ce philosophe a commencé à utiliser un logiciel de dictée numérique. Il raconte dans son livre comment « l’homme qui ne savait plus écrire a fini par écrire », tout en continuant pourtant «  à prétendre qu’il ne sait plus écrire ». Ces réflexions apparaissent profondément liées aux enjeux de la littératie numérique : peut-on désormais écrire sans savoir écrire ? Peut-on écrire sans savoir que l’on écrit ? Et finalement qui écrit : l’humain ou bien la machine ?

Cet article propose des pistes de réponses à travers l’étude de la dictée numérique (utilisée pour l’envoi de sms, mails, rédaction de documents, etc.). Cet outil témoigne d’une reconfiguration particulière de l’écriture par le numérique, brouillant une fois de plus la frontière entre scripturalité et oralité. Les perméabilités de cette frontière ont été largement étudiées, notamment dans les travaux de Jack Goody (1965) sur la normalisation de la langue entraînée par l’écriture, ou encore ceux de Walter Ong (1982) sur l’oralité dite secondaire. Nous savons par ailleurs que le traitement de la voix en régime numérique relève d’une écriture (Souchier, 2004). Nous formulerons ici la question sous l’angle différent de l’écriture par la voix.

L’écriture de la voix existe depuis la fin du XIXe siècle, l’étymologie du « phonographe » signifiait d’ailleurs bien cette intention. Il s’agit pour nous de faire une différence entre l’écriture de la voix – son enregistrement, sa captation et son inscription sur un support – et l’écriture par la voix – la transcription de la parole sur un écran. Dans le second cas, la voix n’est plus objet mais agent de l’action. Contrairement à l’enregistrement, qui ne demande pas au locuteur une littératie particulière (ni même qu’il soit conscient de la captation de sa voix), l’écriture par la voix est un geste intentionnel qui requiert un savoir.

Ainsi, si la captation de la voix peut donner lieu à une inscription, elle ne devient geste d’écriture que lorsque le sujet maîtrise au moins en partie cette inscription. Or, cette maîtrise par le corps relève de la littératie. Jean-Marie Privat (2019) affirme en effet que la littératie est « une technique du corps tant pour l’écriture que pour la lecture : tenue du corps, maniement du stylo, habiletés digitales, lecture avec le doigt, silencieuse, en diagonale, etc. » Sur ces bases, nous formons l’hypothèse d’une « écriture vocescrite », autrement dit une écriture par la voix. Il s’agira de voir en quoi ce geste vocal n’est pas une simple délégation de l’écriture à la machine, mais bien un acte d’écriture en lui-même, mobilisant une littératie (corporelle et linguistique) particulière.

Cette hypothèse va elle-même à l’encontre des discours d’escorte présentant la dictée numérique comme opposée à l’écriture (à commencer par le conseil donné par Apple à ses utilisateurs : « Parlez au lieu d’écrire »). Ces discours montrent qu’avant de questionner la capacité à comprendre, utiliser et créer des écrits, l’étude des interfaces vocales nous confronte à un impensé de l’écrit dans leur usage. Nous assistons à un éclatement de l’écriture : non seulement « trace et support ne vieillissent plus ensemble » (Souchier, 1996) mais œil et main ne sont plus associés (Leroi-Gourhan, 1964). L’écriture se fait discrète, invisible, et rompt avec la tradition de la lettrure. On ne la reconnaît plus. Comme l’annonçait Althusser (1965), « notre temps risque d’apparaître un jour comme marqué par l’épreuve la plus dramatique et la plus laborieuse qui soit, la découverte et l’apprentissage du sens des gestes les plus simples de l’existence, voir, écouter, parler, lire ». Nous y ajoutons le terme « écrire », dont la définition est bouleversée. Peut-on écrire en parlant ? Peut-on écrire sans voir, sans lire ? Et si oui, dans quelle mesure l’impensé de l’écriture dans la dictée numérique est-il un impensé de la littératie et par là-même de ses enjeux de pouvoir ?

Ces questionnements rejoignent ceux initiés par Lee Honeycutt (2004) dans son travail sur l’histoire de la dictée, humaine comme numérique, et ceux de Marie-Emmanuelle Pereira, Christina Romain and Véronique Rey (2017) sur l’usage des logiciels de reconnaissance vocale :  

« La mise au point de logiciels de reconnaissance vocale performants nous amène à reconsidérer la frontière entre l’écriture et la parole. D. Sperber (2002) voit dans ces logiciels l’avènement d’une division du travail scriptural, entre humains et machines, qui devrait conduire à la 
« généralisation de la production orale de textes écrits ». Si par le geste scriptural, on est passé « de la voix à la main » (Goody, 1979, p. 97), quel changement dans la raison graphique sera déterminé lorsqu’on se met à écrire en parlant ? L’écriture perd-elle alors une partie de ses vertus ou au contraire gagne-t-elle certaines de la parole ? »

Là où Lee Honeycutt situe cet outil dans la continuité de l’histoire de la dictée, sans aborder la question de l’écriture, Marie-Emmanuelle Pereira, Christina Romain et Véronique Rey considèrent d’emblée cette technologie comme de l’écriture. Il ne semble pas y avoir de doute pour les chercheuses : on « écrit en parlant ». Nous proposons ici un chemin de traverse : nous saisir de l’héritage de la dictée tout en tentant de comprendre comment ce geste de délégation à un humain est devenu geste d’écriture lors de l’alliance avec la machine. Autrement dit, comment la dictée est devenue écriture, ouvrant un champ de réflexion nouveau sur le corps écrivant et ses enjeux.

Nourri de l’analyse d’entretiens qualitatifs menés auprès d’usagers de la dictée numérique, notre article est organisé en trois temps. Nous commencerons par un détour historique en nous arrêtant sur trois temps majeurs : l’Antiquité, le Moyen-Âge et notre époque contemporaine. Il s’agit de voir comment les organes de l’écriture ont été questionnés au cours du temps, évinçant petit à petit la voix et la main, pour finalement aboutir à la disparition du corps au profit de la machine écrivante dans les discours d’escorte de la dictée numérique.

Nous nous demanderons ensuite en quoi la conceptualisation d’une écriture vocescrite implique une redéfinition du geste d’écriture, non plus fondée sur l’alliance œil-main mais sur la rencontre entre un corps contraint et un support en vue d’une inscription. Nous verrons en quoi ce geste d’écriture particulier requiert une technicisation du corps (Mauss, 1934), et dans quelle mesure cette pratique libérée de la main permet de nouveaux usages et dès lors s’ouvre à de nouveaux scripteurs.

Nous nous pencherons enfin sur le partage de la littératie entre la machine et l’usager. En effet, l’outil technique ne prend pas seulement en charge l’acte graphique (le tracé de la lettre) mais également une partie de l’acte scriptural (la production d’un objet linguistique). Nous verrons que l’écriture vocescrite donne finalement lieu à une grande diversité de pratiques, plus ou moins contraintes selon les degrés de littératie des scripteurs.

En prenant en compte la dimension tant corporelle que lettrée de cette tekhnè, nous souhaitons montrer que la parole peut devenir une « technique du corps » au service de l’écriture.

Écriture et oralité : des opposés historiques ?

Si parole et écriture sont régulièrement présentées comme antagonistes, cette opposition est pourtant loin d’être une évidence. En effet, comme nous le verrons, la bouche et l’oreille étaient il y a quelques siècles encore au cœur des pratiques des auteurs antiques et médiévaux ; elles faisaient parties intégrantes du geste d’écriture. La voix a finalement été évacuée du geste scriptural, puis la main à son tour, victime de la dictée numérique. Cette évolution nous interroge : quels sont les organes de l’écriture ? L’œil et la main, conformément à la théorie héritée de Leroi-Gourhan (1964), ou bien également l’oreille et la bouche ? Peut-on évacuer le corps de l’équation comme semblent le faire les discours d’escorte de la dictée numérique ? Nous nous interrogeons ainsi sur la place du corps dans la définition même de l’écriture et sur la façon dont le statut de scripteur est passé de l’humain à la machine.

Quand la voix faisait encore partie du geste d'écriture

Des pratiques de sténographies antiques à l’ars dictaminis médiéval, la voix a longtemps été intégrée au geste scriptural avant de disparaître au profit de la main, désormais centrale dans les représentations et théorisations de l’écriture, notamment numérique (Garmon, 2019). En quoi ce resserrement des imaginaires est-il en partie responsable de notre difficulté à considérer aujourd’hui la dictée numérique comme une écriture ?

Pour le comprendre, nous nous arrêtons ici sur trois temps majeurs : l’Antiquité, le Moyen-Âge et notre époque contemporaine. Il est évident qu’entre-temps, une série de pratiques, technologies et corps de métier se sont développés ; c’est pourquoi notre propos ne vise pas l’exhaustivité historique mais cherche à illustrer en quoi les organes de l’écriture ont pu être remis en question au cours de l’histoire. En cela, les trois périodes que nous avons choisies interrogent, chacune à leur manière, l’articulation voix/main dans le geste d’écriture et la littératie nécessaire aux scripteurs. Par ce détour historique, nous cherchons à comprendre le passage de l’écriture orale (accompagnée de la parole) à l’écriture par la voix (que nous appellerons écriture vocescrite) et à mettre en évidence les liens mais également les points de divergence entre ces deux pratiques. Nous verrons en quoi les enjeux de la dictée traditionnelle sont réactualisés par le développement des outils de la dictée numérique.

La dictée des auteurs antiques

Comme l’explique Tiziano Dorandi dans Le stylet et la tablette (2000), l’écriture dite « autographe » n’avait rien d’une évidence pour les érudits de l’Antiquité qui pratiquaient régulièrement l’art de la dictée. Sénèque affirmait d’ailleurs que « la main n'a rien à voir avec la sapientia, qui est "maîtresse de l'âme" et non de l'activité manuelle, servile et méprisable, quand bien même il s'agirait de l'art d'écrire » (Cavallo, 2000). L’écriture manuscrite demeurait néanmoins « une prérogative appréciée par l'individu cultivé pour écrire des lettres ou des notes personnelles » (Cavallo, 2000), par respect pour le destinataire et pour lui témoigner son engagement dans la correspondance. On comprend ici que le type de documents avait une importance dans le choix de le dicter ou de l’écrire soi-même. Guglielmo Cavallo explique par ailleurs que la dictée permettait une composition à voix haute beaucoup plus en adéquation avec les procédés rhétoriques de l’époque, eux-mêmes pensés par rapport au texte final, destiné à être lu à voix haute. On voit ici toute l’intrication de la raison orale et de la raison graphique à l’œuvre dans la pratique de la dictée antique.

Le travail de ce paléographe nous intéresse également en ce qu’il dresse le tableau d’un corps indisponible pour l’écriture et surtout libre de faire autre chose tout en s’adonnant à l’activité de composition :

« Pline l'Ancien dictait ses oeuvres même à l'heure des repas, pendant qu'il se faisait masser ou essuyer après le bain, voire en voyage. (...) En définitive, grâce à la dictée, chaque moment de la journée (...) pouvait être utilisé pour mettre un texte par écrit. » (Cavallo, 2000).

Cette liberté corporelle est aujourd’hui encore l’un des principaux arguments de vente de la dictée numérique. Or, comme nous le verrons dans les entretiens que nous avons menés, celle-ci est en réalité restreinte selon les scripteurs et les documents que l’on cherche à produire.

Malgré ses avantages, la pratique de la dictée est critiquée dès l’Antiquité, notamment par le rhéteur et pédagogue Quintilien. Sa critique est particulièrement intéressante car elle évoque un problème actuel, que nous questionnerons dans la suite de cet article : le rythme de l’écriture sous la dictée. Pour le pédagogue, tout scripteur humain est à la fois trop lent pour suivre « le feu de la pensée » et trop rapide pour laisser au raisonnement écrit le temps d’être construit : « celui à qui nous dictons nous presse, et nous avons honte parfois d'hésiter, ou de nous arrêter, ou de changer, comme si nous avions peur d'avoir un témoin de notre faiblesse » (Honeycutt, 2004). Or, si le jugement est absent, nous verrons que la machine ne tolère pas plus (voire moins) les hésitations, arrêts ou reprises de l’auteur. En scribe impitoyable, elle soumet l’utilisateur à une stricte linéarité et au flux radical et rapide de l’oral.

L'ars dictaminis médiéval

Malgré ces critiques, la pratique répandue de la dictée perdurera jusqu’au Moyen-Âge. En effet, il faudra attendre les XI et XIIèmes siècles pour voir se développer « la participation directe de l’auteur à la confection matérielle de ses propres textes » (Dorandi, 2000, p.52). Le Moyen-Âge fut donc marqué par l’oralité avec notamment la pratique de l’ars dictaminis, un art pour lequel l’écriture ne s’envisageait pas sans la voix et surtout impliquait une littératie importante. Comme l’explique Lee Honeycutt l’ars dictaminis médiéval consistait avant tout en un travail de composition résultant d’une « cognition distribuée qui impliquait souvent la participation de plusieurs esprits, de l'invention au produit fini » (Honeycutt, 2004, p.299). Celle-ci ne comprenait pas de sténographie précise mais

« les auteurs du XIIe siècle dictaient leur prose mentale à des scribes qui notaient souvent des résumés édités des mots qu'ils entendaient. Par la suite, les secrétaires devaient reconstituer les intentions des auteurs, ce qui a donné lieu à une forme précoce d'écriture collaborative. »

On note ici une tension entre la transcription mot-à-mot du texte dicté (principe de la sténographie) et la participation active du scribe à la composition du texte final. La conception de l’écriture antique et médiévale semble dispersée au sein d’un collectif, ou a minima d’un duo de personnes. Non seulement les organes de l’écriture sont répartis entre l’auteur et le scribe, mais la composition du texte final et sa reformulation sont également partagées. Nous explorerons dans la troisième partie de cet article le renouvellement de cette dimension collaborative sous l’angle de la double énonciation à l’œuvre dans le texte vocescrit : une « énonciation humaine » et une « énonciation computationnelle ».

Pour résumer, nous retenons de ce détour historique un ensemble de problématiques dont nous étudierons la réactualisation par la dictée numérique : la culture « lettrée » nécessaire à la composition de documents variés, la posture « libérée » du corps écrivant, le rythme d’écriture et enfin le caractère collaboratif de l’écriture et le décalage qu’il induit entre le « dicté » et l’inscrit.

Des discours médiatiques qui les opposent 

Si la lecture et l’écriture orales étaient répandues dans l’Antiquité et au Moyen-Âge, « au cours des trois siècles suivants, la séparation des mots et la lecture silencieuse - ainsi que l'écriture silencieuse - sont devenues des pratiques d'alphabétisation acceptées dans toute l'Europe » (Honeycutt, 2004, p.301). Désormais, le concept d’écriture silencieuse est normalisé, et la voix a disparu des représentations du geste d’écriture.

Cette évolution est particulièrement remarquable dans les discours d’escorte de la dictée numérique, qui opposent parole et écriture. En effet, dans le cadre de notre pratique de veille et de recherche, nous avons relevé tout au long de notre thèse des titres nous interpellant pour leur traitement spécifique de la dictée numérique. À partir de ces derniers, nous avons constitué un corpus médiatique, notamment composé de trois grands types de discours d’escorte : le premier oppose radicalement la parole à l’écriture, l’une évinçant nécessairement l’autre ; le second convoque le champ lexical de la main malgré sa disparition, opérant une confusion dans la représentation des organes mobilisés par le geste d’écriture vocal ; le troisième exclut tout simplement le corps de l’acte d’écriture, le délégant entièrement à la machine.

À travers l’étude de ce ces discours, nous verrons en quoi l’impensé de l’écriture dans la dictée numérique ne relève pas seulement de la « mémoire de l’oubli » (Souchier, 2012), indispensable à toute pratique communicationnelle, mais bien de l’ignorance du fait même que l’on est en train d’écrire, et donc de la non-intelligibilité de la dictée numérique en tant qu’outil d’écriture.

"Parlez au lieu d'écrire"

« Parler au lieu d’écrire » : c’est le conseil donné par Apple aux utilisateurs de la dictée numérique sur iphone. Il y a dans cette formulation une opposition très nette entre la parole et l’écriture, que l’on retrouve dans de nombreux discours médiatiques dont nous reprenons ici les plus exemplaires.

« On n'aura bientôt plus besoin d'écrire... La révolution de la voix est en marche »[1]. Ce titre du média en ligne l’ADN énonce un serpent de mer classique : l’annonce de la disparition potentielle de l’écriture, ou du moins de son geste, remplacé par une autre technique, ici la parole. Et de fait, la pratique de l’écriture est bien évincée par la dictée numérique dans l’ensemble des titres de cette première catégorie. On relève par exemple de nombreuses structures linguistiques d’opposition : « SMS, whatsapp... Comment dicter un message pour ne pas avoir à l'écrire ? »[2] ou encore « Voici comment utiliser la dictée pour parler au lieu d'écrire un texte »[3]. Ce dernier est tout particulièrement intéressant dans la mesure où il associe la construction d’un texte à l’écriture et non à la parole. Mais alors que produit la voix une fois captée par le dispositif ? Nous pouvons également citer l’article intitulé « Faites comme si vous alliez écrire », sous-entendant que nous n’allons pas le faire, qui propose au lecteur de découvrir « comment écrire un message sans lever le petit doigt, uniquement grâce à votre voix »[4]. Si ce dernier titre exclue la main, il est intéressant de constater que toute une autre série de discours d’escorte ne parvient pas à s’en passer, alors même que celle-ci n’est plus mobilisée dans le geste d’écriture. 

La dictée numérique hantée par le fantôme de la main

Des formulations surprenantes, presque antithétiques, voient en effet le jour, telles que « dactylographie vocale », alors même que les doigts ne sont pas impliqués, ou encore « speak to type », alors que l’action de « taper à l’ordinateur » a disparu. Le texte de présentation de l'application "Dactylographie vocale" sur Google play semble aussi opérer cette confusion : « Voice to text converter est un moyen simple de taper la voix pour écrire des sms lorsque vous êtes en voiture ou que vous ne pouvez pas vous concentrer sur le clavier. La dactylographie vocale rend la dactylographie mobile facile et rapide, vous permettant ainsi de vous concentrer sur le texte et les pensées plutôt que sur le clavier. »[5]

Si le choix du terme dactylographie peut surprendre (celui-ci venant du grec ancien « δάκτυλος » -doigt -  et « γραφή » - écriture, graphie), son intérêt réside dans la liberté corporelle qu’il implique, liberté au cœur de la pratique de dictée des auteurs antiques. En effet, la discipline de la dactylographie consiste précisément à ne plus avoir besoin de regarder le clavier, de manière à se rendre disponible à la lecture.

Il semble ainsi compliqué de décrire l’activité d’écriture hors des terminologies habituelles : si la main « tape » au clavier, quel verbe employer pour décrire l’action de la voix ? Nous retrouvons cette difficulté à se représenter l’écriture sans ses gestes habituels dans les entretiens que nous avons menés. Une utilisatrice s’interroge : « Est-ce qu’il y a des gens qui ont le sentiment de se visualiser en train d’écrire quand ils dictent ? Parce que moi pas du tout ». Une autre explique sa difficulté à penser l’action matérielle de la parole : « On n’imagine pas que la voix, la langue puisse avoir un impact directement écrit. (…) La fonction première de la main a été de déchiqueter, de dépouiller, et elle se prête à l’écriture, à la matérialisation de quelque chose. La fonction de la parole est de communiquer et d’échanger sur des choses immatérielles ».

La machine écrivante ou la disparition du corps

De façon plus radicale, les discours issus de la troisième catégorie de notre corpus attribuent entièrement l’action à la machine et entérinent ainsi la non-implication du corps humain dans le geste d’écriture. En disparaissant, la main aurait de fait entraîné avec elle la disparition du corps tout entier.

Le média en ligne Numerama titre par exemple en 2016 : « La reconnaissance vocale désormais plus rapide et correcte que le clavier »[6], comme si l’efficacité ne dépendait pas de la vitesse de frappe des doigts de l’utilisateur, ni du contrôle de l’interface vocale par la voix. L’article va plus loin en expliquant que « le logiciel de reconnaissance vocale Deep Speech 2 de Baidu peut écrire un message trois fois plus rapidement qu’un humain ». La performance d’écriture n’est ici plus dépendante du corps écrivant mais uniquement de l’outil utilisé. Il semble assumé que cet outil fait le travail « à notre place », on le voit avec cet autre titre : « Ne tapez pas vos messages avec la main, dictez-les à votre téléphone qui se chargera de rédiger un SMS ou un email à votre place ».

Plus largement, on constate que l’ensemble des terminologies utilisées pour parler de la dictée numérique situe l’action davantage du côté de la machine que de l’humain. C’est notamment le cas des termes « reconnaissance vocale », « saisie vocale » ou encore « transcription automatique ». Chacun de ces termes, souvent utilisés de façon indistincte dans les discours médiatiques, décrit l’action de la machine et non pas celle de l’humain l’utilisant. Il semble que la complexification et la transformation des outils d’écriture en machines computationnelles écrivantes (Petit & Bouchardon, 2017) aient déplacé le rôle de scripteur de l’humain vers l’ordinateur, faisant de ce dernier l’exécutant unique du geste d’écriture. Ceci nous semble relever d’un impensé majeur : le fait que la machine « écrive » (selon une définition nécessairement différente de l’écriture humaine) n’implique pas que l’utilisateur ne le fasse pas en même temps et avec elle.

Le terme « dictée » est finalement le seul à désigner une action humaine. Néanmoins, il sous-entend avant tout une délégation de l’acte d’écrire à un Autre, humain ou non. En effet, le dictionnaire historique de la langue française nous informe qu’au sens premier, dicter signifie : “faire écrire”, ou encore “dire à voix haute pour qu’on écrive”. Dans le cas de la dictée numérique, l’humain agit mais c’est bien l’ordinateur qui écrit selon cette définition.

Les discours d’escorte tendent ainsi à faire de la dictée numérique une pratique dégagée du corps. Or, comme nous le verrons, nos entretiens montrent que le corps est en réalité omniprésent. Nous proposons donc de nous pencher sur l’action humaine dans la dictée numérique, et posons l’hypothèse que celle-ci relève bien de l’écriture, et ce malgré l’absence de la main et de tout contact avec le support. Il s’agit alors d’explorer la littératie propre à cette écriture particulière en redessinant la scène d’un corps écrivant. Il s’agit par là-même de rendre justice à l’effort humain, et au contrôle nécessaire à sa technicisation. Nous prenons donc le contre-pied des discours présentant la dictée numérique comme un moyen de « contrôler son PC grâce à sa voix, sans clavier ni souris », pour proposer un regard inverse : en quoi la dictée numérique est-elle avant tout un contrôle du corps et donc bien un geste effectué par un corps technicisé ?

Comment inclure le geste vocal dans l'écriture : l'écriture vocescrite

Pour étudier la dictée numérique sous l’angle de l’action humaine, nous proposons de la considérer comme une écriture « par la voix », autrement dit une écriture vocescrite. Partant du nom féminin latin vox, qui à l’ablatif devient voce, l’expression « écrit à la voix » devient « vocescripta », puis vocescrit, sur le modèle de « manuscrit » en français commun, ou « tapuscrit » pour tapé à la machine. Il s’agit ici de voir en quoi ce geste vocal n’est pas une simple délégation de l’écriture à la machine, mais bien un acte d’écriture en lui-même, mobilisant une littératie (corporelle et linguistique) particulière.

Pour cela, nous avons mené des entretiens qualitatifs auprès de dix-neuf personnes (7 femmes et 12 hommes, entre 19 ans et 58 ans) utilisant ponctuellement ou régulièrement la dictée numérique, sur ordinateur, tablette ou smartphone. Ces personnes nous ont répondu suite à un appel sur Twitter, manifestant pour certaines une forte envie de témoigner sur cet outil qui leur avait « changé la vie ».

Nous verrons tout d’abord en quoi ce geste s’inscrit profondément dans une pensée de l’écrit pour les utilisateurs, et dans quelle mesure ces derniers font appel à la raison graphique (Goody, 2010). Nous montrerons ensuite en quoi ce geste d’écriture est contraint par le support et ses défaillances. Nous verrons enfin qu’en permettant de nouveaux usages tels que les « pense-bêtes » et « copier-coller » oraux, cette nouvelle écriture s’ouvre à de nouveaux scripteurs, jusqu’alors exclus du champ théorique de l’écriture.

Il s’agira plus globalement de comprendre en quoi la conceptualisation d’une écriture vocescrite implique une redéfinition du geste d’écriture lui-même, non plus fondé sur l’alliance œil-main mais sur la rencontre entre un corps contraint et un support en vue d’une inscription.

L'intégration du texte dans un environnement écrit : l'appel à la "raison graphique"

Pour prendre la mesure de la pensée de l’écrit dans le geste d’écriture vocescrit, commençons par lister l’ensemble des usages évoqués par nos enquêtés. Ces derniers disent se servir de la dictée numérique pour : l’envoi de sms, de mails, la transcription de cours, la rédaction d’articles, la prise de notes (proche du pense-bête oral), le développement de réflexions sur un sujet, le copier/coller oral pour retranscrire des citations issues de documents non numérisés, des recherches internet. Il y a donc en premier lieu une intention d’écrire mais également une indispensable littératie numérique puisque la porte d’entrée dans tous ces logiciels de traitement de texte requiert elle-même une connaissance du format de chacun de ces écrits. 

Nous avons par ailleurs relevé une anticipation de la (re)lecture – par le destinataire ou le scripteur lui-même) – au  moment de la dictée. Les enquêtés évoquent en premier lieu la recherche d’une cohérence conversationnelle. Un utilisateur nous a ainsi expliqué qu’il préférait envoyer un message vocescrit plutôt qu’un vocal « parce qu’{il} trouve que c’est plus agréable dans une conversation de voir des messages écrits qu'un vocal, un message écrit, un vocal, un message écrit, etc. » Ils évoquent également la rapidité de consultation permise par l’écrit, en comparaison aux messages vocaux, et la possibilité d’une recherche par mots-clés dans la conversation a posteriori.

« en mettant la dictée vocale ça me permet vite de retrouver un message dont j’ai besoin, j’ai les mots clés et hop c’est bon je l’ai et c’est fini quoi. »

« pour consulter un message vocal, il faut demander à l’écouter, on ne peut pas le relire rapidement comme un sms. La vue est beaucoup plus rapide pour scanner l’information. »

Au-delà de l’intention d’écrire, nous notons donc la conscience de produire un écrit numérique. Ils sont en revanche une majorité à répondre par la négative à la question : « pensez-vous qu’il soit nécessaire de savoir écrire pour utiliser la dictée numérique ? ». En effet, si certains évoquent l’importance de savoir lire (notamment pour corriger et réécrire), la maîtrise de l’écriture n’est en revanche pas une nécessité pour effectuer le geste vocal selon nos enquêtés. Les seules mentions d’un savoir propre à l’écrit mobilisé au cours de la dictée numérique concernent la mise en forme des textes produits et la ponctuation :

« il faut dire "à la ligne, point d’exclamation, virgule" (…). Cela me semble important pour la formalité des mails ou des lettres de motivation ou des choses plus formelles comme remplir des papiers. »

On remarque ici une perception différente de la littératie nécessaire selon l’usage et les documents dictés. L’on constate surtout que la dictée semble constituer un premier jet, un entre-deux qui nécessite une correction (comme nous le verrons en troisième partie).   

Contraintes et apprentissage de l'écriture vocescrite 

Au-delà de la « pensée de l’écrit », nous nous intéressons à la dynamique d’adaptation du scripteur à son support ; autrement dit au contrôle et à la contrainte du geste d’écriture par l’outil utilisé. Au cours de nos entretiens, nos utilisateurs ont unanimement évoqué l’attention qu’ils portaient au logiciel de dictée et à ses défaillances, nous expliquant la façon dont ils s’y adaptaient. Plusieurs utilisateurs évitent par exemple d’employer des mots à la prononciation trop proche pour limiter les risques de confusion : « J'essaie entre guillemets de l'aider. C'est un peu de la personnification, mais c'est ça. J'aide un peu le logiciel pour avoir un peu moins à corriger. »

Les personnes que nous avons interrogées expliquent qu’elles adaptent également leur diction, en adoptant un rythme plus lent et une intonation neutre. Il est intéressant de noter que ce geste vocal « ralenti » s’accompagne très souvent d’une pratique de lecture simultanée. Ainsi, là où les discours d’escorte promettent une liberté corporelle loin de l’écran, les réflexes de lecture et de surveillance de l’outil sont en réalité bien présents. On retrouve ici la pensée d’Olivier Fournout (2012) lorsqu’il affirme qu’« une envie de lire et de voir en silence hante l’expression à l’oral. Un tigre de papier, à l’écoute, niche dans le corps démonstratif du discoureur à voix haute ». De même, la dictée numérique n’évince pas la partenaire historique de l’écriture qu’est la lecture et l’on assiste ici bien à une pratique de lettrure.

« Je parle très lentement pour m’assurer qu’il comprend bien ce que je dis (…) et je vais attendre de voir le texte écrit pour continuer ma phrase. »

« Quand je fais une dictée, je parle davantage en mode robotisé. Je parle beaucoup moins naturellement pour que le logiciel puisse me comprendre. »

Loin d’être intuitif, certains parlent d’un temps long nécessaire à l’adaptation de l’utilisateur au logiciel et inversement. C’est le cas de cette étudiante qui a « dressé » son logiciel pendant plusieurs années :

« J’ai passé deux ans à faire en sorte qu'il s'adapte à ma voix, qu’il se montre réceptif, et que je sois aussi efficace à l'oral qu'en tapant sur l'ordinateur. (…) La décomposition des mots est plus importante pour le téléphone que pour Dragon (…), parce que Dragon est habitué à ma voix, à mes manières, à mes tics de langage, et il arrive clairement à identifier lorsque je parle ».

Au travers de ces ajustements, de ces différentes contraintes verbales et vocales, nous voyons se dessiner une « technique du corps ». Cette notion a été développée par Marcel Mauss pour désigner « la façon dont les hommes savent se servir de leur corps ». L’approche par cette théorie nous permet d’étudier la technicisation des corps et le rapport à l’outil en dehors du champ de la main. En effet, le geste technique est souvent pensé en fonction de la main : comme l’explique Régis Ouvrier-Bonnaz (2014), « sans libération de la main, pas de geste technique, pas d’outil - prolongement de la main - ni d’outil - organe de la machine - et au bout du compte pas d’objet fabriqué ».

Or l’écriture vocescrite nous invite justement à penser le rapport à l’outil hors de la main, tout en continuant pourtant à envisager la technicisation du corps et sa capacité à produire. Pour appliquer la théorie des techniques du corps à la parole (une dimension qui était absente des travaux de Mauss), nous nous inspirons des travaux de l’ethnologue Gaëlle Lacaze (2006). Cette dernière considère en effet que « l’activité de parole nécessite une certaine maîtrise du corps et le discours verbal implique la connaissance du langage gestuel du groupe auquel on s’adresse. La technicité corporelle sous-tend l’activité de parole, car parler implique tou­jours de mouvoir son corps. »

Si nous la rejoignons sur la technicité du geste vocal observé dans notre cas, la technique décrite par nos enquêtés se distingue néanmoins de la parole en ce qu’elle est dépourvue de ses propriétés (le flux, l’intonation, les marqueurs émotionnels, etc). C’est une technique du corps vocale avant tout pensée pour l’écrit, pour son rythme, son séquençage et en anticipation de son format. Entre contrainte et contrôle, la dictée numérique signe ainsi la rencontre entre une voix technicisée et un outil en vue d’une inscription : elle est en somme une écriture libérée de la main, une écriture vocescrite. Nous nous interrogeons sur les perspectives ouvertes par cette définition élargie de l’écriture. À qui s’adresse-t-elle et que permet-elle de faire ? 

Une écriture plus accessible et inclusive ?

De nouveaux usages

Nos enquêtés font mention de situations d’écriture particulières, dans lesquelles le corps n’est traditionnellement pas en mesure d’écrire, telles que la conduite, la marche ou encore la course. Une utilisatrice mentionne même un épisode à la plage, à l’origine de sa pratique de « copier-coller oral »:

« J’avais un bouquin sur mon sujet de recherche et je voulais prendre des notes facilement. Et j’ai commencé à dicter sur l’application Notes mes citations et les numéros de page. Ensuite j’ai fait un copier-coller et je me le suis envoyé par mail (…). Et là j’ai réalisé que c’était ultra pratique, plus pratique que de prendre un stylo et de noter sur un carnet, ou de reporter du livre vers mon ordinateur. »

Cette pratique de copier-coller oral à partir de documents non-numérisés a été mentionnée par plusieurs de nos enquêtés comme une pratique devenue régulière dans leurs activités d’écriture. Un petit nombre évoque par ailleurs une prise de note orale, proche de la logique du brouillon : 

« Quand j’essaie de réfléchir sur un sujet, il m’arrive d’activer la dictée vocale, de parler et de regarder a posteriori ce qui a été produit, puis de réorganiser mes idées.»

« Le fait d’utiliser la voix lors de phase de réflexion, c’est simplement parce que quand on est sur son ordinateur, le fait d’utiliser son clavier va forcément ralentir la réflexion. Et donc quelque part c’est se mettre un frein à la pensée qui peut aller assez vite lorsque l’on est en train de réfléchir à un sujet, et donc le fait d’utiliser ce système de dictée vocale permet de pas avoir la barrière de ce clavier.»

On constate ici que la lenteur du scripteur humain (critiquée plus haut par Quintilien) trouve une réponse avec l’écriture vocescrite, plus rapide selon les enquêtés. Le vieux rêve de Scott de Martinville, inventeur du phonautographe refait alors surface : « L’improvisation de l’écrivain, lorsqu’elle surgit au milieu de la nuit, pourra-t-elle se retrouver le lendemain avec toute sa liberté, cette indépendance complète de la plume si lente à traduire une pensée toujours refroidie dans sa lutte avec l’expression écrite ? » (« Principe de phonautographie », 1857).

Dans cette prise de notes orale, le geste d’écriture se fait loin du support ; il épargne au scripteur sa propre lenteur, le dispense de la dispositio à l’écran et plus globalement de la réification contraignante de l’écrit. Les descriptions de cette pratique d’écriture flottante, à distance du support et appelée à être retravaillée, rejoignent à mi-mots la pensée de Lamia Zaki (2006) sur le stade du brouillon : « Le défi de la langue est minimisé, la réflexion est désinhibée, mais elle a tendance à rester flottante, à ne pas dépasser le stade de l’intuition : je touche les idées de loin ».

Cette écriture qui suivrait enfin « le fil de la pensée » parait en opposition avec la surveillance de l’écran et la diction ralentie décrites plus haut. Il nous semble donc que c’est l’une des caractéristiques de l’écriture vocescrite que de permettre des usages distincts, allant de la délégation totale de l’inscription à l’interaction permanente avec l’écran. Ces nouveaux usages, fondés sur une libération de la main, une distance potentielle prise par rapport au support et à l’écran, ouvrent la porte à de nouveaux scripteurs et à de nouveaux corps dans le champ de l’écriture.

De nouveaux scripteurs

Lors de nos entretiens, un thème est en effet revenu de façon très fréquente : les impossibilités et limites du corps. Certains enquêtés ont ainsi expliqué choisir la dictée pour des raisons de fatigue, voire de maladie ou d’handicap. Comme on peut le comprendre dans les témoignages suivants, la dictée numérique est devenue pour ces derniers le moyen de continuer à écrire « envers et contre tout ».

« Je suis malade chronique, […] c’est à dire qu'au bout de 30 minutes d’écriture je vais me déboiter les doigts, la main et cetera, donc je suis obligée de faire tout à l’audio, à l’écoute ou à l’oral pour éviter d’avoir des grosses douleurs ou des blessures. »

« Je suis atteint d’une pathologie, d’une neuropathie, qui déforme les mains notamment et qui fait que je fais de plus en plus de fautes au clavier. Je ne suis pas productif au clavier et je ressens des douleurs, donc je fais appel à la dictée vocale. »

Derrière cette écriture plus accessible se dessinent alors les questions fondamentales de communication et dès lors d’intégration dans une société du tout numérique, du tout écrit :

« L’écriture orale (…) permet à des personnes qui sont fatiguées ou qui sont endolories, d’écrire, de pouvoir continuer à travailler. Et dans un monde où dès qu’on a un état de santé qui n’est pas en accord avec la rapidité de notre monde on est exclu et on est discriminé, cet outil là moi il m’a sauvée personnellement, réellement.»

« Pour beaucoup, la dictée vocale et les vocaux ça leur a changé la vie. Parce qu’en fait ces personnes se retranchaient sur le fait de… “ah on est fatigué, on a mal aux mains, on va pas écrire”. Et depuis qu’il y a les vocaux et la dictée vocale, les gens se ré-ouvrent et en fait vont communiquer. »

Au travers de ces témoignages, il nous semble pouvoir affirmer que la reconnaissance de la dictée numérique en tant qu’écriture est également une reconnaissance de ses scripteurs. L’impensé du corps dans l’écriture vocescrite est en effet avant tout un impensé des corps écrivants, de leur technicisation et du contrôle qu’elle requiert. Or cette technicité corporelle que nous observons est entièrement dépendante de l’outil qui recueille la parole. En effet, avec les logiciels de dictée numérique, la parole est passée de technique du corps « indépendante » à technique du corps outillée, au service de l’écriture.

Cette dépendance à l’outil est particulièrement frappante dans un épisode relaté par François Matheron, philosophe ayant commencé à utiliser un logiciel de dictée numérique suite à un AVC. Dans son livre « L’homme qui ne savait plus écrire », il raconte une crise d’angoisse faite lors d’une panne de son logiciel Dragon. Face à la machine n’inscrivant pas ses paroles, le philosophe se demande si c’est lui ou l’outil qui ne « fonctionne » plus. En effet, le logiciel lui permet de savoir chaque jour « s’il arrive à écrire » et donc plus largement s’il arrive à parler de façon distincte et contrôlée. Plusieurs choses se mêlent ici : s’il ne parle plus, si son corps ne fonctionne plus, alors il n’écrira plus ; réciproquement, si l’outil ne marche plus, alors il ne saura plus écrire. Le logiciel apparaît alors comme l’instrument de mesure du niveau de maitrise de la technique du corps qu’est l’écriture vocescrite.

Cet épisode révèle qu’on ne peut penser le geste vocescrit sans penser la part prise en charge par la machine informatique. Quel rôle joue-t-elle dans l’accomplissement de l’écrit, du texte, de son tracé, de son agencement, de son orthographe ? C’est ce que nous proposons d’explorer dans le troisième temps de cet article.

Une littératie partagée : ce que la machine prend en charge

Héritière directe de la dictée médiévale collaborative, l’écriture vocescrite est avant tout une écriture numérique, c’est à dire qu’elle s’articule entre trois niveaux : « il y a ce qu’écrit la machine, il y a ce qu’écrit le programmeur de cette machine, il y a ce qu’écrit l’utilisateur de cette machine » (Petit, Bouchardon, 2017). Elle procède dès lors a minima d’une double énonciation : humaine et computationnelle.

Il est important de souligner que le terme d’énonciation prend ici deux sens différents, l’un linguistique et l’autre sémiotique. L’énonciation computationnelle relève du second : elle s’ancre dans le champ plus large de l’énonciation éditoriale qui s’intéresse à la pluralité des instances, humaines comme non-humaines, à l’œuvre dans la construction d’un texte. Comme l’explique Emmanuel Souchier (1998),

« proposer l’expression "énonciation éditoriale" est nécessairement faire œuvre d’hérésie au regard de la linguistique ou des études littéraires. D’un point de vue linguistique, le terme d’énonciation implique qu’il y ait un énoncé et un énonciateur [humain]. Le concept d’énonciation éditoriale doit s’émanciper de cette tutelle (…) afin de rendre compte de la dynamique qui associe à travers un matériau signifiant complexe, outils, supports, pratiques et métiers de l’écriture ».

Ainsi, par l’usage de ce concept, nous entendons rendre compte du rôle de la machine dans l’activité d’écriture mais en aucun cas lui prêter une énonciation au sens linguistique. Son énonciation n’est pas l’expression d’une intériorité, mais une participation à la production du sens. Loin d’être anodin, ce dualisme terminologique relève par ailleurs d’une problématique linguistique plus globale, qui sème le trouble sur la différence humain/machine. Là où l’on a longtemps reproché aux scientifiques l’usage de métaphores du vivant pour décrire les machines, le débat sur l’énonciation révèle une problématique propre aux sciences de l’information et de la communication, qui analysent en des termes semblables les actions communicationnelles humaines et machiniques (dont l’écriture et la lecture). Nous sommes pris (à commencer par nous - autrice) dans les mailles du logos pour penser « l’expression » de la matière : or celle-ci, si elle ne « dit » rien au sens propre, exprime pourtant bien quelque chose.

Malgré cette ambiguïté, les concepts « d’énonciation éditoriale » et « d’énonciation computationnelle » ont le mérite de mettre en lumière la pluralité des instances énonciatives dans la mise en œuvre d’un texte. Pour Samuel Goyet, l’énonciation computationnelle désigne plus précisément

« le fait que tout écrit d’écran est le résultat, au moins en partie, de l’exploration de tous les possibles d’un ensemble combinatoire par le biais du calcul formel. Ainsi, ce qu’on lit à l’écran est l’un des possibles retenus par les entités computationnelles à l’œuvre dans la production de ce texte » (Goyet, 2017b, p.11). 

À sa suite, nous souhaitons porter une attention à cette énonciation computationnelle afin de « faire apparaître la pluralité et la polyphonie des écrits d’écran, y compris les voix non-humaines » (Goyet, 2017, p.454). Cela nous permet également d’observer le décalage entre ce qui est pensé, dit, et ce qui est inscrit. Concrètement, nous cherchons à comprendre ce qu’un de nos enquêtés nous a dit à propos d’un texte qu’il avait dicté : « on sent que ce n’est pas mon écriture, c’est celle de la dictée ». Cette formulation nous a interpellée, en quoi consiste « l’écriture de la dictée » exactement ? L’utilisateur nous a répondu la chose suivante :

« les phrases que je dicte sont des phrases très bien construites. Parce qu’avec l’écriture je ne prendrais pas forcément le temps de mettre des majuscules, de mettre les points. […] Et puis avec la dictée vocale, je ne vais pas dire « mdr », alors qu’en tapant un message je le mettrai automatiquement. Avec la dictée vocale, c’est une écriture un peu plus froide, parce qu’on n’utilise pas d’emoji… »

Ici le style formel seul est transformé mais nous verrons que les mots peuvent eux aussi subir des modifications. Le partage de la littératie s’opère non seulement au niveau corporel (délégation du tracé) mais également aux niveaux graphique et linguistique (mise en forme du texte, correcteur orthographique). Il s’agit alors pour nous de mettre en lumière les décalages, transformations et pertes de contrôle sur le texte engendrés par l’énonciation computationnelle dans l’écriture vocescrite

La prise en charge orthographique 

La prise en charge orthographique du texte est celle qui remonte le plus souvent dans nos entretiens. De fait, le texte dicté est passé « à la moulinette du correcteur » (Citton, 2022), pour le meilleur comme pour le pire. Comme l’explique Marie-Emmanuelle Pereira, Christina Romain and Véronique Rey (2017), « le logiciel prend en charge une part de l’activité d’écriture : il gère en l’occurrence les contraintes graphomotrices, "l’acte graphique", mais aussi les contraintes orthographiques, qui font traditionnellement partie de "l’acte scriptural" ». Cette délégation est recherchée par plusieurs enquêtés ayant des problèmes de dyslexie ou dysorthographie, et pour lesquels la dictée numérique s’avère être d’un grand secours.

« Lorsque l'on est dyslexique comme moi, dysorthographiée et dyslexique, lorsque l'on écrit, le geste d’écriture demande un micro-effort qui facilite les inversions. […] Si l’on est dyslexique, et si l'on fait ça toute la journée ou pendant plusieurs heures, cela fatigue énormément la tête : on doit penser à tout ce qui est orthographe et avec le handicap de l'écriture et du graphisme de la lettre, évidemment on fait plus de fautes. »

Le logiciel vient prendre le relais en soulageant le scripteur de cet effort et en supprimant une partie des fautes, mais une partie seulement. En effet, d’autres enquêtés subissent à l’inverse les erreurs du logiciel et ses « ajouts technologiques ». L’un d’eux explique avoir eu un gros travail de relecture à faire après avoir rédigé un document sans regarder l’écran.

« La pensée était écrite mais il y a eu des ajouts technologiques qu’il a fallu enlever après : des mauvaises retranscriptions, des fautes d’accord, beaucoup plus sur ces paragraphes que sur les autres… C’était lisible, parmi les relectures c’était clair que ces paragraphes-là étaient beaucoup plus erronés en terme grammatical. »

Cette catégorie d’enquêtés milite d’ailleurs pour l’ajout automatique d’une mention « ce texte a été écrit grâce à la dictée vocale » afin d’anticiper et d’excuser la présence de fautes dans les documents produits.

On comprend que l’écriture vocescrite est bel et bien régie par un  « pro-gramme orthographique » : pré-écrit, encodé, ce dernier n’autorise pas la moindre fantaisie langagière. Au travers du geste vocescrit, la parole est policée (et polissée) par un programme technique, de la même manière que l’écriture et son orthographe l’avaient été à l’invention de l’imprimerie. En effet, comme le rappel N. Catach (1973, p.11), « c'est l'imprimerie qui a posé véritablement aux professionnels du livre, aux traducteurs, aux grammairiens, les problèmes de la fixation de notre langue. C'est que l'orthographe, c'est avant tout un procédé de fixation du langage, un art mécanique. »

Le geste vocescrit est bien un geste d’écriture et la parole est figée par un « déjà-là du texte ». Nous pourrions résumer notre point avec les mots d’Yves Citton (2017), pour qui il est temps « d’avouer que nos appareils ont déjà écrit par avance (« pro-grammé ») ce que nous écrivons à travers eux ». Nous nous intéressons alors à ce « déjà-là du texte » qui régit l’écriture vocescrite, et à sa dimension notamment politique.

Déjà-là du texte et censure : une liberté linguistique restreinte 

On observe donc un décalage entre la langue parlée et la langue écrite, non pas juste dans l’intonation, le registre de langue ou la formulation comme c’est généralement le cas, mais entre les mots prononcés et ceux reconnus puis inscrits. De fait, contrairement à l’affirmation de Stiegler (1996) selon laquelle « l’écriture [alphabétique], rend possible une réflexivité dans la mesure où elle implique l’enregistrement exact de la parole », l’écriture vocescrite ne permet que la transcription de ce qui a été le plus probablement dit. Elle repose en effet sur un principe de reconnaissance vocale et donc sur un modèle statistique et une logique computationnelle. Cela introduit une marge, un décalage potentiel, entre ce qui a été dit et ce qui est inscrit.

Des mots peuvent ne pas être transcrits car ils n’ont pas été re-connus par le logiciel, ils ne font pas partie du « déjà-là du texte ». Le geste vocescrit s’oppose donc aux propriétés traditionnelles du langage parlé, décrit par Claire Blanche Bencheviste et André Chervel (1974, p.219) de la manière suivante : « sur  tous les points de la langue, et sans cesse, on constate le caractère créateur de l’usage parlé qui ne se laisse pas enfermer dans le carcan mutilant des puristes. » Or, on constate que non seulement l’orthographe est encadrée mais que le choix des mots est aussi restreint. Paradoxalement, certains mots peuvent d’ailleurs ne pas être transcrits précisément parce qu’ils ont été reconnus et ne sont pas « autorisés ». En 2020, un débat autour d’un filtre à mots « problématiques » a par exemple émergé sur Twitter suite au post d’une internaute : « Aujourd'hui je teste le mode #Dictée sur Word pour la thèse. Le problème ? Il censure automatiquement certains mots (ici: "nue", "poitrine" et "pubis"). Autant vous dire que quand on étudie les figurines féminines préhistoriques, ça devient vite compliqué... ». Numerama a étudié la question et a révélé que

« la qualité de la dictée à l’époque faisait parfois apparaître du "vocabulaire inapproprié" […], Seattle a donc mis en place une liste de mots que l’outil speech-to-text pourrait malencontreusement faire apparaître et qui pourraient heurter son jeune public et les a automatiquement masqués »[7].

Il nous semble voir dans ces exemples un élargissement de la portée théorique de l’énonciation éditoriale puisque le rôle du support d’écriture dans l’élaboration du texte a pris une ampleur nouvelle. En effet, traditionnellement, « l’énoncé de cette "énonciation" n’est pas le texte (le discours de l’auteur), mais la forme du texte, son image » (Souchier, 1998). Or la machine contribue ici à l’élaboration linguistique du texte (le choix des mots, leur orthographe) et non plus seulement à sa mise en forme.

Face à cette contrainte et à ce lissage de l’expression, quels recours à l’internaute ? Comment peut-il résister ? À cette question, Yves Citton (2022) répond la chose suivante :

« même si le standard homogénéisateur semble inhérent au fonctionnement des environnements pré́-codés, des attitudes de résistances (collectives) peuvent toujours en déjouer les assignations grâce aux capacités de l’ingéniosité́ humaine à transgresser les frontières qui bornent tout univers numérisé ».

Il nous semble que le premier geste de résistance peut être tout simplement de « reprendre la main », au sens propre du terme, sur le texte produit. En effet, nos enquêtés nous ont expliqué de façon quasiment unanime que la pratique de correction manuelle était pour eux indissociable de leur activité de dictée. Ainsi, si l’envoi d’un simple SMS ne nécessite pas systématiquement de relecture, c’est en revanche toujours le cas des mails, rapports et articles produits. La reprise manuelle permet d’ajuster la ponctuation pour certains, de rajouter des emojis pour d’autres, ou encore des mots non reconnus. Elle permet en somme de mettre « sa patte » au texte et de le refaire sien. In fine, nous assistons à l’émergence d’une pratique d’écriture partagée entre l’œil, la main, la bouche… et la machine.

Conclusion 

Dans son livre, François Matheron (2018) posait la question suivante :

« Comment écrire quand on ne sait plus écrire (…), comment procéder ? Il suffisait de parler et de m’enregistrer, après tout je n’étais plus aphasique (…). Néanmoins, entre parler et construire un texte, et surtout ce texte, il y avait comme un gouffre, un grand vide. »

Par cet article, nous avons tenté de faire l’étude de ce gouffre et de ce qui le comble, de ce qui permet le passage technique (au sens de technique du corps autant que machinique) de la parole à l’écriture. Car plus qu’un gouffre, c’est un chemin qu’il nous semble entrevoir : le chemin de l’humain à la machine tout d’abord, par la technicisation de la voix et l’adaptation au support. Etudier ce chemin, c’est remettre le corps de l’écrivant au cœur de la réflexion sur l’écriture numérique, non pas en tant que captation et écriture du corps mais bien en tant qu’écriture par le corps. Mais il s’agit également de suivre le chemin de la machine à l’humain, c’est-à-dire la prise en charge d’une partie du geste d’écriture et de sa littératie par un dispositif informatique. Il nous semble que ce sont les conditions nécessaires pour envisager l’écriture vocescrite à la croisée des raisons graphique, orale et computationnelle (Bachimont, 2000), la littératie opérant un trait d’union entre ces dernières.

Au travers du concept d’écriture vocescrite, nous cherchons donc à proposer une recherche d’une part pragmatique et proche du corps, et d’autre part non-anthropocentrée, en faisant une place à l’énonciation computationnelle dans cette dernière.

Enfin, cette réflexion amorce un questionnement plus large sur les temporalités et ressorts cognitifs de chacune de ces écritures, manuscrite, tapuscrite, vocescrite, et sur ce que chacun de ces gestes permet au corps de penser, d’extérioriser, d’inscrire et d’exprimer. Quels sont les blocages levés ou créés par ces mobilisations du corps ? De la réponse à ces questions dépend un enjeu majeur : éviter que l’élargissement des possibilités corporelles d’écriture ne se payent par une atrophie de la liberté créative.

Bibliographie

Bachimont, B. (2000). « L’intelligence artificielle comme écriture dynamique : de la raison graphique à la raison computationnelle », Au nom du sens, J. Petitot & P. Fabbri (éds.), Paris, Grasset, 290-319.

Bencheviste, C-B., Chervel, A. (1974). L’orthographe. Paris : Éditions François Maspero.

Catach, N. (1973). « Notions actuelles d'histoire de l'orthographe ». Langue française, n°20, L'orthographe,  11-18.

Citton, Y. (2022). « Quand la loi devient code : l’écologie orthographique à l’âge des correcteurs automatiques », (manuscrit à paraître) in Ludovic Duhem (dir.), Ecologies du numérique.

Dorandi, T. (2000). Le stylet et la tablette. Dans le secret des auteurs antiques. Paris : Les Belles Lettres, Collection L’Âne d’or.

Fournout, O. (2012). Théorie de la communication et éthique relationnelle. Paris : Editions Lavoisier, 2012.

Garmon, I. (2019). « Tinder : un design centré utilisateur ? La place de l’usager en régime de swipe ». Ocula20(20), 107-126.

Goody, J. (2007). « L'oralité et l'écriture ». In: Communication et langages, n°154, L'énonciation éditoriale en question, 3-10.

Goyet, S (2017). « De briques et de blocs. La fonction éditoriale des interfaces de programmation (API) web : entre science combinatoire et industrie du texte ». Thèse de doctorat en Sciences de l'information et de la communication. Paris IV Sorbonne.

Goyet, S (2017b). « De briques et de blocs. La fonction éditoriale des interfaces de programmation (API) web : entre science combinatoire et industrie du texte. Tome II : glossaire et annexes ».

Honeycutt, L. (2004). « Literacy and the Writing Voice The Intersection of Culture and Technology in Dictation ». Iowa State University : Journal of Business and Technical Communication, Vol. 18, 294-327.  https://doi.org/10.1177/1050651904264105.

Lamia, Z. (2006). « L'écriture d'une thèse en sciences sociales : entre contingences et nécessités », Genèses, vol. no 65, no. 4, 112-125.

Lacaze, G. (2006). « La notion de "technique du corps" appliquée à l’étude des Mongols », Le Portique, 17. https://doi.org/10.4000/leportique.842

Leroi-Gourhan, A. (1964). Le geste et la parole. Paris : Editions Albin Michel.

Mauss, M. (1934). « Les techniques du corps ». Communication présentée à la Société de Psychologie le 17 mai 1934.

Matheron, F. (2018).  L’homme qui ne savait plus écrire. Paris : Editions Zones. 

Ouvrier-Bonnaz, R. (2014). « La libération de la main d’André Leroi-Gorhan », Perspectives interdisciplinaires sur le travail et la santé [Online], 16-3.  https://doi.org/10.4000/pistes.3629

Petit, V., Bouchardon, S. (2017). « L’écriture numérique ou l’écriture selon les machines. Enjeux philosophiques et pédagogiques », Communication & langages, vol. 191, no. 1, 129-148.

Pereira, M-E., Romain,  C., Rey, V. (2017). « Quand Dragon accouche le « déjà-là » du texte : l’apport d’un logiciel de reconnaissance vocale dans une activité de rédaction de résumé », Pratiques [Online], 173-174. https://doi.org/10.4000/pratiques.3410

Plane, S. (2006). « Médium d'écriture et écriture littéraire », Le français aujourd'hui, vol. 153, no. 2, 33-40.

Privat, J-M. (2019). « Littératie », Pratiques, 183-184. https://doi.org/10.4000/pratiques.6762

Souchier, E. (1998). « L'image du texte pour une théorie de l'énonciation éditoriale », Les cahiers de médiologie, vol. 6, no. 2, 137-145.

Souchier, E. (2012). « La "lettrure" à l’écran. Lire & écrire au regard des médias informatisés », Communication & langages, vol. 174, no. 4, 85-108.

Souchier, E. (2012). « La mémoire de l’oubli : éloge de l’aliénation. Pour une poétique de "l’infra-ordinaire" », Communication & langages, vol. 172, no. 2, 3-19.


Notes

[1] « On n'aura bientôt plus besoin d'écrire... La révolution de la voix est en marche » Par Olivier ROBILLART –le 2 février 2018 [En ligne] https://www.ladn.eu/tech-a-suivre/ia-machine-learning-iot/reconnaissance-vocale-les-start-up-en-france/

[2] "SMS, WhatsApp... Comment dicter un message pour ne pas avoir à l'écrire ?" par Anissa Nassr, publié le 20/01/2022 sur le site de femme actuelle. [En ligne] https://www.femmeactuelle.fr/vie-pratique/high-tech/sms-whatsapp-comment-dicter-un-message-pour-ne-pas-avoir-a-lecrire-2127382#:~:text=Lors%20de%20la%20saisie%20de,micro%20pour%20envoyer%20votre%20message.

[4] Smartphone: dicter un SMS, l'astuce à connaître". Par Stéphanie Letellier, publié le 01/09/2021  sur le site Notretemps.com. [En ligne] https://www.notretemps.com/high-tech/smartphone-tablette/smartphone-dicter-un-sms-l-astuce-a-connaitre-32508

[6] « La reconnaissance vocale désormais plus rapide et correcte que le clavier » par Omar Belkaab, Publié le 31 août 2016 sur le site numerama. [En ligne] https://www.numerama.com/tech/191843-la-reconnaissance-vocale-desormais-plus-rapide-et-correcte-que-le-clavier.html

[7] « Lesbienne, masturbation et pénis : ces mots que l’outil de diction de Microsoft Word ne veut pas écrire » par Aline Mayard, publié le 6 décembre 2020 sur le site Numerama.com. [En ligne] https://www.numerama.com/politique/673844-lesbienne-masturbation-et-penis-ces-mots-que-loutil-de-diction-de-microsoft-word-ne-veut-pas-ecrire.html

 
 

 

 

 


Imprimer   E-mail