Du son au texte : trois solutions pour transcrire des audios
Les messages vocaux sont de plus en plus populaires mais pour ceux d’entre nous qui lisent vite, c’est une nuisance. Comment transcrire des audios ?
La science-fiction nous a habitués à des ingéniosités impensables, et la technologie a réussi à les transposer dans la réalité avec plus ou moins de succès.
Nous ne voyageons pas dans des voitures volantes, mais il existe des véhicules autonomes qui circuleront tôt ou tard dans les villes du monde entier.
Nous ne croyions pas non plus que nous pourrions parler à notre smartphone ou à notre télévision intelligente. Aujourd’hui, nous avons Siri, Alexa ou l’assistant Google qui écoutent nos questions et nous répondent ou exécutent les tâches que nous leur demandons.
Depuis quelque temps, il est également possible de lire du texte en format audio et vice versa, de transcrire l’audio en texte automatiquement, sans notre intervention.
Voyons trois exemples de conversion d’un enregistrement audio ou d’une dictée en texte dans plusieurs langues et avec une fidélité plus qu’acceptable pour gagner du temps en transcription manuelle.
IBM Watson Speech to Text
Watson est l’intelligence artificielle qu’IBM développe depuis quelques années et qui est déjà utilisée par des entreprises et des organisations du monde entier pour toutes sortes de tâches, comme la gestion de données ou les recherches avancées.
L’un de ses nombreux utilitaires est l’outil Speech to Text d’IBM Watson, qui nous permet de convertir l’audio en texte dans plusieurs langues, comme l’anglais, l’espagnol, le français, le brésilien, etc.
D’une part, nous pouvons enregistrer du son en temps réel et le convertir en texte. Mais parmi ses particularités, il vous permet également de choisir un fichier audio (MP3, WAV, FLAC) et de transcrire ce qu’il dit.
La page Speech to Text d’IBM Watson est une version d’essai gratuite mais entièrement fonctionnelle, et bien qu’elle n’indique pas de limites, certains utilisateurs ont signalé ne pas pouvoir transcrire plus de 10 minutes.
Saisie vocale sur Google Drive
Google Drive a la capacité de dicter ce que l’on veut écrire, se transformant en texte comme par magie. En outre, il prend en charge un grand nombre de langues.
La fonction est connue sous le nom de Voice Typing et nous la trouverons dans le menu Tools lorsque nous ouvrirons un nouveau document ou un document existant.
Bien que cet outil soit conçu pour transcrire de l’audio en direct, et qu’il le fasse très bien à l’exception de quelques erreurs, nous pouvons lire un audio enregistré avec une application externe et Google Drive traduira cet audio en texte.
La fonction Dictée sur Mac
Depuis des années, Apple se préoccupe de doter ses systèmes d’exploitation et ses appareils de fonctions d’accessibilité pour tous les types d’utilisateurs.
L’une d’entre elles est la Dictée, qui vous permet de parler à votre Mac en convertissant votre voix en texte. Il fonctionne aussi bien avec la voix en direct qu’avec des enregistrements et la fidélité est plus que correcte.
Vous pouvez trouver Dictée sous Préférences système > Clavier > Dictée. Si elle n’est pas cochée, il est conseillé d’activer l’option Utiliser la « Dictée améliorée ». De là, nous pouvons choisir la langue par défaut parmi les nombreuses disponibles.
La dictée fonctionne dans toute application où vous pouvez taper, notamment Pages, Notes, Word ou directement dans le navigateur Firefox, Chrome ou Safari. Pour l’activer, il suffit d’appuyer deux fois sur la touche de fonction (Fn). La première fois, il nous demandera de télécharger le logiciel Enhanced Dictation.
Découvrez également :