Retranscription automatique de pistes audio
Pour mener à bien mon projet de podcast, j'ai décidé suite aux précieux conseils de Mariannick Bellot et Charlotte Rouault, formatrices de l'école Louis Lumière de faire la transcription des interviews.
Après quelques recherches, j'ai trouvé une solution plutôt simple pour faire les transcriptions de façon "automatique". Une présentation d'atelier explique comment installer et utiliser une IA open source développée par openAI (sur windows et ubuntu). Merci à l'équipe de Géotéca, plateforme de recherche mutualisée d’Université Paris Cité pour ce partage. ****Cette IA s'appelle Whisper.
On trouve whisper sur github avec les instructions d'installation en anglais (je trouve que c'est plus compliqué). https://github.com/openai/whisper
Attention au moment d'installer python 3.9 la commande ne fonctionne pas. Il faut taper : coda install python=3.9.0 ( je referai peut-être ce document pour que l'on puisse facilement copier les lignes de code)
Pour compléter ce document, j'ai trouvé sur un autre site en anglais des préconisations de format audio pour faciliter la transcription. Ce qui est conseillé c'est d'exporter les parties audios que vous voulez transcrire dans un format plus léger. J'ai trouvé cette configuration. Après quelques essais, je trouve que ça fonctionne bien.
Format: MP3
Bit Rate: 16 kbps
Sample Rate: 12 kHz
Channels: mono