Étape 1 : Mise à Jour du Système et Installation de FFmpeg
Ouvrez un terminal et exécutez les commandes suivantes pour mettre à jour votre système et installer FFmpeg :
sudo apt update && sudo apt upgrade
sudo apt install ffmpeg
La première commande met à jour la liste des paquets disponibles, tandis que la deuxième met à niveau les paquets installés vers leurs versions les plus récentes. La troisième commande installe FFmpeg, un outil essentiel pour le traitement des fichiers audio.
Une fois ces commandes exécutées, votre système sera prêt à accueillir OpenAI Whisper. Vous pouvez passer à l'étape suivante : la création d'un environnement Python virtuel.
Étape 2 : Création d'un Environnement Python Virtuel
Il est fortement recommandé de créer un environnement Python virtuel pour isoler les dépendances de Whisper et éviter les conflits avec d'autres projets.
Pour ce faire, exécutez les commandes suivantes :
mkdir whispertest && cd whispertest
python3 -m venv whispertest
source whispertest/bin/activate
La première commande crée un répertoire nommé 'whispertest' et y accède. La deuxième commande crée un environnement Python virtuel dans ce répertoire. La troisième commande active l'environnement virtuel. Vous devriez voir le nom de l'environnement virtuel ('whispertest') apparaître entre parenthèses avant votre invite de commande, indiquant que l'environnement est actif.
Une fois l'environnement virtuel activé, vous pouvez passer à l'étape suivante : l'installation des dépendances Python de Whisper.
Étape 3 : Installation des Dépendances Python et de Whisper
Maintenant que l'environnement virtuel est actif, vous pouvez installer les dépendances Python de Whisper et Whisper lui-même.
Exécutez les commandes suivantes :
pip install setuptools-rust
pip install -U openai-whisper
La première commande installe 'setuptools-rust', qui peut être nécessaire pour certaines configurations. La deuxième commande installe OpenAI Whisper à partir du dépôt PyPI. Cette commande peut prendre un certain temps, car elle télécharge et installe de nombreuses dépendances.
Une fois l'installation terminée, vous aurez tous les outils nécessaires pour transcrire vos fichiers audio avec OpenAI Whisper. Vous pouvez passer à l'étape suivante : la transcription de votre premier fichier audio.
Étape 4 : Transcription d'un Fichier Audio avec Whisper
Avec Whisper installé et configuré, vous êtes prêt à transcrire vos fichiers audio.
Placez le fichier audio que vous souhaitez transcrire dans le répertoire 'whispertest' et exécutez la commande suivante :
whisper sample.wav --model tiny
Remplacez 'sample.wav' par le nom de votre fichier audio. L'option '--model tiny' spécifie le modèle Whisper à utiliser. Vous pouvez choisir parmi plusieurs modèles, allant de 'tiny' à 'large', en fonction de vos besoins en termes de précision et de vitesse.
La transcription démarrera et affichera le texte transcrit dans le terminal. Vous pouvez également rediriger la sortie vers un fichier texte en ajoutant l'option '> output.txt' à la commande.
whisper sample.wav --model tiny > output.txt
Cette commande enregistrera le texte transcrit dans un fichier nommé 'output.txt'.
Vous pouvez également utiliser un script Python pour automatiser le processus de transcription et personnaliser la sortie. Voici un exemple de script :
import whisper
model = whisper.load_model('tiny')
result = model.transcribe('sample.wav')
print(result['text'])
Ce script charge le modèle 'tiny', transcrit le fichier 'sample.wav' et affiche le texte transcrit. Vous pouvez modifier ce script pour enregistrer la sortie dans un fichier, ajouter des horodatages ou effectuer d'autres opérations.