Le workflow Voice Transcription transcrit automatiquement les messages vocaux Telegram en texte. Un système de routage intelligent choisit le service de transcription optimal selon la durée du message.
Service Usage Avantage Groq Whisper Messages ≤ 30s Gratuit, rapide (1-2s) ElevenLabs Scribe Messages > 30s Diarisation, fichiers longs
Durée Service Raison ≤ 30 secondes Groq Whisper Rapide, gratuit > 30 secondes ElevenLabs Scribe Diarisation, fichiers longs
Problème Sans transcription Avec transcription Écoute obligatoire Réécouter pour comprendre Texte lisible instantanément Recherche impossible Pas de ctrl+F sur l’audio Texte indexable Partage difficile Envoyer le fichier audio Copier-coller le texte Accessibilité Pas accessible aux sourds Texte universel
Critère Groq Whisper ElevenLabs Scribe Coût Gratuit Payant (par heure) Vitesse ~1-2s ~10-30s Limite fichier 25 MB 3 GB Diarisation Non Oui Idéal pour Messages courts Réunions, podcasts
"file_id" : " AwACAgIAAxkB... " ,
"first_name" : " Guillaume "
Community Node: n8n-nodes-groq
Paramètre Valeur Credential Groq account - N8NOperation Transcribe Model whisper-large-v3-turboInput Data Field dataLanguage fr (optionnel)Response Format json
HTTP Request Node
Paramètre Valeur Method POST URL https://api.elevenlabs.io/v1/speech-to-textAuthentication Header Auth → ElevenLabs API Body Content Type Form-Data
Form Parameters:
Name Type Value file Binary {{ $binary.data }}model_id String scribe_v1language_code String fr
"text" : " Rappelle-moi d'appeler Jean demain " ,
L’Orchestrateur Telegram détecte les voice notes et appelle ce sub-workflow :
Execute Workflow: Voice Transcription
Input: $json (contient message.voice)
Send message: "🎤 {response.text}"
Send message: "❌ Transcription échouée"
Callback Action voice_retry_{msg_id}Réessayer transcription voice_process_{msg_id}Traiter avec Claude (résumé, extraction) voice_save_{msg_id}Sauvegarder en note
Service Limite fichier Coût Vitesse Groq Whisper 25 MB Gratuit ~1-2s ElevenLabs Scribe 3 GB Payant (par heure) ~10-30s
Limite Impact Mitigation Quota Groq Rate limiting possible Fallback ElevenLabs Format OGG Seul format Telegram APIs supportent nativement Pas de diarisation < 30s Pas d’identification locuteurs Acceptable pour messages courts
Si Groq rate limit atteint :
Basculer temporairement duration ≤ 0 pour forcer ElevenLabs
Ou ajouter OpenAI Whisper comme fallback intermédiaire
Si besoin de diarisation systématique :
Router tous les messages vers ElevenLabs
Ou utiliser un modèle local avec speaker detection
Si besoin de langues multiples :
Détecter la langue automatiquement
Adapter les paramètres selon la langue détectée
Problème Vérification Transcription vide Fichier audio contient réellement de la parole ? Timeout ElevenLabs Fichiers > 5min : augmenter timeout (180s) Groq rate limit Vérifier quotas, basculer vers ElevenLabs Format non supporté Telegram envoie du .ogg (Opus) — supporté nativement
AI Stack — Claude Ollama pour post-processing