Si quieres hacer un análisis forense con Whisper de OpenAI, el flujo de trabajo recomendado es:
1️⃣ Verificación de metadatos (asegurarse de que el audio no ha sido modificado)
2️⃣ Conversión del formato (si es necesario)
3️⃣ Transcripción con Whisper
4️⃣ Análisis del contenido (detectar pausas, ruido, identificación de voces)
Voy a explicarlo con comandos prácticos.
1️⃣ Extraer metadatos del audio
Antes de transcribir, es importante comprobar los metadatos del archivo de audio para verificar su autenticidad y procedencia.
🔹 Herramientas: ffmpeg
+ exiftool
Ejemplo de comando para extraer metadatos:
exiftool audio.ogg
👀 Resultado esperado:
Te dará información como:
- Fecha de creación
- Codec de audio
- Frecuencia de muestreo
- Dispositivo de grabación (si está disponible)
Si el archivo fue editado o convertido, algunos metadatos pueden faltar o cambiar.
2️⃣ Convertir a formato compatible (opcional)
Si el audio está en un formato como .ogg
o .m4a
(como los audios de WhatsApp), conviértelo a .wav
o .mp3
:
ffmpeg -i audio.ogg -ar 16000 -ac 1 audio.wav
👀 Explicación:
-ar 16000
→ Ajusta la frecuencia a 16kHz (recomendado para Whisper)-ac 1
→ Convierte el audio a mono
3️⃣ Transcribir con Whisper
Si tienes Whisper instalado localmente, puedes ejecutar:
whisper audio.wav --language Spanish --model medium
👀 Resultado esperado:
Te generará archivos de salida como:
audio.txt
→ Solo textoaudio.srt
→ Archivo de subtítulosaudio.vtt
→ Formato de subtítulos para video
También puedes usar el modelo large si necesitas más precisión:
whisper audio.wav --language Spanish --model large
4️⃣ Análisis forense del contenido
Después de la transcripción, puedes analizar patrones como:
🔍 Detección de ruido y silencios
ffmpeg -i audio.wav -af silencedetect=noise=-30dB:d=0.5 -f null -
👀 Resultado esperado:
Te indicará los momentos donde hay silencios en la grabación, útil para detectar ediciones sospechosas.
🔍 Verificación de la voz
Para identificar si una persona es quien dice ser, puedes comparar la voz con herramientas como Praat
(software gratuito de análisis acústico).
📌 Conclusión
Este flujo de trabajo te permite hacer un análisis forense básico con herramientas gratuitas y código abierto. Whisper te da una transcripción de alta precisión, pero es clave complementar con la verificación de metadatos y ruido.
👉 ¿Quieres ayuda para instalar Whisper o hacer pruebas con un archivo de audio?