Análisis forense con Whisper de OpenAI

Si quieres hacer un análisis forense con Whisper de OpenAI, el flujo de trabajo recomendado es:

1️⃣ Verificación de metadatos (asegurarse de que el audio no ha sido modificado)
2️⃣ Conversión del formato (si es necesario)
3️⃣ Transcripción con Whisper
4️⃣ Análisis del contenido (detectar pausas, ruido, identificación de voces)

Voy a explicarlo con comandos prácticos.


1️⃣ Extraer metadatos del audio

Antes de transcribir, es importante comprobar los metadatos del archivo de audio para verificar su autenticidad y procedencia.

🔹 Herramientas: ffmpeg + exiftool

Ejemplo de comando para extraer metadatos:

exiftool audio.ogg

👀 Resultado esperado:
Te dará información como:

  • Fecha de creación
  • Codec de audio
  • Frecuencia de muestreo
  • Dispositivo de grabación (si está disponible)

Si el archivo fue editado o convertido, algunos metadatos pueden faltar o cambiar.


2️⃣ Convertir a formato compatible (opcional)

Si el audio está en un formato como .ogg o .m4a (como los audios de WhatsApp), conviértelo a .wav o .mp3:

ffmpeg -i audio.ogg -ar 16000 -ac 1 audio.wav

👀 Explicación:

  • -ar 16000 → Ajusta la frecuencia a 16kHz (recomendado para Whisper)
  • -ac 1 → Convierte el audio a mono

3️⃣ Transcribir con Whisper

Si tienes Whisper instalado localmente, puedes ejecutar:

whisper audio.wav --language Spanish --model medium

👀 Resultado esperado:
Te generará archivos de salida como:

  • audio.txt → Solo texto
  • audio.srt → Archivo de subtítulos
  • audio.vtt → Formato de subtítulos para video

También puedes usar el modelo large si necesitas más precisión:

whisper audio.wav --language Spanish --model large

4️⃣ Análisis forense del contenido

Después de la transcripción, puedes analizar patrones como:
🔍 Detección de ruido y silencios

ffmpeg -i audio.wav -af silencedetect=noise=-30dB:d=0.5 -f null -

👀 Resultado esperado:
Te indicará los momentos donde hay silencios en la grabación, útil para detectar ediciones sospechosas.

🔍 Verificación de la voz
Para identificar si una persona es quien dice ser, puedes comparar la voz con herramientas como Praat (software gratuito de análisis acústico).


📌 Conclusión

Este flujo de trabajo te permite hacer un análisis forense básico con herramientas gratuitas y código abierto. Whisper te da una transcripción de alta precisión, pero es clave complementar con la verificación de metadatos y ruido.

👉 ¿Quieres ayuda para instalar Whisper o hacer pruebas con un archivo de audio?

Elena

Elena Lacalle es ingeniera informática, perito judicial y fundadora de ChipToChip. Especializada en automatización, desarrollo web profesional y ciberseguridad, lidera el ecosistema de servicios tecnológicos de la marca, incluyendo proyectos de WordPress avanzado, IA aplicada, mantenimiento técnico y auditorías digitales. Su enfoque combina precisión técnica con soluciones escalables para empresas, despachos jurídicos y entornos de alta exigencia operativa.

Deja una respuesta