Análisis forense con Whisper de OpenAI

Si quieres hacer un análisis forense con Whisper de OpenAI, el flujo de trabajo recomendado es:

1️⃣ Verificación de metadatos (asegurarse de que el audio no ha sido modificado)
2️⃣ Conversión del formato (si es necesario)
3️⃣ Transcripción con Whisper
4️⃣ Análisis del contenido (detectar pausas, ruido, identificación de voces)

Voy a explicarlo con comandos prácticos.

1️⃣ Extraer metadatos del audio

Antes de transcribir, es importante comprobar los metadatos del archivo de audio para verificar su autenticidad y procedencia.

🔹 Herramientas: ffmpeg + exiftool

Ejemplo de comando para extraer metadatos:

exiftool audio.ogg

👀 Resultado esperado:
Te dará información como:

Fecha de creación
Codec de audio
Frecuencia de muestreo
Dispositivo de grabación (si está disponible)

Si el archivo fue editado o convertido, algunos metadatos pueden faltar o cambiar.

2️⃣ Convertir a formato compatible (opcional)

Si el audio está en un formato como .ogg o .m4a (como los audios de WhatsApp), conviértelo a .wav o .mp3:

ffmpeg -i audio.ogg -ar 16000 -ac 1 audio.wav

👀 Explicación:

-ar 16000 → Ajusta la frecuencia a 16kHz (recomendado para Whisper)
-ac 1 → Convierte el audio a mono

3️⃣ Transcribir con Whisper

Si tienes Whisper instalado localmente, puedes ejecutar:

whisper audio.wav --language Spanish --model medium

👀 Resultado esperado:
Te generará archivos de salida como:

audio.txt → Solo texto
audio.srt → Archivo de subtítulos
audio.vtt → Formato de subtítulos para video

También puedes usar el modelo large si necesitas más precisión:

whisper audio.wav --language Spanish --model large

4️⃣ Análisis forense del contenido

Después de la transcripción, puedes analizar patrones como:
🔍 Detección de ruido y silencios

ffmpeg -i audio.wav -af silencedetect=noise=-30dB:d=0.5 -f null -

👀 Resultado esperado:
Te indicará los momentos donde hay silencios en la grabación, útil para detectar ediciones sospechosas.

🔍 Verificación de la voz
Para identificar si una persona es quien dice ser, puedes comparar la voz con herramientas como Praat (software gratuito de análisis acústico).

📌 Conclusión

Este flujo de trabajo te permite hacer un análisis forense básico con herramientas gratuitas y código abierto. Whisper te da una transcripción de alta precisión, pero es clave complementar con la verificación de metadatos y ruido.

👉 ¿Quieres ayuda para instalar Whisper o hacer pruebas con un archivo de audio?

Blog - ChipToChip | Servicios informáticos Valencia

1️⃣ Extraer metadatos del audio

2️⃣ Convertir a formato compatible (opcional)

3️⃣ Transcribir con Whisper

4️⃣ Análisis forense del contenido

📌 Conclusión

Elena

Deja una respuesta Cancelar la respuesta