Análisis forense con Whisper de OpenAI

Si quieres hacer un análisis forense con Whisper de OpenAI, el flujo de trabajo recomendado es:

1️⃣ Verificación de metadatos (asegurarse de que el audio no ha sido modificado)
2️⃣ Conversión del formato (si es necesario)
3️⃣ Transcripción con Whisper
4️⃣ Análisis del contenido (detectar pausas, ruido, identificación de voces)

Voy a explicarlo con comandos prácticos.


1️⃣ Extraer metadatos del audio

Antes de transcribir, es importante comprobar los metadatos del archivo de audio para verificar su autenticidad y procedencia.

🔹 Herramientas: ffmpeg + exiftool

Ejemplo de comando para extraer metadatos:

exiftool audio.ogg

👀 Resultado esperado:
Te dará información como:

  • Fecha de creación
  • Codec de audio
  • Frecuencia de muestreo
  • Dispositivo de grabación (si está disponible)

Si el archivo fue editado o convertido, algunos metadatos pueden faltar o cambiar.


2️⃣ Convertir a formato compatible (opcional)

Si el audio está en un formato como .ogg o .m4a (como los audios de WhatsApp), conviértelo a .wav o .mp3:

ffmpeg -i audio.ogg -ar 16000 -ac 1 audio.wav

👀 Explicación:

  • -ar 16000 → Ajusta la frecuencia a 16kHz (recomendado para Whisper)
  • -ac 1 → Convierte el audio a mono

3️⃣ Transcribir con Whisper

Si tienes Whisper instalado localmente, puedes ejecutar:

whisper audio.wav --language Spanish --model medium

👀 Resultado esperado:
Te generará archivos de salida como:

  • audio.txt → Solo texto
  • audio.srt → Archivo de subtítulos
  • audio.vtt → Formato de subtítulos para video

También puedes usar el modelo large si necesitas más precisión:

whisper audio.wav --language Spanish --model large

4️⃣ Análisis forense del contenido

Después de la transcripción, puedes analizar patrones como:
🔍 Detección de ruido y silencios

ffmpeg -i audio.wav -af silencedetect=noise=-30dB:d=0.5 -f null -

👀 Resultado esperado:
Te indicará los momentos donde hay silencios en la grabación, útil para detectar ediciones sospechosas.

🔍 Verificación de la voz
Para identificar si una persona es quien dice ser, puedes comparar la voz con herramientas como Praat (software gratuito de análisis acústico).


📌 Conclusión

Este flujo de trabajo te permite hacer un análisis forense básico con herramientas gratuitas y código abierto. Whisper te da una transcripción de alta precisión, pero es clave complementar con la verificación de metadatos y ruido.

👉 ¿Quieres ayuda para instalar Whisper o hacer pruebas con un archivo de audio?

ChipToChip

Elena Lacalle García es la titular y principal autora del sitio web **ChipToChip**, una empresa de servicios informáticos ubicada en Valencia, España. ## Actividad y Contribuciones Elena ha publicado numerosos artículos técnicos en el blog de **ChipToChip**, donde comparte manuales y guías sobre informática, desarrollo web y seguridad digital. Sus publicaciones incluyen: - Tutoriales sobre **WordPress** (cómo desactivar comentarios, optimización, etc.). - Soluciones a problemas en **Windows** y **Mac OS**. - Guías de **seguridad web** y administración de servidores. ## Servicios Ofrecidos Además de su labor como autora, Elena se encarga de la gestión y operación de **ChipToChip**, ofreciendo servicios como: - **Diseño y desarrollo web.** - **Mantenimiento de sitios web.** - **Desarrollo de aplicaciones web personalizadas.**

Deja una respuesta