Transcripción con diarización.
Cada hablante identificado.
De una grabación de reunión o de un archivo de llamada a una transcripción totalmente atribuida — reconocimiento de voz, diarización de hablantes e identificación, unidos en un único pipeline en el dispositivo. Sin APIs en la nube, sin precios por minuto, sin datos saliendo del dispositivo.
Cuatro formas del mismo pipeline.
Cada forma combina un ASR + un diarizador + un almacén opcional de identificación de hablantes. Los componentes son intercambiables; lo que elijas depende del audio y de tu presupuesto de latencia.
Atribución «Alice dijo…» / «Bob dijo…» a partir de una sola exportación de Zoom.
Turnos agente vs. cliente, sentimiento por hablante, en el dispositivo para cumplimiento.
Anfitrión e invitados identificados a lo largo del episodio, con marcas de tiempo a nivel de palabra.
Atribución de calidad judicial sin que el audio salga nunca del dispositivo.
