¿Son los servicios de transcripción en línea seguros y privados?

La transcripción fue una vez un proceso manual y tedioso. Los médicos, periodistas y una variedad de profesionales grababan sus notas y conversaciones en una cinta de dictáfono rasposa, y luego se sentaban frente a sus computadoras para escribirlas.

Avance rápido hasta 2020, y hay una variedad de servicios que puede usar para convertir una grabación de audio en texto en la pantalla de una computadora. Sin embargo, queda una pregunta: ¿son seguros? Después de todo, es posible que esté cargando grabaciones de voz de conversaciones sensibles y correos de voz privados.

Echemos un vistazo a estos servicios y cómo puede proteger su información.

Cómo funcionan los servicios de transcripción de audio

Los servicios de transcripción de audio tienden a dividirse en tres campos. El primero está completamente controlado por computadora y utiliza modelos de aprendizaje automático e inteligencia artificial existentes para procesar la conversación. El segundo es el más caro porque la gente hace el trabajo pesado. El tercero es una combinación de procesamiento informático y humanos.

Lo más probable es que esté más familiarizado con la primera categoría. Servicios de transcripción de voz, como los que ofrecen Google, Apple y Otter.ai—Convierte las ondas analógicas que crea tu voz en una representación digital. Luego los divide en segmentos pequeños (a veces, una milésima de segundo) y los relaciona con «fonemas» conocidos o elementos de un idioma.

Estos algoritmos luego intentan examinarlos dentro del contexto de otros fonemas y los someten a modelos estadísticos y de inteligencia artificial que finalmente producen texto. Debido a que estos servicios de transcripción están completamente controlados por computadora, tienden a ser los más económicos de ejecutar. Sin embargo, la precisión no siempre es precisa, especialmente cuando se trata de extraer texto de entornos ruidosos o de varias personas.

La transcripción impulsada por humanos implica plataformas dedicadas, como Rvdo, que conectan a los clientes con un grupo de transcriptores preaprobados. También puede contratar a alguien de un mercado independiente, como Upwork o Fiverr, para transcribir para ti.

Finalmente, está la mezcla de los dos. Para acelerar el proceso de transcripción, algunos sitios permiten que la IA haga el trabajo preliminar y luego alguien arregla el resultado y corrige los errores.

Servicios de transcripción que se comportan mal

Un dedo tocando un altavoz Amazon Echo.

En los últimos años, muchos servicios de transcripción han sido objeto de infracciones y escándalos.

Quizás el más antiguo (y, posiblemente, el más impactante) fue SpinVox, que, en la década de 2000, ofrecía un servicio que convertía los correos de voz en mensajes SMS. En ese momento, esto se consideró nada menos que un avance tecnológico. La empresa atrajo rápidamente una prensa positiva, clientes y grandes cantidades de financiación.

¿El problema? Sin que los clientes lo supieran, sus mensajes de voz procesado por personas que trabajan desde oficinas en lugares como Pakistán, Mauricio y Sudáfrica. Un informante de la compañía afirmó que solo el 2 por ciento de los correos de voz fueron procesados ​​por máquinas y el resto fue manejado por alrededor de 10,000 trabajadores explotados.

Cuando no se les pagaba al personal de una oficina de SpinVox en Pakistán, comenzaron a enviar mensajes directamente a los clientes para protestar. Finalmente, la verdad salió a la luz y SpinVox perdió gran parte de su valor. Al final, los restos de la empresa se vendieron a Matiz, uno de los mayores proveedores de reconocimiento de voz del mundo.

Más recientemente, el periodista de ciberseguridad, Brian Krebs, descubrió una gran brecha que ocurrió en MEDantex, un proveedor con sede en Kansas de servicios de transcripción de voz para profesionales médicos. Como era de esperar, se filtraron datos (algunos de los cuales se remontan a 2007) que contienen registros médicos confidenciales. Los contenidos se pueden descargar de un portal inseguro como archivos de Microsoft Word.

Incluso los servicios de transcripción digital no son seguros. Después de todo, cuando utiliza un servicio totalmente controlado por computadora, la empresa puede utilizar contratistas humanos para realizar el control de calidad.

En 2019, el sitio de noticias belga, VRT NWS, descubrió que los contratistas de Google estaban escuchando conversaciones entre personas y sus asistentes inteligentes de Google Home. Un contratista incluso proporcionó a VRT NWS acceso a conversaciones, muchas de las cuales eran de naturaleza profundamente sensible (y, en algunos casos, sexualmente íntima).

Amazon, Apple y Microsoft también estaban utilizando contratistas de esta manera. En otras palabras, alguien podría estar escuchando grabaciones de voz de su asistente virtual.

¿Son seguros los servicios de transcripción en línea?

Una mujer usando audífonos y escribiendo en una computadora portátil.

La cuestión más pertinente es si los servicios de transcripción en línea son seguros. Desafortunadamente, la respuesta es un poco complicada.

El espacio de transcripción de voz está, en este punto, en gran parte maduro. Los malos actores más atroces han sido eliminados.

Sin embargo, cuando confía sus datos (en este caso, conversaciones privadas) a un tercero, confía en él para protegerlos. Esto es tan cierto para los servicios en línea como para los transcriptores humanos.

En última instancia, debes preguntarte dos cosas: ¿confías en el servicio y qué tan sensibles son tus conversaciones?

Cuando busca un servicio de transcripción, siempre vale la pena investigar un poco. ¿Tiene la empresa una buena reputación? ¿Está bien establecido? ¿Ha sido objeto de una violación de datos en el pasado? ¿Existe una política de privacidad que indique explícitamente cómo se manejarán y protegerán sus datos?

Como mencionamos anteriormente, los servicios impulsados ​​por IA con frecuencia dependen de los empleados y contratistas externos para realizar verificaciones de control de calidad. Si bien estos controles representan una fracción de todas las transcripciones, siempre existe la posibilidad de que alguien esté escuchando su conversación.

En muchos casos, sin embargo, esto no es un factor decisivo. Sin embargo, si su conversación es profundamente privada o comercialmente sensible, puede considerar abrir un editor de texto y transcribir a la antigua.