En más de una ocasión seguramente has tenido que transcribir audio a texto. Es una actividad bastante frecuente en el ámbito académico, pero también puede ser por cuestiones de trabajo. No cabe duda que se trata de algo tedioso, más aún cuando el audio está en inglés. Pensando en esto, en el presente artículo hablaremos de Deepgram, una potente herramienta que ofrece una serie de opciones para este propósito.
Lo primero que llama la atención de Deepgram es la simpleza en su diseño, con una interfaz intuitiva que fácilmente es dominada por cualquier persona. Solo es necesario subir un archivo de audio que tengamos almacenado, pero también es compatible con enlaces de páginas como YouTube. A partir de esto, y dependiendo de variables como el tamaño y la calidad, tomará unos cuantos segundos para procesar el archivo y convertirlo en texto.
Para que lo antes descrito sea posible hay de por medio complejos procesos de aprendizaje. Esto se debe a que los desarrolladores de la plataforma emplearon el concepto de “deep learning”, que consiste en introducir todo tipo de información al programa para que tenga la capacidad de interpretar las palabras. Por el momento, solo trabaja con el idioma inglés.
Cabe mencionar que Deepgram ofrece la posibilidad de usarse de manera gratuita. No obstante, existen ciertas limitaciones y funciones que permanecerán desactivadas en este modo. Por ejemplo, no podrá reconocer signos de puntuación ni términos específicos, como nombres de productos o marcas. Para desbloquear estas opciones será necesario pagar una mensualidad, que de todas formas termina siendo algo comprensible, pues existen servicios similares que cobran por hora, como es el caso de Trint.
Solo queda decir que Deepgram tiene ciertos problemas al reconocer algunas voces, ya sea por el tono o acento. Tampoco esperes subir una canción para conocer su letra y luego pasarla por el traductor. Esto es algo sumamente complejo, que le resulta difícil a todas las herramientas de este tipo.