top of page
cataraya1999

Lingüistas de hoy: Sofía Correa Busquets y su camino a la Lingüística computacional


Entre agitadas fechas dieciocheras tuvimos la oportunidad de entrevistar a Sofía Correa Busquets, quien se desempeña como lingüista computacional tras su egreso de Letras Mención Lingüística y Literatura inglesas de la Pontificia Universidad Católica de Chile.


En la presente entrevista, Sofía nos cuenta sobre el camino que siguió para convertirse en una lingüista computacional e invita a quienes estén interesadas/os en el área a que se motiven a aprender y a participar de esta maravillosa rama de la Inteligencia Artificial y a demostrar la capacidad que tiene la lingüística de ser un área que demuestra la definición de interdisciplinariedad en todas sus aristas.


Sofía Correa es miembro activa de la empresa Wird, donde desempeña sus labores en el cargo de Data linguist, dedicándose a la ciencia de datos. Además, es parte del comité organizador de la Red de lingüistas en computación de Chile "Código y Letras". Ella nos comentaba lo siguiente sobre la aplicación de la lingüística en su trabajo:


"Un momento en que me di cuenta de la importancia que tenía la lingüística computacional en mi trabajo fue cuando mi compañero realizaba análisis de sentimientos, donde la gente da sus opiniones y estas se analizan en categorías como positivas, negativas o neutras. El análisis estaba fallando con mensajes de redes sociales que incluían marcas muy evidentes como 'buenísimo' y 'pésimo', así que nos reunimos la persona encargada de análisis de datos, la encargada de desarrollo de IA y yo, para intentar discernir cuál era el problema. Me di cuenta que los mensajes fallidos tenían estas palabras escritas con ortografía no estándar: sin tilde o con letras repetidas. Entonces, le pregunté a mi compañero con qué modelo se trabajaba, ¿cased o uncased?, y, dado a que yo había estudiado los modelos, sabía que los que tienen cased tienen distinción de mayúscula, minúsculas y diacríticos y los que tienen uncased, que no las distingue. Al indagar más, supimos que el modelo tenía cased, por lo tanto no había una representación numérica para una palabra que normalmente tenía tilde.


Luego nos comentó el vínculo que genera entre la inteligencia artificial, la ciencia de datos y su rol como lingüista:


"Para normalizar las distintas formas de predecir, como lingüista, la ortografía con que la gente se podía comunicar, utilicé expresiones regulares, automatizando todo el proceso del trabajo en sí".


Agradecemos a Sofía por participar en la primera nota sobre lingüistas de hoy para el Laboratorio de fonética y Ciencias del Lenguaje.


Link a entrevista en @labfon16:



Link al formulario de inscripción de Código y Letras, para difundirlo :) https://forms.gle/yMWb23DV3QeZrc5t9




Fecha de entrevista: Viernes 16 de septiembre 2023

86 visualizaciones0 comentarios

Comments


bottom of page