aún tengo fresco el recuerdo de algunas conversaciones con mi buen amigo quim, quien dentro de su línea prioritaria de investigación andaba enfrascado en los asuntos relacionados con la traducción automática. un campus para todos, donde todos puedan expresarse en la lengua que elijan, con independencia del contexto y de los receptores. sonaba bien como objetivo dentro de un campus como el de nuestra universidad :-)

sin embargo, más allá de las posibilidades reales de desarrollo de instrumentos que permitan (a la vez que faciliten) la multiplicidad lingüística, quim en otros ratos hablaba de algo que muchos hacemos furtivamente en la redacción de textos en inglés y cómo podría implementarse. si en la red tenemos una de las fuentes más grandes de producción lingüística - con matices seguramente - y tenemos acceso continuo a esta información, ¿por qué no sistematizar su uso llevando un poquito más allá las herramientas que todos tenemos muy cerquita de la mano? google tiene un pequeño corrector, incluso un recuento de ocurrencias en la red para discriminar formas más o menos comunes de entre todos los contenidos indexados, pero ¿por qué no ir un poco más allá?

quim ha ido, y nos lo cuenta en un paper que acaba de publicar en el último número de la revista digithum:

joaquim moré dixit:
en aquest article presentem un corrector gramatical de l’anglès destinat a escriptors no angloparlants. la principal característica d’aquest corrector és l’ús d’un motor de cerca per internet. com que hi ha un gran nombre de pàgines web escrites en anglès, el sistema fa la hipòtesi que un segment de text que no és present en cap pàgina web és probablement un segment de text mal escrit. el sistema també fa la hipòtesi que a la xarxa hi trobarà exemples que ensenyaran a l’usuari com ha d’expressar el contingut del segment de text d’una manera gramatical i idiomàtica. per tant, un cop el corrector avisa l’usuari que és millor verificar un segment del seu text, el motor cerca contextos que poden ser útils a la persona que escriu a l’hora de decidir si corregeix el segment o no. gràcies també a l’ús d’un motor de cerca, el corrector suggereix a l’escriptor que utilitzi expressions que són més freqüents a la Xarxa en comptes de l’expressió que ha escrit.

el artículo está disponible libre y gratuítamente, una excusa como otra cualquiera para seguir una revista interesante como es ésta, “las humanidades en la era digital“. bon treball quim, me alegro de que aquellas ideas vayan viendo la luz! :-)