Surfistes a càmara lenta

Posts Tagged ‘traducció automàtica

En un post anterior explicàvem una aproximació en la detecció d’objectes de pregunta (OP) i objectes de resposta (OR) per al projecte Doraemon. Recordem que un objecte de pregunta és el concepte sobre el qual un estudiant fa una consulta, i l’objecte de resposta és aquest mateix concepte però trobat en un context que al consultor li és útil per donar una resposta.

El mètode explicat en aquest post era insuficient, ja que no podia detectar OPs i ORs amb aquestes característiques

  • L’OP o l’OR està en una forma diferent a com apareix en el diccionari
  • L’OP o l’OR és diferent de l’equivalent del diccionari obtingut per traducció automàtica
  • L’OP o l’OR està mal picat o té faltes d’ortografia

Llegeix la resta d’aquesta entrada »

Introducció

El projecte Doraemon és un projecte PID que pretén presentar al consultor suggerències de resposta a la consulta d’un alumne. Una de les tasques del projecte és la detecció dels objectes de la petició (OP) i de resposta (OR) en els missatges que alumnes i professor deixen en els fòrums. Concretament, ens interessa detectar OPs i ORs relacionats amb el tema de l’assignatura. Per exemple, imaginem que en el cos del missatge es troba la frase Estic intentant de fer la transcripció fonètica del text de la PAC i no tinc gens clar com fer-ho. L’aplicació hauria de detectar aquesta frase per identificar el que vol l’estudiant (saber com realitzar una activitat) i identificar transcripció fonètica– i no PAC, per exemple-, com l’OP, ja que és el terme de l’assignatura que fa referència a l’activitat que no sap fer. Aquest OP és, al seu torn, l’OR de la frase d’un missatge que li resol el dubte. Per exemple,  per fer la transcripció fonètica d’un text, consulta la taula de l’Alfabet Fonètic Internacional. Així transcripció fonètica és la paraula clau amb al qual es fa el mapping entre el dubte i la resposta. D’altra banda, Alfabet Fonètic Internacional és un terme que manté amb transcripció fonètica una relació conceptual estreta, i que pot llençar la presentació d’informació complementària, com podria ser la referència a una pàgina que expliqui i mostri la taula de l’alfabet.

El diccionari

Com hem dit, ens interessa detectar OPs i ORs relacionats amb el tema de l’assignatura. Per aquesta raó hem creat un diccionari temàtic que recull les expressions regulars que poden ser detectades com OP o OR en els missatges dels fòrums d’una aula, o bé poden servir llençar informació complementària. Segons consta en la proposta de projecte PID, les aules escollides per fer l’avaluació han estat les de lingüística. Per aquesta raó hem generat un diccionari de conceptes de lingüística.
Llegeix la resta d’aquesta entrada »