Surfistes a càmara lenta

Posts Tagged ‘vocabulari específic

Fa uns mesos explicàvem com un diccionari sobre un tema generat amb el DicWiki podia ser útil per identificar, en un missatge que l’alumne envia al seu consultor, els objectes de pregunta (OP) i resposta (OR) sobre l’assignatura. Tal com explicàvem al juliol, el núvol de candidats a OP i OR està organitzat de manera que  els termes del domini estan abans que els termes que no ho són. Ara bé, la generació de diccionaris per totes les assignatures, amb temàtiques ben dispars, és un pas previ que podria retardar l’aplicació del Doraemon a totes les assignatures.

Tenint en compte això, s’ha pensat un mètode que detecti els termes del missatge que probablement són del domini temàtic sense fer servir cap diccionari. Existeixen vàries tècniques de detecció de termes d’un domini temàtic sense fer servir diccionaris. La majoria són costoses, com la del tf.idf, que requereix la recopilació d’un corpus significatiu de l’ús general de la llengua, el qual serveixi per contrastar l’ús de termes d’un domini concret. D’altra banda, els mails no són prou llargs com perquè el càlcul de probabilitat de la pertenença d’un terme a un domini, i no al vocabulari general, sigui prou significatiu.

Llegeix la resta d’aquesta entrada »

Anuncis