Publicat per: ajuhe el: juliol 8, 2009
En el últim post sobre detecció de duplicats les coses no pintaven bé, s’havia fet una primera versió del detector, però no acabava de ser el que necessitem, ja que detectava duplicats exactes, això vol dir que un parell de documents amb l’ordre dels paràgrafs canviats el considerava diferents. El objectiu del projecte quedava modificat, [...]
Publicat per: ajuhe el: juny 30, 2009
La primera versió del detector de duplicats ja està en marxa, i una vegada en marxa veiem les seves mancances. En aquests moments detectem documents duplicats en el cas que un document sigui idèntic a un altres o un respecte l’altre només variïn paraules que no son paraules clau. Això està bé, però no es [...]
Publicat per: ajuhe el: juny 18, 2009
Tenim un cercador i tenim un dimoni que va alimentant a les col•leccions del servidor, però que passa si ens arriba un fitxer duplicat, en el que només ha variat una paraula o una frase? Utilitzem els primers 10 segons per lamentacions i queixes sobre l’ofici que hem triat, la resta per buscar solucions. – [...]
Publicat per: ajuhe el: juny 8, 2009
Estem construint un cercador que ha de contestar les preguntes de l’alumne: Quina va ser la primera ciutat fenicia? Capital de França. Que és la psicologia cognitiva? Definició de estatut. Desenvolupem petites releases per arrivar al objectiu esmentat anteriorment. Per desenvolupar aquest projecte estem utilitzant Lucene, Lingpie i llegim papers i mes papers sobre aquesta [...]