15 octombrie 2012

Toamna se numără... stagiarii

Vara aceasta, DEX online a avut plăcerea să colaboreze cu doi stagiari de la Universitatea Politehnică din București (ne ferim să le spunem interni, cum li s-a încetățenit numele studenților din IT care fac practica pe vară, căci nu i-am găzduit la internat, nici nu le-am dat voie să opereze pacienți). Rezultatele sunt fantastice pentru noi și -- sperăm -- și pentru ei.

Mihai Trifu a îmbunătățit rezultatele căutării aproximative, care intră în acțiune atunci când un cuvânt căutat nu este găsit. Algoritmul anterior era mai lent și dădea rezultate mai proaste. Cu algoritmul implementat de Mihai, sistemul răspunde de 3 ori mai repede și „înțelege” ce a vrut utilizatorul să spună când a tastat pignuin, judetz sau chiar calrvizunne.

Pentru cei interesați, algoritmul folosit este căutarea cu trigrame, prin care fiecare cuvânt din baza noastră de date este împărțit în grupuri de trei litere. Pentru pinguin obținem (__p, _pi, pin, ing, ngu, gui, uin, in_, n__). Când utilizatorul tastează pignuin, sistemul caută cuvântul (sau cuvintele) care au cele mai multe trigrame în comun cu pignuin și găsește pinguin.

Cristian Chilipirea a scris un nou joc cu care sperăm să vă ajutăm să vă perfecționați cunoștințele de limba română într-un mod distractiv. El este încă în lucru (unele din întrebări sunt prost alese, iar grafica mai are nevoie de îmbunătățiri), dar îl puteți vedea în versiune beta la Moara cuvintelor.

Cum orice joc are și un scop util, pe viitor sperăm să putem folosi Moara cuvintelor ca să colectăm statistici despre dificultatea cuvintelor limbii române, observând care dintre ele sunt ghicite mai des sau mai rar. Acest proces este iterativ și ne va ajuta să rafinăm nivelurile de dificultate pentru Moara cuvintelor și pentru Spânzurătoarea. Pe termen mai lung, o ordonare bună a cuvintelor limbii române după frecvență servește ca suport pentru estimarea numărului de cuvinte ale limbii pe care le cunoaște un vorbitor.

Această colaborare a fost posibilă prin efortul depus de ROSEdu, o comunitate de entuziaști ai programării și ai educației în programare, în special cea open source. Misiunea ROSEdu este să sprijine educația IT bazată pe valorile open source. Una dintre activitățile ROSEdu în 2012 a fost ROSEdu Summer of Code (RSoC), un program care a oferit multor studenți un stagiu pe timpul verii la diverse proiecte open source, printre care s-a numărat și DEX online.

Le mulțumim călduros și pe această cale lui Cristian, Mihai și comunității ROSEdu!