2 decembrie 2006

Intrări

N-am mai postat nimic de vreo două luni, pentru că nu au fost prea multe noutăţi. În octombrie şi noiembrie am lucrat, cu pauze, la structurarea mai bună a bazei de date prin introducerea "intrărilor" în DEX online. O "intrare" este o colecţie de lexeme, iar un "lexem" este o unitate minimală de analiză lingvistică. De exemplu, DEX online are 8 definiţii pentru "episcop", care până astăzi erau toate listate de-a valma. Începând de astăzi, avem ocazia să împărţim definiţiile în minim două intrări diferite ca înţeles (episcopul ca grad bisericesc şi episcopul ca aparat).

Schema bazei de date este acum mai complexă, dar am eliminat o redundanţă foarte dăunătoare. Până astăzi, fiecare definiţie era asociată cu un număr de cuvinte-cheie. De exemplu, fiecare definiţie pentru "episcop" era asociată cu un cuvânt "episcop" (astfel încât o căutare după "episcop" să producă toate aceste definiţii). Tabela cuvintelor conţinea episcop de 8 ori, o dată pentru fiecare definiţie.

După schimbarea de azi, între cuvinte şi definiţii se interpun intrările. Pentru episcop avem două intrări, fiecare din ele asociată cu câte un cuvânt "episcop" (ceea ce este de dorit, pentru că aceste două cuvinte se declină diferit: episcop/episcopi, respectiv episcop/episcoape). Cele opt definiţii sunt asociate fie cu o intrare, fie cu cealaltă, în funcţie de întelesul lor, dar nu cu amândouă. Similar, pentru "sol" vom avea nu mai puţin de 5 intrări (solul ca emisar, solul ca notă muzicală, solul ca pământ, solul ca monedă şi solul ca soluţie coloidală).

Intenţia pe termen scurt a fost să reducem numărul de cuvinte-duplicat, pentru că urmează să începem flexionarea ( = declinarea = conjugarea) cuvintelor şi vrem să ne uşurăm munca. De exemplu, pentru episcop aveam 8 cuvinte-cheie înainte (exact unul pentru fiecare definiţie), iar acum avem doar două, exact câte înţelesuri are cuvântul. Pe termen lung, sperăm ca această modificare să ne permită o structurare şi mai bună a definiţiilor.

23 septembrie 2006

Găzduire în România

Prin amabilitatea firmei Elvsoft, serverul principal al DEX online este acum găzduit în România! Sperăm ca aceasta să ducă la o latenţă mai mică şi timpi de acces mai buni pentru vizitatorii noştri din România (majoritatea, adică). Până de curând, serverul principal era la mine în sufragerie -- nu chiar locul ideal pentru un server cu pretenţii! Acesta rămâne în continuare activ ca mirror al DEX online, cu numele voronet.dexonline.ro.

3 septembrie 2006

Salutări! A trecut ceva vreme de la ultimele mâzgălituri. Am fost ocupat, dar lucrurile arată mult mai bine acum şi am tone de timp liber pentru DEX online (ce-i drept, în mod misterior o parte din acest timp se pierde cu diverse jocuri pe calculator; dar oricum rămâne destul!). O să încerc să ţin acest blog mai la zi decât până acum.

Pe termen lung, proiectul de anvergură la care lucrăm acum se numeşte Dex Flex şi urmăreşte să genereze o listă completă a cuvintelor limbii române, împreună cu formele lor flexionare (conjugările verbelor, declinările substantivelor şi adjectivelor).

Pe termen mai scurt, vreau să actualizez pagina de informaţii cu unele noutăţi, cum ar fi adresa de unde cei interesaţi pot descărca baza de date şi codul. Vreau să creez o pagină cu legături legate de limba şi cultura română. Vreau să caut găzduire, şi când zic "să caut" vreau să spun "să caut prin folderul de mail", pentru că am primit deja mai multe oferte de la oameni generoşi, şi a venit momentul să mut DEX online pe un calculator care să nu fie în sufrageria mea. Şi vreau să repar 10-20 de bug-uri, pentru că s-au adunat diverse mărunţişuri.