2 decembrie 2006

Intrări

N-am mai postat nimic de vreo două luni, pentru că nu au fost prea multe noutăţi. În octombrie şi noiembrie am lucrat, cu pauze, la structurarea mai bună a bazei de date prin introducerea "intrărilor" în DEX online. O "intrare" este o colecţie de lexeme, iar un "lexem" este o unitate minimală de analiză lingvistică. De exemplu, DEX online are 8 definiţii pentru "episcop", care până astăzi erau toate listate de-a valma. Începând de astăzi, avem ocazia să împărţim definiţiile în minim două intrări diferite ca înţeles (episcopul ca grad bisericesc şi episcopul ca aparat).

Schema bazei de date este acum mai complexă, dar am eliminat o redundanţă foarte dăunătoare. Până astăzi, fiecare definiţie era asociată cu un număr de cuvinte-cheie. De exemplu, fiecare definiţie pentru "episcop" era asociată cu un cuvânt "episcop" (astfel încât o căutare după "episcop" să producă toate aceste definiţii). Tabela cuvintelor conţinea episcop de 8 ori, o dată pentru fiecare definiţie.

După schimbarea de azi, între cuvinte şi definiţii se interpun intrările. Pentru episcop avem două intrări, fiecare din ele asociată cu câte un cuvânt "episcop" (ceea ce este de dorit, pentru că aceste două cuvinte se declină diferit: episcop/episcopi, respectiv episcop/episcoape). Cele opt definiţii sunt asociate fie cu o intrare, fie cu cealaltă, în funcţie de întelesul lor, dar nu cu amândouă. Similar, pentru "sol" vom avea nu mai puţin de 5 intrări (solul ca emisar, solul ca notă muzicală, solul ca pământ, solul ca monedă şi solul ca soluţie coloidală).

Intenţia pe termen scurt a fost să reducem numărul de cuvinte-duplicat, pentru că urmează să începem flexionarea ( = declinarea = conjugarea) cuvintelor şi vrem să ne uşurăm munca. De exemplu, pentru episcop aveam 8 cuvinte-cheie înainte (exact unul pentru fiecare definiţie), iar acum avem doar două, exact câte înţelesuri are cuvântul. Pe termen lung, sperăm ca această modificare să ne permită o structurare şi mai bună a definiţiilor.