Re: SimMetrics: string benz

From: Volkan YAZICI <yazicivo(at)ttnet(dot)net(dot)tr>
To: Emre Sevinc <emres(at)bilgi(dot)edu(dot)tr>
Cc: "Ahmet A(dot) Akin" <ahmetaa(at)gmail(dot)com>, dev(at)zemberek(dot)dev(dot)java(dot)net, pgsql-tr-genel(at)postgresql(dot)org
Subject: Re: SimMetrics: string benz
Date: 2006-08-22 05:45:55
Message-ID: 20060822054555.GB1406@alamut
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-tr-genel

On Aug 22 12:49, Emre Sevinc wrote:
> - PostgreSQL gibi kritik ve büyük, uluslararasi capta, Türkiye'de de
> cesitli ciddi isler icin kullanilan ve Türklerin de katkida bulundugu
> bir sistemin Ingilizce, Almanca gibi diller icin birtakim
> dogal dil isleri icin sundugu imkanlar varken Türkce icin ayni bakimdan
> sundugu imkan sifir.

Evet. PostgreSQL ile gelen bir helva fabrikası mevcut. Yalnız hammaddeyi
bizim sağlamamızı istiyorlar.

> - En basitinden Türkce kökbulucu ("stemmer" karsiligi olarak kullandim)
> bile PosgreSQL ve Türkce arakesitindeki bir boslugu doldurmaya baslar
> kayda deger gelisme olur. Bunu Zemberek paralelinde daha büyük capli
> gelismeler izleyebilir.

PostgreSQL'in şu an UTF-8 yereli kullanırken upper/lower
fonksiyonlarının sorunlu olması dışında hiçbir Türkçe sorunu yok. (Bu
problemin sebebi de PostgreSQL'in aynı anda onlarca farklı mimari ve
platformu desteklemek adına kasmasından kaynaklı.) Ve bunu aşmanın da
yolları var: İster bunun için benim yazmadığım yamayı kullanırsınız,
isterseniz ICU kütüphanesi yamasını kullanırsınız.

> - En azindan bir PostgreSQL hacker'i (Volkan) kisa sürede test edilmis
> Java kodunu PostgreSQL'e entegre edebilecegini belirtti.

(PostgreSQL hacker'ı olmak için bir kaç ulusun 1 haftada tükettiği
ekmeği yemem lazım daha. Ben sadece ufak tefek TODO'ları ancak
yapabiliyorum.) Evet, TurkishStemmer() metodu export edilmiş bir JAR
kütüphanesini, tsearch2 tarafından kullanılabilir hale getirebileceğimi
düşünüyorum. (Ama bu konu hakkında bir önceki e-postamda yazdığım
Snowball kütüphaneleri hakkındaki paragrafı okumanızı öneririm.)

İyi çalışmalar.

In response to

Browse pgsql-tr-genel by date

  From Date Subject
Next Message Volkan YAZICI 2006-08-22 05:52:19 Re: SimMetrics: string benz
Previous Message Volkan YAZICI 2006-08-22 05:34:37 Re: SimMetrics: string benz