From: | Volkan YAZICI <yazicivo(at)ttnet(dot)net(dot)tr> |
---|---|
To: | Nilgün Belma Bugüner <nilgun(at)belgeler(dot)gen(dot)tr> |
Cc: | pgsql-tr-genel(at)postgresql(dot)org |
Subject: | Re: UNICODE veri tabanı |
Date: | 2006-09-05 07:58:41 |
Message-ID: | 20060905075840.GC1369@alamut |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-tr-genel |
On Sep 05 10:43, Nilgün Belma Bugüner wrote:
> Sal 05 Eyl 2006 10:25 sularında, Volkan YAZICI şunları yazmıştı:
> > On Aug 31 12:29, Nilgün Belma Bugüner wrote:
> > > UNICODE ile UTF-8 aynı kodlamanın farklı isimleri sadece,
> >
> > Hem evet, hem hayır. PostgreSQL bir kaç sürüm öncesine kadar UNICODE ve
> > UTF-8'i aynı kefeye koyuyordu. Fakat sorun şu ki, UTF-16 ile UTF-32 de
> > UNICODE. Bu sebepten ötürü (yanlış hatırlamıyorsam) artık yeni
> > sürümlerde UNICODE diye bir seçenek yok, onun yerine sadece UTF-8
> > mevcut.
Yukarıdaki sözler hafif işkembeden gibi duruyor. İlgili bağlantıyı
vereyim: http://archives.postgresql.org/pgsql-odbc/2006-03/msg00226.php
> UTF-8, "glibc bağlamında" UTF-16 ile UTF-32'yi kapsıyor.
> Yine "glibc bağlamında" Unicode ile UTF-8 eşanlamlıdır.
>
> Bence böyle de olması gerekir, çünkü bir sistemde aynı
> anda bir kaç dilin birden desteklenmesinin istendiği bir
> noktada tekrar 256 karakterlik karakter kodlamasındaki
> günlere dönecek olsaydık (bu sefer kapsam daha geniş olsa da
> tamamı olmayacağından) Unicode kendini gereksiz hale
> getirmiş olacaktı. Onun için bunların hepsi tek olmak
> zorunda.
Bu konuda sizin ile hemfikir değilim. Veritabanında UTF-8, UTF-16 ve
UTF-32 olduğunca birbirinden ayrı tutulmak zorunda. Çünkü bunların disk
üzerinde gösterimleri birbirlerinden farklı boyutlarda. Ve veritabanında
disk I/O'sunun en önemli sorun teşkil ettiğini göz önüne alacak olursak,
büyükçe bir tablodaki metin alanlarının UTF-8 ile UTF-32 kullanılarak
saklanması/işlenmesi arasında kayda değer bir performans farkı olacağı
aşikardır. Kaldı ki, eğer böyle bir fark önemsenmeyecek kadar az
olsaydı, PostgreSQL yıllar öncesinden UTF-32'ye geçip büyük bir sorunu
sırtından atmış olurdu.
İyi çalışmalar.
From | Date | Subject | |
---|---|---|---|
Next Message | Volkan YAZICI | 2006-09-05 08:19:42 | Re: BUG #1931: ILIKE and LIKE fails on Turkish locale |
Previous Message | Devrim GUNDUZ | 2006-09-05 07:56:07 | Türkçe'de ILIKE-LIKE sorununun çözümü |