Pazar , 13 Temmuz 2014
Son Haberler
Anasayfa / MAKALELER / Veri Ambarı / Datawarehouse Sistemlerinde Şema Yapıları

Datawarehouse Sistemlerinde Şema Yapıları

DW sistemlerinde oluşturacağımız mimarinin ne kadar önemli olduğunu bir önceki makalemde belirtmiştim(https://datawarehouse.gen.tr/Makale.aspx?ID=492&seo=-datawarehouse–sistemlerine-genel-bakis-)  Şimdi ise bu mimarinin temelini oluşturan  şema yapılarından bahsedeceğim.Genel olarak 3 farklı şema modelimiz vardır;

1-Star Şema

2-Snowflake Şema(Kartanesi Yapısı)

3-3NF Şema(Third Normal Form Şema)

En çok tercih edilen Star şema yapısı ile başlayalım

1-Star Şema ve Özellikleri

 

Genel mantık fact table ve etrafındaki dimension table’lardan oluşan bir yapıdır.Dimension tablolar birbirleri ile bağlanmaz.

Fact(Ana) tablomuz müşterimizin genel bilgilerinin tutulduğu ,tarihsel derinliği olan ve milyonlarca kayıt sayısına sahip olabilecek tablodur.

s1

 

 

Dimension tablolar ise o müşteriye ait daha küçük bilgilerin tutulduğu(kategorize edildiği) ve ana tabloya foreign key-primary key ile bağlı olan tablocuklardır.(Bazı DW sistemlerinde dimension tabloların boyutları neredeyse fact tablolar kadar olabiliyor) 1:N ilişkisi olan bu yapılarda dimensionlarda olan tekil bir kayıda karşılık fact tablomuzda birden fazla kayıt olabilir.Genellikle denormalizasyon datalar kullanılır.

s2

2-Snowflake Şema(Kartanesi Yapısı)

Star şemadan daha karmaşık dw sistemlerinde kullanılan bu modelde çokca normalizasyona ihtiyacınız varsa kullanabilirsiniz.Dimensionlara bağlanan dimension tablolar nomalizasyonun yapılmasını sağlar.Bu şemanın avantajı disk depolama gereksinimlerini küçültür ve  lookup tabloları olduğu için sql sorgularında hızlı aksiyon verir.Fakat veriye ulaşmak bir o kadar zor olacağından genellikle tercih edilmeyen bir yapıdır.DW sistemlerinde ise veriye hızlı şekilde ulaşmak büyük bir öneme sahip olduğunu düşünürsek kullanılmama sebebini bi kez daha açıklamış oluruz.

 

s3

3-3NF Şema(Third Normal Form)

3NF şema modeli ilişkisel database mimarisinin olduğu ve normalizasyonun çokca kullanıldığı yapıdır.Özellikle büyük DW projelerinde uzun süren sorguları çalıştırma ihtiyacımız olduğunda kullanılabilir.Parallellik sıkça kullanılır.Büyük tablolar için genellikler hash-range partition kullanılarak derinliğin bölümlenmesi ve buna bağlı olarak performans iyileştirilmeleri sağlanır

 

 s4

 

Sonuçta, hangi modeli kullanacağız sizin kurmuş olduğunuz yapınızla alakalı bir durumdur.DW sistemlerinde bu 3 yapınında aktif olarak kullanıldığı yerler olabilir.

Bir sonraki makalemde DW ortamlarında kullanılan partition çeşitlerinden bahsedeceğim.Faydalı olması dileğiyle.

Hakkında Yusuf Arslan

Sakarya Üniversitesi Bilgisayar Mühendisliği bölümünü bitirdikten sonra kariyerine Datawarehouse-Database Uzmanı olarak devam etmektedir Sitenin kurucusu ve yazarıdır. yus[email protected] adresinden bana ulaşabilirsiniz.

Cevapla

E-posta adresiniz yayınlanmayacak. Required fields are marked *

*


Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>