DW sistemlerinde oluşturacağımız mimarinin ne kadar önemli olduğunu bir önceki makalemde belirtmiştim(https://datawarehouse.gen.tr/Makale.aspx?ID=492&seo=-datawarehouse–sistemlerine-genel-bakis-) Şimdi ise bu mimarinin temelini oluşturan şema yapılarından bahsedeceğim.Genel olarak 3 farklı şema modelimiz vardır;
1-Star Şema
2-Snowflake Şema(Kartanesi Yapısı)
3-3NF Şema(Third Normal Form Şema)
En çok tercih edilen Star şema yapısı ile başlayalım
1-Star Şema ve Özellikleri
Genel mantık fact table ve etrafındaki dimension table’lardan oluşan bir yapıdır.Dimension tablolar birbirleri ile bağlanmaz.
Fact(Ana) tablomuz müşterimizin genel bilgilerinin tutulduğu ,tarihsel derinliği olan ve milyonlarca kayıt sayısına sahip olabilecek tablodur.
Dimension tablolar ise o müşteriye ait daha küçük bilgilerin tutulduğu(kategorize edildiği) ve ana tabloya foreign key-primary key ile bağlı olan tablocuklardır.(Bazı DW sistemlerinde dimension tabloların boyutları neredeyse fact tablolar kadar olabiliyor) 1:N ilişkisi olan bu yapılarda dimensionlarda olan tekil bir kayıda karşılık fact tablomuzda birden fazla kayıt olabilir.Genellikle denormalizasyon datalar kullanılır.
2-Snowflake Şema(Kartanesi Yapısı)
Star şemadan daha karmaşık dw sistemlerinde kullanılan bu modelde çokca normalizasyona ihtiyacınız varsa kullanabilirsiniz.Dimensionlara bağlanan dimension tablolar nomalizasyonun yapılmasını sağlar.Bu şemanın avantajı disk depolama gereksinimlerini küçültür ve lookup tabloları olduğu için sql sorgularında hızlı aksiyon verir.Fakat veriye ulaşmak bir o kadar zor olacağından genellikle tercih edilmeyen bir yapıdır.DW sistemlerinde ise veriye hızlı şekilde ulaşmak büyük bir öneme sahip olduğunu düşünürsek kullanılmama sebebini bi kez daha açıklamış oluruz.
3-3NF Şema(Third Normal Form)
3NF şema modeli ilişkisel database mimarisinin olduğu ve normalizasyonun çokca kullanıldığı yapıdır.Özellikle büyük DW projelerinde uzun süren sorguları çalıştırma ihtiyacımız olduğunda kullanılabilir.Parallellik sıkça kullanılır.Büyük tablolar için genellikler hash-range partition kullanılarak derinliğin bölümlenmesi ve buna bağlı olarak performans iyileştirilmeleri sağlanır
Sonuçta, hangi modeli kullanacağız sizin kurmuş olduğunuz yapınızla alakalı bir durumdur.DW sistemlerinde bu 3 yapınında aktif olarak kullanıldığı yerler olabilir.
Bir sonraki makalemde DW ortamlarında kullanılan partition çeşitlerinden bahsedeceğim.Faydalı olması dileğiyle.