Büyük Şema Hakkında Bilgi: Yıldıza Karşı Kar Tanesi

Yayınlanan: 2022-08-26

Çok boyutlu şema, bir veri ambarı sistemleri modeli oluşturmak için tasarlanmıştır.

Bu şemaların temel amacı, analitik amaçlar (OLAP) için oluşturulmuş daha büyük veritabanlarının ihtiyaçlarını karşılamaktır.

Bu yöntem, bir veritabanındaki içeriğin iyi bir şekilde düzenlenmesiyle veritabanındaki verileri sıralamak için kullanılır. Şema, müşterilerin iş veya pazar eğilimleriyle ilgili sorular sormasına olanak tanır.

Ayrıca, çok boyutlu bir şema, verileri farklı perspektiflerden ve boyutlardan görüntülemeyi ve modellemeyi sağlayan veri küpleri biçimindeki verileri temsil eder.

Üç çeşittir, ancak çoğu yıldız ve Kar Tanesi arasında kafa karıştırır. Bu nedenle, tercih ettikleri modeli seçmeleri zorlaşıyor.

Onlardan biriyseniz, tanımından başlayarak ve faydalarını, zorluklarını, diyagramını ve özelliklerini anlayarak yıldız ve kar tanesi şeması arasındaki farkları tartışalım.

Çok Boyutlu Şema Nedir?

Şema, eksiksiz bir veritabanı ve veri marketlerinin mantıksal tanımını ifade eder. Toplamalar ve ilişkili veri öğeleri dahil olmak üzere kayıtların adını ve açıklamalarını içerir.

Bir veritabanı, tanımlamak için genellikle ilişkisel bir model kullanırken, bir veri ambarı sistemi bir Şema modeli kullanır.

Data Mining Query Language (DMQL) ile çok boyutlu şema tanımlanabilir.

Veri pazarlarını ve veri ambarlarını tanımlamak için iki temel öğe kullanır - boyut tanımı ve küp tanımı.

Çok boyutlu şema, farklı türde şema modelleri kullanır. Bunlar:

  • Yıldız şeması
  • kar tanesi şeması
  • galaksi şeması

Yıldız ve Kar Tanesi şemalarının ne olduğunu tartışalım.

Yıldıza Karşı Kar Tanesi: Bunlar Nedir?

Yıldız Şeması nedir?

Yıldız şeması, ölçülen ve işlem verilerini depolamak için tek bir olgu tablosu gerektiren bir mimari veri ambarı ve iş zekası modelidir. Ayrıca, iş verileriyle ilgili öznitelikleri tutmak için farklı küçük boyutlu tablolar kullanır.

Yapısına göre isimlendirilir. Bir yıldız gibi, olgu tablosu diyagramın merkezindeki yerini alır ve küçük boyutlu tablolar, yıldız benzeri bir yapı oluşturmak için orta masaya dallar gibi oturur.

Her yıldız şeması, tek bir olgu tablosundan ancak birden çok küçük boyutlu tablodan oluşur. Olgu tabloları, günlüğe kaydedilen performans, finansal veriler veya satış kayıtları gibi analiz edilmesi gereken belirli, ölçülebilir verileri içerir. Bir seferde veya işlemsel olarak geçmiş verilerin bir anlık görüntüsü olabilir.

Ayrıca Star şeması, veri ambarları ve data mart şemaları arasında en basit ve en temel olanıdır. Temel sorguları işlemede etkilidir. Yıldız şeması genellikle iş zekasını, geçici sorguları, analitik uygulamayı ve çevrimiçi analitik işleme küplerini destekler.

Yıldız şeması ayrıca birçok kaydın sayımını, ortalamasını, toplamını ve diğer toplamalarını da destekler. Kullanıcılar, toplamaları boyutlara göre kolayca filtreleyebilir ve gruplayabilir. Örneğin, kullanıcılar "Haziran ayındaki tüm satış kayıtlarını bulun" veya "2022'de XYZ ofisinden elde edilen toplam geliri analiz edin" gibi sorgular oluşturur.

Kar Tanesi Şeması Nedir?

Kar tanesi şeması, yıldız şemasının uzantısı olarak da bilinebilen çok boyutlu bir veri modelidir. Bunun nedeni, kar tanesi şemasındaki boyut tablolarının alt boyutlara ayrılmasıdır.

Bir veya daha fazla boyut tablosu doğrudan olgu tablosuna bağlanmıyorsa, bunun yerine diğer boyut tabloları aracılığıyla bağlanıyorsa, şema bir kar tanesidir.

Kar tanesi, bir yıldız şemasındaki boyut tablolarını normalleştiren bir olgudur. Tüm boyut tablolarını normalleştirdiğinizde, ortaya çıkan yapı, yapının ortasında bir olgu tablosu içeren bir kar tanesine benzer.

Basit bir deyişle, kar tanesi şeması, modelin ortasındaki boyut tablolarına bağlı olan ve yine diğer boyut tablolarına bağlı olan bir olgu tablosundan oluşur. Bu şema, sorguların performansını artırmak için kullanılır.

Model, karmaşık ilişkiler ve boyutlar arasında hızlı ve esnek sorgulama için oluşturulmuştur. Çeşitli boyut seviyeleri arasında birden çoğa ve çoktan çoğa ilişkiler için yararlıdır.

Daha fazla normalizasyon standardına daha sıkı bağlılık nedeniyle, daha fazla depolama verimliliği elde edersiniz. Ancak, veri fazlalığı ihmal edilebilir düzeydedir ve yıldız şeması gibi denormalize veri modellerine kıyasla performans düşüktür.

Yıldıza Karşı Kar Tanesi: Nasıl Çalışırlar?

Yıldız Şeması nasıl çalışır?

Yıldız modelinin ortasındaki olgu tablosu, iki tür bilgiyi saklar – sayısal ve boyut öznitelik değerleri. Bunları bir satış veritabanı örneği ile anlayalım.

  • Sayısal değerler , her satır ve veri noktası için benzersizdir. Bu, başka bir satırda depolanan verilerle ilişkili veya ilişkili değildir. Bunlar, toplam tutar, sipariş miktarı, tam zaman, net kar, sipariş kimliği vb. gibi belirli bir işlemle ilgili gerçeklerdir.
  • Boyutsal öznitelik değerleri herhangi bir veriyi doğrudan saklamaz, satır için yabancı anahtar değerlerini bir boyut tablosunda saklar. Orta tablodaki farklı satırlar, veri değeri, satış çalışanı kimliği, şube ofisi kimliği, ürün kimliği vb. gibi bu bilgileri referans alacaktır.

Boyut tabloları her zaman olgu tablosundan destekleyici bilgileri depolar. Her boyutlu tablo, boyutsal bir değerle birlikte bir olgu tablosunun sütunu ile ilgilidir ve bu değer hakkında ek veriler depolar.

Örnek: Çalışan boyutu tablosu, anahtar değer olarak çalışan kimliğini kullanır ve ayrıca ad, cinsiyet, adres ve telefon numarası gibi bilgileri içerir. Benzer şekilde, bir ürün boyut tablosu, ürün adı, renk, pazara ilk çıkış tarihi, üretim maliyeti vb. dahil olmak üzere bilgileri depolar.

Kar Tanesi Şeması Nasıl Çalışır?

Bir orta kutu ve bu kutudan farklı noktalara farklı bağlantılar içeren bir kar tanesi tasarımı düşünün. Veri pazarlarını ve veri ambarlarını korumak için kar tanesi şema tasarımı devreye giriyor.

Yıldız şemasına benzer, ancak dakika değişiklikleriyle. Yıldız şemasından farklı olarak, kar tanesi şeması, boyut tablolarına bağlı olan alt boyut tablolarını genişletir.

Bu modelin birincil amacı, yıldız modelinin denormalize edilmiş bilgilerini normalleştirmektir. Bu şekilde, bir yıldız şemasıyla ilişkili yaygın sorunları çözebilir.

Şemanın merkezinde, boyut tablolarında yer alan bilgilerle bağlantı kuran bir olgu tablosu bulacaksınız. Bu tablolar yine dışa doğru, boyut tablosu bilgisini açıklayan detaylı bilgileri içeren alt boyut tablolarına yayılır.

Örnek: Kar tanesi şeması, bir satış olgu tablosu ve mağaza konumu, satır, aile, ürün ve zaman boyutu tabloları içerir. Pazar boyutları, birincil boyut tablosu olarak mağaza ve alt boyut tablosu olarak mağazanın konumu olmak üzere iki boyut tablosundan oluşur. Ürün boyutu, ürün, hat ve aile alt boyut tablosundan bahseden üç alt boyut tablosuna sahiptir.

Yıldız vs. Kar Tanesi: Özellikler

Yıldız Şemasının Özellikleri

  • Yıldız şeması, veri ambarı ihtiyaçlarını karşılamak için normalleştirilmiş verilerden verileri filtreleyebilir. Benzersiz anahtar, her satırı tanımlamak için her olgu tablosuyla ilişkili bilgilerden oluşturulur.
  • Her ayın sonunda elde edilen gelirin geliri ve satılan toplam kalemler gibi hızlı hesaplamalar ve toplamalar sağlar. Bu ayrıntılar, uygun sorgular çerçevelenerek ihtiyaçlara göre filtrelenebilir.
  • Yabancı anahtardan oluşan sonlu sayı değerlerini içeren olayların ölçümüdür. Bu tuşlar boyut tabloları ile ilgilidir. Atomik düzeyde değerlerle çerçevelenmiş çeşitli olgu tabloları vardır.
  • İşlem olgu tablosu, satışlar ve tatiller gibi belirli olaylarla ilgili verileri içerir.
  • Kayıt gerçekleri, yıl sonunda veya her üç ayda bir hesap bilgileri gibi belirli dönemleri içerir.
  • Boyut tablosu, ortadaki tabloda bulunan nitelikler veya kayıtlar hakkında ayrıntılı veriler verir.
  • Kullanıcı ihtiyacına göre kendi masasını tasarlayabilir.
  • Anlık görüntü tablolarını toplamak için yıldız şemasını kullanabilirsiniz.

Kar Tanesi Şemasının Özellikleri

  • Kar tanesi şemasının küçük disk alanına ihtiyacı vardır.
  • Bu model, ayrı ve ana boyut tabloları nedeniyle uygulanması kolaydır.
  • Boyut tabloları, bilgileri birden çok zerrede tanımlamak için en az iki öznitelik içerir.
  • Birden fazla tablo nedeniyle, yıldız şemasına kıyasla performans düşüktür.
  • Kar tanesi şeması, normalleştirme nedeniyle en yüksek veri bütünlük düzeyine ve düşük fazlalığa sahiptir.

Yıldıza Karşı Kar Tanesi: Avantajları

Yıldız Şemasının Avantajları

  • Yıldız şeması, data mart şemaları arasında en basit yoldur.
  • Basit bir raporlama mantığına sahiptir. Bu mantık dinamik olarak ima edilir.
  • Küplerin verimli ve etkili çalışmasını sağlamak için Çevrimiçi İşlem Süreci aracılığıyla uygulanan besleme küpleri kullanılarak tasarlanmıştır.
  • Yıldız şeması, basit mantık ve işlem sürecinden çıkarılması kolay sorgularla oluşturulmuştur.
  • Raporlama uygulamaları için gelişmiş performans sunar.
  • Verilerin hızlı kurtarılmasını denetlemek için dağıtılır.
  • Filtrelenen ve seçilen bilgiler farklı durumlarda kolaylıkla uygulanabilir.

Kar Tanesi Şemasının Avantajları

  • Yıldız şeması, daha az disk depolama gereksinimi nedeniyle sorgu performansını geliştirmek için kullanılır.
  • Bileşenler ve boyut seviyeleri arasındaki ilişkilerde daha fazla ölçeklenebilirlik sunar.
  • Bakımı daha kolaydır.
  • Yıldız şeması, hızlı veri alımı sunar.
  • Veri ambarı için yaygın ve basit bir veri şemasıdır.
  • Veri kalitesini artırmaya yardımcı olur.
  • Yapılandırılmış veriler, veri bütünlüğü sorununu azaltır.

Yıldıza Karşı Kar Tanesi: Sınırlamalar

Yıldız Şemasının Sınırlamaları

Yüksek bir denormalize ve bütünlük durumuna sahiptir. Kullanıcı verileri güncelleyemezse tüm süreç çökecektir. Güvenlik ve korumalar da sınırlıdır. Ayrıca yıldız şeması analitik model kadar esnek değildir. Çeşitli ilişkilere verimli destek sunmaz.

Kar Tanesi Şemasının Sınırlamaları

Snowflake ile karşılaşacağınız ana sınırlama, artan sayıda küçük boyutlu tablo nedeniyle ek bakım çalışmalarıdır. Birçok karmaşık sorgu, gerekli verileri bulmayı zorlaştırır. Ayrıca, daha yüksek tablolar nedeniyle sorunun uygulama süresi yüksektir. Bu model aynı zamanda katıdır ve daha yüksek bakım maliyetleri gerektirir.

Yıldız ve Kar Tanesi: Farklar

Yıldız ve Kar Tanesi çok boyutlu şema türleridir ancak farklı yapı ve özelliklere sahiptir. İlki bir yıldız gibidir ve ikincisi isimlerini tanımlayan bir kar tanesine benzer.

Yıldız şemasında, yalnızca tek bir birleştirme, merkezi olgu tablosu ile yan boyut tabloları arasında bir ilişki kurar. Öte yandan, kar tanesi şemasında, boyut tablolarına bağlanmak için birden çok birleştirme gerekir.

Yıldız şeması genellikle boyut tablosunda daha az sayıda satırınız olduğunda kullanılırken, bir boyut tablosu nispeten büyük olduğunda kar tanesi şeması kullanılır.

Aşağıdaki diyagram, iki modeli ve boyut tablolarının ve olgu tablosunun farklı şemalarda nasıl bağlantılı olduğunu ayırt eder.

parametreler Yıldız Şeması Kar Tanesi Şeması
Disk alanı Yıldız şeması daha fazla disk alanı kullanır. Kar tanesi şeması daha az disk alanı kullanır.
Veri yedekleme Yüksek veri fazlalığına sahiptir. Düşük veri fazlalığına sahiptir.
normalleştirme Boyut tabloları denormalize edilir, yani tablo içinde aynı değer tekrarlanır. Boyut tabloları tamamen normalleştirilmiştir.
Sorgu performansı Sorguları yürütmek minimum zaman alır ve bu da daha iyi performans sağlar. Sorgu yürütmesi yıldız şemasından daha fazla zaman alır, bu da onu yıldız şemasından daha az performanslı hale getirir.
Sorgu karmaşıklığı Sorgu karmaşıklığı düşüktür. Sorgu karmaşıklığı yıldız şemasından daha yüksektir.
Bakım onarım Yüksek veri fazlalığı nedeniyle, yıldız şemasını korumak biraz zordur. Düşük veri fazlalığı nedeniyle, kar tanesi şemasının bakımı ve değiştirilmesi kolaydır.
Veri bütünlüğü Veri bütünlüğü yüksektir çünkü veriler, boyut tablolarında birden çok kopyanın bulunduğu yerde yedekli olarak depolanır. Boyut tablolarını tamamen normalleştirdiği için veri bütünlüğü düşüktür.
hiyerarşiler Yıldız şemasındaki boyut tablolarının hiyerarşileri, boyut tablosunda saklanır. Hiyerarşiler ayrı boyut tablolarına bölünmüştür.
veritabanı tasarımı Basit bir DB tasarımına sahiptir. Çok karmaşık bir DB tasarımına sahiptir.
Bilgi Tablosu Çok boyutlu tablolar bir olgu tablosunu çevreler. Olgu tablosu, alt boyut tablolarıyla da çevrelenen boyut tablolarıyla çevrilidir.
Kurmak Yıldız şemasını tasarlamak ve kurmak kolaydır, çünkü doğrudan ilişkiler onları temsil eder. Öte yandan, kar tanesi şemasının kurulması biraz karmaşıktır.
Küp işleme Küp işleme daha hızlıdır. Karmaşık birleştirme nedeniyle, küp işleme biraz yavaştır.
Yabancı anahtarlar Minimum sayıda yabancı anahtara sahiptir. Maksimum sayıda yabancı anahtara sahiptir.

Çözüm

Hem Yıldız hem de Kar Tanesi şemaları farklı sektörlerde faydalıdır. Bu nedenle, aralarında hangisinin daha iyi olduğuna karar vermek, gereksinimlerine dayanmaktadır.

Kar tanesi şeması, yıldız şemasındaki boyut tablolarını normalleştirdiği yıldız şemasının uzantısıdır.

Yıldız şemasının tasarımı basittir, sorguları daha hızlı çalıştırır ve kurulumu kolaydır. Öte yandan, kar tanesi şemasının bakımı daha kolaydır, daha az disk alanı kaplar ve veri bütünlüğü sorunlarına daha az eğilimlidir.

Bu nedenle, basit bir tasarıma, daha az yabancı anahtara ve daha hızlı küp işlemeye ihtiyacınız varsa bir yıldız şeması daha iyi bir seçenek olabilir. Ancak, daha az disk alanına, düşük veri bütünlüğüne ve düşük bakıma ihtiyacınız varsa, kar tanesi şeması daha uygun olabilir.

Ayrıca bazı en iyi grafik veritabanı çözümlerini de keşfedebilirsiniz.