दिलचस्प पोस्ट
क्या करता है (फ़ंक्शन ($) {}) (jQuery); क्या मतलब है? ब्राउज़र से आईओएस ऐप खोलें NSURLConnection sendAsynchronousRequest के माध्यम से मैं एक अतुल्यकालिक कॉल को कैसे रद्द कर सकता / सकती हूं? पायथन स्रोत कोड से यूएमएल आरेख को बनाने का सबसे अच्छा तरीका क्या है? Django ट्यूटोरियल: क्या पसंद_सेट है? यूनिक्स शेल स्क्रिप्ट में एक फ़ाइल की दूसरी फाइल में सामग्री ढूंढना Django 1.8: मौजूदा स्कीमा के लिए प्रारंभिक माइग्रेशन बनाएं बहु-धागा अजगर कार्यक्रम को समाप्त करें MySQL में, क्या मैं प्रतिबद्ध होने तक संदर्भित अखंडता जांच को स्थगित कर सकता हूं रिपोर्टिंग सेवाओं में एक पैरामीटर के लिए एकाधिक मान पास करना रूबी में एक स्ट्रिंग के शून्य या लंबाई की जांच करने का बेहतर तरीका क्या है? जावा के साथ डीओएम पार्सिंग में सामान्यकरण – यह कैसे काम करता है? लर्जल 4 के लिए एनजीएन कॉन्फ़िगरेशन सर्वर साइड कोड के बिना फायरबेज में खोजना अप्रबंधित dll को एक प्रबंधित C # dll में एम्बेड करना

स्टार स्कीमा डिजाइन

क्या किसी डेटा गोदाम के लिए आवश्यक एक स्टार-स्कीमा डिज़ाइन है? या फिर आप किसी अन्य डिज़ाइन पैटर्न के साथ डेटा भंडारण कर सकते हैं?

Solutions Collecting From Web of "स्टार स्कीमा डिजाइन"

डेटा वेयरहाउस सिस्टम के लिए स्टार स्कीमा का उपयोग करने से आपको कई लाभ मिलते हैं और ज्यादातर मामलों में उन्हें शीर्ष परत के लिए उपयोग करना उचित है आपके पास एक परिचालन डेटा स्टोर (ओडीएस) भी हो सकता है – एक सामान्यीकृत संरचना जो 'वर्तमान स्थिति' रखती है और डेटा संरचना जैसी संचालन की सुविधा देती है। हालांकि उचित परिस्थितियों में यह वांछनीय नहीं है। मुझे ओडीएस परतों के साथ और बिना सिस्टम बनाने का अवसर मिला है, और प्रत्येक मामले में आर्किटेक्चर की पसंद के लिए विशिष्ट कारण था।

डेटा गोदाम वास्तुकला की उप-श्रेणियों में जाने या एक किमबॉल बनाम इनाम लौ युद्ध शुरू करने के बिना स्टार स्कीमा के मुख्य लाभ हैं:

  • ज्यादातर डाटाबेस मैनेजमेंट सिस्टम में 'स्टार ट्रांसफोर्मेशन' करने के लिए क्वेरी ऑप्टिमाइज़र में सुविधाएं हैं जो कि बिटमैप इंडेक्स संरचनाएं या तेजी से परिभाषित रिज़ॉल्यूशन के लिए इंडेक्स इंटरसेक्शन का उपयोग करती हैं। इसका मतलब यह है कि चयन का हल होने तक तथ्य तालिका (जो आम तौर पर इंडेक्स से काफी बड़ा होता है) को मारने के बिना स्टार स्कीमा का चयन किया जा सकता है।

  • स्टार स्कीमा का विभाजन करना अपेक्षाकृत सरल है क्योंकि केवल तथ्य तालिका को विभाजित करने की आवश्यकता है (जब तक कि आपके पास कुछ बाइबिल के बड़े आयाम नहीं हैं)। पार्टीशन उन्मूलन का मतलब है कि क्वेरी ऑप्टिमाइज़र उन पार्टियों को अनदेखा कर सकता है जो संभवत: क्वेरी परिणामों में भाग नहीं ले सकते, जो I / O पर बचाता है

  • धीरे-धीरे बदलते आयाम एक बर्फ के टुकड़े से स्टार स्कीमा पर लागू करने के लिए बहुत आसान है।

  • स्कीमा समझने में आसान है और हिमपात या ईआर स्कीमा से कम जुड़ने में शामिल है। आपकी रिपोर्टिंग टीम आपको इसके लिए प्यार करेगी

  • स्टार स्कीमा का प्रयोग करना आसान है और (अधिक महत्वपूर्ण बात) विज्ञापन-हॉक क्वेरी टूल्स जैसे कि बिजनेस ऑब्जेक्ट्स या रिपोर्ट बिल्डर के साथ अच्छा प्रदर्शन करें। एक डेवलपर के रूप में आपके पास इन उपकरणों द्वारा उत्पन्न एसक्यूएल पर बहुत कम नियंत्रण है ताकि आपको क्वेरी ऑप्टिमाइज़र को यथासंभव अधिक सहायता देना होगा। स्टार स्कीमा क्वेरी ऑप्टिमाइज़र को गलत प्राप्त करने के लिए अपेक्षाकृत कम अवसर देते हैं।

आमतौर पर आपकी रिपोर्टिंग परत स्टार स्कीमा का उपयोग करेगी, जब तक आपके पास विशिष्ट कारण नहीं होता है। यदि आपके पास एक से अधिक स्रोत सिस्टम हैं, तो आप डेटा संचित करने के लिए सामान्यीकृत या हिमवर्षाय स्कीमा के साथ आपरेशनल डेटा स्टोर को लागू करना चाह सकते हैं। यह आसान है क्योंकि एक ओडीएस आमतौर पर इतिहास नहीं करता है ऐतिहासिक राज्य को स्टार स्कीमा में ट्रैक किया जाता है जहां सामान्यीकृत संरचनाओं की तुलना में ऐसा करना बहुत आसान होता है एक सामान्यीकृत या स्नोफ्लेक्ड ऑपरेशनल डेटा स्टोर 'वर्तमान' स्थिति को दर्शाता है और डेटा में अंतर्निहित किसी भी ऊपर और ऊपर एक ऐतिहासिक दृश्य नहीं रखता है।

ओडीएस लोड प्रक्रिया डेटा स्क्रबिंग और अनुरूप होने से संबंधित है, जो सामान्यीकृत संरचना के साथ करना आसान है एक बार जब आपके पास एक ओडीएस में साफ डेटा होता है, तो आयाम और वास्तविक भार अपेक्षाकृत सामान्य रूप से सामान्य या अपेक्षाकृत सरल तंत्र के साथ इतिहास (समय के साथ परिवर्तन) को ट्रैक कर सकते हैं; यह एक स्टार स्कीमा के साथ करना आसान है, कई ईटीएल उपकरण (उदाहरण के लिए) धीरे-धीरे बदलते आयामों के लिए अंतर्निहित सुविधाएं प्रदान करते हैं और एक सामान्य तंत्र लागू करने अपेक्षाकृत सरल है।

सिस्टम को इस तरह से लेयरिंग जिम्मेदारियों के अलग-अलग प्रदान करता है – व्यापार और डेटा सफाई तर्क ओडीएस में निपटा जाता है और स्टार स्कीमा लोड ऐतिहासिक राज्य से निपटता है

जहां तक डेटावायरहाउस-वास्तुकला में स्टार-स्कीमा डिजाइन लागू किया जाना चाहिए, इसके बारे में डेटावायर हाउसिंग लिटरेचर में एक बहस चल रही है।

थोड़े किमबिल में डेटावायरहाउस में केवल स्टार-स्कीमा डिज़ाइन का उपयोग करने के लिए बहुत अधिक वकालत की जाती है, जबकि इनोम पहले सामान्यीकृत 3 एनएफ डिज़ाइन का उपयोग करके एंटरप्राइज़ डैटवायरहाउस का निर्माण करना चाहता है और बाद में डैटमर्ट्स में स्टार-स्कीमा डिज़ाइन का उपयोग करता है।

इसके अलावा, यहां तक ​​कि आप यह भी कह सकते हैं कि हिमफ्लैक्स स्कीमा डिजाइन एक अन्य दृष्टिकोण है।

चौथा डिज़ाइन डेटा वॉल्ट मॉडलिंग दृष्टिकोण हो सकता है

स्टार स्कीमा का उपयोग डेटा के बड़े संस्करणों में उच्च गति पहुंच को सक्षम करने के लिए किया जाता है। विषय क्षेत्र के खिलाफ की जाने वाली किसी भी क्वेरी को संसाधित करने के लिए जरूरी होने वाले रकम को कम करके उच्च प्रदर्शन सक्षम किया गया है। यह आयाम तालिका में डेटा अतिरेक को अनुमति देकर किया जाता है।

आपको यह याद रखना होगा कि स्टार स्कीमा गोदाम के शीर्ष स्तर के लिए एक पैटर्न है सभी मॉडलों में वेयरहाउस स्टैक के निचले भाग में स्टेजिंग स्कीमा भी शामिल है, और कुछ में एक स्थायी रूप से परिवर्तित मर्ज वाला स्टेजिंग क्षेत्र भी शामिल है जहां सभी स्रोत सिस्टम 3 एनएफ़ मॉडलिंग स्कीमा में विलय कर दिए गए हैं। विभिन्न विषय क्षेत्र इस से ऊपर बैठे हैं।

शीर्ष स्तरीय स्कीमा को देखने के विकल्प में विविधता शामिल है, जो कि हिमपात का एक स्कीमा है एक नई पद्धति है जो कुछ जांच को लेकर भी हो सकती है, जो डेन लिंस्टेड द्वारा प्रस्तावित डेटा वॉल्ट मॉडलिंग है ।

स्टार स्कीमा के बारे में बात यह है कि वे ऐसे प्रकार के प्रकारों के लिए एक प्राकृतिक मॉडल हैं जो अधिकांश लोग डेटा गोदाम के साथ करना चाहते हैं। उदाहरण के लिए, ग्रैन्यूलिटी के विभिन्न स्तरों (उदाहरण के लिए महीने या दिन या वर्ष) के साथ रिपोर्ट तैयार करना आसान है। यह डेटा कुशलता के लिए सामान्य रूप से एक व्यापारिक डाटा को एक स्टार स्कीमा में डालने के लिए भी सक्षम है, डेटा गोदाम की फिर से एक आम और महत्वपूर्ण विशेषता।

आप निश्चित रूप से किसी भी तरह के डेटाबेस का उपयोग कर सकते हैं, लेकिन जब तक कि आप अपने व्यवसाय के डोमेन को बहुत अच्छी तरह से जानते नहीं हैं, यह संभव है कि आपकी रिपोर्ट कुशलतापूर्वक नहीं चलेगी, क्योंकि वे किसी स्टार स्कीमा का उपयोग कर सकते थे।

स्टार स्कीमा डेटा गोदाम की अंतिम परत के लिए एक प्राकृतिक फिट हैं। आप कैसे मिलते हैं एक और सवाल है जहां तक ​​मुझे पता है, वहां दो बड़े कैंप हैं, बिल इनॉन और राल्फ किमबॉल आप इन दो लोगों के सिद्धांतों को देखना चाहेंगे यदि / जब आप एक स्टार के साथ जाने का निर्णय लेते हैं

इसके अलावा, कुछ रिपोर्टिंग टूल वास्तव में स्टार स्कीमा सेटअप को पसंद करते हैं यदि आप एक विशिष्ट रिपोर्टिंग टूल में लॉक कर रहे हैं, तो यह आपके गोदाम में रिपोर्टिंग मार्ट की तरह लग सकता है।

स्टार स्कीमा, रिलेशनल डेटाबेस के लिए एक तार्किक डेटा मॉडल है जो कि नियमित डेटा भंडारण की जरूरतों को पूरा करता है; यदि रिलेशनल एन्वायरमेंट दिया गया है, तो स्टार या स्नोफ्लेक स्कीमा एक अच्छा डिज़ाइन पैटर्न होगा, जो बहुत सारे डीडब्लू डिज़ाइन के तरीकों में बहुत कठिन हैं।

हालांकि रिलेशनल डेटाबेस इंजिन से भी ज्यादा हैं, और इसका उपयोग कुशल डाटा वेयरहाउसिंग के लिए किया जा सकता है। बहुआयामी भंडारण इंजन ओएलएपी कार्यों (टीएम 1 जैसे।) के लिए बहुत तेजी से हो सकता है; हम इस मामले में स्टार स्कीमा डिजाइन लागू नहीं कर सकते। विशेष तार्किक मॉडलों की आवश्यकता के अन्य उदाहरणों में एक्सएमएल डाटाबेस या स्तंभ उन्मुख डेटाबेस (जैसे प्रयोगात्मक सी-स्टोर) शामिल हैं

इसके बिना करना संभव है हालांकि, आप अपने लिए ज़िंदगी कड़ी मेहनत करेंगे – आपका संगठन मानक उपकरणों का उपयोग करना चाहता है जो डीडब्ल्यूएस के शीर्ष पर रहते हैं, और उन उपकरणों को एक स्टार स्कीमा की उम्मीद होगी – बहुत सारे प्रयास एक दौर में एक वर्ग खूंटी को फ़िट करने में खर्च किए जाएंगे छेद।

बहुत सारे डेटाबेस-स्तरीय अनुकूलन मानते हैं कि आपके पास एक स्टार स्कीमा है; आप अपने बहुत-से-स्टार-लेआउट के साथ "सही चीज़" करने के लिए डीबी को प्राप्त करने के लिए बहुत अधिक समय का अनुकूलन और पुनर्गठन करेंगे।

सुनिश्चित करें कि पेशेवरों ने विपक्ष को पछाड़ दिया ..

(क्या ऐसा लगता है कि मैं वहां गया था?)

डी

हमें हल करने की तीन समस्याएं हैं।

1) ऑपरेशनल सोर्स सिस्टम के आंकड़ों को कैसे प्राप्त करें, उनके भीतर और उनके बीच तालिकाओं में शामिल होने पर, हम आंकड़ों को साफ करने, व्युत्पत्तियां बनाने आदि के आधार पर बिना दबाव पर डाले बिना कैसे प्राप्त करें।

2) असमान स्रोतों से डेटा को मर्ज कैसे करें – कुछ विरासत, कुछ फाइल आधारित, अलग-अलग विभागों से एक अभिन्न, सटीक, कुशलता से संग्रहीत पूरे मॉडल में, जो व्यवसायों को मॉडल बनाती है, और स्रोत सिस्टम की संरचनाओं को प्रतिबिंबित नहीं करती है। याद रखें, सिस्टम अपेक्षाकृत जल्दी बदलते हैं / बदलते हैं, लेकिन व्यवसाय का मूल मॉडल धीरे धीरे बदलता है

3) व्यवसाय में विशिष्ट लोगों / विभागों के लिए विशिष्ट विश्लेषणात्मक और रिपोर्टिंग आवश्यकताओं को पूरा करने के लिए डेटा को कैसे संरचित किया जाए

इन तीन बहुत भिन्न समस्याओं का समाधान उन्हें हल करने के लिए विभिन्न स्थापत्य परतों की आवश्यकता होती है

स्टेजिंग लेयर हम स्रोतों की संरचनाओं को दोहराते हैं, लेकिन केवल स्रोतों से डेटा बदलकर प्रत्येक रात लोड होते हैं एक बार जब स्टेजिंग परत से डेटा को अगली परत में ले लिया जाता है, तो डेटा हटा दिया जाता है। क्वेरीज़ एक साधारण डेटा_टाइम फ़िल्टर के साथ एक टेबल क्वेरीज़ हैं स्रोत पर बहुत कम प्रभाव

एंटरप्राइज़ लेयर यह एक व्यापार उन्मुख तीसरा सामान्य फॉर्म डेटाबेस है। स्टेजिंग परत से एंटरप्राइज़ परत में डेटा निकाला जाता है (और बाद में गिरा दिया जाता है), जहां यह साफ, एकीकृत और सामान्यीकृत होता है

प्रस्तुति (स्टार स्कीमा) परत यहां, हम विशिष्ट आवश्यकताओं को पूरा करने के लिए आयामी रूप से मॉडल करते हैं। डेटा जुड़ने की संख्या को कम करने के लिए जानबूझकर डी-सामान्यीकृत है। पदानुक्रम जो एंटरप्राइज परत में कई तालिकाओं पर कब्जा कर सकते हैं, उन्हें एकल आयाम तालिका में ढह जाता है, और कई ट्रांसेक्शनल टेबल एकल तथ्य तालिका में विलय हो सकते हैं।

आप इन तीन समस्याओं का हमेशा सामना करते हैं यदि आप एंटरप्राइज़ परत से दूर करना चुनते हैं, तो आपको दूसरी समस्या को हल करना होगा, लेकिन आपको इसे स्टार स्कीमा परत में करना होगा, और मेरे विचार में, ऐसा करने के लिए यह गलत जगह है।