apache pig - Maintaining Order of data in Pig Script -
मान लें कि मेरे पास निम्न पीआईजी स्क्रिप्ट है
record = LOAD 'input' का प्रयोग PigStorage ('\ T') के रूप में (आईडी, नाम, आयु); आदेश दिया गया रेकार्ड = आयु आयु एएससी द्वारा रिकॉर्ड; FinalRecord = FOREACH का आदेश दिया गया रिकार्ड आईडी, नाम; संग्रहित रिकॉर्ड्स = LIMIT अंतिम रेकार्ड 1000; स्टोर में संग्रहित रिकॉर्ड्स में 'आउटपुट';
मुझे पता है कि आदेश दिया गया आदेश उम्र के आधार पर सॉर्ट किया जाएगा, लेकिन जब मैंने आदेश दिया रेकार्ड से आयु निकाल दी है, तब भी डेटा क्रमबद्ध क्रम में है मैं सिर्फ 1000 डेटा बिंदुओं को सिर्फ आईडी और उम्र के आधार पर सॉर्ट करना चाहता हूं।
नहीं, यह मेरी समझ के अनुसार सॉर्ट किया जा सकता है लेकिन इसकी गारंटी नहीं है।
जैसा कि आप जानते हैं कि आप इस डेटा को आगे बढ़ाने की प्रक्रिया करते हैं, तो आप ऑर्डर खो देंगे। इसलिए यह गारंटी नहीं है कि आपका डेटा क्रमबद्ध रहेगा लेकिन इसके शेष आदेशों की संभावना अभी भी मौजूद है।
Comments
Post a Comment