apache pig - Maintaining Order of data in Pig Script -


मान लें कि मेरे पास निम्न पीआईजी स्क्रिप्ट है

  record = LOAD 'input' का प्रयोग PigStorage ('\ T') के रूप में (आईडी, नाम, आयु); आदेश दिया गया रेकार्ड = आयु आयु एएससी द्वारा रिकॉर्ड; FinalRecord = FOREACH का आदेश दिया गया रिकार्ड आईडी, नाम; संग्रहित रिकॉर्ड्स = LIMIT अंतिम रेकार्ड 1000; स्टोर में संग्रहित रिकॉर्ड्स में 'आउटपुट';  

मुझे पता है कि आदेश दिया गया आदेश उम्र के आधार पर सॉर्ट किया जाएगा, लेकिन जब मैंने आदेश दिया रेकार्ड से आयु निकाल दी है, तब भी डेटा क्रमबद्ध क्रम में है मैं सिर्फ 1000 डेटा बिंदुओं को सिर्फ आईडी और उम्र के आधार पर सॉर्ट करना चाहता हूं।

नहीं, यह मेरी समझ के अनुसार सॉर्ट किया जा सकता है लेकिन इसकी गारंटी नहीं है।

जैसा कि आप जानते हैं कि आप इस डेटा को आगे बढ़ाने की प्रक्रिया करते हैं, तो आप ऑर्डर खो देंगे। इसलिए यह गारंटी नहीं है कि आपका डेटा क्रमबद्ध रहेगा लेकिन इसके शेष आदेशों की संभावना अभी भी मौजूद है।


Comments

Popular posts from this blog

scala - Play Framework - how to bind form to a session field -

Django Celery - running scheduled tasks -

perl - 'Unquoted string ".." may clash with future reserved word' but only when package is used -