Forming Bigrams of words in list of sentences with Python -
मेरे पास वाक्यों की एक सूची है:
text = ['cant railway station' 'गढ़ होटल', 'पुलिस स्टैन']
मुझे बड़ा राम जोड़े बनाने और उन्हें एक चर में संग्रहित करने की आवश्यकता है। समस्या यह है कि जब मैं ऐसा करता हूं, तो मुझे शब्दों के बजाय वाक्य की एक जोड़ी मिलती है। यहां मैंने जो किया है:
text2 = [[टेक्स्ट में लाइन के लिए word.split () में शब्द के लिए] bigrams = nltk.bigrams (text2) प्रिंट (bigrams)
रेलवे स्टेशन और गढ़ होटल एक बड़ाराम के रूप में नहीं बना सकते हैं। मैं क्या चाहता हूं
[([cant], [रेलवे]), ([रेलवे], [स्टेशन]), ([गढ़, होटल]) और इतने पर ... < / कोड> पहले वाक्य का अंतिम शब्द दूसरे वाक्य के पहले शब्द के साथ विलय नहीं करना चाहिए। इसे काम करने के लिए मुझे क्या करना चाहिए?
का उपयोग करना और:
& gt; & gt; & gt; पाठ = ["यह एक वाक्य है", "तो यह एक है"]] gt; & gt; & gt; Bigrams = [zip (l.split ("") में पाठ के लिए l में [b के लिए] [: - 1], l.split ("") [1:])]> gt; & gt; & gt; प्रिंट (बड़ाराम) [('यह', 'है'), ('है', 'ए'), ('ए', 'वाक्य'), ('तो', 'है'), ('है' 'यह'), ('यह', 'एक')]
Comments
Post a Comment