Forming Bigrams of words in list of sentences with Python -


मेरे पास वाक्यों की एक सूची है:

  text = ['cant railway station' 'गढ़ होटल', 'पुलिस स्टैन']  

मुझे बड़ा राम जोड़े बनाने और उन्हें एक चर में संग्रहित करने की आवश्यकता है। समस्या यह है कि जब मैं ऐसा करता हूं, तो मुझे शब्दों के बजाय वाक्य की एक जोड़ी मिलती है। यहां मैंने जो किया है:

  text2 = [[टेक्स्ट में लाइन के लिए word.split () में शब्द के लिए] bigrams = nltk.bigrams (text2) प्रिंट (bigrams)  

रेलवे स्टेशन और गढ़ होटल एक बड़ाराम के रूप में नहीं बना सकते हैं। मैं क्या चाहता हूं

  [([cant], [रेलवे]), ([रेलवे], [स्टेशन]), ([गढ़, होटल]) और इतने पर ... < / कोड>  

पहले वाक्य का अंतिम शब्द दूसरे वाक्य के पहले शब्द के साथ विलय नहीं करना चाहिए। इसे काम करने के लिए मुझे क्या करना चाहिए?

का उपयोग करना और:

  & gt; & gt; & gt; पाठ = ["यह एक वाक्य है", "तो यह एक है"]] gt; & gt; & gt; Bigrams = [zip (l.split ("") में पाठ के लिए l में [b के लिए] [: - 1], l.split ("") [1:])]> gt; & gt; & gt; प्रिंट (बड़ाराम) [('यह', 'है'), ('है', 'ए'), ('ए', 'वाक्य'), ('तो', 'है'), ('है' 'यह'), ('यह', 'एक')]  

Comments

Popular posts from this blog

javascript - How to use the code plugin with popcornjs -

python - rpy2 import is not working -

Python, converting png to gif using ImageMagick -