Forming Bigrams of words in list of sentences with Python -


मेरे पास वाक्यों की एक सूची है:

  text = ['cant railway station' 'गढ़ होटल', 'पुलिस स्टैन']  

मुझे बड़ा राम जोड़े बनाने और उन्हें एक चर में संग्रहित करने की आवश्यकता है। समस्या यह है कि जब मैं ऐसा करता हूं, तो मुझे शब्दों के बजाय वाक्य की एक जोड़ी मिलती है। यहां मैंने जो किया है:

  text2 = [[टेक्स्ट में लाइन के लिए word.split () में शब्द के लिए] bigrams = nltk.bigrams (text2) प्रिंट (bigrams)  

रेलवे स्टेशन और गढ़ होटल एक बड़ाराम के रूप में नहीं बना सकते हैं। मैं क्या चाहता हूं

  [([cant], [रेलवे]), ([रेलवे], [स्टेशन]), ([गढ़, होटल]) और इतने पर ... < / कोड>  

पहले वाक्य का अंतिम शब्द दूसरे वाक्य के पहले शब्द के साथ विलय नहीं करना चाहिए। इसे काम करने के लिए मुझे क्या करना चाहिए?

का उपयोग करना और:

  & gt; & gt; & gt; पाठ = ["यह एक वाक्य है", "तो यह एक है"]] gt; & gt; & gt; Bigrams = [zip (l.split ("") में पाठ के लिए l में [b के लिए] [: - 1], l.split ("") [1:])]> gt; & gt; & gt; प्रिंट (बड़ाराम) [('यह', 'है'), ('है', 'ए'), ('ए', 'वाक्य'), ('तो', 'है'), ('है' 'यह'), ('यह', 'एक')]  

Comments

Popular posts from this blog

python - rpy2 import is not working -

javascript - How to get MySQL query result returned using $.ajax -

javascript - How to use the code plugin with popcornjs -