Forming Bigrams of words in list of sentences with Python -


मेरे पास वाक्यों की एक सूची है:

  text = ['cant railway station' 'गढ़ होटल', 'पुलिस स्टैन']  

मुझे बड़ा राम जोड़े बनाने और उन्हें एक चर में संग्रहित करने की आवश्यकता है। समस्या यह है कि जब मैं ऐसा करता हूं, तो मुझे शब्दों के बजाय वाक्य की एक जोड़ी मिलती है। यहां मैंने जो किया है:

  text2 = [[टेक्स्ट में लाइन के लिए word.split () में शब्द के लिए] bigrams = nltk.bigrams (text2) प्रिंट (bigrams)  

रेलवे स्टेशन और गढ़ होटल एक बड़ाराम के रूप में नहीं बना सकते हैं। मैं क्या चाहता हूं

  [([cant], [रेलवे]), ([रेलवे], [स्टेशन]), ([गढ़, होटल]) और इतने पर ... < / कोड>  

पहले वाक्य का अंतिम शब्द दूसरे वाक्य के पहले शब्द के साथ विलय नहीं करना चाहिए। इसे काम करने के लिए मुझे क्या करना चाहिए?

का उपयोग करना और:

  & gt; & gt; & gt; पाठ = ["यह एक वाक्य है", "तो यह एक है"]] gt; & gt; & gt; Bigrams = [zip (l.split ("") में पाठ के लिए l में [b के लिए] [: - 1], l.split ("") [1:])]> gt; & gt; & gt; प्रिंट (बड़ाराम) [('यह', 'है'), ('है', 'ए'), ('ए', 'वाक्य'), ('तो', 'है'), ('है' 'यह'), ('यह', 'एक')]  

Comments

Popular posts from this blog

python - rpy2 import is not working -

c++ - How to load a bitmap from file into the samples buffer -

javascript - How to get MySQL query result returned using $.ajax -