Forming Bigrams of words in list of sentences with Python -


मेरे पास वाक्यों की एक सूची है:

  text = ['cant railway station' 'गढ़ होटल', 'पुलिस स्टैन']  

मुझे बड़ा राम जोड़े बनाने और उन्हें एक चर में संग्रहित करने की आवश्यकता है। समस्या यह है कि जब मैं ऐसा करता हूं, तो मुझे शब्दों के बजाय वाक्य की एक जोड़ी मिलती है। यहां मैंने जो किया है:

  text2 = [[टेक्स्ट में लाइन के लिए word.split () में शब्द के लिए] bigrams = nltk.bigrams (text2) प्रिंट (bigrams)  

रेलवे स्टेशन और गढ़ होटल एक बड़ाराम के रूप में नहीं बना सकते हैं। मैं क्या चाहता हूं

  [([cant], [रेलवे]), ([रेलवे], [स्टेशन]), ([गढ़, होटल]) और इतने पर ... < / कोड>  

पहले वाक्य का अंतिम शब्द दूसरे वाक्य के पहले शब्द के साथ विलय नहीं करना चाहिए। इसे काम करने के लिए मुझे क्या करना चाहिए?

का उपयोग करना और:

  & gt; & gt; & gt; पाठ = ["यह एक वाक्य है", "तो यह एक है"]] gt; & gt; & gt; Bigrams = [zip (l.split ("") में पाठ के लिए l में [b के लिए] [: - 1], l.split ("") [1:])]> gt; & gt; & gt; प्रिंट (बड़ाराम) [('यह', 'है'), ('है', 'ए'), ('ए', 'वाक्य'), ('तो', 'है'), ('है' 'यह'), ('यह', 'एक')]  

Comments

Popular posts from this blog

eclipse plugin - Run java code error: Workspace is closed -

ios - How do I use CFArrayRef in Swift? -

scala - Play Framework - how to bind form to a session field -