मराठी शब्दांची कुंडली

आय आय टी च्या वेबसाईटवर डाऊनलोड सेक्शनमध्ये मराठी शब्दांची एक यादी मला पहायला मिळाली. या फाईलचे महत्त्व कदाचित मनोगतावरील पुष्कळांना माहीत नसेल म्हणून मी थोडी माहिती देतो. (marathi-wordlist-tagged-sorted.zip)

दुवा क्र. १

ही फाईल आय आय टी मधील नक्की कुणी बनविली याची मला माहिती नाही. किंवा या फाईलच्या रिड-मी मध्ये देखील त्याचा  उल्लेख नाही. शब्दसंख्या देखील फार नाही (सुमारे ४०,०००) पण शब्दांची मांडणी अभिनव पद्धतीने केलेली दिसते. यात प्रथम मूळ शब्द ,  त्यान्ंतर नाम, विशेषण, क्रियाविशेषण, क्रियापद (आहे की नाही १ किंवा ०) याची नोंद तर त्यानंतर लिंग, विकारी/ अविकारी, सकर्मक / अकर्मक याचा उल्लेख आहे. म्हणजे एका अर्थाने प्रत्येक शब्दाची कुंडलीच मांडून दाखविली आहे असे वाटते.

उदा. "आभाराचे" हा शब्द पाहू.
<आभाराचे>[आभार-1000#Neu$$$_Y](1){}

आभार या मूळ शब्दापासून आभाराचे हा शब्द बनला असून तो "नाम" व शब्द "नपुसकलिंगी" आहे. ही मांडणी सर्व समावेशक आहे का याची मला माहिती नाही. उदा. यात त्या शब्दाच्या विभक्ती प्रत्ययाची माहिती न देता मूळ शब्दाची माहिती देण्यावर भर दिलेला दिसतो.

मराठी शब्द कूडली

वाचकांपैकी कुणी संगणकतज्ज्ञ असतील ते ही फाईल डाऊनलोड करून वापरून पाहू शकतील. त्याकरता आवश्यक त्या कमांड्स वरील चित्रात दाखविल्या आहेत. सांकेतिक भाषेत लिहीलेली माहिती कशी वाचायची ते खाली दिलेल्या चित्रावरून स्पष्ट होईल.

मराठी श्बद उदाहरणासह

मराठी भाषेतील शब्दांना संगणक शास्त्रात बसविण्याचा हा अतिशय चांगला प्रयत्न म्हटला पाहिजे. अर्थात हा शब्दसंग्रह सर्वसमावेशक आहे की नाही माहिती नाही कारण यात सुमारे १४०० नामे आहेत (विभक्ती प्रत्ययांसकट) आणि त्यातील सुमारे ५०० शब्द नाम् आणि विशेषण् या दोन्ही प्रकारे वापरता येतात (उदा. हल्ला, हेकेखोर). या गोष्टी व्हेरिफाय करण्याएवढे माझे मराठी स्ट्रॉंग नाही. मनोगती कदाचित अधिक चांगले विश्लेषण करू शकतील.