l3cube-pune's picture
Update README.md
2da1a02 verified
metadata
language: mr
tags:
  - bert
license: cc-by-4.0
datasets:
  - L3Cube-MahaNews-LDC
widget:
  - text: >-
      भारत आणि आयर्लंड यांच्यात तीन कसोटी सामन्यांची मालिका खेळवण्यात येणार आहे.
      या मालिकेसाठी भारतीय संघात तीन खेळाडूंना पदार्पण करण्याची संधी मिळणार
      असल्याचे समोर येत आहे. तीन खेळाडू आहेत ज्यांना पदार्पणाची संधी मिळू शकते.
      यामध्ये प्रसिद्ध कृष्णा, रिंकू सिंग आणि जितेश शर्मा यांचा समावेश आहे.
      रिंकू सिंग आणि जितेश शर्मा यांनी आयपीएल २०२३ मध्ये अप्रतिम कामगिरी केली
      होती. हे दोन्ही खेळाडू त्यांच्या धारदार फलंदाजीसाठी ओळखले जातात. रिंकू
      सिंगने मॅच फिनिशर म्हणून आपली ओळख निर्माण केली आहे. त्यामुळे आता त्याला या
      मालिकेत भारताकडून खेळताना पहिल्यांदा पाहायची संधी चाहत्यांना मिळणार आहे.
      आयर्लंड मालिकेसाठी भारतीय संघ : जसप्रीत बुमराह (कर्णधार), रिंकू सिंग,
      ऋतुराज गायकवाड, तिलक वर्मा, यशस्वी जैस्वाल, शाहबाज अहमद, शिवम दुबे,
      वॉशिंग्टन सुंदर, जितेश शर्मा (विकेटकीपर), संजू सॅमसन (विकेटकिपर), अर्शदीप
      सिंग, आवेश खान, मुकेश कुमार, प्रसिद्ध कृष्णा, रवी बिश्नोई . भारतीय संघ या
      मालिकेत ३ टी-२० सामने खेळणार आहे. त्यानंतर भारतीय संघ आशिया चषकासाठी रवाना
      होणार असल्याचे म्हटले जात आहे. कारण आता तीच एक मोठी स्पर्धा होणार आहे आणि
      त्यानंतर वर्ल्ड कप खेळवला जाणार आहे. त्यामुळे आशिया चषक ही स्पर्धा भारतीय
      संघासाठी महत्वाची समजली जात आहे. पण आशिया चषकासाठी भारतीय संघाची निवड करत
      असताना या मालिकेतील कामगिरी पाहिली जाणार आहे. त्यामुळे या मालिकेत भारतीय
      संघ कशी कामगिरी करतात, याकडे सर्वाचं लक्ष लागलेले असेल.

MahaNews-LDC-BERT

MahaNews-LDC-BERT is a MahaBERT(l3cube-pune/marathi-bert-v2) model fine-tuned on full L3Cube-MahaNews-LDC Corpus, a Marathi long document classification dataset.
It is a topic identification cum long document classification model with 12 output categories
[dataset link] (https://github.com/l3cube-pune/MarathiNLP)

More details on the dataset, models, and baseline results can be found in our [paper] (coming soon)
Citing:

@inproceedings{mittal2023l3cube,
  title={L3Cube-MahaNews: News-Based Short Text and Long Document Classification Datasets in Marathi},
  author={Mittal, Saloni and Magdum, Vidula and Hiwarkhedkar, Sharayu and Dhekane, Omkar and Joshi, Raviraj},
  booktitle={International Conference on Speech and Language Technologies for Low-resource Languages},
  pages={52--63},
  year={2023},
  organization={Springer}
}

Other Marathi Sentiment models from MahaNews family are shared here:

MahaNews-LDC-BERT (long documents)
MahaNews-SHC-BERT (short text)
MahaNews-LPC-BERT (medium paragraphs)
MahaNews-All-BERT (all document lengths)