Spaces:
Running
Running
Karthik Uppuluri
commited on
Commit
•
12c1463
1
Parent(s):
fc5ddb4
Telugu Language Model streamlit demo
Browse files- language_model_demo.py +52 -0
language_model_demo.py
ADDED
@@ -0,0 +1,52 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
"""Demo script for showcasing Telugu Language model."""
|
2 |
+
import streamlit as st
|
3 |
+
from transformers import AutoModelWithLMHead, AutoTokenizer, pipeline
|
4 |
+
|
5 |
+
|
6 |
+
@st.cache(allow_output_mutation=True)
|
7 |
+
def load_pipeline():
|
8 |
+
"""Load custom built Telugu Language model pipeline."""
|
9 |
+
tokenizer = AutoTokenizer.from_pretrained("kuppuluri/telugu_bertu",
|
10 |
+
clean_text=False,
|
11 |
+
handle_chinese_chars=False,
|
12 |
+
strip_accents=False,
|
13 |
+
wordpieces_prefix='##')
|
14 |
+
|
15 |
+
model = AutoModelWithLMHead.from_pretrained("kuppuluri/telugu_bertu")
|
16 |
+
fill_mask = pipeline("fill-mask", model=model, tokenizer=tokenizer)
|
17 |
+
return fill_mask
|
18 |
+
|
19 |
+
|
20 |
+
def main():
|
21 |
+
"""BERT Telugu Language modeling demo."""
|
22 |
+
st.sidebar.title("""
|
23 |
+
My Custom Model.
|
24 |
+
Example sentences:
|
25 |
+
1. మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.
|
26 |
+
2. నోరూరించే వంకాయ-జీడిపప్పు [MASK] చేయు విధానం
|
27 |
+
3. [MASK] దెబ్బకు హెచ్సిఎల్ ఉద్యోగులకు వర్క్ ప్రమ్ హొమ్ అవకాశం
|
28 |
+
4. నిజం చెప్పొద్దూ, [MASK] మొహాలు ఒక్కసారి మతాబాల్లాగ వెలిగిపోయాయి
|
29 |
+
5. ఆశ్రమంలో వాతవరణం అంతా [MASK] వుంది.
|
30 |
+
6. [MASK] లోకి రాగానే సిగరెట్ కాల్చాలని పించింది.
|
31 |
+
7. ఆస్ట్రేలియా [MASK] టెన్నిస్ టోర్నమెంటులో సంచలనం సానియా మీర్జా మూడో రౌండులోకి ప్రవేశించింది.
|
32 |
+
8. ప్రస్తుత [MASK] సంవత్సరానికి గాను మొదటి త్రైమాసికంలో ఏప్రిల్ - జూన్ లో పరోక్ష పన్నులు 13.8 శాతానికి పెరిగి రూ.1.11 లక్షల కోట్లకు చేరంది.
|
33 |
+
9. భారీ [MASK] ఆర్జిస్తూ, నవరత్న హోదా కలిగిన కేంద్ర ప్రభుత్వ రంగ సంస్థ స్టీల్ అథారిటీ ఆఫ్ ఇండియా
|
34 |
+
10. శ్రీగిరిపల్లి, [MASK] రాష్ట్రం, సిద్ధిపేట జిల్లా, గజ్వేల్ మండలంలోని గ్రామం.
|
35 |
+
11. భీమావరం పట్టణంలో ఒక చిన్న [MASK] స్టేషన్
|
36 |
+
""")
|
37 |
+
|
38 |
+
text = st.text_area("Text (టెక్స్ట్)",
|
39 |
+
"మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.")
|
40 |
+
fill_mask = load_pipeline()
|
41 |
+
|
42 |
+
if st.button("Fill masks"):
|
43 |
+
results = fill_mask(text)
|
44 |
+
for result in results:
|
45 |
+
score = "{0:.3%}".format(result["score"])
|
46 |
+
st.markdown("<p>" + "<span style='color:#808080'>" + score +
|
47 |
+
"</span>" + " " + result["sequence"] + "</p>",
|
48 |
+
unsafe_allow_html=True)
|
49 |
+
|
50 |
+
|
51 |
+
if __name__ == '__main__':
|
52 |
+
main()
|