Spaces:
Running
Running
Yurii Paniv
commited on
Commit
•
8253e81
1
Parent(s):
55d834b
Improve handling
Browse files- converter.py +15 -1
- tests/rosetta.csv +1 -1
converter.py
CHANGED
@@ -40,8 +40,22 @@ def to_latin(text):
|
|
40 |
"ы": "ı",
|
41 |
"ь": "",
|
42 |
"э": "e",
|
43 |
-
"ю": "
|
44 |
"я": "ya",
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45 |
}
|
46 |
|
47 |
for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
|
|
|
40 |
"ы": "ı",
|
41 |
"ь": "",
|
42 |
"э": "e",
|
43 |
+
"ю": "ü",
|
44 |
"я": "ya",
|
45 |
+
"ку": "kü", # non-letter replacements starts here
|
46 |
+
"узю": "üzü",
|
47 |
+
"ур": "ür",
|
48 |
+
"ля": "lâ",
|
49 |
+
"уту": "utu",
|
50 |
+
"ие": "iye",
|
51 |
+
"ко": "kö",
|
52 |
+
"мю": "mü",
|
53 |
+
"ол": "öl",
|
54 |
+
"къу": "qu",
|
55 |
+
"cю": "sü",
|
56 |
+
"ёкъ": "yoq",
|
57 |
+
"юв": "yuv",
|
58 |
+
"уз": "üz",
|
59 |
}
|
60 |
|
61 |
for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
|
tests/rosetta.csv
CHANGED
@@ -14,7 +14,7 @@ Dua etip tek o zaman|Дуа этип тек о заман
|
|
14 |
Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
|
15 |
İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
|
16 |
Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
|
17 |
-
Üzüñiz buğavlarn
|
18 |
Zalım duşman qanı ile|Залым душман къаны иле
|
19 |
Yuvuñız diyarlarnı,|Ювунъыз диярларны,
|
20 |
Ulu, ür bir ailege|Улу, урь бир аилеге
|
|
|
14 |
Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
|
15 |
İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
|
16 |
Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
|
17 |
+
Üzüñiz buğavlarnı|Узюнъиз бугъавларны
|
18 |
Zalım duşman qanı ile|Залым душман къаны иле
|
19 |
Yuvuñız diyarlarnı,|Ювунъыз диярларны,
|
20 |
Ulu, ür bir ailege|Улу, урь бир аилеге
|