Yurii Paniv commited on
Commit
8253e81
1 Parent(s): 55d834b

Improve handling

Browse files
Files changed (2) hide show
  1. converter.py +15 -1
  2. tests/rosetta.csv +1 -1
converter.py CHANGED
@@ -40,8 +40,22 @@ def to_latin(text):
40
  "ы": "ı",
41
  "ь": "",
42
  "э": "e",
43
- "ю": "yu",
44
  "я": "ya",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
45
  }
46
 
47
  for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
 
40
  "ы": "ı",
41
  "ь": "",
42
  "э": "e",
43
+ "ю": "ü",
44
  "я": "ya",
45
+ "ку": "kü", # non-letter replacements starts here
46
+ "узю": "üzü",
47
+ "ур": "ür",
48
+ "ля": "lâ",
49
+ "уту": "utu",
50
+ "ие": "iye",
51
+ "ко": "kö",
52
+ "мю": "mü",
53
+ "ол": "öl",
54
+ "къу": "qu",
55
+ "cю": "sü",
56
+ "ёкъ": "yoq",
57
+ "юв": "yuv",
58
+ "уз": "üz",
59
  }
60
 
61
  for key in sorted(cyrillic_mapping.keys(), key=lambda x: len(x), reverse=True):
tests/rosetta.csv CHANGED
@@ -14,7 +14,7 @@ Dua etip tek o zaman|Дуа этип тек о заман
14
  Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
15
  İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
16
  Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
17
- Üzüñiz buğavlarnı,|Узюнъиз бугъавларны
18
  Zalım duşman qanı ile|Залым душман къаны иле
19
  Yuvuñız diyarlarnı,|Ювунъыз диярларны,
20
  Ulu, ür bir ailege|Улу, урь бир аилеге
 
14
  Çıqarım arş-alâğa, Oña qadar mende yoqtır|Чыкъарым арш-алягъа, Онъа къадар менде ёкътыр
15
  İşanç Alla-Taalâğa.|Ишанч Алла-Таалягъа.
16
  Meni cıyıp, qalqıñız ve|Мени джыйып, къалкъынъыз ве
17
+ Üzüñiz buğavlarnı|Узюнъиз бугъавларны
18
  Zalım duşman qanı ile|Залым душман къаны иле
19
  Yuvuñız diyarlarnı,|Ювунъыз диярларны,
20
  Ulu, ür bir ailege|Улу, урь бир аилеге