Spaces:
Running
Running
mappings = [ | |
["«", '"'], | |
["»", '"'], | |
# 0. словарик | |
# алейкум | |
["алейкум", "aleyküm"], | |
# бейуде | |
["бейуде", "beyüde"], | |
# большевик | |
["большевик", "bolşevik"], | |
# борнен | |
["борнен", "bornen"], | |
# бугунь | |
["([\s\"'\(\)\-.,:;!?>\]])бугун", r"\1bugün"], | |
# бузкесен | |
["бузкесен", "buzkesen"], | |
# буксир | |
["буксир", "buksir"], | |
# бульбуль | |
["бульбуль", "bülbül"], | |
# бульвар | |
["бульвар", "bulvar"], | |
# бульдозер | |
["бульдозер", "buldozer"], | |
# бульон | |
["бульон", "bulyon"], | |
# бунен | |
["бунен", "bunen"], | |
["буннен", "bunnen"], | |
# бус-бутюн | |
["бус-бутюн", "büs-bütün"], | |
# бутерброд | |
["бутерброд", "buterbrod"], | |
# буфер и буфет | |
["буфе([рт])", "bufe\1"], | |
# буюк | |
["буюк([^ъ])", "büyük\1"], | |
# формы глагола буюмек | |
["бую([гдйлмнпрстчшc])(и)", "büyü\1\2"], | |
# буюп | |
["([\s\"'\(\)\-.,:;!?>\]])буюп([\s\"'.,:;!?\)\-\[<])", r"\1büyüp\2"], | |
# буют | |
["буют([^ыа])", "büyüt\1"], | |
# гонъюль | |
["гонъюл", "göñül"], | |
# горизонт | |
["горизонт", "gorizont"], | |
# госпиталь | |
["госпиталь", "gospital"], | |
# гунях | |
["гунях", "günâh"], | |
# гуна | |
["гуна", "güna"], | |
# гургуль | |
["гургуль", "gürgül"], | |
# гуя | |
["гуя", "güya"], | |
# ёлнен | |
["ёлнен", "yolnen"], | |
# зумбуль | |
["зумбуль", "zümbül"], | |
# кодекс | |
["кодекс", "kodeks"], | |
# кодификация и однокоренные | |
["кодифик", "kodifik"], | |
# козь | |
["козь([^я])", "köz\1"], | |
# кой | |
["кой([\s\"'.,:;!?\)\-\[<])", "köy\1"], | |
["койнинъ([\s\"'.,:;!?\)\-\[<])", "köyniñ\1"], | |
["койни([\s\"'.,:;!?\)\-\[<])", "köyni\1"], | |
["койге([\s\"'.,:;!?\)\-\[<])", "köyge\1"], | |
["койде([\s\"'.,:;!?\)\-\[<])", "köyde\1"], | |
["койдеки([\s\"'.,:;!?\)\-\[<])", "köydeki\1"], | |
["койден([\s\"'.,:;!?\)\-\[<])", "köyden\1"], | |
["койлю", "köylü"], | |
["([\s\"'\(\)\-.,:;!?>\]])кою", r"\1köyü"], | |
# ком-кок | |
["([\s\"'\(\)\-.,:;!?>\]])ком-кок", r"\1köm-kök"], | |
# кок | |
["([\s\"'\(\)\-.,:;!?>\]])кок([^еёюяЕЁЮЯ])", r"\1kök\2"], | |
# кокос | |
["кокос", "kokos"], | |
# коллега и однокоренные | |
["коллег", "kolleg"], | |
["коллега", "kollega"], | |
# коллекция, коллектив и однокоренные | |
["коллек([цт])", "kollek\1"], | |
# комбинат и однокоренные | |
["комбин", "kombin"], | |
# комедия | |
["комедия", "komediya"], | |
# комендант и однокоренные | |
["коменда", "komenda"], | |
# комета | |
["комета", "kometa"], | |
# комиссия, комитет | |
["коми([ст])", "komi\1"], | |
# комментарий и однокоренные | |
["коммент", "komment"], | |
# коммерция и коммерсант | |
["коммер([сц])", "kommer\1"], | |
# компенсация и однокоренные | |
["компенс", "kompens"], | |
# компиляция и однокоренные | |
["компил", "kompil"], | |
# компьютер | |
["компьютер", "kompyuter"], | |
# конвейер | |
["конвейер", "konveyer"], | |
# конвенция и однокоренные | |
["конвен", "konven"], | |
# конверт | |
["конверт", "konvert"], | |
# конденсатор и однокоренные | |
["конденс", "kondens"], | |
# кондитер | |
["кондитер", "konditer"], | |
# коник (конический) | |
["коник", "konik"], | |
# консер | |
["консерв", "konserv"], | |
# контейнер | |
["контейнер", "konteyner"], | |
# континент | |
["континент", "kontinent"], | |
# конференция, конфет | |
["конфе", "konfe"], | |
# конфискация и однокоренные | |
["конфискац", "konfiskats"], | |
# концентрация и однокоренные | |
["концен", "kontsen"], | |
# концерт | |
["концерт", "kontsert"], | |
# коньки | |
["коньки", "konki"], | |
# коньки | |
["коньяк", "konyak"], | |
# конъюктура | |
["конъюктур", "konyuktur"], | |
# копирлемек и однокоренные | |
["копирле", "kopirle"], | |
# копия | |
["копия", "kopiya"], | |
# коп | |
["([\s\"'\(\)\-.,:;!?>\]])коп([^еёюяЕЁЮЯ])", r"\1köp\2"], | |
# корея | |
["корея", "koreya"], | |
# корректор, корреспондент | |
["корре", "korre"], | |
# коридор | |
["коридор", "koridor"], | |
# косметика | |
["косме", "kosme"], | |
# костюм | |
["костюм", "kostüm"], | |
# космик (космический) | |
["космик", "kosmik"], | |
# котировка | |
["котировка", "kotirovka"], | |
# котлет | |
["котлет", "kotlet"], | |
# коше | |
["коше", "köşe"], | |
# куе | |
["([\s\"'\(\)\-.,:;!?>\]])куе", r"\1küye"], | |
# кулинар | |
["кулинар", "kulinar"], | |
# кульминация | |
["кульминац", "kulminats"], | |
# культивация | |
["культив", "kultiv"], | |
# культура | |
["культура", "kultura"], | |
# курьк | |
["([\s\"'\(\)\-.,:;!?>\]])курк([\s\"'.,:;!?\)\-\[<])", r"\1kürk\2"], | |
["([\s\"'\(\)\-.,:;!?>\]])куркке", r"\1kürkke"], | |
["([\s\"'\(\)\-.,:;!?>\]])куркни", r"\1kürkni"], | |
["([\s\"'\(\)\-.,:;!?>\]])куркте", r"\1kürkte"], | |
["([\s\"'\(\)\-.,:;!?>\]])куркчи", r"\1kürkçi"], | |
["([\s\"'\(\)\-.,:;!?>\]])куркчю", r"\1kürkçü"], | |
# курсив | |
["курсив", "kursiv"], | |
# кушкулемек и однокоренные | |
["кушку", "küşkü"], | |
# куюк | |
["куюк", "küyük"], | |
# медьюн | |
["медьюн", "medyun"], | |
# месуль | |
["месуль", "mesül"], | |
["месули", "mesüli"], | |
# мефкуре | |
["мефкуре", "mefküre"], | |
# могедек | |
["могедек", "mögedek"], | |
# муурь | |
["муур", "müür"], | |
# муче | |
["муче", "müçe"], | |
# муюз | |
["муюз", "müyüz"], | |
# нумюне | |
["нумюне", "nümüne"], | |
# ог | |
['(["\s(-])ог([^ъ])', r"\1öг\2"], | |
# одеколон | |
["одеколон", "odekolon"], | |
# океан | |
["океан", "okean"], | |
# …ольчер | |
["ольчер", "ölçer"], | |
# олимп | |
["олимп", "olimp"], | |
# онен | |
["онен", "onen"], | |
["оннен", "onnen"], | |
# операция и однокоренные | |
["опера", "opera"], | |
# опция и однокоренные | |
["опция", "optsiya"], | |
["опци", "optsi"], | |
# орден и ордер | |
["([\s\"'\(\)\-.,:;!?>\]])орде([нр])", r"\1orde\2"], | |
# оригинал | |
["оригинал", "original"], | |
# ориентир | |
["ориент", "oriyent"], | |
# оркестр | |
["оркестр", "orkestr"], | |
# офис | |
["офис", "ofis"], | |
# офицер | |
["офицер", "ofitser"], | |
# офсет | |
["офсет", "ofset"], | |
# оюннен | |
["оюннен", "oyunnen"], | |
# публикация и однокоренные | |
["публик", "publik"], | |
# публицистика и однокоренные | |
["публиц", "publits"], | |
# сурет | |
["сурет", "süret"], | |
# ультиматум и однокоренные | |
["ультимат", "ultimat"], | |
# ультра | |
["ультра", "ultra"], | |
# уника | |
["([\s\"'\(\)\-.,:;!?>\]])уник", r"\1unik"], | |
# универcаль, универмаг, университет | |
["универ", "univer"], | |
# унтер | |
["([\s\"'\(\)\-.,:;!?>\]])унтер", r"\1unter"], | |
# урьян | |
["урьян", "uryan"], | |
# джонк | |
["джонкю", "cönkü"], | |
["джонк([^ъ])", "cönk\1"], | |
# джуньджу | |
["джуньджу", "cüncü"], | |
# шовинизм и однокоренные | |
["шовини", "şovini"], | |
# шоссе | |
["шоссе", "şosse"], | |
# шофёр | |
["шоф[её]р", "şoför"], | |
# шунен | |
["шунен", "şunen"], | |
["шуннен", "şunnen"], | |
# юз | |
["([\s\"'\(\)\-.,:;!?>\]])юз([\s\"'.,:;!?\)\-\[<])", r"\1yüz\2"], | |
# юзбашы | |
["([\s\"'\(\)\-.,:;!?>\]])юзбашы", r"\1yüzbaşı"], | |
# юзйыллыкъ | |
["([\s\"'\(\)\-.,:;!?>\]])юзйыл", r"\1yüzyıl"], | |
# юк | |
["([\s\"'\(\)\-.,:;!?>\]])юк([^ъ])", r"\1yüк\2"], | |
# юрип | |
["([\s\"'\(\)\-.,:;!?>\]])юрип", r"\1yürip"], | |
# 3-юнджи, 4-юнджи | |
["([34])-юнджи", r"\1-ünci"], | |
# некоторые глагольные формы на -ама, -алма | |
# букама, букалма | |
["([\s\"'\(\)\-.,:;!?>\]])букама", r"\1bükama"], | |
["([\s\"'\(\)\-.,:;!?>\]])букалма", r"\1bükalma"], | |
# комама, комалма | |
["([\s\"'\(\)\-.,:;!?>\]])комама", r"\1kömama"], | |
["([\s\"'\(\)\-.,:;!?>\]])комалма", r"\1kömalma"], | |
# корама, коралма | |
["([\s\"'\(\)\-.,:;!?>\]])корама", r"\1körama"], | |
["([\s\"'\(\)\-.,:;!?>\]])коралма", r"\1köralma"], | |
# кочама, кочалма | |
["([\s\"'\(\)\-.,:;!?>\]])кочама", r"\1köçama"], | |
["([\s\"'\(\)\-.,:;!?>\]])кочалма", r"\1köçalma"], | |
# куяма, куялма | |
["([\s\"'\(\)\-.,:;!?>\]])куяма", r"\1küyama"], | |
["([\s\"'\(\)\-.,:;!?>\]])куялма", r"\1küyalma"], | |
# кулама, кулалма | |
# [ "([\s\"'\(\)\-.,:;!?>\]])кулама", r"\1külama" ], | |
# [ "([\s\"'\(\)\-.,:;!?>\]])кулалма", r"\1külalma" ], | |
# кусама, кусалма | |
["([\s\"'\(\)\-.,:;!?>\]])кусама", r"\1küsama"], | |
["([\s\"'\(\)\-.,:;!?>\]])кусалма", r"\1küsalma"], | |
# кутама, куталма | |
["([\s\"'\(\)\-.,:;!?>\]])кутама", r"\1kütama"], | |
["([\s\"'\(\)\-.,:;!?>\]])куталма", r"\1kütalma"], | |
# опама, опалма | |
["([\s\"'\(\)\-.,:;!?>\]])опама", r"\1öpama"], | |
["([\s\"'\(\)\-.,:;!?>\]])опалма", r"\1öpalma"], | |
# осама, осалма | |
["([\s\"'\(\)\-.,:;!?>\]])осама", r"\1ösama"], | |
["([\s\"'\(\)\-.,:;!?>\]])осалма", r"\1ösalma"], | |
# отама, оталма | |
# [ "([\s\"'\(\)\-.,:;!?>\]])отама", r"\1ötama" ], | |
["([\s\"'\(\)\-.,:;!?>\]])оталма", r"\1ötalma"], | |
# узама, узалма | |
# [ "([\s\"'\(\)\-.,:;!?>\]])узама", r"\1üzama" ], | |
["([\s\"'\(\)\-.,:;!?>\]])узалма", r"\1üzalma"], | |
# утама, уталма | |
["([\s\"'\(\)\-.,:;!?>\]])утама", r"\1ütama"], | |
["([\s\"'\(\)\-.,:;!?>\]])уталма", r"\1ütalma"], | |
# Имена собственные | |
["аджыумер", "acıümer"], | |
["аджыусеин", "acıüsein"], | |
["боливия", "boliviya"], | |
["([\s\"'\(\)\-.,:;!?>\]])ишунь", r"\1işün"], | |
["корбекул", "körbekül"], | |
["корьбекул", "körbekül"], | |
["куркулет", "kürkület"], | |
["къарагоз", "qaragöz"], | |
["къуртумер", "qurtümer"], | |
["къуртусеин", "qurtüsein"], | |
["марьино", "maryino"], | |
["одесса", "odessa"], | |
["одеса", "odesa"], | |
["потелов", "potelov"], | |
["пушкин", "puşkin"], | |
["сеитумер", "seitümer"], | |
["сеитусеин", "seitüsein"], | |
["сейитумер", "seyitümer"], | |
["сейитусеин", "seyitüsein"], | |
["щёлкино", "şçolkino"], | |
["эмирусеин", "emirüsein"], | |
["юртер", "yurter"], | |
["ющенко", "yuşçenko"], | |
# -ьон | |
["([^\s])ьон", r"\1yon"], | |
# Я | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])Я([\s\"'.,:;!?\)\-\[<])", | |
r"\1Ya\2", | |
], # TODO: check why there is no case for small letters | |
# Ё | |
["([\s\"'\(\)\-.,:;!?>\]])Ё([\s\"'.,:;!?\)\-\[<])", r"\1Yo\2"], | |
# йе | |
["йе", "yye"], | |
# йя | |
["йя", "yya"], | |
# 1. буквы гъ, къ, нъ, дж | |
["гъ", "ğ"], | |
["къ", "q"], | |
["нъ", "ñ"], | |
["дж", "c"], | |
# 2. o', u' первый заход - ё и ю после согласных | |
[r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ю", r"\1ü"], | |
[r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ё", r"\1ö"], | |
# 3. o', u' второй заход | |
# буква u' | |
# ю | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])', | |
r"\1yü\2\3\4", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])', | |
r"\1YÜ\2\3\4", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"(аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])', | |
r"\1yü\2\3", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"(АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])', | |
r"\1YÜ\2\3", | |
], | |
["ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2\3"], | |
["ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2"], | |
# у и ую | |
# после у или ую две согласных | |
# строчная у | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПCШ])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1\2ü\3\4\5", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1ü\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1üyü\2\3\4", | |
], | |
# заглавная У | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1\2Ü\3\4\5", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1Ü\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1Üyü\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1ÜYÜ\2\3\4", | |
], | |
# после у или ую одна согласная | |
# строчная у | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", | |
r"\1\2ü\3\4", | |
], | |
["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"], | |
["([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1üyü\2\3"], | |
# заглавная У | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1\2Ü\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1Ü\2\3", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1Üyü\2\3", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1ÜYÜ\2\3", | |
], | |
# ещё один заход (не помню уже точно для чего он, но для чего-то нужен) | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", | |
r"\1\2ü\3\4", | |
], | |
["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1\2Ü\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])", | |
r"\1Ü\2\3", | |
], | |
# арабские слова на муи- муэ- | |
["([\s\"'\(\)\-.,:;!?>\]])му([иэ])", r"\1mü\2"], | |
# буква o' | |
# ё | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])", | |
r"\1yö\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])Ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])", | |
r"\1Yö\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])Ё([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮÜ])", | |
r"\1YÖ\2\3\4", | |
], | |
["([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([ьеёюэü])", r"\1yö\2\3"], | |
# о | |
# после о две согласных | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1\2ö\3\4\5", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1ö\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1\2Ö\3\4\5", | |
], | |
# после о одна согласная | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1Ö\2\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", | |
r"\1\2ö\3\4", | |
], | |
["([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", r"\1ö\2\3"], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1\2Ö\3\4", | |
], | |
[ | |
"([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])", | |
r"\1Ö\2\3", | |
], | |
# 4. o', u' третий заход | |
["([бвгджзйклмнпрстфхцчшщcñ])ю", r"\1ü"], | |
["([бвгджзйклмнпрстфхцчшщcñ])ё", r"\1ö"], | |
# 5. o', u' четвёртый заход | |
["([ьеёюэöü])ю", r"\1yü"], | |
# 6. буквы е и я | |
# случаи е -> ye и я -> ya | |
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])е', r"\1ye"], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
r"\1YE\2", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜeАЫОЯУЕИЁЭЮЯЬЪÖÜE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
r"\1Ye\2", | |
], | |
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])я', r"\1ya"], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
r"\1YA\2", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
r"\1Ya\2", | |
], | |
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])е', r"\1ye"], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
r"\1YE\2", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
r"\1Ye\2", | |
], | |
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])я', r"\1ya"], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])', | |
r"\1YA\2", | |
], | |
[ | |
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])', | |
r"\1Ya\2", | |
], | |
# остальные вхождения е и я | |
["е", "e"], | |
["я", "â"], | |
# 7. все оставшиеся вхождения о, у, ё, ю | |
["Ю([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YU\1"], | |
["ю", "yu"], | |
["Ё([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YO\1"], | |
["ё", "yo"], | |
["у", "u"], | |
["о", "o"], | |
# 8. убираем ь и ъ | |
["ь", ""], | |
["ъ", ""], | |
# 9. все остальные буквы | |
# заглавные Ц и Щ | |
["Ц([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "TS\1"], | |
["Ц", "Ts"], | |
["Щ([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "ŞÇ\1"], | |
["Щ", "Şç"], | |
# строчные | |
["а", "a"], | |
["б", "b"], | |
["в", "v"], | |
["г", "g"], | |
["д", "d"], | |
["ж", "j"], | |
["з", "z"], | |
["и", "i"], | |
["й", "y"], | |
["к", "k"], | |
["л", "l"], | |
["м", "m"], | |
["н", "n"], | |
["п", "p"], | |
["р", "r"], | |
["с", "s"], | |
["т", "t"], | |
["ф", "f"], | |
["х", "h"], | |
["ц", "ts"], | |
["ч", "ç"], | |
["ш", "ş"], | |
["щ", "şç"], | |
["ы", "ı"], | |
["э", "e"], | |
] | |