Yurii Paniv
Remove extra
858aa2d
raw
history blame
24.9 kB
mappings = [
["«", '"'],
["»", '"'],
# 0. словарик
# алейкум
["алейкум", "aleyküm"],
# бейуде
["бейуде", "beyüde"],
# большевик
["большевик", "bolşevik"],
# борнен
["борнен", "bornen"],
# бугунь
["([\s\"'\(\)\-.,:;!?>\]])бугун", r"\1bugün"],
# бузкесен
["бузкесен", "buzkesen"],
# буксир
["буксир", "buksir"],
# бульбуль
["бульбуль", "bülbül"],
# бульвар
["бульвар", "bulvar"],
# бульдозер
["бульдозер", "buldozer"],
# бульон
["бульон", "bulyon"],
# бунен
["бунен", "bunen"],
["буннен", "bunnen"],
# бус-бутюн
["бус-бутюн", "büs-bütün"],
# бутерброд
["бутерброд", "buterbrod"],
# буфер и буфет
["буфе([рт])", "bufe\1"],
# буюк
["буюк([^ъ])", "büyük\1"],
# формы глагола буюмек
["бую([гдйлмнпрстчшc])(и)", "büyü\1\2"],
# буюп
["([\s\"'\(\)\-.,:;!?>\]])буюп([\s\"'.,:;!?\)\-\[<])", r"\1büyüp\2"],
# буют
["буют([^ыа])", "büyüt\1"],
# гонъюль
["гонъюл", "göñül"],
# горизонт
["горизонт", "gorizont"],
# госпиталь
["госпиталь", "gospital"],
# гунях
["гунях", "günâh"],
# гуна
["гуна", "güna"],
# гургуль
["гургуль", "gürgül"],
# гуя
["гуя", "güya"],
# ёлнен
["ёлнен", "yolnen"],
# зумбуль
["зумбуль", "zümbül"],
# кодекс
["кодекс", "kodeks"],
# кодификация и однокоренные
["кодифик", "kodifik"],
# козь
["козь([^я])", "köz\1"],
# кой
["кой([\s\"'.,:;!?\)\-\[<])", "köy\1"],
["койнинъ([\s\"'.,:;!?\)\-\[<])", "köyniñ\1"],
["койни([\s\"'.,:;!?\)\-\[<])", "köyni\1"],
["койге([\s\"'.,:;!?\)\-\[<])", "köyge\1"],
["койде([\s\"'.,:;!?\)\-\[<])", "köyde\1"],
["койдеки([\s\"'.,:;!?\)\-\[<])", "köydeki\1"],
["койден([\s\"'.,:;!?\)\-\[<])", "köyden\1"],
["койлю", "köylü"],
["([\s\"'\(\)\-.,:;!?>\]])кою", r"\1köyü"],
# ком-кок
["([\s\"'\(\)\-.,:;!?>\]])ком-кок", r"\1köm-kök"],
# кок
["([\s\"'\(\)\-.,:;!?>\]])кок([^еёюяЕЁЮЯ])", r"\1kök\2"],
# кокос
["кокос", "kokos"],
# коллега и однокоренные
["коллег", "kolleg"],
["коллега", "kollega"],
# коллекция, коллектив и однокоренные
["коллек([цт])", "kollek\1"],
# комбинат и однокоренные
["комбин", "kombin"],
# комедия
["комедия", "komediya"],
# комендант и однокоренные
["коменда", "komenda"],
# комета
["комета", "kometa"],
# комиссия, комитет
["коми([ст])", "komi\1"],
# комментарий и однокоренные
["коммент", "komment"],
# коммерция и коммерсант
["коммер([сц])", "kommer\1"],
# компенсация и однокоренные
["компенс", "kompens"],
# компиляция и однокоренные
["компил", "kompil"],
# компьютер
["компьютер", "kompyuter"],
# конвейер
["конвейер", "konveyer"],
# конвенция и однокоренные
["конвен", "konven"],
# конверт
["конверт", "konvert"],
# конденсатор и однокоренные
["конденс", "kondens"],
# кондитер
["кондитер", "konditer"],
# коник (конический)
["коник", "konik"],
# консер
["консерв", "konserv"],
# контейнер
["контейнер", "konteyner"],
# континент
["континент", "kontinent"],
# конференция, конфет
["конфе", "konfe"],
# конфискация и однокоренные
["конфискац", "konfiskats"],
# концентрация и однокоренные
["концен", "kontsen"],
# концерт
["концерт", "kontsert"],
# коньки
["коньки", "konki"],
# коньки
["коньяк", "konyak"],
# конъюктура
["конъюктур", "konyuktur"],
# копирлемек и однокоренные
["копирле", "kopirle"],
# копия
["копия", "kopiya"],
# коп
["([\s\"'\(\)\-.,:;!?>\]])коп([^еёюяЕЁЮЯ])", r"\1köp\2"],
# корея
["корея", "koreya"],
# корректор, корреспондент
["корре", "korre"],
# коридор
["коридор", "koridor"],
# косметика
["косме", "kosme"],
# костюм
["костюм", "kostüm"],
# космик (космический)
["космик", "kosmik"],
# котировка
["котировка", "kotirovka"],
# котлет
["котлет", "kotlet"],
# коше
["коше", "köşe"],
# куе
["([\s\"'\(\)\-.,:;!?>\]])куе", r"\1küye"],
# кулинар
["кулинар", "kulinar"],
# кульминация
["кульминац", "kulminats"],
# культивация
["культив", "kultiv"],
# культура
["культура", "kultura"],
# курьк
["([\s\"'\(\)\-.,:;!?>\]])курк([\s\"'.,:;!?\)\-\[<])", r"\1kürk\2"],
["([\s\"'\(\)\-.,:;!?>\]])куркке", r"\1kürkke"],
["([\s\"'\(\)\-.,:;!?>\]])куркни", r"\1kürkni"],
["([\s\"'\(\)\-.,:;!?>\]])куркте", r"\1kürkte"],
["([\s\"'\(\)\-.,:;!?>\]])куркчи", r"\1kürkçi"],
["([\s\"'\(\)\-.,:;!?>\]])куркчю", r"\1kürkçü"],
# курсив
["курсив", "kursiv"],
# кушкулемек и однокоренные
["кушку", "küşkü"],
# куюк
["куюк", "küyük"],
# медьюн
["медьюн", "medyun"],
# месуль
["месуль", "mesül"],
["месули", "mesüli"],
# мефкуре
["мефкуре", "mefküre"],
# могедек
["могедек", "mögedek"],
# муурь
["муур", "müür"],
# муче
["муче", "müçe"],
# муюз
["муюз", "müyüz"],
# нумюне
["нумюне", "nümüne"],
# ог
['(["\s(-])ог([^ъ])', r"\1öг\2"],
# одеколон
["одеколон", "odekolon"],
# океан
["океан", "okean"],
# …ольчер
["ольчер", "ölçer"],
# олимп
["олимп", "olimp"],
# онен
["онен", "onen"],
["оннен", "onnen"],
# операция и однокоренные
["опера", "opera"],
# опция и однокоренные
["опция", "optsiya"],
["опци", "optsi"],
# орден и ордер
["([\s\"'\(\)\-.,:;!?>\]])орде([нр])", r"\1orde\2"],
# оригинал
["оригинал", "original"],
# ориентир
["ориент", "oriyent"],
# оркестр
["оркестр", "orkestr"],
# офис
["офис", "ofis"],
# офицер
["офицер", "ofitser"],
# офсет
["офсет", "ofset"],
# оюннен
["оюннен", "oyunnen"],
# публикация и однокоренные
["публик", "publik"],
# публицистика и однокоренные
["публиц", "publits"],
# сурет
["сурет", "süret"],
# ультиматум и однокоренные
["ультимат", "ultimat"],
# ультра
["ультра", "ultra"],
# уника
["([\s\"'\(\)\-.,:;!?>\]])уник", r"\1unik"],
# универcаль, универмаг, университет
["универ", "univer"],
# унтер
["([\s\"'\(\)\-.,:;!?>\]])унтер", r"\1unter"],
# урьян
["урьян", "uryan"],
# джонк
["джонкю", "cönkü"],
["джонк([^ъ])", "cönk\1"],
# джуньджу
["джуньджу", "cüncü"],
# шовинизм и однокоренные
["шовини", "şovini"],
# шоссе
["шоссе", "şosse"],
# шофёр
["шоф[её]р", "şoför"],
# шунен
["шунен", "şunen"],
["шуннен", "şunnen"],
# юз
["([\s\"'\(\)\-.,:;!?>\]])юз([\s\"'.,:;!?\)\-\[<])", r"\1yüz\2"],
# юзбашы
["([\s\"'\(\)\-.,:;!?>\]])юзбашы", r"\1yüzbaşı"],
# юзйыллыкъ
["([\s\"'\(\)\-.,:;!?>\]])юзйыл", r"\1yüzyıl"],
# юк
["([\s\"'\(\)\-.,:;!?>\]])юк([^ъ])", r"\1yüк\2"],
# юрип
["([\s\"'\(\)\-.,:;!?>\]])юрип", r"\1yürip"],
# 3-юнджи, 4-юнджи
["([34])-юнджи", r"\1-ünci"],
# некоторые глагольные формы на -ама, -алма
# букама, букалма
["([\s\"'\(\)\-.,:;!?>\]])букама", r"\1bükama"],
["([\s\"'\(\)\-.,:;!?>\]])букалма", r"\1bükalma"],
# комама, комалма
["([\s\"'\(\)\-.,:;!?>\]])комама", r"\1kömama"],
["([\s\"'\(\)\-.,:;!?>\]])комалма", r"\1kömalma"],
# корама, коралма
["([\s\"'\(\)\-.,:;!?>\]])корама", r"\1körama"],
["([\s\"'\(\)\-.,:;!?>\]])коралма", r"\1köralma"],
# кочама, кочалма
["([\s\"'\(\)\-.,:;!?>\]])кочама", r"\1köçama"],
["([\s\"'\(\)\-.,:;!?>\]])кочалма", r"\1köçalma"],
# куяма, куялма
["([\s\"'\(\)\-.,:;!?>\]])куяма", r"\1küyama"],
["([\s\"'\(\)\-.,:;!?>\]])куялма", r"\1küyalma"],
# кулама, кулалма
# [ "([\s\"'\(\)\-.,:;!?>\]])кулама", r"\1külama" ],
# [ "([\s\"'\(\)\-.,:;!?>\]])кулалма", r"\1külalma" ],
# кусама, кусалма
["([\s\"'\(\)\-.,:;!?>\]])кусама", r"\1küsama"],
["([\s\"'\(\)\-.,:;!?>\]])кусалма", r"\1küsalma"],
# кутама, куталма
["([\s\"'\(\)\-.,:;!?>\]])кутама", r"\1kütama"],
["([\s\"'\(\)\-.,:;!?>\]])куталма", r"\1kütalma"],
# опама, опалма
["([\s\"'\(\)\-.,:;!?>\]])опама", r"\1öpama"],
["([\s\"'\(\)\-.,:;!?>\]])опалма", r"\1öpalma"],
# осама, осалма
["([\s\"'\(\)\-.,:;!?>\]])осама", r"\1ösama"],
["([\s\"'\(\)\-.,:;!?>\]])осалма", r"\1ösalma"],
# отама, оталма
# [ "([\s\"'\(\)\-.,:;!?>\]])отама", r"\1ötama" ],
["([\s\"'\(\)\-.,:;!?>\]])оталма", r"\1ötalma"],
# узама, узалма
# [ "([\s\"'\(\)\-.,:;!?>\]])узама", r"\1üzama" ],
["([\s\"'\(\)\-.,:;!?>\]])узалма", r"\1üzalma"],
# утама, уталма
["([\s\"'\(\)\-.,:;!?>\]])утама", r"\1ütama"],
["([\s\"'\(\)\-.,:;!?>\]])уталма", r"\1ütalma"],
# Имена собственные
["аджыумер", "acıümer"],
["аджыусеин", "acıüsein"],
["боливия", "boliviya"],
["([\s\"'\(\)\-.,:;!?>\]])ишунь", r"\1işün"],
["корбекул", "körbekül"],
["корьбекул", "körbekül"],
["куркулет", "kürkület"],
["къарагоз", "qaragöz"],
["къуртумер", "qurtümer"],
["къуртусеин", "qurtüsein"],
["марьино", "maryino"],
["одесса", "odessa"],
["одеса", "odesa"],
["потелов", "potelov"],
["пушкин", "puşkin"],
["сеитумер", "seitümer"],
["сеитусеин", "seitüsein"],
["сейитумер", "seyitümer"],
["сейитусеин", "seyitüsein"],
["щёлкино", "şçolkino"],
["эмирусеин", "emirüsein"],
["юртер", "yurter"],
["ющенко", "yuşçenko"],
# -ьон
["([^\s])ьон", r"\1yon"],
# Я
[
"([\s\"'\(\)\-.,:;!?>\]])Я([\s\"'.,:;!?\)\-\[<])",
r"\1Ya\2",
], # TODO: check why there is no case for small letters
# Ё
["([\s\"'\(\)\-.,:;!?>\]])Ё([\s\"'.,:;!?\)\-\[<])", r"\1Yo\2"],
# йе
["йе", "yye"],
# йя
["йя", "yya"],
# 1. буквы гъ, къ, нъ, дж
["гъ", "ğ"],
["къ", "q"],
["нъ", "ñ"],
["дж", "c"],
# 2. o', u' первый заход - ё и ю после согласных
[r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ю", r"\1ü"],
[r"([бвгджзйклмнпрстфхцчшщñcБВГДЖЗЙКЛМНПРСТФХЦЧШЩÑC])ё", r"\1ö"],
# 3. o', u' второй заход
# буква u'
# ю
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])',
r"\1yü\2\3\4",
],
[
'([\s"\'\(\)\-.,:;!?>\]"АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])',
r"\1YÜ\2\3\4",
],
[
'([\s"\'\(\)\-.,:;!?>\]"(аыоуеиёюАЫОУЕИЁЮ])ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])',
r"\1yü\2\3",
],
[
'([\s"\'\(\)\-.,:;!?>\]"(АЫОУЕИЁЮ])Ю([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮЭÜ])',
r"\1YÜ\2\3",
],
["ю([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2\3"],
["ю([бвгджзйклмнпрстфхцчшщcñ])([ьеюэü])", "yü\1\2"],
# у и ую
# после у или ую две согласных
# строчная у
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПCШ])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1\2ü\3\4\5",
],
[
"([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1ü\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1üyü\2\3\4",
],
# заглавная У
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1\2Ü\3\4\5",
],
[
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1Ü\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1Üyü\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1ÜYÜ\2\3\4",
],
# после у или ую одна согласная
# строчная у
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])",
r"\1\2ü\3\4",
],
["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"],
["([\s\"'\(\)\-.,:;!?>\]])ую([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1üyü\2\3"],
# заглавная У
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1\2Ü\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1Ü\2\3",
],
[
"([\s\"'\(\)\-.,:;!?>\]])Ую([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1Üyü\2\3",
],
[
"([\s\"'\(\)\-.,:;!?>\]])УЮ([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1ÜYÜ\2\3",
],
# ещё один заход (не помню уже точно для чего он, но для чего-то нужен)
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])",
r"\1\2ü\3\4",
],
["([\s\"'\(\)\-.,:;!?>\]])у([бвгджзйклмнпрстфхцчшщycñ])([ьеёиюэü])", r"\1ü\2\3"],
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкмпшcБГКМПШC])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1\2Ü\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])У([бвгджзйклмнпрстфхцчшщcñyБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюüэЬЕЁИЮЭÜ])",
r"\1Ü\2\3",
],
# арабские слова на муи- муэ-
["([\s\"'\(\)\-.,:;!?>\]])му([иэ])", r"\1mü\2"],
# буква o'
# ё
[
"([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])",
r"\1yö\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])Ё([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеюü])",
r"\1Yö\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])Ё([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([БВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ЬЕЮÜ])",
r"\1YÖ\2\3\4",
],
["([\s\"'\(\)\-.,:;!?>\]])ё([бвгджзйклмнпрстфхцчшщcñ])([ьеёюэü])", r"\1yö\2\3"],
# о
# после о две согласных
[
"([\s\"'\(\)\-.,:;!?>\]])([бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1\2ö\3\4\5",
],
[
"([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1ö\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1\2Ö\3\4\5",
],
# после о одна согласная
[
"([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1Ö\2\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])",
r"\1\2ö\3\4",
],
["([\s\"'\(\)\-.,:;!?>\]])о([бвгджзйклмнпрстфхцчшщcñ])([ьеёиюэü])", r"\1ö\2\3"],
[
"([\s\"'\(\)\-.,:;!?>\]])([-\s\"'(бгкшcБГКШC])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1\2Ö\3\4",
],
[
"([\s\"'\(\)\-.,:;!?>\]])О([бвгджзйклмнпрстфхцчшщcñБВГДЖЗЙКЛМНПРСТФХЦЧШЩCÑ])([ьеёиюэüЬЕЁИЮЭÜ])",
r"\1Ö\2\3",
],
# 4. o', u' третий заход
["([бвгджзйклмнпрстфхцчшщcñ])ю", r"\1ü"],
["([бвгджзйклмнпрстфхцчшщcñ])ё", r"\1ö"],
# 5. o', u' четвёртый заход
["([ьеёюэöü])ю", r"\1yü"],
# 6. буквы е и я
# случаи е -> ye и я -> ya
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])е', r"\1ye"],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüeАЫОУЕИЁЭЮЯЬЪÖÜE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])',
r"\1YE\2",
],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜeАЫОЯУЕИЁЭЮЯЬЪÖÜE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])',
r"\1Ye\2",
],
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])я', r"\1ya"],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])',
r"\1YA\2",
],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])',
r"\1Ya\2",
],
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])е', r"\1ye"],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöüaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])',
r"\1YE\2",
],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяьъöÜaeАЫОУЕИЁЭЮЯЬЪÖÜAE(])Е([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])',
r"\1Ye\2",
],
['([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])я', r"\1ya"],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ\s"\'.,:;!?\)\-\[<])',
r"\1YA\2",
],
[
'([\s"\'\(\)\-.,:;!?>\]"аыоуеиёэюяöÜñqğьъaeАЫОУЕИЁЭЮЯÖÜÑQĞЬЪAE(])Я([абвгдеёжзийклмнопрстуфхцчшщъыьэюяqcğñüö])',
r"\1Ya\2",
],
# остальные вхождения е и я
["е", "e"],
["я", "â"],
# 7. все оставшиеся вхождения о, у, ё, ю
["Ю([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YU\1"],
["ю", "yu"],
["Ё([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "YO\1"],
["ё", "yo"],
["у", "u"],
["о", "o"],
# 8. убираем ь и ъ
["ь", ""],
["ъ", ""],
# 9. все остальные буквы
# заглавные Ц и Щ
["Ц([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "TS\1"],
["Ц", "Ts"],
["Щ([АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯQCĞÑÜÖ])", "ŞÇ\1"],
["Щ", "Şç"],
# строчные
["а", "a"],
["б", "b"],
["в", "v"],
["г", "g"],
["д", "d"],
["ж", "j"],
["з", "z"],
["и", "i"],
["й", "y"],
["к", "k"],
["л", "l"],
["м", "m"],
["н", "n"],
["п", "p"],
["р", "r"],
["с", "s"],
["т", "t"],
["ф", "f"],
["х", "h"],
["ц", "ts"],
["ч", "ç"],
["ш", "ş"],
["щ", "şç"],
["ы", "ı"],
["э", "e"],
]