File size: 1,868 Bytes
a2689f4
 
 
 
b1e6f9e
a2689f4
b1e6f9e
 
a2689f4
b1e6f9e
19c634e
 
 
 
093ff4b
19c634e
b1e6f9e
a2689f4
b1e6f9e
 
a2689f4
b1e6f9e
 
 
 
 
 
 
 
 
 
 
 
 
a2689f4
b1e6f9e
a2689f4
 
b1e6f9e
a2689f4
b1e6f9e
a2689f4
b1e6f9e
 
a2689f4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
from crh_preprocessor.preprocessor import preprocess, num2word


def test_num2word():
    assert num2word(16) == "on altı"
    assert (
        num2word(1324759813)
        == "bir milliard üç yüz yigirmi dört million yedi yüz elli doquz biñ sekiz yüz on üç"
    )
    assert num2word(1_000_000) == "million"


def test_preprocessor():
    assert (
        preprocess("İşanç Alla-Taalâğa.") == "işan\u04ab alla-taalâğa."
    )  # first i is two symbols (i without dot and dot)
    assert preprocess("1000000") == "million"
    assert (
        preprocess("1324700000")
        == "bir milliard üç yüz yigirmi dört million yedi yüz biñ"
    )
    assert preprocess("1000002") == "bir million eki"
    assert preprocess("16") == "on altı"
    assert preprocess("001") == "sıfır sıfır bir"
    assert preprocess("00") == "sıfır sıfır"
    assert preprocess("10.02") == "on noqta sıfır eki"
    assert preprocess("0.01") == "sıfır noqta sıfır bir"
    assert preprocess("0,01") == "sıfır virgül sıfır bir"
    assert preprocess("00,01") == "sıfır sıfır virgül sıfır bir"
    assert preprocess("-10") == "minus on"
    assert preprocess("+10") == "plüs on"
    assert preprocess("+10.1400") == "plüs on noqta bir dört sıfır sıfır"
    assert preprocess("-10.14156") == "minus on noqta bir dört bir beş altı"
    assert preprocess("10,14156") == "on virgül bir dört bir beş altı"
    assert (
        preprocess("1, 2, 3, 4, 5, 6,7") == "bir, eki, üç, dört, beş, altı virgül yedi"
    )
    assert (
        preprocess("1. 2. 3. 4. 5. 6.7") == "bir. eki. üç. dört. beş. altı noqta yedi"
    )
    assert preprocess("1,2,3,4,5,6,7") == "bir eki üç dört beş altı yedi"
    assert (
        preprocess("1,2,3,4,5,6,74.3")
        == "bir eki üç dört beş altı yetmiş dört noqta üç"
    )