koziev ilya
commited on
Commit
•
df2028a
1
Parent(s):
84d1a91
minor stylistic changes in readme
Browse files
README.md
CHANGED
@@ -85,9 +85,9 @@ print(text)
|
|
85 |
Модель разрабатывается с прицелом на использование в [чатботе](https://github.com/Koziev/chatbot). Она поддерживает некоторые
|
86 |
типичные ситуации в читчате, которые перечислены далее.
|
87 |
|
88 |
-
В примерах после символа ⇒ идет эталонная раскрытая
|
89 |
|
90 |
-
|
91 |
|
92 |
```
|
93 |
- Как же тебя зовут, а?
|
@@ -102,7 +102,7 @@ print(text)
|
|
102 |
- А ты мне здоровую купи. ⇒ купи мне здоровую собаку
|
103 |
```
|
104 |
|
105 |
-
|
106 |
|
107 |
```
|
108 |
- Ты собак любишь?
|
@@ -117,7 +117,7 @@ print(text)
|
|
117 |
- А что в ней было? ⇒ что было в коробке|голове?
|
118 |
```
|
119 |
|
120 |
-
|
121 |
|
122 |
```
|
123 |
- Ты кошек любишь?
|
@@ -131,7 +131,7 @@ print(text)
|
|
131 |
- Не я - отец. ⇒ Я не получаю пенсию. Отец получает пенсию
|
132 |
```
|
133 |
|
134 |
-
Восстановление необязательного подлежащего (см. pro drop):
|
135 |
|
136 |
```
|
137 |
- Согласна?
|
@@ -213,22 +213,22 @@ print(text)
|
|
213 |
Если русскоговорящие предпочитают OVS вместо формального SVO, то модель будет выдавать именно OVS:
|
214 |
|
215 |
```
|
216 |
-
У тебя штрафы были?
|
217 |
-
Нет, их никогда не было ⇒ у меня никогда не было штрафов
|
218 |
```
|
219 |
|
220 |
Модель обычно вставляет личные местоимения, даже если форма глагола позволяет обойтись без них:
|
221 |
|
222 |
```
|
223 |
-
Жару любишь?
|
224 |
-
Ненавижу ее ⇒ я ненавижу жару
|
225 |
```
|
226 |
|
227 |
Сложносочиненные ответы разбиваются на отдельные клаузы, чтобы downstream pipeline мог обработать их последовательно:
|
228 |
|
229 |
```
|
230 |
-
Тебя как зовут?
|
231 |
-
Кортана, а тебя как? ⇒ Меня зовут Кортана. Как тебя зовут?
|
232 |
```
|
233 |
|
234 |
В качестве контекста можно подавать последние 2 или 3 реплики. Более длинные отношения весьма редки, чтобы ради них усложнять датасет.
|
@@ -236,11 +236,11 @@ print(text)
|
|
236 |
результат их раскрытия моделью:
|
237 |
|
238 |
```
|
239 |
-
Где живешь?
|
240 |
-
В Шанхае ⇒ я живу в Шанхае
|
241 |
-
Давно? ⇒ ты давно живешь в Шанхае?
|
242 |
-
Два года уже ⇒ я уже два года живу в Шанхае
|
243 |
-
Как там погода? ⇒ как там погода в Шанхае?
|
244 |
```
|
245 |
|
246 |
Последнее, что хочется отметить: модель обучена **только** на диалоговых данных с короткими репликами (читчат).
|
|
|
85 |
Модель разрабатывается с прицелом на использование в [чатботе](https://github.com/Koziev/chatbot). Она поддерживает некоторые
|
86 |
типичные ситуации в читчате, которые перечислены далее.
|
87 |
|
88 |
+
В примерах после символа ⇒ идет эталонная раскрытая реплика, которую должна сгенерировать модель.
|
89 |
|
90 |
+
[Эллипсисы](https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%BB%D0%B8%D0%BF%D1%81%D0%B8%D1%81):
|
91 |
|
92 |
```
|
93 |
- Как же тебя зовут, а?
|
|
|
102 |
- А ты мне здоровую купи. ⇒ купи мне здоровую собаку
|
103 |
```
|
104 |
|
105 |
+
[Анафора](https://ru.wikipedia.org/wiki/%D0%90%D0%BD%D0%B0%D1%84%D0%BE%D1%80%D0%B0_(%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0)):
|
106 |
|
107 |
```
|
108 |
- Ты собак любишь?
|
|
|
117 |
- А что в ней было? ⇒ что было в коробке|голове?
|
118 |
```
|
119 |
|
120 |
+
[Гэппинг](https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%BB%D0%B8%D0%BF%D1%81%D0%B8%D1%81#%D0%93%D1%8D%D0%BF%D0%BF%D0%B8%D0%BD%D0%B3_(en:Gapping)):
|
121 |
|
122 |
```
|
123 |
- Ты кошек любишь?
|
|
|
131 |
- Не я - отец. ⇒ Я не получаю пенсию. Отец получает пенсию
|
132 |
```
|
133 |
|
134 |
+
Восстановление необязательного местоименного подлежащего (см. [pro drop](https://en.wikipedia.org/wiki/Pro-drop_language)):
|
135 |
|
136 |
```
|
137 |
- Согласна?
|
|
|
213 |
Если русскоговорящие предпочитают OVS вместо формального SVO, то модель будет выдавать именно OVS:
|
214 |
|
215 |
```
|
216 |
+
- У тебя штрафы были?
|
217 |
+
- Нет, их никогда не было ⇒ у меня никогда не было штрафов
|
218 |
```
|
219 |
|
220 |
Модель обычно вставляет личные местоимения, даже если форма глагола позволяет обойтись без них:
|
221 |
|
222 |
```
|
223 |
+
- Жару любишь?
|
224 |
+
- Ненавижу ее ⇒ я ненавижу жару
|
225 |
```
|
226 |
|
227 |
Сложносочиненные ответы разбиваются на отдельные клаузы, чтобы downstream pipeline мог обработать их последовательно:
|
228 |
|
229 |
```
|
230 |
+
- Тебя как зовут?
|
231 |
+
- Кортана, а тебя как? ⇒ Меня зовут Кортана. Как тебя зовут?
|
232 |
```
|
233 |
|
234 |
В качестве контекста можно подавать последние 2 или 3 реплики. Более длинные отношения весьма редки, чтобы ради них усложнять датасет.
|
|
|
236 |
результат их раскрытия моделью:
|
237 |
|
238 |
```
|
239 |
+
- Где живешь?
|
240 |
+
- В Шанхае ⇒ я живу в Шанхае
|
241 |
+
- Давно? ⇒ ты давно живешь в Шанхае?
|
242 |
+
- Два года уже ⇒ я уже два года живу в Шанхае
|
243 |
+
- Как там погода? ⇒ как там погода в Шанхае?
|
244 |
```
|
245 |
|
246 |
Последнее, что хочется отметить: модель обучена **только** на диалоговых данных с короткими репликами (читчат).
|