Update README.md
Browse files
README.md
CHANGED
@@ -1,5 +1,8 @@
|
|
1 |
---
|
2 |
license: mit
|
|
|
|
|
|
|
3 |
datasets:
|
4 |
- nsmc
|
5 |
- skt/kobest_v1
|
@@ -11,16 +14,61 @@ language:
|
|
11 |
- ko
|
12 |
pipeline_tag: text-classification
|
13 |
---
|
14 |
-
#
|
15 |
-
`[CLS] 입력 정보 [SEP] 지시문 [SEP] 라벨 [SEP]` 형태의 텍스트를 모델에 넣으면, 모델이 세 텍스트의 관계를 파악하고 점수를 반환합니다. 점수가 높을 수록, 라벨이 지시문을 잘 따르는 결과임을 의미합니다. 다음과 같은 사례에 사용이 가능합니다.
|
16 |
|
17 |
-
|
18 |
-
|
|
|
|
|
19 |
|
20 |
[space demo](https://huggingface.co/spaces/iknow-lab/azou)에서 모델을 직접 사용해보세요!<br/>
|
21 |
base model: [klue/roberta-large](https://huggingface.co/klue/roberta-large)
|
22 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
24 |
# 사용 예시
|
25 |
```
|
26 |
# Load model directly
|
@@ -40,7 +88,7 @@ def inference(instruction, input, labels):
|
|
40 |
|
41 |
inference(
|
42 |
"문장을 감성분류해주세요",
|
43 |
-
"아 영화
|
44 |
["긍정적", "부정적"]
|
45 |
)
|
46 |
|
@@ -61,32 +109,13 @@ inference(
|
|
61 |
|
62 |
```
|
63 |
|
64 |
-
|
65 |
-
|
66 |
-
|
67 |
-
|
68 |
-
|
69 |
-
|
70 |
-
|
71 |
-
|
72 |
-
|
73 |
-
|
74 |
-
|kobest-wic|0.7984|
|
75 |
-
|
76 |
-
4epoch 제로샷 성능
|
77 |
-
|task|accuracy|
|
78 |
-
|---|---|
|
79 |
-
|csatqa-GR|0.24|
|
80 |
-
|csatqa-LI|0.2432|
|
81 |
-
|csatqa-RCH|0.2571|
|
82 |
-
|csatqa-RCS|0.2162|
|
83 |
-
|csatqa-RCSS|0.3095|
|
84 |
-
|csatqa-WR|0.0909|
|
85 |
-
|aihub_complaints_topic|0.3284|
|
86 |
-
|aihub_dialog_topic|0.428|
|
87 |
-
|ko_relation_fields|0.403|
|
88 |
-
|
89 |
-
- aihub_complaints_topic: AIHub [민원 업무 자동화 인공지능 언어 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=619) - 16개 카테고리 class 분류
|
90 |
-
- aihub_dialog_topic: AIHub [한국어 주제별 텍스트 일상대화 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=543)의 20개 주제 class 분류
|
91 |
-
- ko_relation_fields: AIHub [한국어 지식기반 관계 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71633) 의 13개 주제 및 분야 분류
|
92 |
-
|
|
|
1 |
---
|
2 |
license: mit
|
3 |
+
widget:
|
4 |
+
- text: "[CLS] 인천발 KTX와 관련한 송도역 복합환승센터가 사실상 무산, 단순 철도·버스 위주 환승시설로 만들어진다. 이 때문에 인천시의 인천발 KTX 기점에 앵커시설인 복합환승센터를 통한 인근 지역 경제 활성화를 이뤄낸다는 계획의 차질이 불가피하다. [SEP] 경제와 관련된 뉴스인가요? [SEP] 예 [SEP]"
|
5 |
+
- text: "[CLS] 인천발 KTX와 관련한 송도역 복합환승센터가 사실상 무산, 단순 철도·버스 위주 환승시설로 만들어진다. 이 때문에 인천시의 인천발 KTX 기점에 앵커시설인 복합환승센터를 통한 인근 지역 경제 활성화를 이뤄낸다는 계획의 차질이 불가피하다. [SEP] 경제에 긍정적인 뉴스인가요? [SEP] 아니요 [SEP]"
|
6 |
datasets:
|
7 |
- nsmc
|
8 |
- skt/kobest_v1
|
|
|
14 |
- ko
|
15 |
pipeline_tag: text-classification
|
16 |
---
|
17 |
+
# AZOU: GPT 3.5보다 뛰어난 제로샷 분류 성능을 가진 한국어 모델
|
|
|
18 |
|
19 |
+
`[CLS] 입력 정보 [SEP] 지시문 [SEP] 라벨 [SEP]` 형태의 텍스트를 모델에 넣으면, 모델이 세 텍스트의 관계를 파악하고 점수를 반환합니다. 점수가 높을 수록, 라벨이 지시문을 잘 따르는 결과임을 의미합니다. 텍스트에 다음과 같은 질문을 함께 주고 평가할 수 있습니다.
|
20 |
+
|
21 |
+
1. 제로샷 분류(주제 분류, 혐오 분류): 이 글의 주제가 뭔가요? 이 글은 혐오 표현을 포함하고 있나요?
|
22 |
+
2. 데이터 검색 및 필터링: 이 글은 "화장품 사용법"에 대한 내용을 포함하고 있나요?
|
23 |
|
24 |
[space demo](https://huggingface.co/spaces/iknow-lab/azou)에서 모델을 직접 사용해보세요!<br/>
|
25 |
base model: [klue/roberta-large](https://huggingface.co/klue/roberta-large)
|
26 |
|
27 |
+
## Developers
|
28 |
+
- 김희규([email protected])
|
29 |
+
- 박성호([email protected])
|
30 |
+
- 육세현([email protected])
|
31 |
+
- 김효진([email protected])
|
32 |
+
|
33 |
+
# Benchmark
|
34 |
+
### 제로샷 분류 성능
|
35 |
+
|task|azou|GPT-3.5-turbo|
|
36 |
+
|---|---|---|
|
37 |
+
|aihub_complaints_topic|0.3284|0.15|
|
38 |
+
|aihub_dialog_topic|0.428|0.32|
|
39 |
+
|ko_relation_fields|0.403|0.381|
|
40 |
+
|Average|<b>0.3865</b>|0.2837|
|
41 |
+
|
42 |
+
- GPT 3.5-turbo의 경우, 비용 문제로 aihub_complaints_topic는 1300개, aihub_dialog_topic와 ko_relation_fields는 1000개만 평가했습니다.
|
43 |
+
- aihub_complaints_topic: AIHub [민원 업무 자동화 인공지능 언어 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=619) - 16개 카테고리 class 분류
|
44 |
+
- aihub_dialog_topic: AIHub [한국어 대화 요약](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=117)의 10개 주제 class 분류
|
45 |
+
- ko_relation_fields: AIHub [한국어 지식기반 관계 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71633) 의 13개 주제 및 분야 분류
|
46 |
+
|
47 |
+
### 파인튜닝 성능
|
48 |
+
|task|accuracy|
|
49 |
+
|---|---|
|
50 |
+
|nsmc|0.8742|
|
51 |
+
|apeach|0.8326|
|
52 |
+
|klue-ynat|0.8208|
|
53 |
+
|kobest-boolq|0.896|
|
54 |
+
|kobest-copa|0.709|
|
55 |
+
|kobest-hellaswag|0.764|
|
56 |
+
|kobest-sentineg|0.9219|
|
57 |
+
|kobest-wic|0.7984|
|
58 |
|
59 |
+
### CSATQA
|
60 |
+
|task|accuracy|GPT-3.5-w-token|
|
61 |
+
|---|---|---|
|
62 |
+
|csatqa-GR|0.24|0.16|
|
63 |
+
|csatqa-LI|0.2432|0.3514|
|
64 |
+
|csatqa-RCH|0.2571|0.4286|
|
65 |
+
|csatqa-RCS|0.2162|0.1892|
|
66 |
+
|csatqa-RCSS|0.3095|0.3571|
|
67 |
+
|csatqa-WR|0.0909|0.0909|
|
68 |
+
|Average| 0.2261 | 0.2629 |
|
69 |
+
|
70 |
+
* GPT 3.5의 성능은 [CSATQA 데이터셋](https://huggingface.co/datasets/HAERAE-HUB/csatqa)의 README에서 가져왔습니다.
|
71 |
+
|
72 |
# 사용 예시
|
73 |
```
|
74 |
# Load model directly
|
|
|
88 |
|
89 |
inference(
|
90 |
"문장을 감성분류해주세요",
|
91 |
+
"아 영화 노잼",
|
92 |
["긍정적", "부정적"]
|
93 |
)
|
94 |
|
|
|
109 |
|
110 |
```
|
111 |
|
112 |
+
## Citation
|
113 |
+
```
|
114 |
+
@misc {azou2023,
|
115 |
+
url={https://huggingface.co/iknow-lab/azou/},
|
116 |
+
title={AZOU: GPT 3.5보다 뛰어난 제로샷 분류 성능을 가진 한국어 모델},
|
117 |
+
author={Kim, Heegyu and Park, Sungho and Yuk, Sehyun and Kim, Hyojin},
|
118 |
+
year={2023},
|
119 |
+
month={Nov}
|
120 |
+
}
|
121 |
+
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|