heegyu commited on
Commit
b9a3b65
1 Parent(s): a61af1c

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +63 -34
README.md CHANGED
@@ -1,5 +1,8 @@
1
  ---
2
  license: mit
 
 
 
3
  datasets:
4
  - nsmc
5
  - skt/kobest_v1
@@ -11,16 +14,61 @@ language:
11
  - ko
12
  pipeline_tag: text-classification
13
  ---
14
- # 아주대학교 제로샷 score model
15
- `[CLS] 입력 정보 [SEP] 지시문 [SEP] 라벨 [SEP]` 형태의 텍스트를 모델에 넣으면, 모델이 세 텍스트의 관계를 파악하고 점수를 반환합니다. 점수가 높을 수록, 라벨이 지시문을 잘 따르는 결과임을 의미합니다. 다음과 같은 사례에 사용이 가능합니다.
16
 
17
- 1. 제로샷 분류(주제 분류, 혐오 분류)
18
- 2. 데이터 필터링(~에 대한 글인가요? 예/아니오)
 
 
19
 
20
  [space demo](https://huggingface.co/spaces/iknow-lab/azou)에서 모델을 직접 사용해보세요!<br/>
21
  base model: [klue/roberta-large](https://huggingface.co/klue/roberta-large)
22
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
23
 
 
 
 
 
 
 
 
 
 
 
 
 
 
24
  # 사용 예시
25
  ```
26
  # Load model directly
@@ -40,7 +88,7 @@ def inference(instruction, input, labels):
40
 
41
  inference(
42
  "문장을 감성분류해주세요",
43
- "아 영화 개노잼",
44
  ["긍정적", "부정적"]
45
  )
46
 
@@ -61,32 +109,13 @@ inference(
61
 
62
  ```
63
 
64
- 4epoch 성능
65
- |task|accuracy|
66
- |---|---|
67
- |nsmc|0.8742|
68
- |apeach|0.8326|
69
- |klue-ynat|0.8208|
70
- |kobest-boolq|0.896|
71
- |kobest-copa|0.709|
72
- |kobest-hellaswag|0.764|
73
- |kobest-sentineg|0.9219|
74
- |kobest-wic|0.7984|
75
-
76
- 4epoch 제로샷 성능
77
- |task|accuracy|
78
- |---|---|
79
- |csatqa-GR|0.24|
80
- |csatqa-LI|0.2432|
81
- |csatqa-RCH|0.2571|
82
- |csatqa-RCS|0.2162|
83
- |csatqa-RCSS|0.3095|
84
- |csatqa-WR|0.0909|
85
- |aihub_complaints_topic|0.3284|
86
- |aihub_dialog_topic|0.428|
87
- |ko_relation_fields|0.403|
88
-
89
- - aihub_complaints_topic: AIHub [민원 업무 자동화 인공지능 언어 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=619) - 16개 카테고리 class 분류
90
- - aihub_dialog_topic: AIHub [한국어 주제별 텍스트 일상대화 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=543)의 20개 주제 class 분류
91
- - ko_relation_fields: AIHub [한국어 지식기반 관계 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71633) 의 13개 주제 및 분야 분류
92
-
 
1
  ---
2
  license: mit
3
+ widget:
4
+ - text: "[CLS] 인천발 KTX와 관련한 송도역 복합환승센터가 사실상 무산, 단순 철도·버스 위주 환승시설로 만들어진다. 이 때문에 인천시의 인천발 KTX 기점에 앵커시설인 복합환승센터를 통한 인근 지역 경제 활성화를 이뤄낸다는 계획의 차질이 불가피하다. [SEP] 경제와 관련된 뉴스인가요? [SEP] 예 [SEP]"
5
+ - text: "[CLS] 인천발 KTX와 관련한 송도역 복합환승센터가 사실상 무산, 단순 철도·버스 위주 환승시설로 만들어진다. 이 때문에 인천시의 인천발 KTX 기점에 앵커시설인 복합환승센터를 통한 인근 지역 경제 활성화를 이뤄낸다는 계획의 차질이 불가피하다. [SEP] 경제에 긍정적인 뉴스인가요? [SEP] 아니요 [SEP]"
6
  datasets:
7
  - nsmc
8
  - skt/kobest_v1
 
14
  - ko
15
  pipeline_tag: text-classification
16
  ---
17
+ # AZOU: GPT 3.5보다 뛰어난 제로샷 분류 성능을 가진 한국어 모델
 
18
 
19
+ `[CLS] 입력 정보 [SEP] 지시문 [SEP] 라벨 [SEP]` 형태의 텍스트를 모델에 넣으면, 모델이 세 텍스트의 관계를 파악하고 점수를 반환합니다. 점수가 높을 수록, 라벨이 지시문을 잘 따르는 결과임을 의미합니다. 텍스트에 다음과 같은 질문을 함께 주고 평가할 수 있습니다.
20
+
21
+ 1. 제로샷 분류(주제 분류, 혐오 분류): 이 글의 주제가 뭔가요? 이 글은 혐오 표현을 포함하고 있나요?
22
+ 2. 데이터 검색 및 필터링: 이 글은 "화장품 사용법"에 대한 내용을 포함하고 있나요?
23
 
24
  [space demo](https://huggingface.co/spaces/iknow-lab/azou)에서 모델을 직접 사용해보세요!<br/>
25
  base model: [klue/roberta-large](https://huggingface.co/klue/roberta-large)
26
 
27
+ ## Developers
28
+ - 김희규([email protected])
29
+ - 박성호([email protected])
30
+ - 육세현([email protected])
31
+ - 김효진([email protected])
32
+
33
+ # Benchmark
34
+ ### 제로샷 분류 성능
35
+ |task|azou|GPT-3.5-turbo|
36
+ |---|---|---|
37
+ |aihub_complaints_topic|0.3284|0.15|
38
+ |aihub_dialog_topic|0.428|0.32|
39
+ |ko_relation_fields|0.403|0.381|
40
+ |Average|<b>0.3865</b>|0.2837|
41
+
42
+ - GPT 3.5-turbo의 경우, 비용 문제로 aihub_complaints_topic는 1300개, aihub_dialog_topic와 ko_relation_fields는 1000개만 평가했습니다.
43
+ - aihub_complaints_topic: AIHub [민원 업무 자동화 인공지능 언어 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=619) - 16개 카테고리 class 분류
44
+ - aihub_dialog_topic: AIHub [한국어 대화 요약](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=117)의 10개 주제 class 분류
45
+ - ko_relation_fields: AIHub [한국어 지식기반 관계 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71633) 의 13개 주제 및 분야 분류
46
+
47
+ ### 파인튜닝 성능
48
+ |task|accuracy|
49
+ |---|---|
50
+ |nsmc|0.8742|
51
+ |apeach|0.8326|
52
+ |klue-ynat|0.8208|
53
+ |kobest-boolq|0.896|
54
+ |kobest-copa|0.709|
55
+ |kobest-hellaswag|0.764|
56
+ |kobest-sentineg|0.9219|
57
+ |kobest-wic|0.7984|
58
 
59
+ ### CSATQA
60
+ |task|accuracy|GPT-3.5-w-token|
61
+ |---|---|---|
62
+ |csatqa-GR|0.24|0.16|
63
+ |csatqa-LI|0.2432|0.3514|
64
+ |csatqa-RCH|0.2571|0.4286|
65
+ |csatqa-RCS|0.2162|0.1892|
66
+ |csatqa-RCSS|0.3095|0.3571|
67
+ |csatqa-WR|0.0909|0.0909|
68
+ |Average| 0.2261 | 0.2629 |
69
+
70
+ * GPT 3.5의 성능은 [CSATQA 데이터셋](https://huggingface.co/datasets/HAERAE-HUB/csatqa)의 README에서 가져왔습니다.
71
+
72
  # 사용 예시
73
  ```
74
  # Load model directly
 
88
 
89
  inference(
90
  "문장을 감성분류해주세요",
91
+ "아 영화 노잼",
92
  ["긍정적", "부정적"]
93
  )
94
 
 
109
 
110
  ```
111
 
112
+ ## Citation
113
+ ```
114
+ @misc {azou2023,
115
+ url={https://huggingface.co/iknow-lab/azou/},
116
+ title={AZOU: GPT 3.5보다 뛰어난 제로샷 분류 성능을 가진 한국어 모델},
117
+ author={Kim, Heegyu and Park, Sungho and Yuk, Sehyun and Kim, Hyojin},
118
+ year={2023},
119
+ month={Nov}
120
+ }
121
+ ```