--- base_model: mini1013/master_domain library_name: setfit metrics: - metric pipeline_tag: text-classification tags: - setfit - sentence-transformers - text-classification - generated_from_setfit_trainer widget: - text: 1+1 세트상품 푸쉬팝게임기 팝잇 푸시팝 뽁뽁이 게임기 스피드킹 토끼 곰돌이 우주인게임기_병아리게임기(5세대999레벨) 크앤비 - text: 굵은 모루 8mm 일반 장식줄 만들기재료 철사공예 아트 모루꽃 아트모루(10개입세트)_형광연두 아이디몬 주식회사 - text: 해리포터코스튬 풀세트 어린이 성인 남녀공용 졸사 이벤트 의상 추억 사진 후플푸프(7세트)_XXL 181-185cm 권장 here_ - text: 3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이 - text: 알꿀밤 소형 나노블럭 미니블록 5+1 YK앉은 분홍 고양이 243. CK꽃무늬 롱치마 해적 늘솔길에아람벌다 inference: true model-index: - name: SetFit with mini1013/master_domain results: - task: type: text-classification name: Text Classification dataset: name: Unknown type: unknown split: test metrics: - type: metric value: 0.9032178674706208 name: Metric --- # SetFit with mini1013/master_domain This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification. The model has been trained using an efficient few-shot learning technique that involves: 1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning. 2. Training a classification head with features from the fine-tuned Sentence Transformer. ## Model Details ### Model Description - **Model Type:** SetFit - **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance - **Maximum Sequence Length:** 512 tokens - **Number of Classes:** 14 classes ### Model Sources - **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit) - **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055) - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit) ### Model Labels | Label | Examples | |:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 5.0 |

'(LMG 택티컬) BFE 파우치 OD 대신장비샵'
'퍼프디노 그린가스 블랙 파워가스 600ml 12kg 검펍디 리버티라이프(Liberty Life)'
'아카데미과학 전동권총 데저트이글 L6 비비탄권총 자동 에어소프트건 비비탄총 09. 한국군 K5 오마이컴퍼니'

| | 4.0 |

'DJI 네오 / 납품 세금계산서 가능 주식회사 모즈인터내셔날'
'DJI Air 3 Fly More Combo (DJI RC-N2 포함) 게이트비젼(주)'
'DJI AIR 3S 에어 3S 플라이 모어 콤보 (RC2)납품 세금계산서가능 주식회사 모즈인터내셔날'

| | 10.0 |

'해적안대 가죽 할로윈용품 파티 의상소품 장식 데코 홈피스트'
'특수분장 할로윈 더마왁스상처재료 가짜피 인조피100ml BMmall'
'해적안대 가죽 할로윈 용품 파티 의상소품 데이 에스지'

| | 3.0 |

'디디샵 지우개 야광 당근 나이프 (주)라온러닝'
'반다이 정품 RG 가오가이거 선물의 목적'
'주사모형 정맥 주입 근육 훈련 팔 모델 간호사 혈액 손 모형 팔뚝 정맥 천자 재킷 싹슬'

| | 12.0 |

'소량 포스터 출력 인쇄 / 4종류 종이 / A3(420 297) 단면 아트지90g A3(420×297)_양면_스노우지 250g 킹콩카피'
'6090포스터 모음 W-3. 지구지도 포스터 한글 - 블루2 주식회사 제로퍼제로'
'천 포스터 가리개 장식 행잉 크리스마스 벽 트리 패브릭 인테리어 소품 5. 전나무 130X150 성공한 스토어'

| | 2.0 |

'비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 투명 비즈아이'
'스쿠비두 룰라끈 매듭 공예 키링 스쿠비드 1m 낱줄 운동화끈-빨강 꾀조은'
'비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 그린 비즈아이'

| | 1.0 |

'최고급 메탈 피젯 핑거 스피너 야광 무소음 연속 회전 1_01_오렌지 sf103 사찌몰'
'5초 준다 MinSellAmount 스마일배송'
'5초 준다 주식회사 보드엠'

| | 8.0 |

'빈티지 도장 스탬프 헤드 카드 봉투 청첩장 선물 포장 18.1588971 14.1588966 써니타운몰15호점'
'킵탑 자동차 유아용 보조 카시트 방석 커버 보호매트 삼촌쇼핑몰'
'오렌지오피스 스카이보람 우표 수집 앨범 리필내지 전지 우표 5단 리필 오렌지 오피스'

| | 7.0 |

'세븐틴 응원봉 SEVENTEEN OFFICIAL LIGHT STICK VER.3 (새제품) 조우코리아'
'IVE 아이브 응원봉 키링 오후세시반'
'아이브 얼빡샷 포카 포토카드 옵션선택 배디 키치홀리데이'

| | 11.0 |

'직소퍼즐 주문제작 커플 여행 기념일 선물 사진 퍼즐액자 제작 A5-(80피스)_추가안함_세로 투미투'
'짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_19.온천욕-150 예그린스페이스'
'짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_03.디비전-150 예그린스페이스'

| | 0.0 |

'봇치 더 락 록 굿즈 결속 밴드 아날로그 LP 바이닐 한정판 일본 직구 기본 다락방'
'2LP 게이트폴드 비닐 컷팅 32cm 10장 2LP 게이트폴드 비닐 컷팅 32cm 10장 포린(porin)'
'잭 브라이언 The Great American Bar Scene 바이닐 LP 앨범 음반 엘라커넥티드'

| | 13.0 |

'전문가 동전 수집 코인 케이스 보관 종이 홀더 50장 코인홀더 종이홀더 수집홀더 37mm 더비씨디'
'개업 연말 이벤트 답례 축하 선물 행운의 2달러 포함 액자 행운의2달러 액자 주식회사 투마이니'
'비트코인 기념주화 모형 장식 3종 골드 에스에이치에너지'

| | 6.0 |

'유니콘 입체 그림 인테리어 소품 액자 유니콘 그림 1번지 스토어'
'서예용품 단아미 고급서예붓18mm 화방 화방용 화선지 글로벌케이마켓'
'16절고무판(20입)문구 교재류 준비물 판화교재 남생몰'

| | 9.0 |

'파니니 NBA카드 탑클래스 KBL 농구카드 1박스 르브론제임스 스테판커리 이정현 허웅 허훈 월드스포츠카드서울신도림점'
'원피스 루피 조로 캐릭터 굿즈 트럼프카드 유캔매직샵'
'고전키티 과일키티 스트랩 오타쿠 다락방'

| ## Evaluation ### Metrics | Label | Metric | |:--------|:-------| | **all** | 0.9032 | ## Uses ### Direct Use for Inference First install the SetFit library: ```bash pip install setfit ``` Then you can load this model and run inference. ```python from setfit import SetFitModel # Download from the 🤗 Hub model = SetFitModel.from_pretrained("mini1013/master_cate_lh15") # Run inference preds = model("3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이") ``` ## Training Details ### Training Set Metrics | Training set | Min | Median | Max | |:-------------|:----|:--------|:----| | Word count | 3 | 10.9546 | 25 | | Label | Training Sample Count | |:------|:----------------------| | 0.0 | 50 | | 1.0 | 50 | | 2.0 | 50 | | 3.0 | 50 | | 4.0 | 48 | | 5.0 | 50 | | 6.0 | 38 | | 7.0 | 50 | | 8.0 | 50 | | 9.0 | 25 | | 10.0 | 50 | | 11.0 | 50 | | 12.0 | 50 | | 13.0 | 50 | ### Training Hyperparameters - batch_size: (512, 512) - num_epochs: (20, 20) - max_steps: -1 - sampling_strategy: oversampling - num_iterations: 40 - body_learning_rate: (2e-05, 2e-05) - head_learning_rate: 2e-05 - loss: CosineSimilarityLoss - distance_metric: cosine_distance - margin: 0.25 - end_to_end: False - use_amp: False - warmup_proportion: 0.1 - seed: 42 - eval_max_steps: -1 - load_best_model_at_end: False ### Training Results | Epoch | Step | Training Loss | Validation Loss | |:-------:|:----:|:-------------:|:---------------:| | 0.0096 | 1 | 0.4054 | - | | 0.4808 | 50 | 0.3432 | - | | 0.9615 | 100 | 0.2163 | - | | 1.4423 | 150 | 0.0533 | - | | 1.9231 | 200 | 0.0368 | - | | 2.4038 | 250 | 0.0235 | - | | 2.8846 | 300 | 0.0308 | - | | 3.3654 | 350 | 0.0158 | - | | 3.8462 | 400 | 0.0122 | - | | 4.3269 | 450 | 0.0117 | - | | 4.8077 | 500 | 0.0041 | - | | 5.2885 | 550 | 0.004 | - | | 5.7692 | 600 | 0.006 | - | | 6.25 | 650 | 0.0096 | - | | 6.7308 | 700 | 0.004 | - | | 7.2115 | 750 | 0.0002 | - | | 7.6923 | 800 | 0.0002 | - | | 8.1731 | 850 | 0.0001 | - | | 8.6538 | 900 | 0.0001 | - | | 9.1346 | 950 | 0.0001 | - | | 9.6154 | 1000 | 0.0001 | - | | 10.0962 | 1050 | 0.0001 | - | | 10.5769 | 1100 | 0.0001 | - | | 11.0577 | 1150 | 0.0001 | - | | 11.5385 | 1200 | 0.0 | - | | 12.0192 | 1250 | 0.0001 | - | | 12.5 | 1300 | 0.0001 | - | | 12.9808 | 1350 | 0.0001 | - | | 13.4615 | 1400 | 0.0001 | - | | 13.9423 | 1450 | 0.0 | - | | 14.4231 | 1500 | 0.0 | - | | 14.9038 | 1550 | 0.0 | - | | 15.3846 | 1600 | 0.0 | - | | 15.8654 | 1650 | 0.0 | - | | 16.3462 | 1700 | 0.0001 | - | | 16.8269 | 1750 | 0.0 | - | | 17.3077 | 1800 | 0.0 | - | | 17.7885 | 1850 | 0.0 | - | | 18.2692 | 1900 | 0.0 | - | | 18.75 | 1950 | 0.0 | - | | 19.2308 | 2000 | 0.0 | - | | 19.7115 | 2050 | 0.0001 | - | ### Framework Versions - Python: 3.10.12 - SetFit: 1.1.0.dev0 - Sentence Transformers: 3.1.1 - Transformers: 4.46.1 - PyTorch: 2.4.0+cu121 - Datasets: 2.20.0 - Tokenizers: 0.20.0 ## Citation ### BibTeX ```bibtex @article{https://doi.org/10.48550/arxiv.2209.11055, doi = {10.48550/ARXIV.2209.11055}, url = {https://arxiv.org/abs/2209.11055}, author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren}, keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences}, title = {Efficient Few-Shot Learning Without Prompts}, publisher = {arXiv}, year = {2022}, copyright = {Creative Commons Attribution 4.0 International} } ```