Update README.md

6431de7 verified 9 months ago

6.78 kB

	---
	license: other
	library_name: peft
	tags:
	- trl
	- sft
	- generated_from_trainer
	datasets:
	- generator
	base_model: google/gemma-7b-it
	model-index:
	- name: gemma-7b-it-summarization-sft-qlora
	results: []
	---

	# gemma-7b-it-summarization-sft-qlora

	This model is a fine-tuned version of [google/gemma-7b-it](https://huggingface.co/google/gemma-7b-it) on the generator dataset.


	## Model Details
	### Base Model
	- https://huggingface.co/google/gemma-7b-it

	### Model Description
	- Korean summarization finetune model based on gemma-7b-it model

	- Finetuned by: [Kang Seok Ju]
	- Contact: [[email protected]]

	### Dataset
	- https://huggingface.co/datasets/brildev7/new_summary_by_gpt4

	### Framework versions

	- PEFT 0.8.2
	- Transformers 4.38.0
	- Pytorch 2.2.1+cu121
	- Datasets 2.17.0
	- Tokenizers 0.15.2

	### Inference Examples
	```
	import torch
	from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

	model_id = "brildev7/gemma-7b-it-finetune-summarization-ko-sft-qlora"
	quantization_config = BitsAndBytesConfig(
	load_in_4bit=True,
	bnb_4bit_compute_dtype=torch.float16,
	bnb_4bit_quant_type="nf4"
	)

	model = AutoModelForCausalLM.from_pretrained(
	model_id,
	device_map="auto",
	quantization_config=quantization_config,
	torch_dtype=torch.float16,
	)

	tokenizer = AutoTokenizer.from_pretrained(model_id)
	tokenizer.pad_token_id = tokenizer.eos_token_id
	tokenizer.padding_side = 'right'


	passage = "AP·AFP 통신 등 외신은 아시아 최고 부자로 꼽히는 인도의 무케시 암바니 릴라이언스 인더스트리 회장이 막내아들의 초호화 결혼식을 준비하면서 전세계 억만장자와 할리우드 스타 등 유명 인사들을 대거 초대했다고 2일(현지시간) 보도했다. 이에 따르면 그의 28세 아들인 아난트 암바니는 오는 7월 인도 서부 구자라트주 잠나가르에서 오랜 연인인 라디카 머천트와 결혼할 예정이다. 머천트는 인도 제약회사 앙코르 헬스케어의 최고경영자(CEO) 바이렌 머천트의 딸이다. 사흘간 진행될 두 사람의 결혼식엔 마크 저커버그 메타 CEO, 빌 게이츠 마이크로소프트(MS) 창업자, 순다르 피차이 구글 CEO, 도널드 트럼프 전 미국 대통령의 딸 이방카 트럼프 등 1200명의 유명 인사들이 참석할 예정이다. 또 팝스타 리한나와 마술사 데이비드 블레인 등의 공연도 열릴 예정이다. 인디아 투데이는 리한나가 이 행사 출연료로 900만 달러(약 120억 원)를 제안받았다고 보도했다. 지난 6일 서울김포비즈니스항공센터를 통해 아랍메미리트연합(UAE)으로 출국하고 있는 이재용 삼성전자 회장. 뉴시스 이번 결혼식에 참석하는 하객들은 정글을 테마로 한 의상을 입고 아난트 암바니가 운영하는 동물 구조 센터를 방문한다. ‘숲의 별’이라는 뜻의 ‘반타라’로 알려진 이곳은 면적만 여의도의 4배 규모인 12㎢에 달하며 코끼리 등 각종 멸종 위기에 있는 동물들이 서식한다. 또 매일 초호화 파티가 열리며 그때마다 새로운 드레스 코드에 맞춰 옷을 입어야 한다. 이번 결혼식을 위해 암바니는 힌두교 사원 단지를 새로 건설 중이며, 결혼식 파티에만 2500여 개의 음식이 제공될 예정이다. 암바니는 2018년과 2019년에도 각각 딸과 아들을 결혼시키면서 초호화 파티를 열어 전 세계의 이목을 집중시켰다. 2018년 12월에 열린 딸 이샤 암바니의 결혼식 축하연에는 힐러리 클린턴 전 미국 국무장관과 이재용 삼성전자 회장, 언론 재벌 루퍼트 머독의 차남 제임스 머독 등이 참석했고, 축하 공연은 팝스타 비욘세가 맡았다. 암바니 회장은 이 결혼식에만 1억 달러(약 1336억 원)를 사용한 것으로 전해졌다. 2019년 장남 아카시 암바니의 결혼식에도 토니 블레어 전 영국 총리를 비롯해 순다르 피차이와 반기문 전 유엔사무총장 등이 참석했다. 이재용 회장은 이 때 인도 전통 의상을 입고 참석한 사진이 공개돼 화제가 되기도 했다. 암바니 회장은 석유와 가스, 석유화학 분야에서 성공해 많은 돈을 모았고 2016년 릴라이언스 지오를 앞세워 인도 통신 시장에도 진출, 인도 시장을 사실상 평정하면서 아시아 최고 갑부 대열에 올라섰다. 그가 소유한 인도 뭄바이의 27층짜리 저택 ‘안탈리아’는 세계에서 가장 비싼 개인 주택으로 꼽힌다."
	text = f"문장: {passage}\n요약 :"
	device = "cuda"
	inputs = tokenizer(text, return_tensors="pt").to(device)
	outputs = model.generate(**inputs,
	max_new_tokens=512,
	temperature=1,
	use_cache=False)
	print(tokenizer.decode(outputs[0], skip_special_tokens=True))
	"인도의 부자 무케시 암바니 회장이 자신의 28세 아들 아난트 암바니의 결혼식을 준비하며, 전세계 억만장자와 할리우드 스타 등 유명 인사들을 초대해 마크 저커버그, 빌 게이츠, 순다르 피차이, 도널드 트럼프 딸 이방카 트럼프 등이 참석할 예정임."


	passage = "국민의힘 장일 전 서울 노원을 당협위원장이 2일 공천 탈락에 반발해 여의도 당사 앞에서 분신을 시도 중인 것으로 알려졌다. 현재 경찰과 대치 상태다. 장 전 위원장은 이날 오후 당사 앞에서 휘발유로 추정되는 액체를 몸에 뿌린 뒤 오른손에 라이터를 들고 경찰과 대치 중이다. 앞서 국민의힘은 이날 노원갑에서 김광수 전 서울시 의원, 김선규 한국사이버보안협회 회장, 현경병 전 서울시장 비서실장의 3자 경선 방침을 발표했다. 노원을에는 김준호 전 서울대 국가재정연구센터 연구원이 우선 추천됐다. 장 전 위원장은 노원갑 공천을 신청했으나 경선 명단과 우선 공천 명단에 포함되지 않았다."
	text = f"문장: {passage}\n요약: "
	device = "cuda"
	inputs = tokenizer(text, return_tensors="pt").to(device)
	outputs = model.generate(**inputs,
	max_new_tokens=1024,
	temperature=1,
	use_cache=False)
	print(tokenizer.decode(outputs[0], skip_special_tokens=True))
	"2일 경찰과 대치 중인 장일 전 서울 노원 당협위원장이 국민의힘의 노원갑 경선 방침 발표와 김준호 전 서울대 국가재정연구센터 연구원의 우선 추천 지정으로 공천 탈락이 예상되는 가운데, 자신을 위해 여의도 당사 앞에서 분신을 시도하고 있다."
	```