moiduy04
/

homemade_lo_vi

Text2Text Generation

Model card Files Files and versions Community

homemade_lo_vi / translate.py

moiduy04's picture

Update translate.py

5d0c765 11 months ago

history blame contribute delete

2.71 kB

	from typing import Tuple

	import torch
	from torch import Tensor

	from tokenizers import Tokenizer

	from transformer import Transformer
	from decode_method import greedy_decode, beam_search_decode

	def translate(
	model: Transformer,
	src_tokenizer: Tokenizer,
	tgt_tokenizer: Tokenizer,
	text: str,
	decode_method: str = 'greedy',
	device = torch.device('cpu')
	) -> Tuple[str, Tensor]:
	"""
	Translation function.

	Supported `decode_method`: 'greedy' or 'beam-search'

	'beam-search' doesn't give attn scores.

	Output:
	- translation (str): the translated string.
	- attn (Tensor): The decoder's attention (for visualization)
	"""
	model.eval()
	with torch.no_grad():
	sos_token = torch.tensor([src_tokenizer.token_to_id('<sos>')], dtype=torch.int64)
	eos_token = torch.tensor([src_tokenizer.token_to_id('<eos>')], dtype=torch.int64)
	pad_token = torch.tensor([src_tokenizer.token_to_id('<pad>')], dtype=torch.int64)

	encoder_input_tokens = src_tokenizer.encode(text).ids
	# <sos> + source_text + <eos> = encoder_input
	encoder_input = torch.cat(
	[
	sos_token,
	torch.tensor(encoder_input_tokens, dtype=torch.int64),
	eos_token,
	]
	)
	encoder_mask = (encoder_input != pad_token).unsqueeze(0).unsqueeze(0).unsqueeze(0).int() # (1, 1, seq_len)

	encoder_input = encoder_input.unsqueeze(0)
	# encoder_mask = torch.tensor(encoder_mask)

	assert encoder_input.size(0) == 1

	if decode_method == 'greedy':
	model_out, attn = greedy_decode(
	model, encoder_input, encoder_mask, src_tokenizer, tgt_tokenizer, 349, device,
	give_attn=True,
	)
	elif decode_method == 'beam-search':
	model_out = beam_search_decode(
	model, encoder_input, encoder_mask, src_tokenizer, tgt_tokenizer, 349, device,
	)
	attn = None # Beam search doesn't give attention score
	else:
	raise ValueError("Unsuppored decode method")

	model_out_text = tgt_tokenizer.decode(model_out.detach().cpu().numpy())
	return model_out_text, attn


	from config import load_config
	from load_model import load_model_tokenizer
	if __name__ == '__main__':
	config = load_config(file_name='/config/config_final.yaml')
	model, src_tokenizer, tgt_tokenizer = load_model_tokenizer(config)
	text = "ສະບາຍດີ" # Hello.
	translation, attn = translate(
	model, src_tokenizer, tgt_tokenizer, text,
	decode_method='beam-search',
	)
	print(translation)