contract-review

Sleeping

App Files Files Community

contract-review / app.py

TensoraCO

Duplicate from os1187/contract-review

29e3c9e over 1 year ago

raw

history blame contribute delete

3.51 kB

	import streamlit as st
	from predict import run_prediction
	from io import StringIO
	import json

	st.set_page_config(layout="wide")
	st.cache(show_spinner=False, persist=True)


	def load_questions():
	questions = []
	with open('data/questions.txt') as f:
	questions = f.readlines()

	# questions = []
	# for i, q in enumerate(data['data'][0]['paragraphs'][0]['qas']):
	# question = data['data'][0]['paragraphs'][0]['qas'][i]['question']
	# questions.append(question)
	return questions


	def load_questions_short():
	questions_short = []
	with open('data/questions_short.txt') as f:
	questions_short = f.readlines()

	# questions = []
	# for i, q in enumerate(data['data'][0]['paragraphs'][0]['qas']):
	# question = data['data'][0]['paragraphs'][0]['qas'][i]['question']
	# questions.append(question)
	return questions_short


	st.cache(show_spinner=False, persist=True)


	def load_contracts():
	with open('data/test.json') as json_file:
	data = json.load(json_file)

	contracts = []
	for i, q in enumerate(data['data']):
	contract = ' '.join(data['data'][i]['paragraphs'][0]['context'].split())
	contracts.append(contract)
	return contracts


	questions = load_questions()
	questions_short = load_questions_short()
	# contracts = load_contracts()


	st.sidebar.header("Contract Selection")

	# select contract
	contracts_drop = ['Contract 1', 'Contract 2', 'Contract 3']
	contracts_files = ['contract-1.txt', 'contract-2.txt', 'contract-3.txt']
	contract = st.sidebar.selectbox('Please Select a Contract', contracts_drop)


	idx = contracts_drop.index(contract)
	with open('data/'+contracts_files[idx]) as f:
	contract_data = f.read()

	# upload contract
	#user_upload = st.sidebar.file_uploader('Please upload your own', type=['txt'],
	# accept_multiple_files=False)



	results_drop = ['1', '2', '3']
	number_results = st.sidebar.selectbox('Select number of results', results_drop)

	### DEFINE MAIN PAGE
	st.header("Legal Contract Review Demo")
	st.write("This demo uses the CUAD dataset for Contract Understanding.")

	paragraph = st.text_area(label="Contract", value=contract_data, height=300)

	questions_drop = questions_short
	question_short = st.selectbox('Choose one of the 41 queries from the CUAD dataset:', questions_drop)
	idxq = questions_drop.index(question_short)
	question = questions[idxq]

	if st.button('Analyze'):
	if (not len(paragraph)==0) and not (len(question)==0):
	print('getting predictions')
	with st.spinner(text='Analysis in progress...'):
	predictions = run_prediction([question], paragraph, 'marshmellow77/roberta-base-cuad',
	n_best_size=5)
	answer = ""
	if predictions['0'] == "":
	answer = 'No answer found in document'
	else:
	# if number_results == '1':
	# answer = f"Answer: {predictions['0']}"
	# # st.text_area(label="Answer", value=f"{answer}")
	# else:
	answer = ""
	with open("nbest.json") as jf:
	data = json.load(jf)
	for i in range(int(number_results)):
	answer += f"Answer {i+1}: {data['0'][i]['text']} -- \n"
	answer += f"Probability: {round(data['0'][i]['probability']*100,1)}%\n\n"
	st.success(answer)

	else:
	st.write("Unable to call model, please select question and contract")