import gradio as gr
from openai import OpenAI
import os


client = OpenAI(
    base_url="https://integrate.api.nvidia.com/v1",
    api_key=os.getenv('API_KEY')
)

def generate_response(message, history):
    history_openai_format = []
    for human, assistant in history:
        history_openai_format.append({"role": "user", "content": human})
        history_openai_format.append({"role": "assistant", "content": assistant})
    history_openai_format.append({"role": "user", "content": message})

    completion = client.chat.completions.create(
        model="nvidia/nemotron-4-340b-instruct",
        messages=history_openai_format,
        temperature=0.2,
        top_p=0.7,
        max_tokens=1024,
        stream=True
    )
    
    response = ""
    for chunk in completion:
        if chunk.choices[0].delta.content is not None:
            response += chunk.choices[0].delta.content
            yield response

iface = gr.ChatInterface(
    generate_response,
    title="NVIDIA Nemotron-4 Sohbet Arayüzü",
    description="Bir soru girin ve NVIDIA'nın Nemotron-4 modeli tarafından üretilen yanıtı alın. Sohbet geçmişi korunacaktır.",
    examples=[
        "GPU hesaplamanın harikalarıyla ilgili bir limerick yazabilir misin?",
        "Yapay zeka ve etik arasındaki ilişkiyi açıklayabilir misin?",
        "Kuantum bilgisayarların geleceği hakkında ne düşünüyorsun?"
    ],
    cache_examples=False
)

iface.launch()