Spaces:

bardsai
/

performance-llm-board

Running

App Files Files Community

performance-llm-board / data /2024-01-26 16:16:56.390177_model_costs.csv

piotr-szleg-bards-ai's picture

piotr-szleg-bards-ai

2024-01-26 16:45:03 Publish script update

40be773 10 months ago

1.41 kB

	model,provider,provider_pricing,cost_per_token
	gpt-3.5-turbo,OpenAI,"$1.00 / 1M input tokens, $2.00 / 1M output tokens","$1.00 / 1M input tokens, $2.00 / 1M output tokens"
	gpt-4-turbo,OpenAI,"$10.00 / 1M input tokens, $30.00 / 1M output tokens","$10.00 / 1M input tokens, $30.00 / 1M output tokens"
	gpt-4,OpenAI,"$30.00 / 1M input tokens, $60.00 / 1M output tokens","$30.00 / 1M input tokens, $60.00 / 1M output tokens"
	gpt-3.5-turbo,OpenAI,"$1.00 / 1M input tokens, $2.00 / 1M output tokens","$1.00 / 1M input tokens, $2.00 / 1M output tokens"
	llama-2-70b-chat,Together AI,$0.20 / 1M tokens,$0.20 / 1M tokens
	Mixtral-8x7B-Instruct-v0.1,Together AI,$0.90 / 1M tokens,$0.90 / 1M tokens
	zephyr-7b-beta,Hugging Face Inference Endpoint,$1.30 / hour,$0.00 / 1M tokens
	Mistral-7B-Instruct-v0.2,Hugging Face Inference Endpoint,$1.30 / hour,$0.00 / 1M tokens
	TinyLlama/TinyLlama-1.1B-Chat-v1.0,Hugging Face Inference Endpoint,$0.60 / hour,$0.00 / 1M tokens
	gemini-pro,Google VertexAI,"$0.25 / 1M input characters, $0.5 / 1M output characters (60 queries per minute are free)","$0.25 / 1M input tokens, $0.50 / 1M output tokens"
	chat-bison (PaLM 2),Google VertexAI,"$0.25 / 1M input tokens, $0.50 / 1M output tokens","$0.25 / 1M input tokens, $0.50 / 1M output tokens"
	chat-bison-32k (PaLM 2 32K),Google VertexAI,"$0.25 / 1M input tokens, $0.50 / 1M output tokens","$0.25 / 1M input tokens, $0.50 / 1M output tokens"