--- language: - en tags: - gguf - llama.cpp - tiny - tinyllama --- # TinyLlama-1.1B-Chat-v1.0 ![Image](image.png) ## Requisitos Para usar este modelo, necesitas tener instalado llama.cpp en tu equipo. Puedes obtener llama.cpp desde el siguiente repositorio: - [Repositorio de llama.cpp](https://github.com/ggerganov/llama.cpp) Para instalar llama.cpp, sigue estos pasos: ```bash git clone https://github.com/ggerganov/llama.cpp cd llama.cpp make ``` ## Uso del modelo La plantilla del modelo es la siguiente: ```plaintext <|system|>\nAnswer user questions\n<|user|>\n{prompt}\n<|assistant|> ``` Puedes utilizar el modelo en llama.cpp con el siguiente comando: ```bash ./main -m ggml-model-Q8_0.gguf -p "<|system|>\nAnswer user questions\n<|user|>\nHi\n<|assistant|>" --log-disable ``` LM Studio config-presets Filename:tinyllamachat.preset.json ```json { "name": "TinyLlama Chat", "inference_params": { "input_prefix": "<|user|>\n", "input_suffix": "\n<|assistant|>\n", "antiprompt": [ "<|user|>\n", "\n<|assistant|>\n" ], "pre_prompt": "<|system|>\nAnswer user questions", "pre_prompt_prefix": "", "pre_prompt_suffix": "" }, "load_params": { "rope_freq_scale": 0, "rope_freq_base": 0 } } ``` ## Referencias - [Repositorio original](https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0) - [Repositorio de llama.cpp](https://github.com/ggerganov/llama.cpp)