koboldcpp_cpu

Sleeping

koboldcpp_cpu / Dockerfile

Better clone-ability

a1992ae about 1 year ago

574 Bytes

	FROM nvidia/cuda:11.8.0-devel-ubuntu22.04
	ARG MODEL
	ARG MODEL_NAME
	RUN mkdir /opt/koboldcpp
	RUN apt update && apt install git build-essential libopenblas-dev wget python3-pip -y
	RUN git clone https://github.com/lostruins/koboldcpp /opt/koboldcpp
	WORKDIR /opt/koboldcpp
	RUN make LLAMA_OPENBLAS=1 LLAMA_CUBLAS=1 LLAMA_PORTABLE=1
	RUN wget -O model.ggml $MODEL
	CMD ["/bin/python3", "./koboldcpp.py", "--model", "model.ggml", "--usecublas", "mmq", "--gpulayers", "99", "--multiuser", "--contextsize", "4096", "--port", "7860", "--hordeconfig", "HF_SPACE_$MODEL_NAME", "1", "1"]