Abhi Venigalla's picture

52

Abhi Venigalla

abhi-mosaic

AI & ML interests

None yet

Organizations

None yet

abhi-mosaic's activity

New activity in mosaicml/mpt-30b-instruct over 1 year ago

minor prose tweaks

#1 opened over 1 year ago by

New activity in mosaicml/mpt-30b over 1 year ago

prose tweaks

#2 opened over 1 year ago by

New activity in mosaicml/mpt-7b-chat over 1 year ago

there are something wrong when the latest code generate longer text

#19 opened over 1 year ago by

New activity in mosaicml/mpt-7b over 1 year ago

MPT-7b on colab - RAM of GPU not used

#50 opened over 1 year ago by

Pad_token_id of MPT-7B

#49 opened over 1 year ago by

Running on single Nvidia K80 GPU with large context to generate long output

#29 opened over 1 year ago by

Speed on CPU

#8 opened over 1 year ago by

H100 TransformerEngine

#14 opened over 1 year ago by

Using `self.transformer.wte.weight` directly for LM head breaks HF accelerate device map auto infer on multi-gpu

#46 opened over 1 year ago by

Create requirements.txt

#22 opened over 1 year ago by

New activity in mosaicml/mpt-7b-instruct over 1 year ago

configuration / penalty to lower repetition?

#32 opened over 1 year ago by

How much GPU memory is needed to finetune MPT-7B Instruct model?

#31 opened over 1 year ago by

Provide fine-tuning example notebook using hf transformers

#22 opened over 1 year ago by

GPU Memory / RAM requierements

#19 opened over 1 year ago by

Help Needed!! Text Generation Taking Too Long

#17 opened over 1 year ago by

Error in Triton implementation

#9 opened over 1 year ago by

Error in Installation Setup

#24 opened over 1 year ago by

KeyError in triton implementation

#25 opened over 1 year ago by

8bit and sharded weights

#37 opened over 1 year ago by

ValueError: MPTForCausalLM does not support `device_map='auto'` yet.

#38 opened over 1 year ago by