Yener Karaca's picture

13

Yener Karaca

Yener

·

AI & ML interests

None yet

Organizations

None yet

Yener's activity

upvoted 2 papers 7 months ago

LoRA Land: 310 Fine-tuned LLMs that Rival GPT-4, A Technical Report

Paper • 2405.00732 • Published Apr 29 • 118

What matters when building vision-language models?

Paper • 2405.02246 • Published May 3 • 100

upvoted an article 7 months ago

Article

Run the strongest open-source LLM model: Llama3 70B with just a single 4GB GPU!

By

•

Apr 21

• 43

upvoted 2 papers 9 months ago

DocGraphLM: Documental Graph Language Model for Information Extraction

Paper • 2401.02823 • Published Jan 5 • 35

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 181

upvoted 4 papers 10 months ago

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 138

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 81

Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research

Paper • 2402.00159 • Published Jan 31 • 59

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1 • 21

upvoted a collection 10 months ago

LLaVA-1.6

A collection of LLaVA-1.6 checkpoints • 4 items • Updated Jan 31 • 65

upvoted 3 papers 10 months ago

InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model

Paper • 2401.16420 • Published Jan 29 • 55

MoE-LLaVA: Mixture of Experts for Large Vision-Language Models

Paper • 2401.15947 • Published Jan 29 • 49

Improving Text Embeddings with Large Language Models

Paper • 2401.00368 • Published Dec 31, 2023 • 79