Luka Pluzynski's picture

31 42

Luka Pluzynski

lukasplu

·

AI & ML interests

Computer vision

Recent Activity

liked a Space 1 day ago

huggingface/paper-central

upvoted a paper 7 days ago

liked a model 7 days ago

allenai/Molmo-7B-D-0924

Organizations

lukasplu's activity

upvoted a paper 7 days ago

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models

Paper • 2409.17146 • Published Sep 25 • 103

upvoted 2 collections 7 days ago

Qwen2-VL

Vision-language model series based on Qwen2 • 15 items • Updated Sep 18 • 156

LLM2CLIP

LLM2CLIP makes SOTA pretrained CLIP modal more SOTA ever. • 7 items • Updated 2 days ago • 36

upvoted 3 papers 3 months ago

DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos

Paper • 2409.02095 • Published Sep 3 • 35

Task-oriented Sequential Grounding in 3D Scenes

Paper • 2408.04034 • Published Aug 7 • 8

Transformer Explainer: Interactive Learning of Text-Generative Models

Paper • 2408.04619 • Published Aug 8 • 155

upvoted a paper 4 months ago

BetterDepth: Plug-and-Play Diffusion Refiner for Zero-Shot Monocular Depth Estimation

Paper • 2407.17952 • Published Jul 25 • 29

upvoted a paper 5 months ago

Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks

Paper • 2311.06242 • Published Nov 10, 2023 • 84

upvoted a collection 5 months ago

Florence

9 items • Updated Jul 11 • 160

upvoted a paper 5 months ago

Depth Anything V2

Paper • 2406.09414 • Published Jun 13 • 92

upvoted an article 6 months ago

Article

A Dive into Pretraining Strategies for Vision-Language Models

Feb 3, 2023

• 48

upvoted 2 articles 7 months ago

Article

seemore: Implement a Vision Language Model from Scratch

By

•

Jun 23

• 65

Article

Welcome Llama 3 - Meta's new open LLM

Apr 18

• 278

upvoted a collection 7 months ago

Llama 3

8 items • Updated Apr 18 • 15

upvoted an article 7 months ago

Article

Vision Language Models Explained

Apr 11

• 214

upvoted 2 papers 8 months ago

DepthFM: Fast Monocular Depth Estimation with Flow Matching

Paper • 2403.13788 • Published Mar 20 • 17

SceneScript: Reconstructing Scenes With An Autoregressive Structured Language Model

Paper • 2403.13064 • Published Mar 19 • 31

upvoted 3 papers 10 months ago

CARFF: Conditional Auto-encoded Radiance Field for 3D Scene Forecasting

Paper • 2401.18075 • Published Jan 31 • 8

Rephrasing the Web: A Recipe for Compute and Data-Efficient Language Modeling

Paper • 2401.16380 • Published Jan 29 • 48

Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities

Paper • 2401.14405 • Published Jan 25 • 11