dkapt (Dimitrios Kapetanios)

upvoted an article 2 days ago

Article

Document Similarity Search with ColPali

By

•

11 days ago

• 36

upvoted a collection 2 days ago

Qwen2-VL

Collection

Vision-language model series based on Qwen2 • 15 items • Updated 14 days ago • 129

upvoted a paper 6 days ago

Flamingo: a Visual Language Model for Few-Shot Learning

Paper • 2204.14198 • Published Apr 29, 2022 • 14

upvoted an article 6 days ago

Article

Introducing IDEFICS: An Open Reproduction of State-of-the-art Visual Language Model

Aug 22, 2023

• 26

upvoted a paper 9 days ago

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27 • 41

upvoted a collection 2 months ago

Llama 3.1

Collection

This collection hosts the transformers and original repos of the Llama 3.1, Llama Guard 3 and Prompt Guard models • 11 items • Updated 7 days ago • 585

upvoted 4 articles 5 months ago

Article

Multimodal Augmentation for Documents: Recovering “Comprehension” in “Reading and Comprehension” task

By

•

May 16

• 17

Article

Vision Language Models Explained

Apr 11

• 183

Article

A Dive into Pretraining Strategies for Vision-Language Models

Feb 3, 2023

• 35

Article

PaliGemma – Google's Cutting-Edge Open Vision Language Model

May 14

• 200

upvoted a paper 7 months ago

Evaluating Frontier Models for Dangerous Capabilities

Paper • 2403.13793 • Published Mar 20 • 7

Dimitrios Kapetanios

AI & ML interests

Organizations

dkapt's activity

Document Similarity Search with ColPali

Qwen2-VL

Flamingo: a Visual Language Model for Few-Shot Learning

Introducing IDEFICS: An Open Reproduction of State-of-the-art Visual Language Model

ColPali: Efficient Document Retrieval with Vision Language Models

Llama 3.1

Multimodal Augmentation for Documents: Recovering “Comprehension” in “Reading and Comprehension” task

Vision Language Models Explained

A Dive into Pretraining Strategies for Vision-Language Models

PaliGemma – Google's Cutting-Edge Open Vision Language Model

Evaluating Frontier Models for Dangerous Capabilities