Bhimraj Yadav's picture

5 94 2

Bhimraj Yadav

bhimrazy

·

https://bhimraj.com.np

AI & ML interests

Computer Vision, Healthcare, Generative AI and NLP

Recent Activity

upvoted a paper about 15 hours ago

upvoted a paper about 15 hours ago

upvoted a paper about 15 hours ago

Organizations

bhimrazy's activity

upvoted 4 papers about 15 hours ago

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

Paper • 2411.10958 • Published 5 days ago • 36

SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory

Paper • 2411.11922 • Published 4 days ago • 12

LLaVA-o1: Let Vision Language Models Reason Step-by-Step

Paper • 2411.10440 • Published 6 days ago • 89

SlimLM: An Efficient Small Language Model for On-Device Document Assistance

Paper • 2411.09944 • Published 7 days ago • 12

upvoted 2 papers 1 day ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published 3 days ago • 39

ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements

Paper • 2411.12044 • Published 3 days ago • 12

upvoted a paper 4 days ago

ClinicalBench: Can LLMs Beat Traditional ML Models in Clinical Prediction?

Paper • 2411.06469 • Published 12 days ago • 17

upvoted a paper 9 days ago

Autoregressive Models in Vision: A Survey

Paper • 2411.05902 • Published 13 days ago • 13

upvoted 2 papers 10 days ago

Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

Paper • 2411.07126 • Published 10 days ago • 28

LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation

Paper • 2411.04997 • Published 14 days ago • 34

upvoted a paper 16 days ago

Personalization of Large Language Models: A Survey

Paper • 2411.00027 • Published 24 days ago • 31

upvoted a paper 23 days ago

GPT-4o System Card

Paper • 2410.21276 • Published 27 days ago • 79

upvoted 2 papers 26 days ago

MedINST: Meta Dataset of Biomedical Instructions

Paper • 2410.13458 • Published Oct 17 • 6

LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding

Paper • 2410.17434 • Published about 1 month ago • 24

upvoted 6 papers 29 days ago

Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception

Paper • 2410.12788 • Published Oct 16 • 21

Baichuan Alignment Technical Report

Paper • 2410.14940 • Published Oct 19 • 48

AutoTrain: No-code training for state-of-the-art models

Paper • 2410.15735 • Published Oct 21 • 57

SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Paper • 2410.16268 • Published Oct 21 • 65

Improve Vision Language Model Chain-of-thought Reasoning

Paper • 2410.16198 • Published Oct 21 • 17

LLM-based Optimization of Compound AI Systems: A Survey

Paper • 2410.16392 • Published Oct 21 • 13