Melisa Aneta Russak's picture

7 12 2

Melisa Aneta Russak

melisa

·

AI & ML interests

I love definitions

Organizations

melisa's activity

upvoted a paper 8 days ago

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Paper • 2406.14491 • Published 10 days ago • 75

upvoted a paper 25 days ago

Block Transformer: Global-to-Local Language Modeling for Fast Inference

Paper • 2406.02657 • Published 26 days ago • 35

upvoted 3 papers about 1 month ago

Zamba: A Compact 7B SSM Hybrid Model

Paper • 2405.16712 • Published May 26 • 19

An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 77

Evolutionary Optimization of Model Merging Recipes

Paper • 2403.13187 • Published Mar 19 • 47

upvoted a collection about 1 month ago

Phi-3

Phi-3 family of small language and multi-modal models. Language models are available in short- and long-context lengths. • 22 items • Updated May 31 • 348

upvoted a paper about 1 month ago

LoRA Learns Less and Forgets Less

Paper • 2405.09673 • Published May 15 • 80

upvoted 2 papers 3 months ago

OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments

Paper • 2404.07972 • Published Apr 11 • 41

RecurrentGemma: Moving Past Transformers for Efficient Open Language Models

Paper • 2404.07839 • Published Apr 11 • 40

upvoted a paper 4 months ago

OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web

Paper • 2402.17553 • Published Feb 27 • 21

upvoted a paper 5 months ago

MoE-Mamba: Efficient Selective State Space Models with Mixture of Experts

Paper • 2401.04081 • Published Jan 8 • 68

upvoted a paper 12 months ago

Becoming self-instruct: introducing early stopping criteria for minimal instruct tuning

Paper • 2307.03692 • Published Jul 5, 2023 • 24