audio_llm - a sam2ai Collection

sam2ai 's Collections

llm

erase_image_add_image

segment_anything

Llm_long_context

Text_trajectory_videogen

NerF

MM_LLM

Moe

Recsys

tinygpt

audio_llm

updated Sep 9, 2023

LLaSM: Large Language and Speech Model

Paper • 2308.15930 • Published Aug 30, 2023 • 30
SpeechX: Neural Codec Language Model as a Versatile Speech Transformer

Paper • 2308.06873 • Published Aug 14, 2023 • 25
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining

Paper • 2308.05734 • Published Aug 10, 2023 • 36
JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion Models

Paper • 2308.04729 • Published Aug 9, 2023 • 31
WavJourney: Compositional Audio Creation with Large Language Models

Paper • 2307.14335 • Published Jul 26, 2023 • 43