darren's picture

3 9 75

darren

computerdarren

·

https://darren.computer

AI & ML interests

biotech, healthcare, poetry

Organizations

computerdarren's activity

upvoted a collection 8 months ago

OpenCulture

A multilingual dataset of public domain books and newspapers. • 27 items • Updated 18 days ago • 117

upvoted 2 papers 10 months ago

Grandmaster-Level Chess Without Search

Paper • 2402.04494 • Published Feb 7 • 67

Scavenging Hyena: Distilling Transformers into Long Convolution Models

Paper • 2401.17574 • Published Jan 31 • 15

upvoted a paper 11 months ago

Weight subcloning: direct initialization of transformers using larger pretrained ones

Paper • 2312.09299 • Published Dec 14, 2023 • 17

upvoted 2 papers about 1 year ago

Sparse Finetuning for Inference Acceleration of Large Language Models

Paper • 2310.06927 • Published Oct 10, 2023 • 14

Frustratingly Simple Memory Efficiency for Pre-trained Language Models via Dynamic Embedding Pruning

Paper • 2309.08708 • Published Sep 15, 2023 • 3

upvoted 2 collections about 1 year ago

Pruning

178 items • Updated Sep 23 • 8

Performance LLMs - Fine tuned

27 items • Updated Jun 6 • 3

upvoted a paper about 1 year ago

DebateSum: A large-scale argument mining and summarization dataset

Paper • 2011.07251 • Published Nov 14, 2020 • 2