Multi-Layer Sparse Autoencoders with Transformers

tim-lawson 's Collections

updated Oct 7

Single SAEs trained on the residual stream activation vectors from every transformer layer simultaneously (including the transformers).

Upvote

tim-lawson/mlsae-pythia-70m-deduped-x1-k32-tfm

Updated Sep 9 • 31
tim-lawson/mlsae-pythia-70m-deduped-x2-k32-tfm

Updated Sep 9 • 24
tim-lawson/mlsae-pythia-70m-deduped-x4-k32-tfm

Updated Sep 9 • 26
tim-lawson/mlsae-pythia-70m-deduped-x8-k32-tfm

Updated Sep 9 • 27
tim-lawson/mlsae-pythia-70m-deduped-x16-k32-tfm

Updated Sep 9 • 28
tim-lawson/mlsae-pythia-70m-deduped-x32-k32-tfm

Updated Sep 9 • 25
tim-lawson/mlsae-pythia-70m-deduped-x64-k32-tfm

Updated 1 day ago • 190
tim-lawson/mlsae-pythia-70m-deduped-x128-k32-tfm

Updated Sep 9 • 22
tim-lawson/mlsae-pythia-70m-deduped-x256-k32-tfm

Updated Sep 9 • 22
tim-lawson/mlsae-pythia-70m-deduped-x64-k16-tfm

Updated Sep 9 • 22
tim-lawson/mlsae-pythia-70m-deduped-x64-k64-tfm

Updated Sep 9 • 22
tim-lawson/mlsae-pythia-70m-deduped-x64-k128-tfm

Updated Sep 9 • 26
tim-lawson/mlsae-pythia-70m-deduped-x64-k256-tfm

Updated Sep 9 • 24
tim-lawson/mlsae-pythia-70m-deduped-x64-k512-tfm

Updated Sep 9 • 25
tim-lawson/mlsae-pythia-160m-deduped-x1-k32-tfm

Updated Sep 9 • 18
tim-lawson/mlsae-pythia-160m-deduped-x2-k32-tfm

Updated Sep 9 • 17
tim-lawson/mlsae-pythia-160m-deduped-x4-k32-tfm

Updated Sep 9 • 18
tim-lawson/mlsae-pythia-160m-deduped-x8-k32-tfm

Updated Sep 9 • 18
tim-lawson/mlsae-pythia-160m-deduped-x16-k32-tfm

Updated Sep 17 • 17
tim-lawson/mlsae-pythia-160m-deduped-x32-k32-tfm

Updated Sep 9 • 18
tim-lawson/mlsae-pythia-160m-deduped-x64-k32-tfm

Updated 1 day ago • 151
tim-lawson/mlsae-pythia-160m-deduped-x128-k32-tfm

Updated Oct 3 • 16
tim-lawson/mlsae-pythia-160m-deduped-x256-k32-tfm

Updated Oct 6 • 18
tim-lawson/mlsae-pythia-160m-deduped-x64-k16-tfm

Updated Sep 27 • 16
tim-lawson/mlsae-pythia-160m-deduped-x64-k64-tfm

Updated Sep 27 • 16
tim-lawson/mlsae-pythia-160m-deduped-x64-k128-tfm

Updated Sep 27 • 18
tim-lawson/mlsae-pythia-160m-deduped-x64-k256-tfm

Updated Sep 28 • 18
tim-lawson/mlsae-pythia-160m-deduped-x64-k512-tfm

Updated Oct 3 • 16
tim-lawson/mlsae-pythia-410m-deduped-x64-k32-tfm

Updated 2 days ago • 49
tim-lawson/mlsae-pythia-1b-deduped-x64-k32-tfm

Updated Sep 18 • 33

Upvote

Collection guide
Browse collections