BEEspoke Data

community

https://www.bees.org/

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Organization Card

Community About org cards

🐝📊💁

Collections 7

spaces 1

pinned

Sleeping

🐝

BeeCoder Demo

models 52

datasets 71

BEE-spoke-data/TxT360-5M-sample-en

Viewer • Updated Oct 11 • 10M • 182 • 2

BEE-spoke-data/TxT360-500k-sample-no_cc

Viewer • Updated Oct 11 • 500k • 34

BEE-spoke-data/TxT360-1M-sample

Viewer • Updated Oct 10 • 1M • 118

BEE-spoke-data/survivorslib-law-books

Viewer • Updated Oct 8 • 49 • 55

BEE-spoke-data/roastme-filtered

Viewer • Updated Oct 8 • 78.8k • 57

BEE-spoke-data/taskweb

Viewer • Updated Oct 5 • 1.05M • 34

BEE-spoke-data/FLAN-compressed-plusplus

Viewer • Updated Oct 2 • 124M • 223 • 1

BEE-spoke-data/FLAN-compressed

Viewer • Updated Sep 27 • 338M • 59 • 1

BEE-spoke-data/synthsumm-comparisons

Viewer • Updated Sep 22 • 4.67k • 31

BEE-spoke-data/fineweb-cinema-100k

Viewer • Updated Sep 22 • 100k • 35

BEEspoke Data

AI & ML interests

Collections 7

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 52

BEE-spoke-data/pegasus-x-base-synthsumm_open-16k

BEE-spoke-data/tFINE-680m-e32-d16-gqa-flan

BEE-spoke-data/tFINE-680m-e32-d16-infinity_instruct-L2

BEE-spoke-data/tFINE-900m-e16-d32-instruct_2e

BEE-spoke-data/tFINE-900m-instruct-orpo

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/tFINE-900m-e16-d32-instruct

BEE-spoke-data/tFINE-900m-e16-d32-flan

BEE-spoke-data/slimpajama_tok-48128-BPE-forT5

BEE-spoke-data/claude-tokenizer-forT5

datasets 71

BEE-spoke-data/TxT360-5M-sample-en

BEE-spoke-data/TxT360-500k-sample-no_cc

BEE-spoke-data/TxT360-1M-sample

BEE-spoke-data/survivorslib-law-books

BEE-spoke-data/roastme-filtered

BEE-spoke-data/taskweb

BEE-spoke-data/FLAN-compressed-plusplus

BEE-spoke-data/FLAN-compressed

BEE-spoke-data/synthsumm-comparisons

BEE-spoke-data/fineweb-cinema-100k

AI & ML interests

Team members 9

Collections 7

spaces 1

BeeCoder Demo

models 52 Sort: Recently updated

datasets 71 Sort: Recently updated

models 52

datasets 71