Edit model card

bertopic_beta

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Alprocco/bertopic_beta")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 33
  • Number of training documents: 552048
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 швейцарии - 00 - добрый - подскажите - спасибо 104 -1_швейцарии_00_добрый_подскажите
0 подскажите - добрый - спасибо - здравствуйте - доброго 262869 0_подскажите_добрый_спасибо_здравствуйте
1 нужен - купить - добрый - девочки - доброго 280586 1_нужен_купить_добрый_девочки
2 обратиться - сказали - стоит - делать - документы 1264 2_обратиться_сказали_стоит_делать
3 сайте - ch - адрес - информация - напишите 762 3_сайте_ch_адрес_информация
4 новый - сказали - месяца - дней - времени 596 4_новый_сказали_месяца_дней
5 деньги - вместе - писали - 100 - людей 583 5_деньги_вместе_писали_100
6 сайте - ch - купить - онлайн - смотрите 476 6_сайте_ch_купить_онлайн
7 купити - стоит - личку - привіт - знає 410 7_купити_стоит_личку_привіт
8 посмотрите - дешевле - купить - вариант - сайте 377 8_посмотрите_дешевле_купить_вариант
9 новый - 12 - франков - личку - привет 305 9_новый_12_франков_личку
10 интересно - купить - франков - пишите - 50 300 10_интересно_купить_франков_пишите
11 карту - нужна - онлайн - доброго - год 289 11_карту_нужна_онлайн_доброго
12 группе - чате - поводу - выше - типа 288 12_группе_чате_поводу_выше
13 дело - вопрос - жизни - дают - сожалению 271 13_дело_вопрос_жизни_дают
14 посмотреть - плюс - первый - купить - вечер 217 14_посмотреть_плюс_первый_купить
15 нужна - можливо - разные - доброго - думаю 189 15_нужна_можливо_разные_доброго
16 новый - дали - номер - делать - карту 183 16_новый_дали_номер_делать
17 месяца - купить - купити - покупать - фр 168 17_месяца_купить_купити_покупать
18 купити - купить - підкажіть - 00 - можливо 149 18_купити_купить_підкажіть_00
19 места - 00 - 18 - 10 - человека 144 19_места_00_18_10
20 внимание - видела - жизни - типа - знаю 142 20_внимание_видела_жизни_типа
21 карту - деньги - дней - бесплатно - типа 138 21_карту_деньги_дней_бесплатно
22 знать - разные - написано - смотрите - нашла 138 22_знать_разные_написано_смотрите
23 нужны - обязательно - швейцарии - 12 - года 136 23_нужны_обязательно_швейцарии_12
24 адрес - дешевле - стоит - сделать - искать 132 24_адрес_дешевле_стоит_сделать
25 номер - карту - деньги - приват - нужен 128 25_номер_карту_деньги_приват
26 людей - детей - помощь - насколько - дают 126 26_людей_детей_помощь_насколько
27 дешевле - купити - купить - посмотрите - вчера 125 27_дешевле_купити_купить_посмотрите
28 возле - кантон - адрес - найти - прошу 118 28_возле_кантон_адрес_найти
29 получить - типа - купить - подскажите - знает 114 29_получить_типа_купить_подскажите
30 времени - спасибо - - - 114 30_времени_спасибо__
31 кантон - месте - сожалению - говорят - написано 107 31_кантон_месте_сожалению_говорят

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: auto
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True

Framework versions

  • Numpy: 1.21.5
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.4
  • Pandas: 1.2.5
  • Scikit-Learn: 1.3.0
  • Sentence-transformers: 2.2.2
  • Transformers: 4.33.2
  • Numba: 0.55.1
  • Plotly: 5.9.0
  • Python: 3.9.13
Downloads last month
2
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.