louisbrulenaudet commited on
Commit
f2bb668
1 Parent(s): 6afbfdc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +90 -20
README.md CHANGED
@@ -1,39 +1,88 @@
1
  ---
2
  library_name: transformers
3
- license: mit
4
- base_model: intfloat/multilingual-e5-small
5
  tags:
6
  - generated_from_trainer
 
 
 
 
 
 
 
 
7
  metrics:
8
  - accuracy
9
  model-index:
10
- - name: lemone-router-s
11
  results: []
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12
  ---
13
 
14
- <!-- This model card has been generated automatically according to the information the Trainer had access to. You
15
- should probably proofread and complete it, then remove this comment. -->
16
-
17
- # lemone-router-s
18
-
19
- This model is a fine-tuned version of [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) on an unknown dataset.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
20
  It achieves the following results on the evaluation set:
21
  - Loss: 0.4446
22
  - Accuracy: 0.9061
23
 
24
- ## Model description
25
-
26
- More information needed
27
-
28
- ## Intended uses & limitations
29
-
30
- More information needed
31
 
32
- ## Training and evaluation data
 
 
33
 
34
- More information needed
35
-
36
- ## Training procedure
37
 
38
  ### Training hyperparameters
39
 
@@ -57,9 +106,30 @@ The following hyperparameters were used during training:
57
  | 0.189 | 4.0 | 22468 | 0.4446 | 0.9061 |
58
 
59
 
 
 
 
 
 
60
  ### Framework versions
61
 
62
  - Transformers 4.45.2
63
  - Pytorch 2.4.1+cu121
64
  - Datasets 2.21.0
65
  - Tokenizers 0.20.1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  library_name: transformers
3
+ license: apache-2.0
4
+ base_model: intfloat/multilingual-e5-base
5
  tags:
6
  - generated_from_trainer
7
+ - sentence-transformers
8
+ - text-classification
9
+ - feature-extraction
10
+ - generated_from_trainer
11
+ - legal
12
+ - taxation
13
+ - fiscalité
14
+ - tax
15
  metrics:
16
  - accuracy
17
  model-index:
18
+ - name: lemone-router
19
  results: []
20
+ language:
21
+ - fr
22
+ pipeline_tag: text-classification
23
+ datasets:
24
+ - louisbrulenaudet/code-impots
25
+ - louisbrulenaudet/code-impots-annexe-iv
26
+ - louisbrulenaudet/code-impots-annexe-iii
27
+ - louisbrulenaudet/code-impots-annexe-i
28
+ - louisbrulenaudet/code-impots-annexe-ii
29
+ - louisbrulenaudet/livre-procedures-fiscales
30
+ - louisbrulenaudet/bofip
31
+ widget:
32
+ - text: "Quelles sont les modalités d'adoption d'un plan d'apurement échelonné par la commission chargée du recouvrement, et quelles sont les conditions qui s'imposent aux administrations et organismes chargés du recouvrement ainsi qu'au débiteur qui s'engage à le respecter ?"
33
+ example_title: "Contrôle et contentieux"
34
+ - text: "Quel régime fiscal est applicable aux opérations de crédit-bail portant sur des fonds de commerce, des fonds artisanaux, ou l'un de leurs éléments incorporels non amortissables, et quelles sont les conditions dans lesquelles les sommes correspondant à la quote-part de loyer ne constituent pas un élément du bénéfice imposable du bailleur et ne sont pas déductibles pour la détermination des résultats imposables du locataire ?"
35
+ example_title: "Bénéfices professionnels"
36
+ - text: "La succession s'ouvre par le décès dude cujus(code civil, art. 720). C'est donc le décès qui constitue le fait générateur de l'impôt. Dès lors, le tarif du droit et les règles applicables à sa liquidation sont celles en vigueur au jour du décès (en ce sens, Cass. com 7 janvier 1997 n° de pourvoi 95-11686). Toutefois, pour les legs sous condition suspensive (BOI-ENR-DMTG-10-10-10-10), les droits sont dus lors de la réalisation de la condition, d'après le régime fiscal applicable et la valeur des biens à cette époque (code général des impôts (CGI), art 676). Par ailleurs, pour les pénalités éventuellement exigibles, la loi applicable est celle en vigueur lors de la contravention. L'administration prouve le décès, en vue de la réclamation des droits, au moyen des registres de l'état civil dont les maires sont tenus de lui remettre un relevé trimestriel (LPF, art. L. 102 A). Elle peut aussi prouver la mutation par décès au moyen des présomptions légales de l'article 1881 du CGI et de l'article 1882 du CGI. Dans ce cas le fait générateur se place à la date à partir de laquelle la prise de possession est établie."
37
+ example_title: "Patrimoine et enregistrement"
38
+ - text: "Quelles sont les obligations déclaratives que les associés personnes physiques doivent respecter pour bénéficier de la réduction d'impôt accordée au titre des dépenses de restauration immobilière effectuées dans les sites patrimoniaux remarquables et les quartiers relevant de la politique de la ville, et quelles sont les pièces justificatives qui doivent être jointes à leur déclaration des revenus ?"
39
+ example_title: "Revenus particuliers"
40
  ---
41
 
42
+ <img src="assets/thumbnail.webp">
43
+
44
+ # Lemone-Router: A Series of Fine-Tuned Classification Models for French Taxation
45
+
46
+ Lemone-router is a series of classification models designed to produce an optimal multi-agent system for different branches of tax law. Trained on a base of 49k lines comprising a set of synthetic questions generated by GPT-4 Turbo and Llama 3.1 70B, which have been further refined through evol-instruction tuning and manual curation and authority documents, these models are based on an 8-category decomposition of the classification scheme derived from the Bulletin officiel des finances publiques - impôts :
47
+
48
+ ```python3
49
+ label2id = {
50
+ "Bénéfices professionnels": 0,
51
+ "Contrôle et contentieux": 1,
52
+ "Dispositifs transversaux": 2,
53
+ "Fiscalité des entreprises": 3,
54
+ "Patrimoine et enregistrement": 4,
55
+ "Revenus particuliers": 5,
56
+ "Revenus patrimoniaux": 6,
57
+ "Taxes sur la consommation": 7
58
+ }
59
+
60
+ id2label = {
61
+ 0: "Bénéfices professionnels",
62
+ 1: "Contrôle et contentieux",
63
+ 2: "Dispositifs transversaux",
64
+ 3: "Fiscalité des entreprises",
65
+ 4: "Patrimoine et enregistrement",
66
+ 5: "Revenus particuliers",
67
+ 6: "Revenus patrimoniaux",
68
+ 7: "Taxes sur la consommation"
69
+ }
70
+ ```
71
+
72
+ This model is a fine-tuned version of [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small).
73
  It achieves the following results on the evaluation set:
74
  - Loss: 0.4446
75
  - Accuracy: 0.9061
76
 
77
+ ### Usage
 
 
 
 
 
 
78
 
79
+ ```python
80
+ # Load model directly
81
+ from transformers import AutoTokenizer, AutoModelForSequenceClassification
82
 
83
+ tokenizer = AutoTokenizer.from_pretrained("louisbrulenaudet/lemone-router-s")
84
+ model = AutoModelForSequenceClassification.from_pretrained("louisbrulenaudet/lemone-router-s")
85
+ ```
86
 
87
  ### Training hyperparameters
88
 
 
106
  | 0.189 | 4.0 | 22468 | 0.4446 | 0.9061 |
107
 
108
 
109
+ ### Training Hardware
110
+ - **On Cloud**: No
111
+ - **GPU Model**: 1 x NVIDIA H100 NVL
112
+ - **CPU Model**: AMD EPYC 9V84 96-Core Processor
113
+
114
  ### Framework versions
115
 
116
  - Transformers 4.45.2
117
  - Pytorch 2.4.1+cu121
118
  - Datasets 2.21.0
119
  - Tokenizers 0.20.1
120
+
121
+ ## Citation
122
+ If you use this code in your research, please use the following BibTeX entry.
123
+
124
+ ```BibTeX
125
+ @misc{louisbrulenaudet2024,
126
+ author = {Louis Brulé Naudet},
127
+ title = {Lemone-Router: A Series of Fine-Tuned Classification Models for French Taxation},
128
+ year = {2024}
129
+ howpublished = {\url{https://huggingface.co/datasets/louisbrulenaudet/lemone-router-s}},
130
+ }
131
+ ```
132
+
133
+ ## Feedback
134
+
135
+ If you have any feedback, please reach out at [[email protected]](mailto:[email protected]).