Agnuxo commited on
Commit
e0e6dc2
1 Parent(s): 4508a1d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +134 -2
README.md CHANGED
@@ -2,6 +2,7 @@
2
  base_model: unsloth/qwen2.5-3b-instruct-bnb-4bit
3
  language:
4
  - en
 
5
  license: apache-2.0
6
  tags:
7
  - text-generation-inference
@@ -9,14 +10,145 @@ tags:
9
  - unsloth
10
  - qwen2
11
  - trl
 
 
 
12
  ---
13
 
14
- # Uploaded model
15
 
 
 
16
  - **Developed by:** Agnuxo
17
  - **License:** apache-2.0
18
- - **Finetuned from model :** unsloth/qwen2.5-3b-instruct-bnb-4bit
19
 
20
  This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
21
 
22
  [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2
  base_model: unsloth/qwen2.5-3b-instruct-bnb-4bit
3
  language:
4
  - en
5
+ - es
6
  license: apache-2.0
7
  tags:
8
  - text-generation-inference
 
10
  - unsloth
11
  - qwen2
12
  - trl
13
+ - sft
14
+ datasets:
15
+ - Agnuxo/Agente-Director
16
  ---
17
 
18
+ # Uploaded model
19
 
20
+ [<img src="https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png" width="100"/><img src="https://github.githubassets.com/assets/GitHub-Logo-ee398b662d42.png" width="100"/>](https://github.com/Agnuxo1)
21
+ - **Developed by:** [Agnuxo](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
22
  - **Developed by:** Agnuxo
23
  - **License:** apache-2.0
24
+ - **Finetuned from model :** unsloth/qwen2.5-7b-bnb-4bit
25
 
26
  This qwen2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
27
 
28
  [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
29
+
30
+
31
+ # Lector y Debatidor de Documentos 📚🗣️
32
+
33
+ Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.
34
+
35
+ ## Descripción del Modelo
36
+
37
+ El sistema utiliza dos modelos principales:
38
+
39
+ 1. **Agente-GPT (Profesor)**: `Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit`
40
+ - Basado en Qwen 2.5 7B, adaptado para español
41
+ - Función: Explicar documentos y generar preguntas para el debate
42
+
43
+ 2. **Agente-Llama (Periodista)**: `Agnuxo/Agente-Llama-3.1-Spanish_16bit`
44
+ - Basado en Llama 3.1, adaptado para español
45
+ - Función: Responder preguntas y participar en el debate con un estilo periodístico
46
+
47
+ ## Uso Previsto
48
+
49
+ Este modelo está diseñado para:
50
+ - Analizar y explicar documentos en español
51
+ - Generar debates simulados sobre el contenido de los documentos
52
+ - Proporcionar una experiencia interactiva de aprendizaje y discusión
53
+
54
+ ## Limitaciones y Sesgos
55
+
56
+ - Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
57
+ - La calidad del debate depende de la calidad y relevancia del documento de entrada.
58
+ - Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.
59
+
60
+ ## Consideraciones Éticas
61
+
62
+ - El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
63
+ - Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.
64
+
65
+ ## Métricas de Evaluación
66
+
67
+ - Perplexidad: [Valor]
68
+ - Precisión en tareas de comprensión de lectura: [Valor]
69
+
70
+ ## Entrenamiento
71
+
72
+ Los modelos fueron fine-tuned utilizando el dataset `Agnuxo/Spanish-Debate-Dataset`, que contiene:
73
+ - Transcripciones de debates en español
74
+ - Artículos periodísticos y académicos
75
+ - Resúmenes de documentos en diversos campos
76
+
77
+ # Explicación-Debate-PDF-VOZ
78
+ Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.
79
+
80
+ ## 🖥️ Interfaz de Usuario
81
+
82
+ La interfaz gráfica incluye:
83
+
84
+ - 💬 Área de chat para mostrar el debate
85
+ - 🎛️ Controles de velocidad de voz
86
+ - 🔢 Ajustes de límite de tokens
87
+ - 📂 Botón para cargar documentos
88
+ - ▶️ Botones para iniciar explicación o debate
89
+
90
+
91
+ ## 🧠 Modelos de IA
92
+
93
+ El programa utiliza dos modelos de lenguaje:
94
+
95
+ - 🧑‍🏫 **Profesor-GPT**: Basado en "GPT"
96
+ - 👩‍🎤 **Periodista LLAMA**: Basado en "Meta-Llama-3.1-8B"
97
+
98
+
99
+ ## 🎙️ Síntesis de Voz
100
+
101
+ Se utilizan dos modelos de TTS:
102
+
103
+ - 🇪🇸 Modelo español para el Profesor-GPT
104
+ - 🇦🇷 Modelo con acento argentino para la Periodista LLAMA
105
+
106
+
107
+ ## 📝 Notas Adicionales
108
+
109
+ - El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
110
+ - Se incluyen controles para ajustar la velocidad de reproducción de voz.
111
+ - La interfaz permite una fácil navegación y control del proceso de lectura y debate.
112
+
113
+
114
+ ---
115
+
116
+ Desarrollado por [Francisco Angulo de Lafuente]
117
+
118
+ # 📚 Lector y Debatidor de Documentos
119
+
120
+ ![Banner](https://github.com/Agnuxo1/Explicaci-n-Debate-PDF)
121
+
122
+ ## 🌟 Características Principales
123
+
124
+ - 📖 Lectura de documentos PDF y TXT
125
+ - 🗣️ Explicación del contenido en español
126
+ - 🎭 Debate simulado entre dos IA
127
+ - 🔊 Síntesis de voz para las respuestas
128
+ - 🖥️ Interfaz gráfica moderna y fácil de usar
129
+
130
+ ## 🛠️ Tecnologías Utilizadas
131
+
132
+ - Python
133
+ - PyQt5 para la interfaz gráfica
134
+ - Transformers para modelos de lenguaje
135
+ - TTS para síntesis de voz
136
+ - PyPDF2 para lectura de PDFs
137
+
138
+ ## 🚀 Cómo Funciona
139
+
140
+ El programa ofrece una experiencia interactiva de lectura y debate de documentos:
141
+
142
+ 1️⃣ **Carga de Documentos**: Sube fácilmente archivos PDF o TXT.
143
+
144
+ 2️⃣ **Explicación del Contenido**: Una IA explica el documento de forma clara y concisa.
145
+
146
+ 3️⃣ **Debate Simulado**: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.
147
+
148
+ 4️⃣ **Síntesis de Voz**: Las respuestas se convierten en audio para una experiencia más inmersiva.
149
+
150
+ 5️⃣ **Interacción del Usuario**: Participa en el debate añadiendo tus propios comentarios o preguntas.
151
+
152
+ ## Citación
153
+
154
+ Si utilizas este modelo en tu investigación, por favor cita: