S-MurilloG commited on
Commit
47ba807
1 Parent(s): b50d137

Data visualization

Browse files
Files changed (1) hide show
  1. CARSE_00_Cleaning.ipynb +449 -218
CARSE_00_Cleaning.ipynb CHANGED
@@ -2,7 +2,7 @@
2
  "cells": [
3
  {
4
  "cell_type": "code",
5
- "execution_count": 12,
6
  "metadata": {},
7
  "outputs": [],
8
  "source": [
@@ -21,7 +21,7 @@
21
  },
22
  {
23
  "cell_type": "code",
24
- "execution_count": 13,
25
  "metadata": {},
26
  "outputs": [],
27
  "source": [
@@ -64,7 +64,7 @@
64
  },
65
  {
66
  "cell_type": "code",
67
- "execution_count": 14,
68
  "metadata": {},
69
  "outputs": [
70
  {
@@ -115,7 +115,7 @@
115
  },
116
  {
117
  "cell_type": "code",
118
- "execution_count": 15,
119
  "metadata": {},
120
  "outputs": [],
121
  "source": [
@@ -152,7 +152,7 @@
152
  },
153
  {
154
  "cell_type": "code",
155
- "execution_count": 16,
156
  "metadata": {},
157
  "outputs": [
158
  {
@@ -209,7 +209,7 @@
209
  },
210
  {
211
  "cell_type": "code",
212
- "execution_count": 17,
213
  "metadata": {},
214
  "outputs": [],
215
  "source": [
@@ -230,7 +230,7 @@
230
  },
231
  {
232
  "cell_type": "code",
233
- "execution_count": 18,
234
  "metadata": {},
235
  "outputs": [
236
  {
@@ -288,7 +288,7 @@
288
  },
289
  {
290
  "cell_type": "code",
291
- "execution_count": 19,
292
  "metadata": {},
293
  "outputs": [],
294
  "source": [
@@ -345,7 +345,7 @@
345
  },
346
  {
347
  "cell_type": "code",
348
- "execution_count": 20,
349
  "metadata": {},
350
  "outputs": [
351
  {
@@ -461,7 +461,7 @@
461
  "10 Vale mi amor, disfruta tu baño\\nSabes que me e... "
462
  ]
463
  },
464
- "execution_count": 20,
465
  "metadata": {},
466
  "output_type": "execute_result"
467
  }
@@ -505,7 +505,7 @@
505
  },
506
  {
507
  "cell_type": "code",
508
- "execution_count": 21,
509
  "metadata": {},
510
  "outputs": [],
511
  "source": [
@@ -529,7 +529,7 @@
529
  },
530
  {
531
  "cell_type": "code",
532
- "execution_count": 23,
533
  "metadata": {},
534
  "outputs": [
535
  {
@@ -561,27 +561,27 @@
561
  " <tr>\n",
562
  " <th>0</th>\n",
563
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
564
- " <td>Buenos días mi amorrrr\\nBien bien, pero hacía ...</td>\n",
565
  " </tr>\n",
566
  " <tr>\n",
567
  " <th>1</th>\n",
568
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
569
- " <td>Hola hola bebitaaaa, te amo mucho másss\\nTambi...</td>\n",
570
  " </tr>\n",
571
  " <tr>\n",
572
  " <th>2</th>\n",
573
- " <td>Buenos días mi bb, disfruta mucho tu día guapo</td>\n",
574
- " <td>Buenos días amorrr, graciassssss\\nTambién disf...</td>\n",
575
  " </tr>\n",
576
  " <tr>\n",
577
  " <th>3</th>\n",
578
- " <td>Buenos días mi amor, espero que hayas podido d...</td>\n",
579
- " <td>Hola mi amorcito, cómo amaneciste hoyyy???\\nTa...</td>\n",
580
  " </tr>\n",
581
  " <tr>\n",
582
  " <th>4</th>\n",
583
- " <td>Hellouuuuu, te amo mucho guapiiii, ten lindo dia</td>\n",
584
- " <td>Holi mi vida, cómo estás hoy??\\nTe amo mucho m...</td>\n",
585
  " </tr>\n",
586
  " <tr>\n",
587
  " <th>...</th>\n",
@@ -589,66 +589,66 @@
589
  " <td>...</td>\n",
590
  " </tr>\n",
591
  " <tr>\n",
592
- " <th>745</th>\n",
593
- " <td>Descansaste?\\nQue soñaste?</td>\n",
594
- " <td>No muy bien amor, la verdad es que me desperté...</td>\n",
595
  " </tr>\n",
596
  " <tr>\n",
597
- " <th>746</th>\n",
598
- " <td>Hay que ver una peli de miedoooo</td>\n",
599
- " <td> amooor, vamos al cine a verla</td>\n",
600
  " </tr>\n",
601
  " <tr>\n",
602
- " <th>747</th>\n",
603
- " <td>Hay que venir a comer aquí</td>\n",
604
- " <td>Cuando quieras bb, ya sabes que yo estoy super...</td>\n",
605
  " </tr>\n",
606
  " <tr>\n",
607
- " <th>748</th>\n",
608
- " <td>Estoy muy triste amor</td>\n",
609
- " <td>Por qué mi amor? Cuéntame si quieres</td>\n",
610
  " </tr>\n",
611
  " <tr>\n",
612
- " <th>749</th>\n",
613
- " <td>Te extraño aquí en el gym :(</td>\n",
614
- " <td>Yo también te extraño bb, pero por ahora disfr...</td>\n",
615
  " </tr>\n",
616
  " </tbody>\n",
617
  "</table>\n",
618
- "<p>750 rows × 2 columns</p>\n",
619
  "</div>"
620
  ],
621
  "text/plain": [
622
  " CarmenQ \\\n",
623
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
624
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
625
- "2 Buenos días mi bb, disfruta mucho tu día guapo \n",
626
- "3 Buenos días mi amor, espero que hayas podido d... \n",
627
- "4 Hellouuuuu, te amo mucho guapiiii, ten lindo dia \n",
628
  ".. ... \n",
629
- "745 Descansaste?\\nQue soñaste? \n",
630
- "746 Hay que ver una peli de miedoooo \n",
631
- "747 Hay que venir a comer aquí \n",
632
- "748 Estoy muy triste amor \n",
633
- "749 Te extraño aquí en el gym :( \n",
634
  "\n",
635
  " Sebas \n",
636
- "0 Buenos días mi amorrrr\\nBien bien, pero hacía ... \n",
637
- "1 Hola hola bebitaaaa, te amo mucho másss\\nTambi... \n",
638
- "2 Buenos días amorrr, graciassssss\\nTambién disf... \n",
639
- "3 Hola mi amorcito, cómo amaneciste hoyyy???\\nTa... \n",
640
- "4 Holi mi vida, cómo estás hoy??\\nTe amo mucho m... \n",
641
  ".. ... \n",
642
- "745 No muy bien amor, la verdad es que me desperté... \n",
643
- "746 Sí amooor, vamos al cine a verla \n",
644
- "747 Cuando quieras bb, ya sabes que yo estoy super... \n",
645
- "748 Por qué mi amor? Cuéntame si quieres \n",
646
- "749 Yo también te extraño bb, pero por ahora disfr... \n",
647
  "\n",
648
- "[750 rows x 2 columns]"
649
  ]
650
  },
651
- "execution_count": 23,
652
  "metadata": {},
653
  "output_type": "execute_result"
654
  }
@@ -667,7 +667,7 @@
667
  },
668
  {
669
  "cell_type": "code",
670
- "execution_count": 24,
671
  "metadata": {},
672
  "outputs": [],
673
  "source": [
@@ -683,7 +683,7 @@
683
  },
684
  {
685
  "cell_type": "code",
686
- "execution_count": 25,
687
  "metadata": {},
688
  "outputs": [
689
  {
@@ -717,31 +717,31 @@
717
  " <th>0</th>\n",
718
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
719
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
720
- " <td>Buenos días mi amorrrr\\nBien bien, pero hacía ...</td>\n",
721
  " </tr>\n",
722
  " <tr>\n",
723
  " <th>1</th>\n",
724
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
725
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
726
- " <td>Hola hola bebitaaaa, te amo mucho másss\\nTambi...</td>\n",
727
  " </tr>\n",
728
  " <tr>\n",
729
  " <th>2</th>\n",
730
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
731
- " <td>Buenos días mi bb, disfruta mucho tu día guapo</td>\n",
732
- " <td>Buenos días amorrr, graciassssss\\nTambién disf...</td>\n",
733
  " </tr>\n",
734
  " <tr>\n",
735
  " <th>3</th>\n",
736
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
737
- " <td>Buenos días mi amor, espero que hayas podido d...</td>\n",
738
- " <td>Hola mi amorcito, cómo amaneciste hoyyy???\\nTa...</td>\n",
739
  " </tr>\n",
740
  " <tr>\n",
741
  " <th>4</th>\n",
742
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
743
- " <td>Hellouuuuu, te amo mucho guapiiii, ten lindo dia</td>\n",
744
- " <td>Holi mi vida, cómo estás hoy??\\nTe amo mucho m...</td>\n",
745
  " </tr>\n",
746
  " <tr>\n",
747
  " <th>...</th>\n",
@@ -750,38 +750,38 @@
750
  " <td>...</td>\n",
751
  " </tr>\n",
752
  " <tr>\n",
753
- " <th>745</th>\n",
754
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
755
- " <td>Descansaste?\\nQue soñaste?</td>\n",
756
- " <td>No muy bien amor, la verdad es que me desperté...</td>\n",
757
  " </tr>\n",
758
  " <tr>\n",
759
- " <th>746</th>\n",
760
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
761
- " <td>Hay que ver una peli de miedoooo</td>\n",
762
- " <td> amooor, vamos al cine a verla</td>\n",
763
  " </tr>\n",
764
  " <tr>\n",
765
- " <th>747</th>\n",
766
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
767
- " <td>Hay que venir a comer aquí</td>\n",
768
- " <td>Cuando quieras bb, ya sabes que yo estoy super...</td>\n",
769
  " </tr>\n",
770
  " <tr>\n",
771
- " <th>748</th>\n",
772
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
773
- " <td>Estoy muy triste amor</td>\n",
774
- " <td>Por qué mi amor? Cuéntame si quieres</td>\n",
775
  " </tr>\n",
776
  " <tr>\n",
777
- " <th>749</th>\n",
778
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
779
- " <td>Te extraño aquí en el gym :(</td>\n",
780
- " <td>Yo también te extraño bb, pero por ahora disfr...</td>\n",
781
  " </tr>\n",
782
  " </tbody>\n",
783
  "</table>\n",
784
- "<p>750 rows × 3 columns</p>\n",
785
  "</div>"
786
  ],
787
  "text/plain": [
@@ -792,42 +792,42 @@
792
  "3 CARSE es un chatbot que imita el estilo en que... \n",
793
  "4 CARSE es un chatbot que imita el estilo en que... \n",
794
  ".. ... \n",
795
- "745 CARSE es un chatbot que imita el estilo en que... \n",
796
- "746 CARSE es un chatbot que imita el estilo en que... \n",
797
- "747 CARSE es un chatbot que imita el estilo en que... \n",
798
- "748 CARSE es un chatbot que imita el estilo en que... \n",
799
- "749 CARSE es un chatbot que imita el estilo en que... \n",
800
  "\n",
801
  " CarmenQ \\\n",
802
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
803
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
804
- "2 Buenos días mi bb, disfruta mucho tu día guapo \n",
805
- "3 Buenos días mi amor, espero que hayas podido d... \n",
806
- "4 Hellouuuuu, te amo mucho guapiiii, ten lindo dia \n",
807
  ".. ... \n",
808
- "745 Descansaste?\\nQue soñaste? \n",
809
- "746 Hay que ver una peli de miedoooo \n",
810
- "747 Hay que venir a comer aquí \n",
811
- "748 Estoy muy triste amor \n",
812
- "749 Te extraño aquí en el gym :( \n",
813
  "\n",
814
  " Sebas \n",
815
- "0 Buenos días mi amorrrr\\nBien bien, pero hacía ... \n",
816
- "1 Hola hola bebitaaaa, te amo mucho másss\\nTambi... \n",
817
- "2 Buenos días amorrr, graciassssss\\nTambién disf... \n",
818
- "3 Hola mi amorcito, cómo amaneciste hoyyy???\\nTa... \n",
819
- "4 Holi mi vida, cómo estás hoy??\\nTe amo mucho m... \n",
820
  ".. ... \n",
821
- "745 No muy bien amor, la verdad es que me desperté... \n",
822
- "746 Sí amooor, vamos al cine a verla \n",
823
- "747 Cuando quieras bb, ya sabes que yo estoy super... \n",
824
- "748 Por qué mi amor? Cuéntame si quieres \n",
825
- "749 Yo también te extraño bb, pero por ahora disfr... \n",
826
  "\n",
827
- "[750 rows x 3 columns]"
828
  ]
829
  },
830
- "execution_count": 25,
831
  "metadata": {},
832
  "output_type": "execute_result"
833
  }
@@ -840,7 +840,7 @@
840
  },
841
  {
842
  "cell_type": "code",
843
- "execution_count": 26,
844
  "metadata": {},
845
  "outputs": [],
846
  "source": [
@@ -853,7 +853,7 @@
853
  },
854
  {
855
  "cell_type": "code",
856
- "execution_count": 27,
857
  "metadata": {},
858
  "outputs": [
859
  {
@@ -887,31 +887,31 @@
887
  " <th>0</th>\n",
888
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
889
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
890
- " <td>Buenos días mi amorrrr\\nBien bien, pero hacía ...</td>\n",
891
  " </tr>\n",
892
  " <tr>\n",
893
  " <th>1</th>\n",
894
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
895
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
896
- " <td>Hola hola bebitaaaa, te amo mucho másss\\nTambi...</td>\n",
897
  " </tr>\n",
898
  " <tr>\n",
899
  " <th>2</th>\n",
900
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
901
- " <td>Buenos días mi bb, disfruta mucho tu día guapo</td>\n",
902
- " <td>Buenos días amorrr, graciassssss\\nTambién disf...</td>\n",
903
  " </tr>\n",
904
  " <tr>\n",
905
  " <th>3</th>\n",
906
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
907
- " <td>Buenos días mi amor, espero que hayas podido d...</td>\n",
908
- " <td>Hola mi amorcito, cómo amaneciste hoyyy???\\nTa...</td>\n",
909
  " </tr>\n",
910
  " <tr>\n",
911
  " <th>4</th>\n",
912
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
913
- " <td>Hellouuuuu, te amo mucho guapiiii, ten lindo dia</td>\n",
914
- " <td>Holi mi vida, cómo estás hoy??\\nTe amo mucho m...</td>\n",
915
  " </tr>\n",
916
  " <tr>\n",
917
  " <th>...</th>\n",
@@ -920,38 +920,38 @@
920
  " <td>...</td>\n",
921
  " </tr>\n",
922
  " <tr>\n",
923
- " <th>745</th>\n",
924
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
925
- " <td>Descansaste?\\nQue soñaste?</td>\n",
926
- " <td>No muy bien amor, la verdad es que me desperté...</td>\n",
927
  " </tr>\n",
928
  " <tr>\n",
929
- " <th>746</th>\n",
930
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
931
- " <td>Hay que ver una peli de miedoooo</td>\n",
932
- " <td> amooor, vamos al cine a verla</td>\n",
933
  " </tr>\n",
934
  " <tr>\n",
935
- " <th>747</th>\n",
936
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
937
- " <td>Hay que venir a comer aquí</td>\n",
938
- " <td>Cuando quieras bb, ya sabes que yo estoy super...</td>\n",
939
  " </tr>\n",
940
  " <tr>\n",
941
- " <th>748</th>\n",
942
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
943
- " <td>Estoy muy triste amor</td>\n",
944
- " <td>Por qué mi amor? Cuéntame si quieres</td>\n",
945
  " </tr>\n",
946
  " <tr>\n",
947
- " <th>749</th>\n",
948
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
949
- " <td>Te extraño aquí en el gym :(</td>\n",
950
- " <td>Yo también te extraño bb, pero por ahora disfr...</td>\n",
951
  " </tr>\n",
952
  " </tbody>\n",
953
  "</table>\n",
954
- "<p>750 rows × 3 columns</p>\n",
955
  "</div>"
956
  ],
957
  "text/plain": [
@@ -962,42 +962,42 @@
962
  "3 CARSE es un chatbot que imita el estilo en que... \n",
963
  "4 CARSE es un chatbot que imita el estilo en que... \n",
964
  ".. ... \n",
965
- "745 CARSE es un chatbot que imita el estilo en que... \n",
966
- "746 CARSE es un chatbot que imita el estilo en que... \n",
967
- "747 CARSE es un chatbot que imita el estilo en que... \n",
968
- "748 CARSE es un chatbot que imita el estilo en que... \n",
969
- "749 CARSE es un chatbot que imita el estilo en que... \n",
970
  "\n",
971
  " user \\\n",
972
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
973
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
974
- "2 Buenos días mi bb, disfruta mucho tu día guapo \n",
975
- "3 Buenos días mi amor, espero que hayas podido d... \n",
976
- "4 Hellouuuuu, te amo mucho guapiiii, ten lindo dia \n",
977
  ".. ... \n",
978
- "745 Descansaste?\\nQue soñaste? \n",
979
- "746 Hay que ver una peli de miedoooo \n",
980
- "747 Hay que venir a comer aquí \n",
981
- "748 Estoy muy triste amor \n",
982
- "749 Te extraño aquí en el gym :( \n",
983
  "\n",
984
  " assistant \n",
985
- "0 Buenos días mi amorrrr\\nBien bien, pero hacía ... \n",
986
- "1 Hola hola bebitaaaa, te amo mucho másss\\nTambi... \n",
987
- "2 Buenos días amorrr, graciassssss\\nTambién disf... \n",
988
- "3 Hola mi amorcito, cómo amaneciste hoyyy???\\nTa... \n",
989
- "4 Holi mi vida, cómo estás hoy??\\nTe amo mucho m... \n",
990
  ".. ... \n",
991
- "745 No muy bien amor, la verdad es que me desperté... \n",
992
- "746 Sí amooor, vamos al cine a verla \n",
993
- "747 Cuando quieras bb, ya sabes que yo estoy super... \n",
994
- "748 Por qué mi amor? Cuéntame si quieres \n",
995
- "749 Yo también te extraño bb, pero por ahora disfr... \n",
996
  "\n",
997
- "[750 rows x 3 columns]"
998
  ]
999
  },
1000
- "execution_count": 27,
1001
  "metadata": {},
1002
  "output_type": "execute_result"
1003
  }
@@ -1010,7 +1010,7 @@
1010
  },
1011
  {
1012
  "cell_type": "code",
1013
- "execution_count": 28,
1014
  "metadata": {},
1015
  "outputs": [
1016
  {
@@ -1043,32 +1043,32 @@
1043
  " <tr>\n",
1044
  " <th>0</th>\n",
1045
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1046
- " <td>Yo me iré al gym en unos minutos</td>\n",
1047
- " <td>Super mi amorrr, disfruta mucho tu ejercicio, ...</td>\n",
1048
  " </tr>\n",
1049
  " <tr>\n",
1050
  " <th>1</th>\n",
1051
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1052
- " <td>Ya ando en el gym amor</td>\n",
1053
- " <td>Super mi amorrr, disfruta mucho tu ejercicio\\n...</td>\n",
1054
  " </tr>\n",
1055
  " <tr>\n",
1056
  " <th>2</th>\n",
1057
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1058
- " <td>Te mandaré nota</td>\n",
1059
- " <td>Vale amor, mándame lo que quieras, que sí me g...</td>\n",
1060
  " </tr>\n",
1061
  " <tr>\n",
1062
  " <th>3</th>\n",
1063
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1064
- " <td>Te extraño poquis</td>\n",
1065
- " <td>Igual te extraño poquis\\nIntentaré organizarme...</td>\n",
1066
  " </tr>\n",
1067
  " <tr>\n",
1068
  " <th>4</th>\n",
1069
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1070
- " <td>He dormido mejor\\nSiento que no descansé nada</td>\n",
1071
- " <td>Y por qué no duermes un rato más?</td>\n",
1072
  " </tr>\n",
1073
  " <tr>\n",
1074
  " <th>...</th>\n",
@@ -1077,38 +1077,38 @@
1077
  " <td>...</td>\n",
1078
  " </tr>\n",
1079
  " <tr>\n",
1080
- " <th>745</th>\n",
1081
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1082
- " <td>Pues ya toca casarnos</td>\n",
1083
- " <td>Por fiiiin, ya te habías tardado en decir eso</td>\n",
1084
  " </tr>\n",
1085
  " <tr>\n",
1086
- " <th>746</th>\n",
1087
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1088
- " <td>Biennnnn\\n¿Y tu?</td>\n",
1089
- " <td>Bien igual</td>\n",
1090
  " </tr>\n",
1091
  " <tr>\n",
1092
- " <th>747</th>\n",
1093
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1094
- " <td>JAJAJJAJAJA no</td>\n",
1095
- " <td>Ya dimeeeee</td>\n",
1096
  " </tr>\n",
1097
  " <tr>\n",
1098
- " <th>748</th>\n",
1099
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1100
- " <td>Casarme contigo algún día</td>\n",
1101
- " <td>Awwww amoorr, quiero casarme contigo algún ...</td>\n",
1102
  " </tr>\n",
1103
  " <tr>\n",
1104
- " <th>749</th>\n",
1105
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1106
- " <td>Me estaba acabando el café</td>\n",
1107
- " <td>Disfruta tu cafecito</td>\n",
1108
  " </tr>\n",
1109
  " </tbody>\n",
1110
  "</table>\n",
1111
- "<p>750 rows × 3 columns</p>\n",
1112
  "</div>"
1113
  ],
1114
  "text/plain": [
@@ -1119,42 +1119,42 @@
1119
  "3 CARSE es un chatbot que imita el estilo en que... \n",
1120
  "4 CARSE es un chatbot que imita el estilo en que... \n",
1121
  ".. ... \n",
1122
- "745 CARSE es un chatbot que imita el estilo en que... \n",
1123
- "746 CARSE es un chatbot que imita el estilo en que... \n",
1124
- "747 CARSE es un chatbot que imita el estilo en que... \n",
1125
- "748 CARSE es un chatbot que imita el estilo en que... \n",
1126
- "749 CARSE es un chatbot que imita el estilo en que... \n",
1127
  "\n",
1128
- " user \\\n",
1129
- "0 Yo me iré al gym en unos minutos \n",
1130
- "1 Ya ando en el gym amor \n",
1131
- "2 Te mandaré nota \n",
1132
- "3 Te extraño poquis \n",
1133
- "4 He dormido mejor\\nSiento que no descansé nada \n",
1134
- ".. ... \n",
1135
- "745 Pues ya toca casarnos \n",
1136
- "746 Biennnnn\\n¿Y tu? \n",
1137
- "747 JAJAJJAJAJA no \n",
1138
- "748 Casarme contigo algún día \n",
1139
- "749 Me estaba acabando el café \n",
1140
  "\n",
1141
  " assistant \n",
1142
- "0 Super mi amorrr, disfruta mucho tu ejercicio, ... \n",
1143
- "1 Super mi amorrr, disfruta mucho tu ejercicio\\n... \n",
1144
- "2 Vale amor, mándame lo que quieras, que sí me g... \n",
1145
- "3 Igual te extraño poquis\\nIntentaré organizarme... \n",
1146
- "4 Y por qué no duermes un rato más? \n",
1147
  ".. ... \n",
1148
- "745 Por fiiiin, ya te habías tardado en decir eso \n",
1149
- "746 Bien igual \n",
1150
- "747 Ya dimeeeee \n",
1151
- "748 Awwww amoorr, quiero casarme contigo algún ... \n",
1152
- "749 Disfruta tu cafecito \n",
1153
  "\n",
1154
- "[750 rows x 3 columns]"
1155
  ]
1156
  },
1157
- "execution_count": 28,
1158
  "metadata": {},
1159
  "output_type": "execute_result"
1160
  }
@@ -1174,7 +1174,7 @@
1174
  },
1175
  {
1176
  "cell_type": "code",
1177
- "execution_count": 29,
1178
  "metadata": {},
1179
  "outputs": [],
1180
  "source": [
@@ -1198,7 +1198,7 @@
1198
  },
1199
  {
1200
  "cell_type": "code",
1201
- "execution_count": 30,
1202
  "metadata": {},
1203
  "outputs": [],
1204
  "source": [
@@ -1209,14 +1209,14 @@
1209
  },
1210
  {
1211
  "cell_type": "code",
1212
- "execution_count": 31,
1213
  "metadata": {},
1214
  "outputs": [
1215
  {
1216
  "name": "stdout",
1217
  "output_type": "stream",
1218
  "text": [
1219
- "El archivo tiene 750 líneas.\n"
1220
  ]
1221
  }
1222
  ],
@@ -1233,6 +1233,237 @@
1233
  " print(\"Archivo no encontrado. Por favor verifica la ruta.\")"
1234
  ]
1235
  },
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1236
  {
1237
  "cell_type": "code",
1238
  "execution_count": null,
 
2
  "cells": [
3
  {
4
  "cell_type": "code",
5
+ "execution_count": 44,
6
  "metadata": {},
7
  "outputs": [],
8
  "source": [
 
21
  },
22
  {
23
  "cell_type": "code",
24
+ "execution_count": 45,
25
  "metadata": {},
26
  "outputs": [],
27
  "source": [
 
64
  },
65
  {
66
  "cell_type": "code",
67
+ "execution_count": 46,
68
  "metadata": {},
69
  "outputs": [
70
  {
 
115
  },
116
  {
117
  "cell_type": "code",
118
+ "execution_count": 47,
119
  "metadata": {},
120
  "outputs": [],
121
  "source": [
 
152
  },
153
  {
154
  "cell_type": "code",
155
+ "execution_count": 48,
156
  "metadata": {},
157
  "outputs": [
158
  {
 
209
  },
210
  {
211
  "cell_type": "code",
212
+ "execution_count": 49,
213
  "metadata": {},
214
  "outputs": [],
215
  "source": [
 
230
  },
231
  {
232
  "cell_type": "code",
233
+ "execution_count": 50,
234
  "metadata": {},
235
  "outputs": [
236
  {
 
288
  },
289
  {
290
  "cell_type": "code",
291
+ "execution_count": 51,
292
  "metadata": {},
293
  "outputs": [],
294
  "source": [
 
345
  },
346
  {
347
  "cell_type": "code",
348
+ "execution_count": 52,
349
  "metadata": {},
350
  "outputs": [
351
  {
 
461
  "10 Vale mi amor, disfruta tu baño\\nSabes que me e... "
462
  ]
463
  },
464
+ "execution_count": 52,
465
  "metadata": {},
466
  "output_type": "execute_result"
467
  }
 
505
  },
506
  {
507
  "cell_type": "code",
508
+ "execution_count": 53,
509
  "metadata": {},
510
  "outputs": [],
511
  "source": [
 
529
  },
530
  {
531
  "cell_type": "code",
532
+ "execution_count": 54,
533
  "metadata": {},
534
  "outputs": [
535
  {
 
561
  " <tr>\n",
562
  " <th>0</th>\n",
563
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
564
+ " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
565
  " </tr>\n",
566
  " <tr>\n",
567
  " <th>1</th>\n",
568
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
569
+ " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
570
  " </tr>\n",
571
  " <tr>\n",
572
  " <th>2</th>\n",
573
+ " <td>Buenos días mi amor, disfruta tu día</td>\n",
574
+ " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
575
  " </tr>\n",
576
  " <tr>\n",
577
  " <th>3</th>\n",
578
+ " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
579
+ " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
580
  " </tr>\n",
581
  " <tr>\n",
582
  " <th>4</th>\n",
583
+ " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
584
+ " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
585
  " </tr>\n",
586
  " <tr>\n",
587
  " <th>...</th>\n",
 
589
  " <td>...</td>\n",
590
  " </tr>\n",
591
  " <tr>\n",
592
+ " <th>408</th>\n",
593
+ " <td>Andamos en el café amorchis</td>\n",
594
+ " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
595
  " </tr>\n",
596
  " <tr>\n",
597
+ " <th>409</th>\n",
598
+ " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
599
+ " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
600
  " </tr>\n",
601
  " <tr>\n",
602
+ " <th>410</th>\n",
603
+ " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
604
+ " <td> mi amorcito, vamos por tu café más tarde</td>\n",
605
  " </tr>\n",
606
  " <tr>\n",
607
+ " <th>411</th>\n",
608
+ " <td>Aquí andamos en un café</td>\n",
609
+ " <td>Que rico Carmen Q, disfruten</td>\n",
610
  " </tr>\n",
611
  " <tr>\n",
612
+ " <th>412</th>\n",
613
+ " <td>Pues iremos por un café según</td>\n",
614
+ " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
615
  " </tr>\n",
616
  " </tbody>\n",
617
  "</table>\n",
618
+ "<p>413 rows × 2 columns</p>\n",
619
  "</div>"
620
  ],
621
  "text/plain": [
622
  " CarmenQ \\\n",
623
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
624
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
625
+ "2 Buenos días mi amor, disfruta tu día \n",
626
+ "3 Buenos días mi amorchis, disfruta mucho tu día \n",
627
+ "4 Buenos días mi amorchis, ten un lindo día \n",
628
  ".. ... \n",
629
+ "408 Andamos en el café amorchis \n",
630
+ "409 Ya salimos pero nos vinimos por un coffee \n",
631
+ "410 Ya había dicho que iríamos más tarde por el café \n",
632
+ "411 Aquí andamos en un café \n",
633
+ "412 Pues iremos por un café según \n",
634
  "\n",
635
  " Sebas \n",
636
+ "0 Buenos días Carmen Q. Bien bien, pero hacía mu... \n",
637
+ "1 Hola hola amorcito, te amo mucho más. También ... \n",
638
+ "2 Buenos días Carmen Q. Te mando muchos besos, a... \n",
639
+ "3 Buenos días Carmen Q, gracias! También disfrut... \n",
640
+ "4 Hola hola Carmen Q. Cómo dormiste? Disfruta mu... \n",
641
  ".. ... \n",
642
+ "408 Super super, disfruta tu cafecito mi Carmen Q \n",
643
+ "409 Ah okey amorcito, disfruta entonces tu café \n",
644
+ "410 Sí mi amorcito, vamos por tu café más tarde \n",
645
+ "411 Que rico Carmen Q, disfruten \n",
646
+ "412 Disfruten mucho su cafecito, Carmen Q \n",
647
  "\n",
648
+ "[413 rows x 2 columns]"
649
  ]
650
  },
651
+ "execution_count": 54,
652
  "metadata": {},
653
  "output_type": "execute_result"
654
  }
 
667
  },
668
  {
669
  "cell_type": "code",
670
+ "execution_count": 55,
671
  "metadata": {},
672
  "outputs": [],
673
  "source": [
 
683
  },
684
  {
685
  "cell_type": "code",
686
+ "execution_count": 56,
687
  "metadata": {},
688
  "outputs": [
689
  {
 
717
  " <th>0</th>\n",
718
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
719
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
720
+ " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
721
  " </tr>\n",
722
  " <tr>\n",
723
  " <th>1</th>\n",
724
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
725
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
726
+ " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
727
  " </tr>\n",
728
  " <tr>\n",
729
  " <th>2</th>\n",
730
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
731
+ " <td>Buenos días mi amor, disfruta tu día</td>\n",
732
+ " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
733
  " </tr>\n",
734
  " <tr>\n",
735
  " <th>3</th>\n",
736
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
737
+ " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
738
+ " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
739
  " </tr>\n",
740
  " <tr>\n",
741
  " <th>4</th>\n",
742
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
743
+ " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
744
+ " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
745
  " </tr>\n",
746
  " <tr>\n",
747
  " <th>...</th>\n",
 
750
  " <td>...</td>\n",
751
  " </tr>\n",
752
  " <tr>\n",
753
+ " <th>408</th>\n",
754
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
755
+ " <td>Andamos en el café amorchis</td>\n",
756
+ " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
757
  " </tr>\n",
758
  " <tr>\n",
759
+ " <th>409</th>\n",
760
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
761
+ " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
762
+ " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
763
  " </tr>\n",
764
  " <tr>\n",
765
+ " <th>410</th>\n",
766
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
767
+ " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
768
+ " <td> mi amorcito, vamos por tu café más tarde</td>\n",
769
  " </tr>\n",
770
  " <tr>\n",
771
+ " <th>411</th>\n",
772
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
773
+ " <td>Aquí andamos en un café</td>\n",
774
+ " <td>Que rico Carmen Q, disfruten</td>\n",
775
  " </tr>\n",
776
  " <tr>\n",
777
+ " <th>412</th>\n",
778
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
779
+ " <td>Pues iremos por un café según</td>\n",
780
+ " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
781
  " </tr>\n",
782
  " </tbody>\n",
783
  "</table>\n",
784
+ "<p>413 rows × 3 columns</p>\n",
785
  "</div>"
786
  ],
787
  "text/plain": [
 
792
  "3 CARSE es un chatbot que imita el estilo en que... \n",
793
  "4 CARSE es un chatbot que imita el estilo en que... \n",
794
  ".. ... \n",
795
+ "408 CARSE es un chatbot que imita el estilo en que... \n",
796
+ "409 CARSE es un chatbot que imita el estilo en que... \n",
797
+ "410 CARSE es un chatbot que imita el estilo en que... \n",
798
+ "411 CARSE es un chatbot que imita el estilo en que... \n",
799
+ "412 CARSE es un chatbot que imita el estilo en que... \n",
800
  "\n",
801
  " CarmenQ \\\n",
802
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
803
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
804
+ "2 Buenos días mi amor, disfruta tu día \n",
805
+ "3 Buenos días mi amorchis, disfruta mucho tu día \n",
806
+ "4 Buenos días mi amorchis, ten un lindo día \n",
807
  ".. ... \n",
808
+ "408 Andamos en el café amorchis \n",
809
+ "409 Ya salimos pero nos vinimos por un coffee \n",
810
+ "410 Ya había dicho que iríamos más tarde por el café \n",
811
+ "411 Aquí andamos en un café \n",
812
+ "412 Pues iremos por un café según \n",
813
  "\n",
814
  " Sebas \n",
815
+ "0 Buenos días Carmen Q. Bien bien, pero hacía mu... \n",
816
+ "1 Hola hola amorcito, te amo mucho más. También ... \n",
817
+ "2 Buenos días Carmen Q. Te mando muchos besos, a... \n",
818
+ "3 Buenos días Carmen Q, gracias! También disfrut... \n",
819
+ "4 Hola hola Carmen Q. Cómo dormiste? Disfruta mu... \n",
820
  ".. ... \n",
821
+ "408 Super super, disfruta tu cafecito mi Carmen Q \n",
822
+ "409 Ah okey amorcito, disfruta entonces tu café \n",
823
+ "410 Sí mi amorcito, vamos por tu café más tarde \n",
824
+ "411 Que rico Carmen Q, disfruten \n",
825
+ "412 Disfruten mucho su cafecito, Carmen Q \n",
826
  "\n",
827
+ "[413 rows x 3 columns]"
828
  ]
829
  },
830
+ "execution_count": 56,
831
  "metadata": {},
832
  "output_type": "execute_result"
833
  }
 
840
  },
841
  {
842
  "cell_type": "code",
843
+ "execution_count": 57,
844
  "metadata": {},
845
  "outputs": [],
846
  "source": [
 
853
  },
854
  {
855
  "cell_type": "code",
856
+ "execution_count": 58,
857
  "metadata": {},
858
  "outputs": [
859
  {
 
887
  " <th>0</th>\n",
888
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
889
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
890
+ " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
891
  " </tr>\n",
892
  " <tr>\n",
893
  " <th>1</th>\n",
894
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
895
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
896
+ " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
897
  " </tr>\n",
898
  " <tr>\n",
899
  " <th>2</th>\n",
900
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
901
+ " <td>Buenos días mi amor, disfruta tu día</td>\n",
902
+ " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
903
  " </tr>\n",
904
  " <tr>\n",
905
  " <th>3</th>\n",
906
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
907
+ " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
908
+ " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
909
  " </tr>\n",
910
  " <tr>\n",
911
  " <th>4</th>\n",
912
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
913
+ " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
914
+ " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
915
  " </tr>\n",
916
  " <tr>\n",
917
  " <th>...</th>\n",
 
920
  " <td>...</td>\n",
921
  " </tr>\n",
922
  " <tr>\n",
923
+ " <th>408</th>\n",
924
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
925
+ " <td>Andamos en el café amorchis</td>\n",
926
+ " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
927
  " </tr>\n",
928
  " <tr>\n",
929
+ " <th>409</th>\n",
930
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
931
+ " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
932
+ " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
933
  " </tr>\n",
934
  " <tr>\n",
935
+ " <th>410</th>\n",
936
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
937
+ " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
938
+ " <td> mi amorcito, vamos por tu café más tarde</td>\n",
939
  " </tr>\n",
940
  " <tr>\n",
941
+ " <th>411</th>\n",
942
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
943
+ " <td>Aquí andamos en un café</td>\n",
944
+ " <td>Que rico Carmen Q, disfruten</td>\n",
945
  " </tr>\n",
946
  " <tr>\n",
947
+ " <th>412</th>\n",
948
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
949
+ " <td>Pues iremos por un café según</td>\n",
950
+ " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
951
  " </tr>\n",
952
  " </tbody>\n",
953
  "</table>\n",
954
+ "<p>413 rows × 3 columns</p>\n",
955
  "</div>"
956
  ],
957
  "text/plain": [
 
962
  "3 CARSE es un chatbot que imita el estilo en que... \n",
963
  "4 CARSE es un chatbot que imita el estilo en que... \n",
964
  ".. ... \n",
965
+ "408 CARSE es un chatbot que imita el estilo en que... \n",
966
+ "409 CARSE es un chatbot que imita el estilo en que... \n",
967
+ "410 CARSE es un chatbot que imita el estilo en que... \n",
968
+ "411 CARSE es un chatbot que imita el estilo en que... \n",
969
+ "412 CARSE es un chatbot que imita el estilo en que... \n",
970
  "\n",
971
  " user \\\n",
972
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
973
  "1 Holis mi amor, espero que tengas un muy bonito... \n",
974
+ "2 Buenos días mi amor, disfruta tu día \n",
975
+ "3 Buenos días mi amorchis, disfruta mucho tu día \n",
976
+ "4 Buenos días mi amorchis, ten un lindo día \n",
977
  ".. ... \n",
978
+ "408 Andamos en el café amorchis \n",
979
+ "409 Ya salimos pero nos vinimos por un coffee \n",
980
+ "410 Ya había dicho que iríamos más tarde por el café \n",
981
+ "411 Aquí andamos en un café \n",
982
+ "412 Pues iremos por un café según \n",
983
  "\n",
984
  " assistant \n",
985
+ "0 Buenos días Carmen Q. Bien bien, pero hacía mu... \n",
986
+ "1 Hola hola amorcito, te amo mucho más. También ... \n",
987
+ "2 Buenos días Carmen Q. Te mando muchos besos, a... \n",
988
+ "3 Buenos días Carmen Q, gracias! También disfrut... \n",
989
+ "4 Hola hola Carmen Q. Cómo dormiste? Disfruta mu... \n",
990
  ".. ... \n",
991
+ "408 Super super, disfruta tu cafecito mi Carmen Q \n",
992
+ "409 Ah okey amorcito, disfruta entonces tu café \n",
993
+ "410 Sí mi amorcito, vamos por tu café más tarde \n",
994
+ "411 Que rico Carmen Q, disfruten \n",
995
+ "412 Disfruten mucho su cafecito, Carmen Q \n",
996
  "\n",
997
+ "[413 rows x 3 columns]"
998
  ]
999
  },
1000
+ "execution_count": 58,
1001
  "metadata": {},
1002
  "output_type": "execute_result"
1003
  }
 
1010
  },
1011
  {
1012
  "cell_type": "code",
1013
+ "execution_count": 59,
1014
  "metadata": {},
1015
  "outputs": [
1016
  {
 
1043
  " <tr>\n",
1044
  " <th>0</th>\n",
1045
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1046
+ " <td>Ya acabaste tus entregas de hoy?</td>\n",
1047
+ " <td>Ya casi amorcito, solo me falta checar algunos...</td>\n",
1048
  " </tr>\n",
1049
  " <tr>\n",
1050
  " <th>1</th>\n",
1051
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1052
+ " <td>Buenos días amorchis</td>\n",
1053
+ " <td>Buenos días mi Carmen Q, cómo dormiste hoy? Sí...</td>\n",
1054
  " </tr>\n",
1055
  " <tr>\n",
1056
  " <th>2</th>\n",
1057
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1058
+ " <td>Ya no quiero ir al gym</td>\n",
1059
+ " <td>Ve solo un rato Carmen Q, a correr</td>\n",
1060
  " </tr>\n",
1061
  " <tr>\n",
1062
  " <th>3</th>\n",
1063
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1064
+ " <td>Qué me vas a invitar hoy?</td>\n",
1065
+ " <td>Te invito a besarnos escuchando a Dani Flow</td>\n",
1066
  " </tr>\n",
1067
  " <tr>\n",
1068
  " <th>4</th>\n",
1069
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1070
+ " <td>Hola amor, ten bonito día, te quierooooo</td>\n",
1071
+ " <td>Perdóname Carmen Q, me quedé dormido de la nad...</td>\n",
1072
  " </tr>\n",
1073
  " <tr>\n",
1074
  " <th>...</th>\n",
 
1077
  " <td>...</td>\n",
1078
  " </tr>\n",
1079
  " <tr>\n",
1080
+ " <th>408</th>\n",
1081
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1082
+ " <td>No tengo más pendientes</td>\n",
1083
+ " <td>Okey amorcito, me avisas si quieres hacer algo...</td>\n",
1084
  " </tr>\n",
1085
  " <tr>\n",
1086
+ " <th>409</th>\n",
1087
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1088
+ " <td>11:11 amorchis</td>\n",
1089
+ " <td>11:11. Te amo tanto, eres mi deseo diario</td>\n",
1090
  " </tr>\n",
1091
  " <tr>\n",
1092
+ " <th>410</th>\n",
1093
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1094
+ " <td>Buenos días amorchis</td>\n",
1095
+ " <td>Buenos días mi amorcito. Sorry por quedarme do...</td>\n",
1096
  " </tr>\n",
1097
  " <tr>\n",
1098
+ " <th>411</th>\n",
1099
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1100
+ " <td>Amorchis deberíamos de hacer un maratón de pel...</td>\n",
1101
+ " <td>Ay amorcito, estaría super bien eso. Pues pued...</td>\n",
1102
  " </tr>\n",
1103
  " <tr>\n",
1104
+ " <th>412</th>\n",
1105
  " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1106
+ " <td>Que harás?</td>\n",
1107
+ " <td>Además de extrañarte?. La verdad no estoy segu...</td>\n",
1108
  " </tr>\n",
1109
  " </tbody>\n",
1110
  "</table>\n",
1111
+ "<p>413 rows × 3 columns</p>\n",
1112
  "</div>"
1113
  ],
1114
  "text/plain": [
 
1119
  "3 CARSE es un chatbot que imita el estilo en que... \n",
1120
  "4 CARSE es un chatbot que imita el estilo en que... \n",
1121
  ".. ... \n",
1122
+ "408 CARSE es un chatbot que imita el estilo en que... \n",
1123
+ "409 CARSE es un chatbot que imita el estilo en que... \n",
1124
+ "410 CARSE es un chatbot que imita el estilo en que... \n",
1125
+ "411 CARSE es un chatbot que imita el estilo en que... \n",
1126
+ "412 CARSE es un chatbot que imita el estilo en que... \n",
1127
  "\n",
1128
+ " user \\\n",
1129
+ "0 Ya acabaste tus entregas de hoy? \n",
1130
+ "1 Buenos días amorchis \n",
1131
+ "2 Ya no quiero ir al gym \n",
1132
+ "3 Qué me vas a invitar hoy? \n",
1133
+ "4 Hola amor, ten bonito día, te quierooooo \n",
1134
+ ".. ... \n",
1135
+ "408 No tengo más pendientes \n",
1136
+ "409 11:11 amorchis \n",
1137
+ "410 Buenos días amorchis \n",
1138
+ "411 Amorchis deberíamos de hacer un maratón de pel... \n",
1139
+ "412 Que harás? \n",
1140
  "\n",
1141
  " assistant \n",
1142
+ "0 Ya casi amorcito, solo me falta checar algunos... \n",
1143
+ "1 Buenos días mi Carmen Q, cómo dormiste hoy? Sí... \n",
1144
+ "2 Ve solo un rato Carmen Q, a correr \n",
1145
+ "3 Te invito a besarnos escuchando a Dani Flow \n",
1146
+ "4 Perdóname Carmen Q, me quedé dormido de la nad... \n",
1147
  ".. ... \n",
1148
+ "408 Okey amorcito, me avisas si quieres hacer algo... \n",
1149
+ "409 11:11. Te amo tanto, eres mi deseo diario \n",
1150
+ "410 Buenos días mi amorcito. Sorry por quedarme do... \n",
1151
+ "411 Ay amorcito, estaría super bien eso. Pues pued... \n",
1152
+ "412 Además de extrañarte?. La verdad no estoy segu... \n",
1153
  "\n",
1154
+ "[413 rows x 3 columns]"
1155
  ]
1156
  },
1157
+ "execution_count": 59,
1158
  "metadata": {},
1159
  "output_type": "execute_result"
1160
  }
 
1174
  },
1175
  {
1176
  "cell_type": "code",
1177
+ "execution_count": 60,
1178
  "metadata": {},
1179
  "outputs": [],
1180
  "source": [
 
1198
  },
1199
  {
1200
  "cell_type": "code",
1201
+ "execution_count": 61,
1202
  "metadata": {},
1203
  "outputs": [],
1204
  "source": [
 
1209
  },
1210
  {
1211
  "cell_type": "code",
1212
+ "execution_count": 62,
1213
  "metadata": {},
1214
  "outputs": [
1215
  {
1216
  "name": "stdout",
1217
  "output_type": "stream",
1218
  "text": [
1219
+ "El archivo tiene 413 líneas.\n"
1220
  ]
1221
  }
1222
  ],
 
1233
  " print(\"Archivo no encontrado. Por favor verifica la ruta.\")"
1234
  ]
1235
  },
1236
+ {
1237
+ "cell_type": "code",
1238
+ "execution_count": 63,
1239
+ "metadata": {},
1240
+ "outputs": [],
1241
+ "source": [
1242
+ "def dividir_jsonl(ruta_archivo, num_partes):\n",
1243
+ " # Leer todas las líneas del archivo\n",
1244
+ " with open(ruta_archivo, 'r', encoding='utf-8') as file:\n",
1245
+ " lineas = file.readlines()\n",
1246
+ "\n",
1247
+ " # Calcular el tamaño de cada parte\n",
1248
+ " tamano_parte = len(lineas) // num_partes\n",
1249
+ "\n",
1250
+ " for i in range(num_partes):\n",
1251
+ " # Calcular el inicio y el fin de cada parte\n",
1252
+ " inicio = i * tamano_parte\n",
1253
+ " fin = (i + 1) * tamano_parte if i != num_partes - 1 else len(lineas)\n",
1254
+ "\n",
1255
+ " # Nombre del nuevo archivo\n",
1256
+ " nombre_nuevo_archivo = ruta_archivo.replace('.jsonl', f'_{i + 1}.jsonl')\n",
1257
+ "\n",
1258
+ " # Escribir las líneas en el nuevo archivo\n",
1259
+ " with open(nombre_nuevo_archivo, 'w', encoding='utf-8') as nuevo_archivo:\n",
1260
+ " nuevo_archivo.writelines(lineas[inicio:fin])"
1261
+ ]
1262
+ },
1263
+ {
1264
+ "cell_type": "code",
1265
+ "execution_count": 64,
1266
+ "metadata": {},
1267
+ "outputs": [],
1268
+ "source": [
1269
+ "# Llamada a la función\n",
1270
+ "#dividir_jsonl('Training_data/prompts_finales.jsonl', 2)"
1271
+ ]
1272
+ },
1273
+ {
1274
+ "cell_type": "markdown",
1275
+ "metadata": {},
1276
+ "source": [
1277
+ "# Veamos algunos ejemplos"
1278
+ ]
1279
+ },
1280
+ {
1281
+ "cell_type": "code",
1282
+ "execution_count": 76,
1283
+ "metadata": {},
1284
+ "outputs": [
1285
+ {
1286
+ "data": {
1287
+ "text/html": [
1288
+ "<div>\n",
1289
+ "<style scoped>\n",
1290
+ " .dataframe tbody tr th:only-of-type {\n",
1291
+ " vertical-align: middle;\n",
1292
+ " }\n",
1293
+ "\n",
1294
+ " .dataframe tbody tr th {\n",
1295
+ " vertical-align: top;\n",
1296
+ " }\n",
1297
+ "\n",
1298
+ " .dataframe thead th {\n",
1299
+ " text-align: right;\n",
1300
+ " }\n",
1301
+ "</style>\n",
1302
+ "<table border=\"1\" class=\"dataframe\">\n",
1303
+ " <thead>\n",
1304
+ " <tr style=\"text-align: right;\">\n",
1305
+ " <th></th>\n",
1306
+ " <th>user</th>\n",
1307
+ " <th>assistant</th>\n",
1308
+ " </tr>\n",
1309
+ " </thead>\n",
1310
+ " <tbody>\n",
1311
+ " <tr>\n",
1312
+ " <th>0</th>\n",
1313
+ " <td>Ya acabaste tus entregas de hoy?</td>\n",
1314
+ " <td>Ya casi amorcito, solo me falta checar algunos...</td>\n",
1315
+ " </tr>\n",
1316
+ " <tr>\n",
1317
+ " <th>1</th>\n",
1318
+ " <td>Buenos días amorchis</td>\n",
1319
+ " <td>Buenos días mi Carmen Q, cómo dormiste hoy? Sí...</td>\n",
1320
+ " </tr>\n",
1321
+ " <tr>\n",
1322
+ " <th>2</th>\n",
1323
+ " <td>Ya no quiero ir al gym</td>\n",
1324
+ " <td>Ve solo un rato Carmen Q, a correr</td>\n",
1325
+ " </tr>\n",
1326
+ " <tr>\n",
1327
+ " <th>3</th>\n",
1328
+ " <td>Qué me vas a invitar hoy?</td>\n",
1329
+ " <td>Te invito a besarnos escuchando a Dani Flow</td>\n",
1330
+ " </tr>\n",
1331
+ " <tr>\n",
1332
+ " <th>4</th>\n",
1333
+ " <td>Hola amor, ten bonito día, te quierooooo</td>\n",
1334
+ " <td>Perdóname Carmen Q, me quedé dormido de la nad...</td>\n",
1335
+ " </tr>\n",
1336
+ " <tr>\n",
1337
+ " <th>...</th>\n",
1338
+ " <td>...</td>\n",
1339
+ " <td>...</td>\n",
1340
+ " </tr>\n",
1341
+ " <tr>\n",
1342
+ " <th>408</th>\n",
1343
+ " <td>No tengo más pendientes</td>\n",
1344
+ " <td>Okey amorcito, me avisas si quieres hacer algo...</td>\n",
1345
+ " </tr>\n",
1346
+ " <tr>\n",
1347
+ " <th>409</th>\n",
1348
+ " <td>11:11 amorchis</td>\n",
1349
+ " <td>11:11. Te amo tanto, eres mi deseo diario</td>\n",
1350
+ " </tr>\n",
1351
+ " <tr>\n",
1352
+ " <th>410</th>\n",
1353
+ " <td>Buenos días amorchis</td>\n",
1354
+ " <td>Buenos días mi amorcito. Sorry por quedarme do...</td>\n",
1355
+ " </tr>\n",
1356
+ " <tr>\n",
1357
+ " <th>411</th>\n",
1358
+ " <td>Amorchis deberíamos de hacer un maratón de pel...</td>\n",
1359
+ " <td>Ay amorcito, estaría super bien eso. Pues pued...</td>\n",
1360
+ " </tr>\n",
1361
+ " <tr>\n",
1362
+ " <th>412</th>\n",
1363
+ " <td>Que harás?</td>\n",
1364
+ " <td>Además de extrañarte?. La verdad no estoy segu...</td>\n",
1365
+ " </tr>\n",
1366
+ " </tbody>\n",
1367
+ "</table>\n",
1368
+ "<p>413 rows × 2 columns</p>\n",
1369
+ "</div>"
1370
+ ],
1371
+ "text/plain": [
1372
+ " user \\\n",
1373
+ "0 Ya acabaste tus entregas de hoy? \n",
1374
+ "1 Buenos días amorchis \n",
1375
+ "2 Ya no quiero ir al gym \n",
1376
+ "3 Qué me vas a invitar hoy? \n",
1377
+ "4 Hola amor, ten bonito día, te quierooooo \n",
1378
+ ".. ... \n",
1379
+ "408 No tengo más pendientes \n",
1380
+ "409 11:11 amorchis \n",
1381
+ "410 Buenos días amorchis \n",
1382
+ "411 Amorchis deberíamos de hacer un maratón de pel... \n",
1383
+ "412 Que harás? \n",
1384
+ "\n",
1385
+ " assistant \n",
1386
+ "0 Ya casi amorcito, solo me falta checar algunos... \n",
1387
+ "1 Buenos días mi Carmen Q, cómo dormiste hoy? Sí... \n",
1388
+ "2 Ve solo un rato Carmen Q, a correr \n",
1389
+ "3 Te invito a besarnos escuchando a Dani Flow \n",
1390
+ "4 Perdóname Carmen Q, me quedé dormido de la nad... \n",
1391
+ ".. ... \n",
1392
+ "408 Okey amorcito, me avisas si quieres hacer algo... \n",
1393
+ "409 11:11. Te amo tanto, eres mi deseo diario \n",
1394
+ "410 Buenos días mi amorcito. Sorry por quedarme do... \n",
1395
+ "411 Ay amorcito, estaría super bien eso. Pues pued... \n",
1396
+ "412 Además de extrañarte?. La verdad no estoy segu... \n",
1397
+ "\n",
1398
+ "[413 rows x 2 columns]"
1399
+ ]
1400
+ },
1401
+ "execution_count": 76,
1402
+ "metadata": {},
1403
+ "output_type": "execute_result"
1404
+ }
1405
+ ],
1406
+ "source": [
1407
+ "# Ruta de tu archivo JSONL\n",
1408
+ "archivo_jsonl = 'Training_Data/Training_Prompts.jsonl'\n",
1409
+ "\n",
1410
+ "# Lista para almacenar los datos extraídos\n",
1411
+ "json_data = []\n",
1412
+ "# Leer archivo JSONL\n",
1413
+ "with open(archivo_jsonl, 'r', encoding='utf-8') as file:\n",
1414
+ " for line in file:\n",
1415
+ " registro = json.loads(line)\n",
1416
+ " contenido_user = ''\n",
1417
+ " contenido_assistant = ''\n",
1418
+ " for mensaje in registro['messages']:\n",
1419
+ " if mensaje['role'] == 'user':\n",
1420
+ " contenido_user = mensaje['content']\n",
1421
+ " elif mensaje['role'] == 'assistant':\n",
1422
+ " contenido_assistant = mensaje['content']\n",
1423
+ " json_data.append({'user': contenido_user, 'assistant': contenido_assistant})\n",
1424
+ "\n",
1425
+ "# Convertir los datos a un DataFrame de pandas\n",
1426
+ "samples = pd.DataFrame(json_data)\n",
1427
+ "samples"
1428
+ ]
1429
+ },
1430
+ {
1431
+ "cell_type": "code",
1432
+ "execution_count": 80,
1433
+ "metadata": {},
1434
+ "outputs": [
1435
+ {
1436
+ "name": "stdout",
1437
+ "output_type": "stream",
1438
+ "text": [
1439
+ "\n",
1440
+ "User: Amorchis deberíamos de hacer un maratón de pelis del terror\n",
1441
+ "Assistant: Ay amorcito, estaría super bien eso. Pues puedes el fin de semana o algo así?\n",
1442
+ "\n",
1443
+ "User: Luego te puedo enseñar un trabajo y me das tu opinión?\n",
1444
+ "Assistant: Claro mi Carmen Q, veo lo que quieras\n",
1445
+ "\n",
1446
+ "User: Si te están gustando las pelis amor?\n",
1447
+ "Assistant: Si amorcito, mucho. A ver cuándo me invitar a ver las otras\n",
1448
+ "\n",
1449
+ "User: Tengo mucho sueño no se por que\n",
1450
+ "Assistant: Pues ya duerme Carmen Q, igual y la noche no la pasaste cool\n",
1451
+ "\n",
1452
+ "User: Holaaa. Que tal dormiste?\n",
1453
+ "Assistant: Hola hola, super bien, so��é contigo. Hasta desperté feliz. Tú qué tal dormiste?\n"
1454
+ ]
1455
+ }
1456
+ ],
1457
+ "source": [
1458
+ "# Seleccionar 10 ejemplos aleatorios\n",
1459
+ "sample = samples[['user', 'assistant']].sample(5)\n",
1460
+ "\n",
1461
+ "# Imprimir los resultados en el formato solicitado\n",
1462
+ "for index, row in sample.iterrows():\n",
1463
+ " print(f\"\\nUser: {row['user']}\")\n",
1464
+ " print(f\"Assistant: {row['assistant']}\")"
1465
+ ]
1466
+ },
1467
  {
1468
  "cell_type": "code",
1469
  "execution_count": null,