File size: 92,472 Bytes
b882887 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 1056 1057 1058 1059 1060 1061 1062 1063 1064 |
---
base_model: mixedbread-ai/deepset-mxbai-embed-de-large-v1
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:3262
- loss:MatryoshkaLoss
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: In welchen Datenbeständen wird das Gesetz UrhG in Bezug auf historische
topographische Informationen aus dem 18. Jahrhundert referenziert?
sentences:
- "\nDatenbestand\n - titel: Parkscheinautomaten (PSA) Standorte öffentlich anzeigen\n\
\ - typ: Fachverfahren\n - kurzbeschreibung: Maschinenlesbare Dateien mit\
\ aktuellen Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow.\n -\
\ allgemeine_beschreibung: Es werden 2 maschinenlesbare Dateien mit den aktuellen\
\ Standorten der Parkscheinautomaten (PSA) im Bezirk Pankow bereitgestellt.\n\
\ - fachliche_beschreibung: Der Datensatz wird vom Bezirksamt Pankow, Amt für\
\ öffentliche Ordnung bereitgestellt. Er dient der Transparenz und der besseren\
\ Orientierung im Straßenverkehr in Pankow. Die relevanten Behörden sind das Bezirksamt\
\ Pankow und die FITKO (Föderale IT-Kooperation), welche das GovData Portal betreibt.\n\
\ - zweck: Der Datensatz wird erhoben, um den Bürgerinnen und Bürgern sowie\
\ Besucherinnen und Besuchern von Pankow die Standorte der Parkscheinautomaten\
\ (PSA) zugänglich zu machen und somit das Auffinden von Parkmöglichkeiten zu\
\ erleichtern.\n - einfuehrungsjahr: 2021\nDatenbestand hat Datenlieferanten\n\
\ - name: Amt für öffentliche Ordnung\n - name: Bezirksamt Pankow\nDatenbestand\
\ hat Schlagwort\n - name: ticket\n - name: parkscheinautomat\n - name:\
\ parkplatz\n - name: parken\n - name: parkraumbewirtschaftung\n - name:\
\ pankow\n - name: parkticket\n - name: handyparken\n - name: ordnungsamt\n\
\ - name: berlin\nDatenbestand hat Kategorie\n - name: Verkehr\nDatenbestand\
\ hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\n\
Datenbestand hat politisches Gebiet\n - name: 110010001003\nDatenbestand hat\
\ Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n \
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
\ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ordnungsamt\n \
\ - kurzbezeichnung: OA\n - themen: Öffentliche Ordnung, Ordnungswidrigkeiten,\
\ Lebensmittelaufsicht\n - ministerium_des_geschaeftsbereichs: Innere Verwaltung\n\
\ - ressort: Ordnungs- und Sicherheitsangelegenheiten\nDatenbestand hat Gesetze:\n\
Gesetz\n - bezeichnung: Gesetz zur Durchführung der Verordnung (EU) 2016/425\
\ des Europäischen Parlaments und des Rates vom 9. März 2016 über persönliche\
\ Schutzausrüstungen (PSA)\n - kurzbezeichnung: PSA-DG\nDatenbestand hat Verordnung\n\
Verordnung\nVerordnung\n - referenz: https://www.transparenz.bremen.de/sixcms/detail.php?gsid=bremen2014_tp.c.69002.de&asl=bremen203_tpgesetz.c.55340.de&template=20_gp_ifg_meta_detail_d\n\
\ - bezeichnung: Verordnung über Parkgebühren\n"
- "\nDatenbestand\n - titel: Naphthalin im Meerwasser 2003\n - typ: Fachverfahren\n\
\ - kurzbeschreibung: Messung des Parameters 'Naphthalin im Meerwasser' im\
\ Jahr 2003 im Rahmen von Überwachungsprogrammen für Nord- und Ostsee.\n -\
\ allgemeine_beschreibung: Der Datensatz 'Naphthalin im Meerwasser 2003' wurde\
\ im Rahmen des gemeinsamen Bund/Länder-Messprogramms für die Nord- und Ostsee\
\ sowie weiterer Überwachungsprogramme erhoben, um den Parameter 'Naphthalin im\
\ Meerwasser' zu bestimmen.\n - fachliche_beschreibung: Der Datensatz wird\
\ vom Bundesamt für Seeschifffahrt und Hydrographie (BSH) erhoben. Er dient der\
\ Überwachung der Meeresumwelt in Nord- und Ostsee hinsichtlich des Parameters\
\ 'Naphthalin im Meerwasser'.\n - zweck: Der Datensatz wird erhoben, um die\
\ Konzentration von Naphthalin im Meerwasser zu überwachen und mögliche Umweltauswirkungen\
\ zu bewerten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
\ - zeitliche_abdeckung_start: 2003-05-20\n - zeitliche_abdeckung_ende:\
\ 2003-08-10\nDatenbestand hat Datenlieferanten\n - name: Bundesamt für Seeschifffahrt\
\ und Hydrographie (BSH)\nDatenbestand hat Schlagwort\n - name: open-data\n\
\ - name: monitoring\n - name: naphthalene\n - name: nordsee\n - name:\
\ bundesamt-für-seeschifffahrt-und-hydrographie\n - name: wasser\n - name:\
\ baltic-sea\n - name: the-federal-maritime-and-hydrographic-agency\n -\
\ name: naphthalin\n - name: bsh\n - name: opendata\n - name: nap\n \
\ - name: ostsee\n - name: north-sea\n - name: national\n - name: 2003\n\
\ - name: water\nDatenbestand hat Kategorie\n - name: Wissenschaft und Technologie\n\
\ - name: Fischerei\n - name: Verkehr\n - name: Umwelt\n - name: Regionen\
\ und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft und Nahrungsmittel\n\
Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
Ministerium\n - bezeichnung: Bundesministerium für Wirtschaft und Klimaschutz\n\
\ - kurzbezeichnung: BMWK\n - ressorts: Bundesamt für Seeschifffahrt und\
\ Hydrographie (BSH)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesamt\
\ für Seeschifffahrt und Hydrographie (BSH)\n - kurzbezeichnung: BSH\n -\
\ themen: Seeschifffahrt, Hydrographie, Schifffahrtssicherheit, Meeresumweltschutz\n\
\ - ministerium_des_geschaeftsbereichs: Bundesministerium für Verkehr und digitale\
\ Infrastruktur\n - ressort: Verkehr\nDatenbestand hat Gesetze:\nGesetz\n \
\ - bezeichnung: Grenzwerteverordnung 2003\n - kurzbezeichnung: GKV 2003\n\
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
\ - bezeichnung: Leitfaden zur Anwendung umweltverträglicher Stoffe\nVerordnung\n\
\ - referenz: https://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:268:0029:0043:de:PDF\n\
\ - bezeichnung: VERORDNUNG (EG) Nr. 1831/2003 DES EUROPÄISCHEN PARLAMENTS\
\ UND DES RATES vom 22. September 2003\nVerordnung\n - referenz: https://rathaus.rostock.de/media/rostock_01.a.4984.de/datei/warnowbruecke_u19_umweltfachliche_untersuchungen_wrrl.pdf\n\
\ - bezeichnung: Verordnung zum Schutz der Oberflächengewässer\n - kurzbezeichnung:\
\ OGewV\nVerordnung\n - referenz: https://www.umweltbundesamt.de/sites/default/files/medien/publikation/long/2325.pdf\n\
\ - bezeichnung: Verordnung über Anforderungen an das Einleiten von Abwasser\
\ in Gewässer\n"
- "\nDatenbestand\n - titel: Schmettausches Kartenwerk Brandenburg-Sektion 77,\
\ Potsdam\n - typ: Fachverfahren\n - kurzbeschreibung: Historisches topographisches\
\ Kartenwerk im Maßstab 1:50.000 für das preußische Staatsgebiet östlich der Weser,\
\ erstellt zwischen 1767 und 1787.\n - allgemeine_beschreibung: Das Schmettausche\
\ Kartenwerk Brandenburg-Sektion 77, Potsdam, ist ein historisches topographisches\
\ Kartenwerk im Maßstab 1:50.000, das zwischen 1767 und 1787 erstellt wurde. Es\
\ umfasst insgesamt 270 handgezeichnete Blätter und stellt das damalige preußische\
\ Staatsgebiet östlich der Weser detailliert dar. Die Originale des Kartenwerks\
\ befinden sich in der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz.\n\
\ - fachliche_beschreibung: Das Schmettausche Kartenwerk Brandenburg-Sektion\
\ 77, Potsdam, wird von der Landesvermessung und Geobasisinformation Brandenburg\
\ (LGB) bereitgestellt. Es gehört zum Ressort der Vermessung, Geobasisinformation\
\ und Katasterverwaltung. Die historischen Karten bieten Einblicke in die topographische\
\ Darstellung des preußischen Staatsgebiets im 18. Jahrhundert und dienen Forschungszwecken\
\ im Bereich der Geographie, Geschichte und Kartographie.\n - zweck: Der Zweck\
\ des Datensatzes besteht darin, historische topographische Informationen über\
\ das preußische Staatsgebiet östlich der Weser im 18. Jahrhundert bereitzustellen.\
\ Das Kartenwerk dient der Erforschung und Analyse historischer Gegebenheiten,\
\ insbesondere im Bereich der Vermessung und Kartographie.\n - einfuehrungsjahr:\
\ 2024\n - aktualisierungsfrequenz: unbekannt\nDatenbestand hat Datenlieferanten\n\
\ - name: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
\ hat Schlagwort\n - name: preußisches Staatsgebiet\n - name: 150.000\n\
\ - name: historisch\n - name: vermessung\n - name: Vermessung\n -\
\ name: Kartographie\n - name: opendata\n - name: bodenbedeckung\n -\
\ name: karte\n - name: topographie\n - name: 18. Jahrhundert\nDatenbestand\
\ hat Kategorie\n - name: Wissenschaft und Technologie\n - name: Fischerei\n\
\ - name: Umwelt\n - name: Regierung und öffentlicher Sektor\n - name:\
\ Regionen und Städte\n - name: Landwirtschaft\n - name: Forstwirtschaft\
\ und Nahrungsmittel\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
\ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
\ - ressorts: Landesvermessung und Geobasisinformation Brandenburg (LGB)\nDatenbestand\
\ hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung und Geobasisinformation\
\ Brandenburg (LGB)\n - kurzbezeichnung: LGB\n - themen: Vermessung, Geobasisinformation,\
\ Katasterverwaltung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
\ Infrastruktur und Landesplanung des Landes Brandenburg\n - ressort: Landesvermessung,\
\ Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Gesetz\
\ über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz)\n - kurzbezeichnung:\
\ UrhG\n - paragraph: § 70\nDatenbestand hat Verordnung\nVerordnung\nVerordnung\n\
\ - referenz: https://geobasis-bb.de/lgb/de/service/nutzungsbedingungen/\n\
\ - bezeichnung: Nutzungsbedingungen des Landesvermessung und Geobasisinformation\
\ Brandenburg (LGB)\n"
- source_sentence: In welchen Datenbeständen finde ich vom BMI überwachte Informationen
zu Kinderbetreuungsstätten in Nobitz?
sentences:
- "\nDatenbestand\n - titel: Kindertagesstätten der Gemeinde Nobitz und der beauftragenden\
\ Gemeinden\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten\
\ und Kinderkrippen der Gemeinde Nobitz und beauftragenden Gemeinden.\n - allgemeine_beschreibung:\
\ Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Gemeinde\
\ Nobitz und der beauftragenden Gemeinden. Es handelt sich um einen Sekundärdatenbestand.\
\ Die Kindertagesstätten werden von der Gemeinde Nobitz und den beauftragenden\
\ Gemeinden betrieben.\n - fachliche_beschreibung: Der Datensatz zu den Kindertagesstätten\
\ wird von der Gemeinde Nobitz und den beauftragenden Gemeinden verwaltet. Zuständige\
\ Behörden sind die Gemeinde Nobitz und die beauftragenden Gemeinden, die im Bereich\
\ der Kinderbetreuung tätig sind. Die Daten werden regelmäßig aktualisiert und\
\ über das FITKO (Föderale IT-Kooperation) – GovData Portal bereitgestellt.\n\
\ - zweck: Der Datensatz wird erhoben, um den Bürgern und Bürgerinnen sowie\
\ interessierten Personen Informationen über die Standorte von Kindertagesstätten\
\ in Nobitz und den beauftragenden Gemeinden zur Verfügung zu stellen. Dies dient\
\ der Transparenz und der besseren Zugänglichkeit von Informationen im Bereich\
\ der Kinderbetreuung.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
Datenbestand hat Datenlieferanten\n - name: Gemeinde Nobitz und der beauftragenden\
\ Gemeinden\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n\
\ - name: kindertagesstätten\n - name: langenleuba-niederhain\n - name:\
\ kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name:\
\ opendata\n - name: göpfersdorf\n - name: kinderkrippe\n - name: kita\n\
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
\ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
\ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name:\
\ Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
\ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Gemeinde\
\ Nobitz, beauftragenden Gemeinden\nDatenbestand hat Behörde\nBehoerde\n -\
\ bezeichnung: Gemeinde Nobitz\n - kurzbezeichnung: Nobitz\n - themen: Gemeindeverwaltung,\
\ Verwaltungsaufgaben, Kommunalpolitik\n - ministerium_des_geschaeftsbereichs:\
\ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalaufsicht\n\
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
\ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
\ - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
\ - bezeichnung: Satzung über die Benutzung der Kindertageseinrichtungen in\
\ kommunaler Trägerschaft der Gemeinde Nobitz (KitaBenS)\n - kurzbezeichnung:\
\ KitaBenS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob/@@getlink?id=1339072591\n\
\ - bezeichnung: Kindertageseinrichtungen in kommunaler Trägerschaft der Gemeinde\
\ Nobitz\n - kurzbezeichnung: KitaGebS\nVerordnung\n - referenz: https://www.nobitz.de/inhalte/nobitz/_inhalt/nobitz/ortsrecht/ortsrecht_nob\n\
\ - bezeichnung: Ordnungsbehördliche Verordnung\n"
- "\nDatenbestand\n - titel: Preußische Urmesstischblätter 1 : 25 000 4345 Herzberg/Elster\n\
\ - typ: Fachverfahren\n - kurzbeschreibung: Historische handgezeichnete\
\ topographische Karten im Maßstab 1 : 25 000 des gesamten Staatsgebiets Preußens\
\ aus dem 19. Jahrhundert.\n - allgemeine_beschreibung: Die Preußischen Urmesstischblätter\
\ im Maßstab 1 : 25 000 wurden ab 1822 für das gesamte Staatsgebiet Preußens erstellt.\
\ Diese handgezeichneten Karten dienten als Grundlage für kleinere Kartenwerke\
\ und markieren den Beginn der topographischen Kartographie in Preußen. Die Karten\
\ sind heute als hochwertige Drucke verfügbar und bilden historische Landkarten\
\ ab.\n - fachliche_beschreibung: Die Preußischen Urmesstischblätter werden\
\ von der Landesvermessung und Geobasisinformation Brandenburg (LGB) erhoben und\
\ sind Teil der historischen Kartographie des Landes. Das Ministerium für Infrastruktur\
\ und Landesplanung des Landes Brandenburg hat die fachliche Aufsicht über die\
\ Erstellung und Bereitstellung dieser historischen Karten.\n - zweck: Die\
\ Preußischen Urmesstischblätter werden erhoben, um historische topographische\
\ Informationen über das Staatsgebiet Preußens im 19. Jahrhundert bereitzustellen.\
\ Sie dienen der Erforschung und Darstellung historischer Landnutzung, Siedlungsstrukturen\
\ und topographischer Gegebenheiten.\n - einfuehrungsjahr: 2024\n - aktualisierungsfrequenz:\
\ unbekannt\nDatenbestand hat Datenlieferanten\n - name: Landesvermessung und\
\ Geobasisinformation Brandenburg (LGB)\nDatenbestand hat Schlagwort\n - name:\
\ 125.000\n - name: Katasterverwaltung\n - name: Maßstab 1:25.000\n -\
\ name: historisch\n - name: vermessung\n - name: Topographie\n - name:\
\ Preußische Urmesstischblätter\n - name: opendata\n - name: bodenbedeckung\n\
\ - name: karte\n - name: Historische Karten\n - name: Geobasisinformation\n\
\ - name: Landesvermessung\nDatenbestand hat Kategorie\n - name: Wissenschaft\
\ und Technologie\n - name: Fischerei\n - name: Umwelt\n - name: Regierung\
\ und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Landwirtschaft\n\
\ - name: Forstwirtschaft und Nahrungsmittel\nDatenbestand hat Ministerium\n\
Ministerium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n\
\ - kurzbezeichnung: BMI\n - ressorts: Landesvermessung und Geobasisinformation\
\ Brandenburg (LGB)\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Landesvermessung\
\ und Geobasisinformation Brandenburg (LGB)\n - kurzbezeichnung: LGB\n -\
\ themen: Vermessung, Geobasisinformation, Katasterverwaltung\n - ministerium_des_geschaeftsbereichs:\
\ Ministerium für Infrastruktur und Landesplanung des Landes Brandenburg\n \
\ - ressort: Landesvermessung, Geoinformation\nDatenbestand hat Gesetze:\nGesetz\n\
\ - bezeichnung: Gesetz über die Landesvermessung und Geobasisinformation Brandenburg\
\ (VermGeoG Bbg)\n - kurzbezeichnung: VermGeoG Bbg\nDatenbestand hat Verordnung\n\
Verordnung\n - bezeichnung: Verordnung über die Geodateninfrastruktur Brandenburg\
\ (GeoDINV Bbg)\n - kurzbezeichnung: GeoDINV Bbg\nVerordnung\n - bezeichnung:\
\ Instruction für die topographischen Arbeiten des Königlich Preußischen Generalstabes\
\ von 1821\n - kurzbezeichnung: Instruction 1821\nVerordnung\n - bezeichnung:\
\ Erläuterungen zu den Musterblättern für die topographischen Arbeiten des Königlich\
\ Preußischen Generalstabes\n - kurzbezeichnung: Erläuterungen Musterblätter\n"
- "\nDatenbestand\n - titel: Kindertagesstätten\n - typ: Fachverfahren\n \
\ - kurzbeschreibung: Stammdaten aller Kindertagesstätten in Schleswig-Holstein\
\ mit Informationen wie Einrichtungsnummer, Adresse, pädagogischem Konzept, Trägername\
\ und Betreuungsalter.\n - allgemeine_beschreibung: Der Datensatz 'Kindertagesstätten'\
\ enthält die Stammdaten aller Kindertagesstätten, die im KitaPortal Schleswig-Holstein\
\ enthalten sind. Die Daten umfassen Informationen wie die eindeutige Nummer der\
\ Einrichtung, die Anschrift, barrierefreien Zugang, pädagogisches Konzept, Trägername,\
\ Betreuungsalter, Öffnungszeiten und mehr.\n - fachliche_beschreibung: Der\
\ Datensatz 'Kindertagesstätten' wird vom Ministerium für Soziales, Jugend, Familie,\
\ Senioren, Integration und Gleichstellung erhoben. Er enthält relevante Informationen\
\ über die Kindertagesstätten in Schleswig-Holstein und dient der Bereitstellung\
\ von wichtigen Daten für Eltern, Erziehungsberechtigte und Interessierte.\n \
\ - zweck: Der Datensatz wird erhoben, um Transparenz über die vorhandenen Kindertagesstätten\
\ in Schleswig-Holstein zu schaffen und Eltern sowie Erziehungsberechtigten bei\
\ der Suche nach passenden Betreuungseinrichtungen zu unterstützen.\n - einfuehrungsjahr:\
\ 2023\n - zeitliche_abdeckung_start: 2022-12-17T00:00:00\n - zeitliche_abdeckung_ende:\
\ 2023-01-17T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Jugend\n\
\ - name: Familie\n - name: Senioren\n - name: Ministerium für Soziales\n\
\ - name: Integration und Gleichstellung\nDatenbestand hat Schlagwort\n \
\ - name: Barrierefreiheit\n - name: Kindertagespflege\n - name: kindergarten\n\
\ - name: kindertagestätten\n - name: tagespflege\n - name: Schleswig-Holstein\n\
\ - name: kitas\n - name: Pädagogisches Konzept\n - name: Kindergarten\n\
\ - name: Kita\n - name: Trägername\n - name: Betreuungsalter\n -\
\ name: kindertagespflege\n - name: kindertageseinrichtungen\n - name: Öffnungszeiten\n\
\ - name: kita\n - name: kindertagesstätte\n - name: Kindertageseinrichtungen\n\
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
Datenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\n\
Ministerium\n - bezeichnung: Bundesministerium für Familie, Senioren, Frauen\
\ und Jugend\n - kurzbezeichnung: BMFSFJ\n - ressorts: Ministerium für Soziales,\
\ Jugend, Familie, Senioren, Integration und Gleichstellung\nDatenbestand hat\
\ Behörde\nBehoerde\n - bezeichnung: Ministerium für Soziales, Jugend, Familie,\
\ Senioren, Integration und Gleichstellung\n - kurzbezeichnung: MSJFSIG\n \
\ - ministerium_des_geschaeftsbereichs: Ministerium für Soziales, Jugend, Familie,\
\ Senioren, Integration und Gleichstellung des Landes Schleswig-Holstein\n \
\ - ressort: Soziales\nDatenbestand hat Gesetze:\nGesetz\n - absatz: Teil 2\n\
\ - bezeichnung: Kindertagesstättengesetz Schleswig-Holstein\n - kurzbezeichnung:\
\ KiTaG SH\n - paragraph: § 4\nGesetz\n - bezeichnung: KiTa-Qualitätsgesetz\n\
Datenbestand hat Verordnung\nVerordnung\n - referenz: http://www.schure.de/21130/dvo-nkitag.htm\n\
\ - bezeichnung: Verordnung zur Durchführung des Niedersächsischen Gesetzes\
\ über Kindertagesstätten und Kindertagespflege\n - kurzbezeichnung: DVO-NKiTaG\n"
- source_sentence: In welchen Datenbeständen sind statistische Auswertungen aus dem
Sterberegister von Roetgen für 2020 enthalten gemäß dem Gesetz zum Schutz vor
Luftverunreinigung, Geräuschen?
sentences:
- "\nDatenbestand\n - titel: Datenbanken Beschäftigungsstatistik\n - typ:\
\ Fachverfahren\n - kurzbeschreibung: Monatliche Beschäftigtenkennzahlen nach\
\ soziodemographischen Merkmalen und Berufen in Deutschland.\n - allgemeine_beschreibung:\
\ Die Datenbanken Beschäftigungsstatistik enthalten monatliche Beschäftigtenkennzahlen\
\ nach soziodemographischen Merkmalen sowie der Klassifikation der Berufe. Die\
\ Datenbanken werden quartalsweise mit Monatsdaten aktualisiert und bieten einen\
\ umfassenden Überblick über die Beschäftigungssituation in Deutschland.\n \
\ - fachliche_beschreibung: Die Datenbanken Beschäftigungsstatistik werden von\
\ der Statistik der Bundesagentur für Arbeit geführt. Sie bieten detaillierte\
\ Informationen über die Beschäftigungssituation in Deutschland und werden quartalsweise\
\ mit aktuellen Monatsdaten aktualisiert. Die Daten dienen als Grundlage für Analysen\
\ zur Entwicklung des Arbeitsmarktes und der Beschäftigungsdynamik. Zu den relevanten\
\ Behörden gehören die Bundesagentur für Arbeit und das Bundesministerium für\
\ Arbeit und Soziales.\n - zweck: Der Datensatz wird erhoben, um detaillierte\
\ Einblicke in die Beschäftigungssituation in Deutschland zu ermöglichen. Er dient\
\ der Analyse von Trends in der Beschäftigung nach verschiedenen Merkmalen wie\
\ Alter, Geschlecht, Beruf und Staatsangehörigkeit.\nDatenbestand hat Datenlieferanten\n\
\ - name: Statistik der Bundesagentur für Arbeit\nDatenbestand hat Schlagwort\n\
\ - name: Arbeitszeit\n - name: Ausschließlich geringfügig Beschäftigte\n\
\ - name: Staatsangehörigkeit\n - name: Sozialversicherungspflichtig beschäftigte\
\ Auszubildende\n - name: Geschlecht\n - name: Beschäftigung\n - name:\
\ Berufe\n - name: Beschäftigte\n - name: Sozialversicherungspflichtig Beschäftigte\n\
\ - name: Geringfügig Beschäftigte\n - name: Geringfügig Beschäftigte im\
\ Nebenjob\n - name: Alter\nDatenbestand hat Kategorie\n - name: Wirtschaft\
\ und Finanzen\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat politische\
\ Ebenen\n - name: Bundesebene\nDatenbestand hat geografische Abdeckung\n \
\ - name: Kreise\n - name: Deutschland\n - name: Länder\nDatenbestand\
\ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Arbeit\
\ und Soziales\n - kurzbezeichnung: BMAS\n - ressorts: Statistik der Bundesagentur\
\ für Arbeit\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesagentur\
\ für Arbeit (BA)\n - kurzbezeichnung: BA\n - themen: Arbeitsmarkt, Beschäftigungsstatistik,\
\ Ressortstatistiken\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
\ für Arbeit und Soziales\n - ressort: Bundesagentur für Arbeit\nDatenbestand\
\ hat Gesetze:\nGesetz\n - bezeichnung: Verdienststatistikgesetz\n - paragraph:\
\ § 4\nDatenbestand hat Verordnung\nVerordnung\n - referenz: SR 431.012.1\n\
\ - bezeichnung: Verordnung vom 30. Juni 1993 über statistische Erhebungen\n\
Verordnung\n - referenz: Entwurf eines Gesetzes zur Einführung eines Registerzensus\n\
\ - bezeichnung: Registerzensusgesetz\n"
- "\nDatenbestand\n - titel: Wahllokale in Lübeck zur Europawahl 2024\n -\
\ typ: Fachverfahren\n - kurzbeschreibung: Georeferenzierter Datensatz der\
\ Wahllokale in Lübeck zur Europawahl 2024.\n - allgemeine_beschreibung: Der\
\ Datensatz enthält georeferenzierte Informationen zu den Wahllokalen in der Hansestadt\
\ Lübeck für die Europawahl am 9. Juni 2024. Enthalten sind Angaben wie Wahlbezirksnummer,\
\ Name des Wahllokals, Adresse, Hinweise zum Wahllokal, Barrierefreiheit und Koordinaten.\n\
\ - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung der\
\ Hansestadt Lübeck bereitgestellt und enthält Informationen zu den Wahllokalen,\
\ die für die Europawahl am 9. Juni 2024 relevant sind. Die Daten werden im Fachverfahren\
\ der Kommunalverwaltung verwaltet und dienen der Unterstützung des Wahlprozesses\
\ in Lübeck.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Lübeck\
\ die Standorte der Wahllokale für die Europawahl 2024 zugänglich zu machen und\
\ ihnen eine barrierefreie Teilnahme zu ermöglichen.\n - einfuehrungsjahr:\
\ 2024\n - zeitliche_abdeckung_start: 2024-06-09T00:00:00\n - zeitliche_abdeckung_ende:\
\ 2024-06-09T00:00:00\nDatenbestand hat Datenlieferanten\n - name: Hansestadt\
\ Lübeck\nDatenbestand hat Schlagwort\n - name: barrierefreiheit\n - name:\
\ wahlbezirk\n - name: wahllokal\n - name: wahl\n - name: stimmbezirk\n\
Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\nDatenbestand\
\ hat Ministerium\nMinisterium\n - bezeichnung: Hansestadt Lübeck\nDatenbestand\
\ hat Behörde\nBehoerde\n - bezeichnung: Hansestadt Lübeck\n - kurzbezeichnung:\
\ Stadtverwaltung\n - themen: Stadtverwaltung, Kommunalverwaltung, Bürgerservice\n\
\ - ministerium_des_geschaeftsbereichs: Innenministerium des Landes Schleswig-Holstein\n\
\ - ressort: Kommunale Verwaltung\nDatenbestand hat Gesetze:\nGesetz\n -\
\ bezeichnung: Europawahlgesetz\nDatenbestand hat Verordnung\nVerordnung\n \
\ - bezeichnung: Datenschutzgrundverordnung (DSGVO)\n - kurzbezeichnung: DSGVO\n\
Verordnung\n - bezeichnung: Europawahlordnung\n"
- "\nDatenbestand\n - titel: Auswertungen aus dem Sterberegister der Gemeinde\
\ Roetgen\n - typ: Fachverfahren\n - kurzbeschreibung: Auswertungen aus\
\ dem Sterberegister der Gemeinde Roetgen, Jahr 2020.\n - allgemeine_beschreibung:\
\ Der Datensatz enthält Auswertungen aus dem Sterberegister der Gemeinde Roetgen,\
\ speziell aus dem Jahr 2020. Die Daten werden jährlich aktualisiert und sind\
\ über das GovData Portal verfügbar.\n - fachliche_beschreibung: Der Datensatz\
\ wird von der Stadt Aachen bereitgestellt und enthält statistische Auswertungen\
\ aus dem Sterberegister der Gemeinde Roetgen. Die Daten dienen der Analyse von\
\ Sterbefällen in der Gemeinde und werden unter der fachlichen Aufsicht des Bundesministeriums\
\ des Innern und für Heimat veröffentlicht.\n - zweck: Der Datensatz wird erhoben,\
\ um Einblicke in Sterbefälle und statistische Auswertungen im Bereich der Gemeinde\
\ Roetgen zu ermöglichen.\n - einfuehrungsjahr: 2024\nDatenbestand hat Datenlieferanten\n\
\ - name: Aachen\nDatenbestand hat Schlagwort\n - name: sterbefälle\n \
\ - name: auswertungen\n - name: Sterbefälle\n - name: Auswertungen\n \
\ - name: GovData Portal\n - name: Statistiken\n - name: roetgen\n \
\ - name: Jahresbericht\n - name: Gemeinde Roetgen\nDatenbestand hat Kategorie\n\
\ - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n\
\ - name: Bevölkerung und Gesellschaft\nDatenbestand hat Ministerium\nMinisterium\n\
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
\ BMI\n - ressorts: Stadt Aachen, StädteRegion Aachen, Rathaus Aachen\nDatenbestand\
\ hat Behörde\nBehoerde\n - bezeichnung: Stadt Aachen\n - kurzbezeichnung:\
\ Stadtverwaltung Aachen\n - ministerium_des_geschaeftsbereichs: Ministerium\
\ des Innern\n - ressort: Kommunales\nDatenbestand hat Gesetze:\nGesetz\n \
\ - bezeichnung: Gesetz zum Schutz vor Luftverunreinigung, Geräuschen\n -\
\ paragraph: § 5 Abs. 1; 7 Abs. 1; 9 Abs. 3; 10 Abs. 4\nDatenbestand hat Verordnung\n\
Verordnung\n - referenz: https://www.roetgen.de/wp-content/uploads/2018/06/Ordnungsbeh%C3%B6rdliche-Verordnung-%C3%BCber-die-Aufrechterhaltung-der-%C3%B6ffentlichen-Sicherheit-und-Ordnung.pdf\n\
\ - bezeichnung: Ordnungsbehördliche Verordnung - Gemeinde Roetgen\nVerordnung\n\
\ - referenz: https://buergerportal.roetgen.de/detail/-/vr-bis-detail/dienstleistung/659/show\n\
\ - bezeichnung: Personenstandsurkunden Aufbewahrungsfristen\n"
- source_sentence: Welche Datenquellen des BStU bieten Einblicke in die Antragszahlen
und Verwendungszwecke für Stasi-Unterlagen?
sentences:
- "\nDatenbestand\n - titel: Entwicklung der Antragszahlen nach Verwendungszweck\n\
\ - typ: Fachverfahren\n - kurzbeschreibung: Anzahl der Anträge und Ersuchen\
\ an die Stasi-Unterlagen-Behörde (BStU) nach Verwendungszweck und Jahren gemäß\
\ Stasi-Unterlagen-Gesetz (StUG).\n - allgemeine_beschreibung: Der Datensatz\
\ bietet eine Übersicht über die Anzahl der an die Stasi-Unterlagen-Behörde (BStU)\
\ gestellten Anträge und Ersuchen, aufgeschlüsselt nach Jahren und den jeweiligen\
\ Verwendungszwecken gemäß Stasi-Unterlagen-Gesetz (StUG). Die Daten werden vom\
\ Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen\
\ Deutschen Demokratischen Republik (BStU) bereitgestellt und sind über das FITKO\
\ (Föderale IT-Kooperation) – GovData Portal verfügbar.\n - fachliche_beschreibung:\
\ Der Datensatz wird vom Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes\
\ der ehemaligen Deutschen Demokratischen Republik (BStU) bereitgestellt. Die\
\ Behörde ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt\
\ und hat den Auftrag, die Unterlagen des ehemaligen Staatssicherheitsdienstes\
\ der DDR zu sichern, zu erforschen und der Öffentlichkeit zugänglich zu machen.\
\ Die Antragszahlen geben Einblicke in das Interesse an der Aufarbeitung der Stasi-Unterlagen\
\ und dienen der historischen Forschung sowie der Erinnerungskultur.\n - zweck:\
\ Der Datensatz wird erhoben, um Transparenz über die Anzahl und die Verwendungszwecke\
\ der gestellten Anträge und Ersuchen an die Stasi-Unterlagen-Behörde zu schaffen.\
\ Dies dient der Aufarbeitung von Unterlagen des Staatssicherheitsdienstes der\
\ ehemaligen DDR und ermöglicht es Forschern, Historikern und der interessierten\
\ Öffentlichkeit Einblicke in die Aktivitäten der Stasi zu erhalten.\n - einfuehrungsjahr:\
\ 2014\nDatenbestand hat Datenlieferanten\n - name: Der Bundesbeauftragte für\
\ die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratsichen\
\ Republik (BStU)\nDatenbestand hat Schlagwort\n - name: anträge\n - name:\
\ antrag\n - name: stug\n - name: staatssicherheit\n - name: ersuchen\n\
\ - name: aufarbeitung\n - name: auskunft\n - name: stasi\n - name:\
\ ddr\n - name: akteneinsicht\n - name: mfs\n - name: stasi-unterlagen\n\
Datenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n\
\ - name: Wissenschaft und Technologie\nDatenbestand hat Ministerium\nMinisterium\n\
\ - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
\ BMI\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Der Bundesbeauftragte\
\ für die Unterlagen des Staatssicherheitsdienstes der ehemaligen Deutschen Demokratischen\
\ Republik (BStU)\n - kurzbezeichnung: BStU\n - themen: Staatssicherheitsdienst,\
\ Unterlagen, DDR\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
\ des Innern, für Bau und Heimat\n - ressort: Bundesbeauftragter für die Stasi-Unterlagen\n\
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Stasi-Unterlagen-Gesetz\n\
\ - kurzbezeichnung: StUG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
\ https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/3_Downloads/Gesetze_und_Verordnungen/GuV/D/VO_Datentransparenzverordnung.pdf\n\
\ - bezeichnung: VO_Datentransparenzverordnung\n"
- "\nDatenbestand\n - titel: UAV-Lärmmessdaten des RauMoLeS-Projekts\n - typ:\
\ Fachverfahren\n - kurzbeschreibung: Lärmmessdaten von UAVs im RauMoLeS-Projekt,\
\ inklusive Positionen der Messmikrofone und UAVs, Propellerdrehzahlen und elektrische\
\ Gesamtsystemleistung.\n - allgemeine_beschreibung: Der Datensatz enthält\
\ Lärmmessdaten von UAVs im Rahmen des RauMoLeS-Projekts. Es gibt Messdaten für\
\ das UAV \"Manta Ray\" und drei verschiedene Konfigurationen des UAV \"Minitalon\"\
. Die Daten umfassen die Positionen der Messmikrofone und der UAVs, sowie Propellerdrehzahlen\
\ und die elektrische Gesamtsystemleistung der UAVs.\n - fachliche_beschreibung:\
\ Der Datensatz wird vom Lehrstuhl für Luftfahrtsysteme der Technischen Universität\
\ München und der Phoenix-Wings GmbH bereitgestellt. Er dient der Erfassung und\
\ Analyse von Lärmemissionen von UAVs, insbesondere im Bereich der Luftfahrt.\
\ Das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) ist die\
\ zuständige Behörde für Luftfahrtthemen.\n - zweck: Der Datensatz wurde erhoben,\
\ um Lärmdaten von UAVs zu sammeln und zu analysieren, insbesondere im Hinblick\
\ auf die Auswirkungen auf die Umwelt und die Bevölkerung. Die Daten dienen der\
\ Forschung und Entwicklung im Bereich der Luftfahrt.\n - einfuehrungsjahr:\
\ 2020\nDatenbestand hat Datenlieferanten\n - name: Prof. Schaller UmweltConsult\
\ GmbH\n - name: 2020\n - name: 2020 Flugmessdaten: Phoenix-Wings GmbH\n\
\ - name: Technische Universität München\n - name: Lärmdaten: Lehrstuhl\
\ für Luftfahrtsysteme\nDatenbestand hat Schlagwort\n - name: Minitalon\n \
\ - name: Manta Ray\n - name: mcloud_category_aviation\n - name: mfund-projekt-raumoles\n\
\ - name: Propellerdrehzahlen\n - name: mcloud_idd46c56b5-c70e-4fc9-bd54-b62d82db146e\n\
\ - name: UAVs\n - name: Gesamtsystemleistung\n - name: Luftfahrt\n \
\ - name: Lärmdaten\n - name: RauMoLeS-Projekt\nDatenbestand hat Kategorie\n\
\ - name: Verkehr\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
\ Bundesministerium für Verkehr und digitale Infrastruktur\n - kurzbezeichnung:\
\ BMDV\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Bundesministerium\
\ für Verkehr und digitale Infrastruktur\n - kurzbezeichnung: BMVI\n - themen:\
\ Lärmdaten, Flugmessdaten\n - ministerium_des_geschaeftsbereichs: Bundesministerium\
\ für Verkehr und digitale Infrastruktur\n - ressort: Luftfahrt\nDatenbestand\
\ hat Gesetze:\nGesetz\n - bezeichnung: Bundes-Immissionsschutzgesetz\n \
\ - kurzbezeichnung: BImSchG\n - paragraph: 34\nDatenbestand hat Verordnung\n\
Verordnung\n - referenz: https://www.mcloud.de/export/csv/datasets?page=1&pageSize=198&sortOrder=desc&sortField=latest&aggs=categories%3Aaviation\n\
\ - bezeichnung: Verordnung zur Durchführung des Bundes-Immissionsschutzgesetzes\n\
\ - kurzbezeichnung: 34. BImSchV\n"
- "\nDatenbestand\n - titel: Kindertageseinrichtungen in Neckarsulm\n - typ:\
\ Fachverfahren\n - kurzbeschreibung: Standorte, Öffnungszeiten und weitere\
\ Infos zu Kindertageseinrichtungen in Neckarsulm.\n - allgemeine_beschreibung:\
\ Der Datensatz enthält Informationen zu den Standorten, Öffnungszeiten und weiteren\
\ Details der Kindertageseinrichtungen in Neckarsulm.\n - fachliche_beschreibung:\
\ Der Datensatz wird vom Amt für Stadtentwicklung und Gebäudewirtschaft, Stadtplanung\
\ und GIS der Stadt Neckarsulm bereitgestellt. Er enthält relevante Informationen\
\ zu den Kindertageseinrichtungen in der Stadt, um Transparenz zu schaffen und\
\ Eltern bei der Suche nach einer geeigneten Einrichtung zu unterstützen.\n \
\ - zweck: Der Datensatz wird erhoben, um Eltern und Erziehungsberechtigten einen\
\ Überblick über die verfügbaren Kindertageseinrichtungen in Neckarsulm zu geben\
\ und sie bei der Auswahl einer passenden Einrichtung zu unterstützen.\n -\
\ einfuehrungsjahr: 2023\nDatenbestand hat Datenlieferanten\n - name: Stadtplanung\
\ und GIS\n - name: Amt für Stadtentwicklung und Gebäudewirtschaft\nDatenbestand\
\ hat Schlagwort\n - name: Kindertageseinrichtung\n - name: GIS\n - name:\
\ Stadtplanung\n - name: Neckarsulm\n - name: kindertageseinrichtung\n \
\ - name: Gebäudewirtschaft\n - name: Kita\n - name: Öffnungszeiten\n\
\ - name: kita\n - name: Standorte\n - name: Stadtentwicklung\nDatenbestand\
\ hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\nDatenbestand\
\ hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium für Wohnen,\
\ Stadtentwicklung und Bauwesen\n - kurzbezeichnung: BMWSB\nDatenbestand hat\
\ Behörde\nBehoerde\n - bezeichnung: Amt für Stadtentwicklung und Gebäudewirtschaft,\
\ Stadtplanung und GIS\n - kurzbezeichnung: Stadtentwicklung und Bauamt\n \
\ - themen: Stadtentwicklung, Gebäudewirtschaft, Stadtplanung, GIS\n - ministerium_des_geschaeftsbereichs:\
\ Bundesministerium des Innern, für Bau und Heimat\n - ressort: Stadtentwicklung,\
\ Bau und Wohnungswesen\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung:\
\ Gesetz zur Bildung, Erziehung und Betreuung von Kindern in Kindertageseinrichtungen\
\ und in Tagespflege (BayKiBiG)\n - kurzbezeichnung: BayKiBiG\nGesetz\n \
\ - bezeichnung: Kindertagesstättengesetz (KitaG)\n - kurzbezeichnung: KitaG\n\
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.landesrecht-bw.de/bsbw/document/jlr-KiTaVBWV6P1\n\
\ - bezeichnung: Verordnung des Kultusministeriums über den Mindestpersonalschlüssel\
\ und die Personalfortbildung in Kindergärten und Tageseinrichtungen mit altersgemischten\
\ Gruppen (KiTaVO)\n - kurzbezeichnung: KiTaVO\nVerordnung\n - referenz:\
\ https://www.bmfsfj.de/bmfsfj/themen/familie/kinderbetreuung/fuer-gute-kinderbetreuung-bundesweit-das-kita-qualitaetsgesetz-209046\n\
\ - bezeichnung: KiTa-Qualitätsgesetz\n - kurzbezeichnung: KiTa-Qualitätsgesetz\n"
- source_sentence: Welche Datenbestände dokumentieren die Fachaufsicht des BMI über
Kinderbetreuungseinrichtungen in der Stadt Oberhof?
sentences:
- "\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung:\
\ Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und\
\ Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz\
\ 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt\
\ Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16\
\ Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung:\
\ Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt,\
\ speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer\
\ Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben,\
\ um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung\
\ aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start:\
\ 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\n\
Datenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\n\
Datenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n \
\ - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n\
\ - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\n\
Datenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n \
\ - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name:\
\ Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n\
\ - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat\
\ Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n -\
\ name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n -\
\ bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung:\
\ BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat\
\ Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n\
\ - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung,\
\ Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für\
\ Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\n\
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n\
\ - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz:\
\ https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n\
\ - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und\
\ Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n\
\ - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n"
- "\nDatenbestand\n - titel: Bebauungspläne\n - typ: Fachverfahren\n -\
\ kurzbeschreibung: Der Datensatz enthält Bebauungspläne der Ortsgemeinde Wintrich,\
\ die die Nutzung von Grundstücken in bestimmten Gebieten regeln.\n - allgemeine_beschreibung:\
\ Der Datensatz umfasst Bebauungspläne, die von der Ortsgemeinde Wintrich bereitgestellt\
\ werden. Bebauungspläne sind Satzungen, die von Gemeinden beschlossen werden\
\ und die beabsichtigte Bodennutzung in einem bestimmten Gebiet regeln.\n -\
\ fachliche_beschreibung: Die Ortsgemeinde Wintrich stellt Bebauungspläne bereit,\
\ die im Rahmen der Bauleitplanung gemäß dem Baugesetzbuch (BauGB) erstellt werden.\
\ Die Bebauungspläne werden als Satzungen von der Gemeinde beschlossen und regeln\
\ die Art der baulichen Nutzung sowie die städtebauliche Entwicklung in einem\
\ definierten Gebiet. Zuständig für die Verwaltung und Bereitstellung der Bebauungspläne\
\ ist die Kommunalverwaltung der Ortsgemeinde Wintrich.\n - zweck: Die Bebauungspläne\
\ dienen dazu, die bauliche und sonstige Nutzung von Grundstücken in einem definierten\
\ Gebiet zu regeln. Sie legen fest, welche Art von Bebauung zulässig ist und dienen\
\ der städtebaulichen Entwicklung und Ordnung.\n - einfuehrungsjahr: 2022\n\
Datenbestand hat Datenlieferanten\n - name: Ortsgemeinde Wintrich\nDatenbestand\
\ hat Schlagwort\n - name: Ortsgemeinde Wintrich\n - name: städtebauliche\
\ Entwicklung\n - name: Bebauungspläne\n - name: Baugesetzbuch\n - name:\
\ Bauleitplanung\n - name: Satzungen\nDatenbestand hat Kategorie\n - name:\
\ Regierung und öffentlicher Sektor\nDatenbestand hat Sprache\n - name: http://publications.europa.eu/resource/authority/language/GER\n\
Datenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium\
\ des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Ortsgemeinde\
\ Wintrich\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Ortsgemeinde\
\ Wintrich\n - kurzbezeichnung: Ortsgemeinde Wintrich\n - themen: Gemeindeverwaltung,\
\ Ortsrecht, Bürgerdienste\n - ministerium_des_geschaeftsbereichs: Ministerium\
\ des Innern, für Sport und Infrastruktur Rheinland-Pfalz\n - ressort: Kommunalverwaltung\n\
Datenbestand hat Gesetze:\nGesetz\n - absatz: (1) Die Gemeinde beschließt den\
\ Bebauungsplan als Satzung. (2) Bebauungspläne nach § 8 Absatz ...\n - bezeichnung:\
\ Baugesetzbuch (BauGB)\n - kurzbezeichnung: BauGB\n - paragraph: § 10\n\
Datenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bmwsb.bund.de/SharedDocs/gesetzgebungsverfahren/Webs/BMWSB/DE/digitalisierung-im-bauleitverfahren.html\n\
\ - bezeichnung: Entwurf eines Gesetzes zur Stärkung der Digitalisierung\n\
\ - kurzbezeichnung: Digitalisierungsgesetz\nVerordnung\n - referenz: https://recht.nrw.de/lmi/owa/br_bes_text?print=1&anw_nr=1&gld_nr=%202&ugl_nr=2311&val=2493&ver=7&aufgehoben=J&keyword=&bes_id=2493&show_preview=1\n\
\ - bezeichnung: Verordnung zur Änderung der Baunutzungsverordnung\n - kurzbezeichnung:\
\ BauNVO\n"
- "\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ:\
\ Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen\
\ der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte\
\ von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen\
\ Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von\
\ der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen\
\ in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof\
\ und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der\
\ Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren\
\ Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz:\
\ http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\n\
Datenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat\
\ Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n -\
\ name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n\
\ - name: thüringen\n - name: opendata\n - name: kinderkrippe\n -\
\ name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur\
\ und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen\
\ und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n\
\ - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung:\
\ Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n \
\ - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung:\
\ Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen:\
\ Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs:\
\ Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\n\
Datenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n\
\ - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n \
\ - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n\
\ - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle\
\ für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n\
\ - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung\
\ einer erfüllenden Gemeinde\n"
model-index:
- name: SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 512
type: dim_512
metrics:
- type: cosine_accuracy@1
value: 0.40814867762687634
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6311651179413867
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.7176554681915654
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8077197998570408
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.40814867762687634
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.21038837264712884
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.14353109363831304
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08077197998570407
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.40814867762687634
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.6311651179413867
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.7176554681915654
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8077197998570408
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6045190659045919
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5398677626876347
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.5472345393824497
name: Cosine Map@100
---
# SentenceTransformer based on mixedbread-ai/deepset-mxbai-embed-de-large-v1
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [mixedbread-ai/deepset-mxbai-embed-de-large-v1](https://huggingface.co/mixedbread-ai/deepset-mxbai-embed-de-large-v1) <!-- at revision fe450620a047ac704e100d84aebe7cd3fc137021 -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 1024 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Welche Datenbestände dokumentieren die Fachaufsicht des BMI über Kinderbetreuungseinrichtungen in der Stadt Oberhof?',
'\nDatenbestand\n - titel: Kindertagesstätten der Stadt Oberhof\n - typ: Fachverfahren\n - kurzbeschreibung: Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof.\n - allgemeine_beschreibung: Der Datensatz zeigt die Standorte von Kindergärten und Kinderkrippen der Stadt Oberhof. Es handelt sich um einen Sekundärdatenbestand.\n - fachliche_beschreibung: Der Datensatz wird von der Stadtverwaltung Oberhof verwaltet und dient dazu, Transparenz über die Kinderbetreuungseinrichtungen in Oberhof zu schaffen. Zuständige Behörden sind die Stadtverwaltung Oberhof und das Thüringer Ministerium für Inneres und Kommunales.\n - zweck: Der Datensatz wird erhoben, um den Bürgern von Oberhof Informationen über die verfügbaren Kindertagesstätten und Kinderkrippen bereitzustellen.\n - aktualisierungsfrequenz: http://inspire.ec.europa.eu/metadata-codelist/MaintenanceFrequencyCode/asNeeded\nDatenbestand hat Datenlieferanten\n - name: Stadt Oberhof\nDatenbestand hat Schlagwort\n - name: versorgungswirtschaft-und-staatliche-dienste\n - name: kindertagesstätten\n - name: kindergarten\n - name: kinderbetreuung\n - name: thüringen\n - name: opendata\n - name: kinderkrippe\n - name: kita\nDatenbestand hat Kategorie\n - name: Bildung\n - name: Kultur und Sport\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\n - name: Bevölkerung und Gesellschaft\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Stadt Oberhof\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Stadtverwaltung Oberhof\n - kurzbezeichnung: Stadtverwaltung\n - themen: Verwaltung, Bürgerdienste, Stadtrat, Satzungen\n - ministerium_des_geschaeftsbereichs: Thüringer Ministerium für Inneres und Kommunales\n - ressort: Kommunalverwaltung\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Thüringer Kindertageseinrichtungsgesetz\n - kurzbezeichnung: ThürKigaG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.hfm-weimar.de/fileadmin/user_upload/Gesetze_Ordnungen/Thueringer_Gleichstellungsgesetz.pdf\n - bezeichnung: Thüringer Verordnung zur Bestimmung der zentralen Landesstelle für den automatisierten Datenaustausch\nVerordnung\n - referenz: https://parldok.thueringer-landtag.de/ParlDok/dokument/72529/gesetz_und_verordnungsblatt_nr_11_2019.pdf\n - bezeichnung: Thüringer Verordnung über die Anerkennung der Vereinbarung einer erfüllenden Gemeinde\n',
"\nDatenbestand\n - titel: Luftbild 2002\n - typ: Fachverfahren\n - kurzbeschreibung: Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002.\n - allgemeine_beschreibung: Der Datensatz 'Luftbild 2002' umfasst das Luftbild (Digitales Orthophoto) der Hanse- und Universitätsstadt Rostock und Umgebung von März und April 2002 mit einer Bodenauflösung von 0,16 Metern. Die Ressourcen werden in der Regel nicht aktualisiert.\n - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt, speziell vom Ressort Kommunalaufsicht. Er dient der Bereitstellung historischer Luftbilder für die Öffentlichkeit.\n - zweck: Der Datensatz wird erhoben, um historische Luftbilder der Hanse- und Universitätsstadt Rostock und Umgebung aus dem Jahr 2002 bereitzustellen.\n - einfuehrungsjahr: 2017\n - zeitliche_abdeckung_start: 2002-03-01T00:00:00+01:00\n - zeitliche_abdeckung_ende: 2002-05-01T00:00:00+02:00\nDatenbestand hat Datenlieferanten\n - name: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Schlagwort\n - name: luftbild\n - name: Historisch\n - name: Digitales Orthophoto\n - name: 2002\n - name: Bodenauflösung\n - name: Rostock\n - name: Luftbild\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Kategorie\n - name: Regierung und öffentlicher Sektor\n - name: Regionen und Städte\nDatenbestand hat politische Ebenen\n - name: Ebene der Landkreise und Regierungsbezirke\nDatenbestand hat politisches Gebiet\n - name: Rostock\n - name: Hanse- und Universitätsstadt\nDatenbestand hat Sprache\n - name: Deutsch\nDatenbestand hat geografische Abdeckung\n - name: Rostock und Umgebung\nDatenbestand hat Ministerium\nMinisterium\n - bezeichnung: Bundesministerium des Innern und für Heimat\n - kurzbezeichnung: BMI\n - ressorts: Hanse- und Universitätsstadt Rostock\nDatenbestand hat Behörde\nBehoerde\n - bezeichnung: Hanse- und Universitätsstadt Rostock\n - kurzbezeichnung: Rostock\n - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung\n - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern\n - ressort: Kommunalaufsicht\nDatenbestand hat Gesetze:\nGesetz\n - bezeichnung: Bundesdatenschutzgesetz\n - kurzbezeichnung: BDSG\nDatenbestand hat Verordnung\nVerordnung\n - referenz: https://www.bgbl.de/xaver/bgbl/start.xav?start=%2F%2F*%5B%40attr_id%3D%27bgbl102s0027.pdf%27%5D\n - bezeichnung: Verordnung über Art, Umfang, Beschaffenheit, Zulassung und Ausführung von Luftbildern\nVerordnung\n - referenz: https://stadt.muenchen.de/rathaus/stadtrecht/vorschrift/831.html\n - bezeichnung: Datenschutzrechtliche Belange bei Luftbildern\n",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Information Retrieval
* Dataset: `dim_512`
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
| Metric | Value |
|:--------------------|:-----------|
| cosine_accuracy@1 | 0.4081 |
| cosine_accuracy@3 | 0.6312 |
| cosine_accuracy@5 | 0.7177 |
| cosine_accuracy@10 | 0.8077 |
| cosine_precision@1 | 0.4081 |
| cosine_precision@3 | 0.2104 |
| cosine_precision@5 | 0.1435 |
| cosine_precision@10 | 0.0808 |
| cosine_recall@1 | 0.4081 |
| cosine_recall@3 | 0.6312 |
| cosine_recall@5 | 0.7177 |
| cosine_recall@10 | 0.8077 |
| cosine_ndcg@10 | 0.6045 |
| cosine_mrr@10 | 0.5399 |
| **cosine_map@100** | **0.5472** |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 3,262 training samples
* Columns: <code>anchor</code> and <code>positive</code>
* Approximate statistics based on the first 1000 samples:
| | anchor | positive |
|:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
| type | string | string |
| details | <ul><li>min: 15 tokens</li><li>mean: 29.17 tokens</li><li>max: 53 tokens</li></ul> | <ul><li>min: 308 tokens</li><li>mean: 510.05 tokens</li><li>max: 512 tokens</li></ul> |
* Samples:
| anchor | positive |
|:------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| <code>Welche Datenbestände decken die Region Rostock und Umgebung ab und enthalten Informationen zu Verkehrswegen und -sicherheit?</code> | <code><br>Datenbestand<br> - titel: Großraum- und Schwertransportrouten<br> - typ: Fachverfahren<br> - kurzbeschreibung: Empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung mit Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind.<br> - allgemeine_beschreibung: Der Datensatz umfasst die empfohlenen Großraum- und Schwertransportwege in der Hanse- und Universitätsstadt Rostock und Umgebung. Er enthält Informationen zu Straßennutzung, Baulastträgern, Bewirtschaftern und Standorten von Ingenieurbauwerken im Eigentum der Stadt Rostock, die nicht für Großraum- und Schwertransporte zugänglich sind. Die Ressourcen werden regelmäßig alle 365 Tage aktualisiert.<br> - fachliche_beschreibung: Der Datensatz wird von der Hanse- und Universitätsstadt Rostock bereitgestellt. Zuständige Behörden sind das Ministerium für Inneres und Europa Mecklenburg-Vorpommern mit dem Ressort Kommunalaufsicht. Die Daten enthalten wichtige Informationen für die Verkehrsplanung und -sicherheit in Rostock und Umgebung.<br> - zweck: Der Datensatz wird erhoben, um Informationen über empfohlene Großraum- und Schwertransportwege in Rostock und Umgebung bereitzustellen. Er dient der Planung und Durchführung von Großraum- und Schwertransporten sowie der Sicherstellung der Verkehrssicherheit und Infrastrukturintegrität.<br> - einfuehrungsjahr: 2018<br>Datenbestand hat Datenlieferanten<br> - name: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Schlagwort<br> - name: verkehrsinfrastruktur<br> - name: Erlaubnis<br> - name: Genehmigung<br> - name: straßennetz<br> - name: stadtverkehr<br> - name: infrastruktur<br> - name: brücke<br> - name: Großraum- und Schwertransport<br> - name: straßenverkehrstechnik<br> - name: tunnel<br> - name: verkehr<br> - name: bauwerk<br> - name: Straßenverkehrs-Ordnung<br> - name: öffentlicher-verkehr<br> - name: straße<br> - name: verkehrstechnik<br> - name: straßenverkehr<br> - name: öffentliche-straße<br> - name: Straßenverkehrszulassungsverordnung<br>Datenbestand hat Kategorie<br> - name: Verkehr<br> - name: Regierung und öffentlicher Sektor<br> - name: Regionen und Städte<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat politisches Gebiet<br> - name: Rostock<br> - name: Hanse- und Universitätsstadt<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Rostock und Umgebung<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Hanse- und Universitätsstadt Rostock<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Hanse- und Universitätsstadt Rostock<br> - kurzbezeichnung: Rostock<br> - themen: Kommunalverwaltung, Stadtentwicklung, Öffentliche Ordnung<br> - ministerium_des_geschaeftsbereichs: Ministerium für Inneres und Europa Mecklenburg-Vorpommern<br> - ressort: Kommunalaufsicht<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 3<br> - bezeichnung: Straßenverkehrs-Ordnung (StVO)<br> - kurzbezeichnung: StVO<br> - paragraph: § 29<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehr-Transportbegleitungsverordnung (StTbV)<br> - kurzbezeichnung: StTbV<br>Verordnung<br> - referenz: https://www.buzer.de/StTbV.htm<br> - bezeichnung: Straßenverkehrs-Zulassungs-Ordnung (StVZO)<br> - kurzbezeichnung: StVZO<br></code> |
| <code>Welche Datenbestände bieten Einblicke in die Standorte und Strukturen des THW für Koordinationszwecke im Katastrophenschutz?</code> | <code><br>Datenbestand<br> - titel: Übersicht der THW-Liegenschaften<br> - typ: Fachverfahren<br> - kurzbeschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Adressen und Geoinformationen zu den Standorten des Technischen Hilfswerks (THW) in Deutschland.<br> - allgemeine_beschreibung: Der Datensatz 'Übersicht der THW-Liegenschaften' enthält Informationen über die verschiedenen Standorte des Technischen Hilfswerks (THW) in Deutschland. Dazu gehören 668 Ortsverbände, 66 Geschäftsstellen, acht Landesverbände, eine Bundesschule mit zwei Standorten und die THW-Leitung. Die Daten enthalten Adressen und Geoinformationen zu den THW-Liegenschaften.<br> - fachliche_beschreibung: Der Datensatz wird von der Bundesanstalt Technisches Hilfswerk erhoben und bereitgestellt. Das THW ist dem Bundesministerium des Innern, für Bau und Heimat unterstellt und hat als Aufgaben den Katastrophenschutz, technisch-humanitäre Hilfeleistungen und die Organisation von Einsatzkräften. Die Daten werden vom Referat Z2 - Organisation des THW geliefert und sind über das GovData Portal verfügbar.<br> - zweck: Der Datensatz wird erhoben, um einen umfassenden Überblick über die Standorte und Strukturen des Technischen Hilfswerks in Deutschland zu bieten. Er dient der Transparenz und kann für Planungs- und Koordinationszwecke im Bereich des Katastrophenschutzes und der technisch-humanitären Hilfeleistungen genutzt werden.<br> - einfuehrungsjahr: 2015<br> - zeitliche_abdeckung_start: 2015-01-01T00:00:00<br>Datenbestand hat Datenlieferanten<br> - name: Referat Z2 - Organisation<br> - name: Bundesanstalt Technisches Hilfswerk<br>Datenbestand hat Schlagwort<br> - name: THW-Landesverband<br> - name: THW-Ortsverband<br> - name: Rettung<br> - name: Katastrophenschutz<br> - name: Bergung<br> - name: THW-Leitung<br> - name: THW-Dienststellen<br> - name: technisch-humanitäre Hilfeleistungen<br> - name: THW-Liegenschaft<br> - name: Geoinformationen<br> - name: THW<br> - name: THW-Geschäftsstelle<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium des Innern und für Heimat<br> - kurzbezeichnung: BMI<br> - ressorts: Bundesanstalt Technisches Hilfswerk, Referat Z2 - Organisation<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesanstalt Technisches Hilfswerk<br> - kurzbezeichnung: THW<br> - themen: Katastrophenschutz, technisch-humanitäre Hilfeleistungen, Organisation von Einsatzkräften<br> - ministerium_des_geschaeftsbereichs: Bundesministerium des Innern, für Bau und Heimat<br> - ressort: Geschäftsbereich des Bundesministeriums des Innern, für Bau und Heimat<br>Datenbestand hat Gesetze:<br>Gesetz<br> - absatz: 1<br> - bezeichnung: Gesetz über das Technische Hilfswerk (THW-Gesetz)<br> - kurzbezeichnung: THWG<br> - paragraph: § 4<br>Datenbestand hat Verordnung<br>Verordnung<br> - referenz: https://beck-online.beck.de/Normen/29337/T?pagenr=21&sortField=1&sortDirection=1<br> - bezeichnung: Technisches Hilfswerk-Auslandsunfallfürsorgeverordnung<br> - kurzbezeichnung: THW-AuslUFV<br>Verordnung<br> - referenz: https://ov-ludwigsburg.thw.de/fileadmin/user_upload/LVBW/GSTU/OLUD/Mediathek/Dokumente/thw_go_ea_anlage_00.pdf<br> - bezeichnung: Geschäftsordnung des Technischen Hilfswerks<br> - kurzbezeichnung: THW-GO<br></code> |
| <code>Welche Datensätze analysieren die Geschlechterverteilung von Schulabgängern ohne Abschluss in deutschen Kreisen von 2006 bis 2021?</code> | <code><br>Datenbestand<br> - titel: Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen<br> - typ: Fachverfahren<br> - kurzbeschreibung: Prozentualer Anteil von Frauen und Männern an Schulabgängern ohne Hauptschulabschluss nach Kreisen<br> - allgemeine_beschreibung: Der Datensatz enthält den prozentualen Anteil von Frauen und Männern an den Abgängerinnen und Abgängern ohne ersten Schulabschluss (Hauptschulabschluss) aus allgemeinbildenden Schulen nach Kreisen in Deutschland.<br> - fachliche_beschreibung: Der Datensatz wird vom Bundesministerium für Familie, Senioren, Frauen und Jugend bereitgestellt und enthält Informationen über den Anteil von Frauen und Männern an Schulabgängern ohne ersten Schulabschluss aus allgemeinbildenden Schulen in Deutschland. Die Daten werden nach Kreisen aufgeschlüsselt und dienen der Analyse der Bildungssituation in verschiedenen Regionen des Landes.<br> - zweck: Der Datensatz wird erhoben, um die Geschlechterverteilung bei Schulabgängern ohne Hauptschulabschluss in verschiedenen Regionen Deutschlands zu analysieren und mögliche Maßnahmen zur Verbesserung der Bildungschancen zu entwickeln.<br> - einfuehrungsjahr: 2023<br> - zeitliche_abdeckung_start: 2006-01-01<br> - zeitliche_abdeckung_ende: 2021-12-31<br>Datenbestand hat Datenlieferanten<br> - name: Bundesministerium für Familie<br> - name: Frauen und Jugend<br> - name: Senioren<br>Datenbestand hat Schlagwort<br> - name: bildung<br> - name: schulabbrecher<br> - name: gleichstellung<br> - name: schulabschluss<br> - name: schule<br>Datenbestand hat Kategorie<br> - name: Bevölkerung und Gesellschaft<br>Datenbestand hat politische Ebenen<br> - name: Ebene der Landkreise und Regierungsbezirke<br>Datenbestand hat Sprache<br> - name: Deutsch<br>Datenbestand hat geografische Abdeckung<br> - name: Bundesrepublik Deutschland<br> - name: aufgeschlüsselt nach Kreisen<br>Datenbestand hat Ministerium<br>Ministerium<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ressorts: Familie, Senioren, Frauen, Jugend<br>Datenbestand hat Behörde<br>Behoerde<br> - bezeichnung: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - kurzbezeichnung: BMFSFJ<br> - ministerium_des_geschaeftsbereichs: Bundesministerium für Familie, Senioren, Frauen und Jugend<br> - ressort: Bundesministerium für Familie, Senioren, Frauen und Jugend<br>Datenbestand hat Gesetze:<br>Gesetz<br> - bezeichnung: E-Government-Gesetz<br>Datenbestand hat Verordnung<br>Verordnung<br>Verordnung<br> - referenz: https://recht.nrw.de/lmi/owa/br_vbl_detail_text?anw_nr=6&vd_id=20346&vd_back=N405&sg=0&menu=0<br> - bezeichnung: § 50 Schulgesetz NRW<br></code> |
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
```json
{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
512
],
"matryoshka_weights": [
1
],
"n_dims_per_step": -1
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: epoch
- `learning_rate`: 1e-05
- `warmup_ratio`: 0.1
- `bf16`: True
- `tf32`: False
- `load_best_model_at_end`: True
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: epoch
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 8
- `per_device_eval_batch_size`: 8
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 1e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 3
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.1
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: True
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: False
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: True
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss | dim_512_cosine_map@100 |
|:-------:|:-------:|:-------------:|:----------------------:|
| 0 | 0 | - | 0.5212 |
| 0.0490 | 10 | 1.2397 | - |
| 0.0980 | 20 | 0.7542 | - |
| 0.1471 | 30 | 0.3055 | - |
| 0.1961 | 40 | 0.2075 | - |
| 0.2451 | 50 | 0.2064 | - |
| 0.2941 | 60 | 0.1429 | - |
| 0.3431 | 70 | 0.1821 | - |
| 0.3922 | 80 | 0.063 | - |
| 0.4412 | 90 | 0.078 | - |
| 0.4902 | 100 | 0.1026 | - |
| 0.5392 | 110 | 0.0717 | - |
| 0.5882 | 120 | 0.0394 | - |
| 0.6373 | 130 | 0.0751 | - |
| 0.6863 | 140 | 0.1377 | - |
| 0.7353 | 150 | 0.0666 | - |
| 0.7843 | 160 | 0.127 | - |
| 0.8333 | 170 | 0.1129 | - |
| 0.8824 | 180 | 0.0734 | - |
| 0.9314 | 190 | 0.0727 | - |
| 0.9804 | 200 | 0.1564 | - |
| 1.0 | 204 | - | 0.5428 |
| 1.0294 | 210 | 0.0904 | - |
| 1.0784 | 220 | 0.0974 | - |
| 1.1275 | 230 | 0.0785 | - |
| 1.1765 | 240 | 0.0704 | - |
| 1.2255 | 250 | 0.0929 | - |
| 1.2745 | 260 | 0.1119 | - |
| 1.3235 | 270 | 0.0459 | - |
| 1.3725 | 280 | 0.1181 | - |
| 1.4216 | 290 | 0.0459 | - |
| 1.4706 | 300 | 0.0248 | - |
| 1.5196 | 310 | 0.0567 | - |
| 1.5686 | 320 | 0.0247 | - |
| 1.6176 | 330 | 0.0412 | - |
| 1.6667 | 340 | 0.0498 | - |
| 1.7157 | 350 | 0.0693 | - |
| 1.7647 | 360 | 0.0589 | - |
| 1.8137 | 370 | 0.0383 | - |
| 1.8627 | 380 | 0.0429 | - |
| 1.9118 | 390 | 0.0466 | - |
| 1.9608 | 400 | 0.0331 | - |
| **2.0** | **408** | **-** | **0.5469** |
| 2.0098 | 410 | 0.0812 | - |
| 2.0588 | 420 | 0.0705 | - |
| 2.1078 | 430 | 0.0215 | - |
| 2.1569 | 440 | 0.0571 | - |
| 2.2059 | 450 | 0.0821 | - |
| 2.2549 | 460 | 0.046 | - |
| 2.3039 | 470 | 0.0165 | - |
| 2.3529 | 480 | 0.0335 | - |
| 2.4020 | 490 | 0.0339 | - |
| 2.4510 | 500 | 0.0291 | - |
| 2.5 | 510 | 0.0788 | - |
| 2.5490 | 520 | 0.0468 | - |
| 2.5980 | 530 | 0.0457 | - |
| 2.6471 | 540 | 0.0121 | - |
| 2.6961 | 550 | 0.0543 | - |
| 2.7451 | 560 | 0.0463 | - |
| 2.7941 | 570 | 0.0974 | - |
| 2.8431 | 580 | 0.0204 | - |
| 2.8922 | 590 | 0.012 | - |
| 2.9412 | 600 | 0.0545 | - |
| 2.9902 | 610 | 0.0581 | - |
| 3.0 | 612 | - | 0.5472 |
* The bold row denotes the saved checkpoint.
### Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.1.1
- Transformers: 4.45.2
- PyTorch: 2.4.1+cu121
- Accelerate: 1.0.0
- Datasets: 3.0.1
- Tokenizers: 0.20.1
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### MatryoshkaLoss
```bibtex
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
```
#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |