SCORM → RAG

Tote SCORM-Kurse in eine lebendige Wissensdatenbank verwandeln

Ihr Unternehmen hat Hunderte von SCORM-Paketen, die in einem LMS verstauben. Darin steckt genau das domänenspezifische Wissen, das Ihre RAG-Pipeline benötigt – Trainingsverfahren, Compliance-Regeln, Produktspezifikationen. ScormParser öffnet sie und übergibt Ihnen strukturierte, embedding-bereite Inhalte. Keine manuelle Arbeit. Ein API-Aufruf.

Warum SCORM-Pakete Goldminen für RAG sind

Unternehmens-Schulungsbibliotheken enthalten jahrzehntelanges akkumuliertes Fachwissen – Sicherheitsverfahren, Compliance-Anforderungen, Produktspezifikationen, Onboarding-Prozesse. Diese Inhalte wurden von Fachexperten zu erheblichen Kosten erstellt. Sie sind jedoch in SCORM-Paketen gesperrt, die für LMS-Interop, nicht für KI-Pipelines konzipiert wurden.

ScormParser überbrückt diese Lücke. Unsere KI-Engine versteht die interne Struktur von SCORM, extrahiert alle Inhalts-Assets, transkribiert Audio und Video und gibt vorgechunkte Inhalte aus, die bereit zum Embedding sind.

So funktioniert es

Laden Sie ein SCORM ZIP-Paket über unsere API hoch. Die KI von ScormParser verarbeitet das gesamte Paket – extrahiert Textinhalte, transkribiert Audio und Video mit Spracherkennung und strukturiert alles in sauberes Markdown oder JSON. Der Output enthält vorberechnete Chunk-Grenzen, die für gängige Embedding-Modelle optimiert sind.

Chunk-Strategien für verschiedene Embedding-Modelle

Verschiedene Embedding-Modelle haben unterschiedliche Kontextfenster und liefern mit verschiedenen Chunk-Größen beste Ergebnisse. ScormParser ermöglicht es Ihnen, Chunking-Strategien zu konfigurieren, die zu Ihrem Modell passen – egal ob Sie OpenAIs text-embedding-3-large, Coheres embed-v3 oder Open-Source-Modelle wie BGE oder E5 verwenden. Jeder Chunk enthält Kurshierarchie-Metadaten, sodass Ihre Retrieval-Pipeline den Kontext beibehält.

chunk-output.json

{
  "text": "All forklift operators must complete...",
  "metadata": {
    "course": "Warehouse Safety 2024",
    "module": "Equipment Operation",
    "slide": 7
  }
}

Integration mit gängigen Vektor-Datenbanken

Der gechunkte Output von ScormParser ist für die direkte Einspeisung in gängige Vektor-Datenbanken konzipiert. Laden Sie Chunks direkt in Pinecone, Weaviate, Qdrant oder ChromaDB, ohne benutzerdefinierten Transformationscode zu schreiben. Das Ausgabeformat entspricht dem, was diese Datenbanken erwarten, sodass Sie in Minuten von SCORM zu durchsuchbarem Wissen gelangen.

Unterstützt SCORM 1.2 und SCORM 2004 (alle Editionen)
KI-gestützte Video- und Audio-Transkription
Vorgechunkter Output, optimiert für Embedding-Modelle
Strukturiertes JSON mit vollständiger Kurshierarchie
Markdown-Output für Dokumentations-Pipelines
Batch-Verarbeitung über asynchrone API
Webhook-Benachrichtigungen bei Abschluss
S3-kompatibler Output-Speicher

Häufig gestellte Fragen

Welche Chunk-Größen verwendet ScormParser für den RAG-Output?

ScormParser verwendet intelligente Standardwerte, die für gängige Embedding-Modelle optimiert sind. Sie können Chunk-Größen und Überlappung über die API vollständig anpassen, um das optimale Kontextfenster Ihres spezifischen Modells zu erreichen.

Kann ich die Chunking-Strategie anpassen?

Ja. Die API bietet vollständige Kontrolle über das Chunking – Größe, Überlappung und Aufteilungsstrategie. Sie können auch nach Kursmodul aufteilen, um Chunks thematisch auf einen einzigen Themenbereich zu beschränken.

Bewahrt es die Kurshierarchie in den Chunk-Metadaten?

Jeder Chunk enthält Metadaten mit der vollständigen Kurshierarchie: Kurstitel, Modulname, Foliennummer und Inhaltstyp (Text, Transkript, Quiz). Dies ermöglicht Ihrer RAG-Pipeline, Ergebnisse basierend darauf zu filtern und zu gewichten, wo der Inhalt in der ursprünglichen Kursstruktur erschienen ist.

Wie geht ScormParser mit Multimedia-Inhalten im RAG-Output um?

Audio- und Videoinhalte werden per KI transkribiert und als Text-Chunks mit entsprechenden Metadaten eingefügt. Bilder mit Alt-Text sind ebenfalls enthalten. Dies stellt sicher, dass das gesamte Kurswissen – nicht nur Text-Folien – für den Abruf verfügbar ist.

SCORM noch heute in RAG konvertieren

Treten Sie der Beta bei und erhalten Sie 5 kostenlose Paket-Konvertierungen pro Monat.

Kostenloser Tarif verfügbar
Keine Kreditkarte erforderlich
Vollständiger API-Zugang

Jetzt Platz sichern

Geben Sie Ihre E-Mail ein und wir benachrichtigen Sie, wenn ScormParser startet.