Tote SCORM-Kurse in eine lebendige Wissensdatenbank verwandeln
Ihr Unternehmen hat Hunderte von SCORM-Paketen, die in einem LMS verstauben. Darin steckt genau das domänenspezifische Wissen, das Ihre RAG-Pipeline benötigt – Trainingsverfahren, Compliance-Regeln, Produktspezifikationen. ScormParser öffnet sie und übergibt Ihnen strukturierte, embedding-bereite Inhalte. Keine manuelle Arbeit. Ein API-Aufruf.
Warum SCORM-Pakete Goldminen für RAG sind
Unternehmens-Schulungsbibliotheken enthalten jahrzehntelanges akkumuliertes Fachwissen – Sicherheitsverfahren, Compliance-Anforderungen, Produktspezifikationen, Onboarding-Prozesse. Diese Inhalte wurden von Fachexperten zu erheblichen Kosten erstellt. Sie sind jedoch in SCORM-Paketen gesperrt, die für LMS-Interop, nicht für KI-Pipelines konzipiert wurden.
ScormParser überbrückt diese Lücke. Unsere KI-Engine versteht die interne Struktur von SCORM, extrahiert alle Inhalts-Assets, transkribiert Audio und Video und gibt vorgechunkte Inhalte aus, die bereit zum Embedding sind.
So funktioniert es
Laden Sie ein SCORM ZIP-Paket über unsere API hoch. Die KI von ScormParser verarbeitet das gesamte Paket – extrahiert Textinhalte, transkribiert Audio und Video mit Spracherkennung und strukturiert alles in sauberes Markdown oder JSON. Der Output enthält vorberechnete Chunk-Grenzen, die für gängige Embedding-Modelle optimiert sind.
Chunk-Strategien für verschiedene Embedding-Modelle
Verschiedene Embedding-Modelle haben unterschiedliche Kontextfenster und liefern mit verschiedenen Chunk-Größen beste Ergebnisse. ScormParser ermöglicht es Ihnen, Chunking-Strategien zu konfigurieren, die zu Ihrem Modell passen – egal ob Sie OpenAIs text-embedding-3-large, Coheres embed-v3 oder Open-Source-Modelle wie BGE oder E5 verwenden. Jeder Chunk enthält Kurshierarchie-Metadaten, sodass Ihre Retrieval-Pipeline den Kontext beibehält.
{
"text": "All forklift operators must complete...",
"metadata": {
"course": "Warehouse Safety 2024",
"module": "Equipment Operation",
"slide": 7
}
}Integration mit gängigen Vektor-Datenbanken
Der gechunkte Output von ScormParser ist für die direkte Einspeisung in gängige Vektor-Datenbanken konzipiert. Laden Sie Chunks direkt in Pinecone, Weaviate, Qdrant oder ChromaDB, ohne benutzerdefinierten Transformationscode zu schreiben. Das Ausgabeformat entspricht dem, was diese Datenbanken erwarten, sodass Sie in Minuten von SCORM zu durchsuchbarem Wissen gelangen.
- Unterstützt SCORM 1.2 und SCORM 2004 (alle Editionen)
- KI-gestützte Video- und Audio-Transkription
- Vorgechunkter Output, optimiert für Embedding-Modelle
- Strukturiertes JSON mit vollständiger Kurshierarchie
- Markdown-Output für Dokumentations-Pipelines
- Batch-Verarbeitung über asynchrone API
- Webhook-Benachrichtigungen bei Abschluss
- S3-kompatibler Output-Speicher
Häufig gestellte Fragen
Welche Chunk-Größen verwendet ScormParser für den RAG-Output?
+
ScormParser verwendet intelligente Standardwerte, die für gängige Embedding-Modelle optimiert sind. Sie können Chunk-Größen und Überlappung über die API vollständig anpassen, um das optimale Kontextfenster Ihres spezifischen Modells zu erreichen.
Kann ich die Chunking-Strategie anpassen?
+
Ja. Die API bietet vollständige Kontrolle über das Chunking – Größe, Überlappung und Aufteilungsstrategie. Sie können auch nach Kursmodul aufteilen, um Chunks thematisch auf einen einzigen Themenbereich zu beschränken.
Bewahrt es die Kurshierarchie in den Chunk-Metadaten?
+
Jeder Chunk enthält Metadaten mit der vollständigen Kurshierarchie: Kurstitel, Modulname, Foliennummer und Inhaltstyp (Text, Transkript, Quiz). Dies ermöglicht Ihrer RAG-Pipeline, Ergebnisse basierend darauf zu filtern und zu gewichten, wo der Inhalt in der ursprünglichen Kursstruktur erschienen ist.
Wie geht ScormParser mit Multimedia-Inhalten im RAG-Output um?
+
Audio- und Videoinhalte werden per KI transkribiert und als Text-Chunks mit entsprechenden Metadaten eingefügt. Bilder mit Alt-Text sind ebenfalls enthalten. Dies stellt sicher, dass das gesamte Kurswissen – nicht nur Text-Folien – für den Abruf verfügbar ist.
Verwandte Lösungen
SCORM zu Markdown & JSON
SCORM-Pakete in sauberes Markdown und strukturiertes JSON für Dokumentation und Content-Pipelines konvertieren.
API & Entwickler-Tools
REST API, Python- und Node.js-SDKs, Webhooks und Batch-Verarbeitung für SCORM-Parsing.
Video- & Audio-Transkription
KI-gestützte Transkription für jedes gesprochene Wort in SCORM-Mediendateien.
SCORM noch heute in RAG konvertieren
Treten Sie der Beta bei und erhalten Sie 5 kostenlose Paket-Konvertierungen pro Monat.
- Kostenloser Tarif verfügbar
- Keine Kreditkarte erforderlich
- Vollständiger API-Zugang
Jetzt Platz sichern
Geben Sie Ihre E-Mail ein und wir benachrichtigen Sie, wenn ScormParser startet.