SCORM → RAG

Zamień martwe kursy SCORM w żywą bazę wiedzy

Twoja firma ma setki pakietów SCORM zbierających kurz w LMS. W środku jest dokładnie ta wiedza domenowa, której potrzebuje Twój pipeline RAG — procedury szkoleniowe, regulacje compliance, specyfikacje produktów. ScormParser otwiera je i przekazuje Ci strukturalne treści gotowe do embeddingu. Bez pracy ręcznej. Jedno wywołanie API.

Dlaczego pakiety SCORM to kopalnie złota dla RAG

Korporacyjne biblioteki szkoleniowe zawierają dekady zgromadzonej wiedzy domenowej — procedury bezpieczeństwa, wymagania regulacyjne, specyfikacje produktów, procesy onboardingu. Te treści zostały stworzone przez ekspertów merytorycznych ze znacznymi nakładami. Ale są uwięzione w pakietach SCORM zaprojektowanych do interoperacyjności LMS, nie do pipeline'ów AI.

ScormParser wypełnia tę lukę. Nasz silnik AI rozumie wewnętrzną strukturę SCORM, wyodrębnia każdy zasób treściowy, transkrybuje audio i wideo, i generuje wstępnie podzielone treści gotowe do embeddingu.

Jak to działa

Wgraj pakiet SCORM ZIP przez nasze API. AI ScormParser przetwarza cały pakiet — wyodrębniając treść tekstową, transkrybując audio i wideo za pomocą zamiany mowy na tekst i strukturyzując wszystko w czysty Markdown lub JSON. Wynik zawiera wstępnie obliczone granice chunków zoptymalizowane pod popularne modele embeddingu.

Strategie chunkowania dla różnych modeli embeddingu

Różne modele embeddingu mają różne okna kontekstowe i działają najlepiej z różnymi rozmiarami chunków. ScormParser pozwala konfigurować strategie chunkowania dopasowane do Twojego modelu — czy używasz OpenAI text-embedding-3-large, Cohere embed-v3, czy modeli open-source takich jak BGE lub E5. Każdy chunk zawiera metadane hierarchii kursu, aby Twój pipeline wyszukiwania zachował kontekst.

chunk-output.json
{
  "text": "All forklift operators must complete...",
  "metadata": {
    "course": "Warehouse Safety 2024",
    "module": "Equipment Operation",
    "slide": 7
  }
}

Integracja z popularnymi bazami wektorowymi

Podzielone wyniki ScormParser są zaprojektowane do bezpośredniego zasilania popularnych baz wektorowych. Ładuj chunki prosto do Pinecone, Weaviate, Qdrant lub ChromaDB bez pisania własnego kodu transformacji. Format wyjściowy jest zgodny z tym, czego oczekują te bazy danych, więc od SCORM do przeszukiwalnej wiedzy możesz dojść w minuty.

Często zadawane pytania

Jakie rozmiary chunków ScormParser używa dla wyników RAG?

+

ScormParser używa inteligentnych domyślnych ustawień zoptymalizowanych pod popularne modele embeddingu. Możesz w pełni dostosować rozmiary chunków i nakładanie się przez API, aby dopasować optymalne okno kontekstowe Twojego konkretnego modelu.

Czy mogę dostosować strategię chunkowania?

+

Tak. API oferuje pełną kontrolę nad chunkingiem — rozmiar, nakładanie i strategia podziału. Możesz również dzielić według modułu kursu, aby chunki były tematycznie ograniczone do pojedynczego obszaru merytorycznego.

Czy hierarchia kursu jest zachowywana w metadanych chunków?

+

Każdy chunk zawiera metadane z pełną hierarchią kursu: tytuł kursu, nazwa modułu, numer slajdu i typ treści (tekst, transkrypt, quiz). To pozwala Twojemu pipeline'owi RAG filtrować i ważyć wyniki na podstawie tego, gdzie treść pojawiała się w oryginalnej strukturze kursu.

Jak ScormParser obsługuje treści multimedialne w wynikach RAG?

+

Treści audio i wideo są transkrybowane przez AI i dołączane jako chunki tekstowe z odpowiednimi metadanymi. Obrazy z tekstem alternatywnym są również dołączane. To zapewnia, że cała wiedza z kursu — nie tylko slajdy tekstowe — jest dostępna do wyszukiwania.

Powiązane rozwiązania

Zacznij konwertować SCORM do RAG już dziś

Dołącz do bety i otrzymaj 5 darmowych konwersji pakietów miesięcznie.

  • Darmowy plan dostępny
  • Bez karty kredytowej
  • Pełny dostęp do API

Zarezerwuj swoje miejsce

Wpisz swój email, a powiadomimy Cię, gdy ScormParser wystartuje.