GenOM: Ontologieabgleich mit Beschreibungsgenerierung und Large Language Model

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Der Ontologieabgleich (OM) ist ein entscheidender Baustein für die semantische Interoperabilität, insbesondere im biomedizinischen Bereich, wo komplexe Konzepte zu Krankheiten und Arzneimitteln miteinander verknüpft werden müssen.

GenOM stellt ein neues, auf Large‑Language‑Models (LLM) basierendes Framework vor, das die semantische Repräsentation von Ontologie­konzepten durch die automatische Generierung von Textdefinitionen erweitert. Anschließend werden potenzielle Übereinstimmungen mithilfe eines Embedding‑Modells abgerufen und durch exakte Matching‑Tools verfeinert, um die Präzision zu erhöhen.

Umfangreiche Tests auf dem OAEI Bio‑ML‑Track zeigen, dass GenOM häufig konkurrenzfähige Ergebnisse erzielt und dabei viele etablierte Baselines – sowohl traditionelle OM‑Systeme als auch neuere LLM‑basierte Ansätze – übertrifft.

Durch gezielte Ablationsstudien wurde die Wirksamkeit der semantischen Enrichment‑Strategie sowie der Few‑Shot‑Prompting‑Techniken bestätigt. Diese Untersuchungen unterstreichen die Robustheit und Anpassungsfähigkeit des Frameworks.

GenOM demonstriert damit, dass die Kombination aus LLM‑generierter Beschreibungs­erweiterung, Embedding‑basiertem Kandidaten‑Retrieval und exaktem Matching ein neues Niveau an Präzision im Ontologieabgleich erreicht und damit die Integration heterogener Wissensquellen im Gesundheitswesen vorantreibt.

Ähnliche Artikel