Synonymwörterbücher


Der Article Wizard verfügt über einen deutschen Thesaurus (Synonymwörterbuch), der auf dem Projekt http://www.openthesaurus.org/ von Daniel Naber beruht. Dieses Wörterbuch ist nach dem folgenden Prinzip aufgebaut:

Aufbau des Thesaurus

Es gibt ein Synonymwörterbuch. Dieses Wörterbuch enthält eine Reihe von originalen Ausganswörtern (im Folgenden auch „Original“ genannt). Jedes Ausgangswort hat Synonyme (im Folgenden auch „Synonym“ genannt). Die Synonyme sind wiederum in Synonymgruppen (im Folgenden auch „Bedeutung“ genannt) angeordnet. Die folgende Abbildung verdeutlicht diese Beziehungen.

Schema für das Synonymwörterbuch
Schema für das Synonymwörterbuch

Dieser Aufbau wurde gewählt, da es zu einem Original Synonyme geben kann, die jedoch untereinander keine Synonyme sind. Ein Beispiel dafür ist das Original „Bank“. Dieses kann sowohl im Sinne von „Sitzgelegenheit“ als auch im Sinne von „Kreditinstitut“ aufgefasst werden. Durch die Gliederung in Bedeutungen kann der Article Wizard gleichbedeutende Synonyme semantisch sortieren und erleichtert damit die Auswahl passender Synonyme. Für das Original „Bank“ sind z.B. die in der folgenden Abbildung dargestellte Synonymgruppen und Synonyme verfügbar.

Schema für das Original Bank
Schema für das Original Bank

XML Syntax von Synonymwörterbüchern

Das Synonymwörterbuch kann durch den Benutzer beliebig erweitert und auch nachträglich über einen Wörterbuch Manager editiert werden. Außerdem ist es möglich Wörterbücher zu exportieren und zu importieren. Damit können Wörterbücher in beliebiger Sprache verwendet werden. Als Austauschformat wird dabei XML benutzt. Ein Beispiel für den Aufbau einer solchen Datei befindet sich im folgenden Codebeispiel. Um alle Sonderzeichen (zum Beispiel deutsche Umlaute) richtig darstellen zu können, muss diese Datei mit dem Zeichensatz UTF-8 gespeichert werden.

<?xml version="1.0" encoding="utf-8"?>
<Dictionary xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" Name="">
<Originals>
<Original Name="unglücklicherweise">
<Meanings>
<Meaning Name="bedauerlicherweise">
<Synonyms>
<Synonym Name="bedauerlicherweise" />
<Synonym Name="dummerweise" />
<Synonym Name="leider Gottes" />
<Synonym Name="zu meinem Bedauern" />
<Synonym Name="leider" />
</Synonyms>
</Meaning>
</Meanings>
</Original>
</Originals>
</Dictionary>

Das Synonymwörterbuch wird beim Start der Software geladen und ermöglich somit ein verzögerungsfreies Bereitstellen von Synonymen.

Hunspell-Thesauri als Standardwörterbuch benutzen

Seit Version 1.0.0.5 des Article Wizards wird das Hinzfügen beliebiger Thesauri unterstützt, die auf dem Format des Hunspell-Projektes beruhen. Eine Auswahl dieser Thesauri findet man im Dictionary Download Bereich von OpenOffice.

Das Hinzufügen dieser Thesauri wird in dem folgenden Video demonstriert.

Achtung: Durch eine Umstellung bei OpenOffice werden Wörterbücher nur noch im neuen Format angeboten – das Video ist deshalb nicht mehr aktuell!

Zunächst muss der entsprechende Thesaurus von der OpenOffice Downloadseite heruntergeladen werden. Dabei handelt es sich um eine .oxt Datei. Das ist jedoch nichts anderes als ein .zip Archiv, so dass einfach die Dateiendung angepasst werden kann.

Das Archiv muss mindestens zwei Dateien enthalten (diese können sich auch in einem Unterordner des Archivs befinden):

  1. Datendatei (.dat)
  2. Indexdatei (.idx)

Diese beiden Dateien müssen nun bei der Auswahl eines neuen Standardwörterbuches angegeben werden. Darauf hin wird der neue Thesaurus geladen und kann ganz normal verwendet werden.

Im Anschluss folgt eine Liste einiger Thesauri:

Nachdem Sie das Pack heruntergeladen haben, müssen Sie kontrollieren, ob sich ein Thesauruspaket darin befinden. Dieses beginnt üblicherweise mit th_ oder thes_. In diesem Paket müssen sich die bereits erwähnte Daten- und Indexdatei befinden. Es kann auch sein, dass sich Daten- und Indexdatei direkt im Pack befinden!

Das Thesauruspaket auswählen
Das Thesauruspaket auswählen
Index- und Datendatei des spanischen Thesaurus
Index- und Datendatei des spanischen Thesaurus

«« Article Spinning

Vorlagen »»