AUGUR: Ein Perfektionist in Sachen OCR

Bereits im Heft 5/89 der ST-Computer wurde mit dem Programm AUGUR ausführlich eine neue Anwendungsebene für den ATARI ST vorgestellt: die Texterkennung. In diesem neuen und sehr schnell fortschreitenden Marktsegment tummeln sich mittlerweile einige Mitbewerber. Das High-Tech-Forschungsinstitut ICD prognostiziert für die Jahre bis 2000 eine durchschnittliche Steigerung von ca. 30% jährlich im Marktvolumen. Die Entwicklung in maßgeblicher Zusammenarbeit mit der „Eidgenössischen Technischen Hochschule Zürich“ darf aber behaupten, die erste für den ATARI ST gewesen zu sein.

Pünktlich zur diesjährigen CeBIT-Messe in Hannover durften wir eine Weiterentwicklung von AUGUR begutachten. Es soll im folgenden hauptsächlich auf die Neuerungen und Änderungen eingegangen werden.

AUGUR 1.5 benötigt nach dem Starten nur noch 400 kByte Hauptspeicher und kann somit erstmals auch auf „kleineren“ STs wie dem ATARI 520 arbeiten. Wenn der Arbeitsspeicher fürdie Texterkennung selbst nicht ausreicht, wählt AUGUR einfach kleinere Bildausschnitte. Für ein sinnvolles Arbeiten mit einem Flachbett-Scanner ist aber auf jeden Fall ein Arbeitsspeicher von 2 MByte empfohlen.

AUGUR 1.5 wird wie bisher in Form eines ROM-Port-Steckers geliefert. Der Programmstart erfolgt auch von dort. Das bringt einerseits wesentliche Vorteile bezüglich Funktionssicherheit und Programmschnelligkeit, aber auch den Nachteil, daß keine Kopie angefertigt werden kann. Bedauerlicherweise ist dieses Pro gramm deswegen für Hand-Scanner, die ebenfalls den ROM-Port benutzen, nicht erreichbar. Es muß noch immer der Umweg des Bildes vom Hand-Scanner in ein Bildprogramm, dann auf Diskette und nach ROM-Port-Wechse I z wi sehen Scanner und AUGUR-Modul wieder von Diskette herunter in AUGUR in Kauf genommen werden - leider.

Starthilfe

Neu hinzugekommen ist ein sogenanntes „Aufstartprogramm“ namens AUGUR-.PRG. In einer Datei DEFAULT.AUG werden alle Parameter des Arbeitens gespeichert; AUGUR stellt bei jedem Neustart das Programm entsprechend ein (Fenstergrößen- und läge, Verzeichnispfade usw.) und lädt alle nötigen Programmteile nach (Bibliotheken, Textteile). So trifft man es immer so an, wie man es verlassen hat, und außerdem muß nun der ROM-Port nicht mehr als Laufwerk c angemeldet sein.

Wenn man für das Aufstartprogramm mit Anwendung anmelden im Atari-Desktop unter Datei typ AUG angibt, kann die Datei DEFAULT.AUG auch umbenannt werden. Nur den Extender AUG muß man immer beibehalten. Jetzt kann man beliebig viele Info-Dateien *.AUG anlegen, die alle ganz spezielle Verhältnisse für fest umrissene Tätigkeiten gespeichert haben. Mit einem Doppelklick auf eine dieser Dateien wird AUGUR gestartet und übernimmt sofort die entsprechenden Einstellungen und Ladevorgänge.

Schiebung

Alle Fenster und die Funktionstastenanzeige der Arbeitsoberfläche lassen sich frei auf dem Bildschirm verschieben. Bei Arbeiten mit dem Großbildschirm erhalten alle Fenster entsprechende Rollbalken (Slider), um die Größe individuell einstellen zu können. Wertung: längst überfällig und deshalb sehr angenehm.

In der Lupe (links im Bild) wird ständig eine Vergrößerung angezeigt, wenn das Fadenkreuz sich im Hauptfenster (Mitte) bewegt. Das Größen Verhältnis ist deswegen nicht frei wählbar, weil dies vom Arbeitsspeicher einen Großteil schlucken würde und deswegen die Arbeitsgeschwindigkeit sehr darunter leiden müßte.

Sehr interessant ist der Scroll-Modus. Durch einen Einfachklick im Hauptübersichtsfenster (Mitte) vergrößert sich das Lupenfenster auf den gesamten Bildschirm. Bei gedrückter Shift-Taste bewegt sich der Lupenausschnitt langsamer. Normalerweise bewegt sich der Lupenausschnitt immer in dieselbe Richtung wie die Maus. Hält man bei dem genannten Doppelklick (linke Maustaste) gleichzeitig die rechte Maustaste gedrückt (Fingerakrobaten an die Front), bewegt sich die Lupe gegenläufig zur Maus, als ob man das Dokument jetzt unter dem Bildschirm verschieben würde. Wertung: sehr interessante Sache, aber gewöhnungsbedürftig. Vielleicht ließe sich dieses per Abfrage in einer Dialogbox dauerhaft vorwählen oder man ersinnt eine andere Tastenkombination hierfür.

Das altbewährte Arbeitsfenster mit der Original Verkleinerung (Mitte), der Lupe (links) und dem Info-Fenster (rechts)

Buchstabenfilter

Neu hinzugekommen ist der Textfilter. Bei manchen Schriftarten sind sich Groß-“I“ und Klein-‘T\ Klein-“l“ und die Zahl Eins, sowie Groß-“0“ und die Zahl Null sehr ähnlich. Mildern Filter kann nun eine automatische Korrektureingeschaltet oder unterdrückt werden. Auch das Ersetzen von Hochkommas, Gänsefüßchen usw. ist hier eingebaut. Die Filtereinstellungen werden mit der Bibliothek abgespeichert.

Der Lernmodus wurde neu gestaltet. Die Prototypen sind zwar etwas kleiner geworden, nun direkt im Textumfeld sichtbar, auch wurde der Ausschnitt vergrößert. Dafür ist aber Platz, um (rechts daneben) den nächsten einzutippenden Buchstaben anzuzeigen. Der geübte Schnellschreiber erzielt hierdurch eine Geschwindigkeitssteigerung bis zu 100%, weil sie nicht mehr auf das Anzeigen des nächsten unbekannten Buchstabens lauern müssen.

Schön ist jetzt auch der direkte (ständig mögliche) Wechsel zwischen Text- und Lernfenster. Mit einem Doppelklick auf einen Buchstaben im Textfenster gelangt man unmittelbar an seine Stelle im Lernfenster. Man braucht nun auf der Suche nach einem Buchstaben nicht mehr die ganze Bibliothek sequentiell (d.h. der Reihe nach) zu durchwandern.

Ein Bibliothek-Manipulatios-programm erlaubt das Austauschen gleicher Buchstaben zwischen verschiedenen Zeichensatzbibliotheken.

Lernen im Rahmen

Auch AUGUR behält das Prinzip der Rahmen um den Text bei, d.h., daß erst ein Rahmen aufgezogen sein muß, bevor die Lernfunktion aktiv werden kann. Neu ist jetzt, daß ein einfaches Anklicken eines Textblockes genügt, damit AUGUR einen Rahmen darum zieht. Natürlich kann weiterhin die Maus mit ihrer Gummibandfunktion benutzt werden. Auch das Selektieren und Ändern der Rahmen ist mit umfangreichen Tastenkombinationen etwas komfortabler geworden.

Der Bibliothek-Manager

Bei den bisherigen Versionen des Texterkennungsmoduls AUGUR war es nicht sehr einfach, Schriftbibliotheken nachträglich zu verändern, zu verbessern oder nachzubearbeiten. Auf vielfachen Wunsch der Nutzer hat die Fa. Marvin AG einen Schrifteneditor als Zusatzprogramm den Programmversionen ab 1.5 beigelegt.

Jetzt ist das Löschen, Importieren, Vertauschen und Verketten verschiedener Bibliotheken leichter möglich. Besonders wenn mehrere Schriftbibliotheken zu derselben Typart existieren, können sie zu einer zusammengelegt werden. So war es in der Praxis oft vorgekommen, daß aus ein und derselben Textvorlage durch Änderung von Scan-Parametern (Helligkeit, Kontrast, Auflösung usw.) verschiedene Buchstabendefinitionen entstanden. Diese können nun mit AUGUR TOOL vereinheitlicht werden. Es kann wahlweise al s normales Programm oder als Accessory aufgerufen werden und benötigt nur 300 KByte Arbeitsspeicher.

Ist eine Bibliothek in den Arbeitsspeicher geladen, kann sie mit den Cursor-Tasten oder mit den Rollbalken durchwandert werden. Benutzen Sie die Cursor-Tasten zusammen mit Shifl. springt das Arbeitsfensterchen um fünf Buchstaben weiter. Zusammen mit der Control-Taste rollt man gleichzeitig durch beide Bibliotheken, was beim unmittelbaren Vergleich sehr wichtig ist.

Die Arbeitsoberfläche von SCANSOFT

Häufig treten beim Erkennungsprozeß sogenannte ‘verwaschene Zeichen’ auf. Besonders, wenn die Druckvorlage nicht sehr sauber ist (unscharf reproduziert, zu kontrastreich, zu kleine Auflösung), gehen mehrere Buchstaben ineinander über. Da solche unerwünschten Kombinationen in weiteren Texten nicht mehr Vorkommen und die Bibliothek nur unnötig aufblähen, ist es sehr wichtig, sie grundsätzlich aus der Bibliothek zu entfernen. In AUGUR TOOL kann dies wahlweise mit drei oder zwei zusammengeklebten Buchstaben (Verkettungen) geschehen.

ASCII-Werte können jederzeit ediert werden. Dazu bringt man das Zeichen in das (linke, etwas größere) Hauptfenster und klickt das (rechts daneben liegende, sehr winzige) Edierfenster an. Schon ist der entsprechende ASCII-Wert abgespeichert.

AUGUR TOOL ist zwar vornehmlich für das Nachbearbeiten von AUGUR-ei-genen Schriftbibliotheken gedacht und funktioniert auch nur, wenn das AUGUR-ROM-Modul im Port steckt. Aber es sind Ansätze vorhanden, die es, bei entsprechender Weiterentwicklung zu einem nützlichen Hilfsmittel für vielleicht auch andere Schriftbibliotheken werden lassen können. Dann könnte durchaus ein komfortabler Schrifteneditor daraus werden. Im Moment ist es nur eine kostenlose (und dennoch nützliche) Zugabe zu den Marvin-Texterkennungsprogrammen, geboren aus der Notwendigkeit etwas flexibleren Arbeitens mit den genannten Programmen.

Bemerkenswert ist die Tatsache, daß hier verhältnismäßig schnell auf Nutzerbeschwerden reagiert wurde - oder war AUGUR TOOL doch schon länger fertig und wartete auf die Implementation ins eigentliche AUGUR-Programm, was wegen der Übergröße des Programmcodes unterblieb?

Das Handbuch besitzt mit seinen 189 Seiten einen erfreulichen Umfang. Aber leider fehlt auch hier die Auflockerung durch grafische Elemente (Piktogramme u.ä.). Die Erläuterung der Vorgänge und Funktionen geht sehr ausführlich und tiefgreifend zur Sache. Auch ein Glossar, ein Kapitel zur Fehlerbehandlung und einige (wenige) Tips und Tricks fehlen nicht. Die einzelnen Kapitel sind sehr geradlinig, fast generalstabsmäßig durchstrukturiert. Die Beschreibungen lesen sich oftmals sehr streng und präzise, fast wie eine Diplomarbeit. Stellenweise sind lange Textpassagen kaum durch ein oder zwei Bilder aufgelockert. Dennoch vermittelt das Handbuch auch ein ausreichendes Grundlagenwissen zur Theorie der Texterkennung.

Vielfältige Veränderungsmöglichkeiten durch HJB-PAINT

AUGUR für sich betrachtet

Noch immer ist AUGUR - jetzt in seiner Version 1.5 - ein Meister der Texterkennung auf dem ATARI ST. Wenngleich es lange Jahre alleiniger Bewerber um die Gunst der Kunden war, regt sich jetzt eine kleine „Angreifergruppe“ auf dem OCR-Weg. AUGUR ist ein Programm, das sich durch ein wohldurchdachtes Konzept, Funktionssicherheit und Zuverlässigkeit auszeichnet. Lediglich der hohe Kaufpreis wird es für den Hobbyanwender oder den Kleinbetrieb nicht gerade interessant werden lassen. Selbstverständlich läuft AUGUR 1.5 auf dem ATARI TT und allen verfügbaren Großbildschirmen.

AUGUR kostet in der neuen Version 1.5 stolze 3290 DM. Ein Update von V 1.4 auf V 1.5 ist zum Preis von 780 DM für registrierte Benutzer möglich.

DK

Bezugsquelle:

H. Richter-Distributor-Hagener Straße 65 5H20 Gevelsberg



Aus: ST-Computer 11 / 1990, Seite 22

Links

Copyright-Bestimmungen: siehe Über diese Seite