Als wir das OCR-Programm SYNTEX im Heft 11/90 zum ersten Mal genauer betrachteten, war es noch ein „Azubi“ im ersten Lehrjahr. Nachdem sein „Lehrmeister“, die Fa. MARVIN AG in der Schweiz, den weiteren Ausbildungsbetrieb zur Konkursmasse erklärt hat, nahm die Firma Richter-Distributor sich des verlorenen Kindes an. Mittlerweile kann man sagen, daß SYNTEX durchaus dazugelernt und wahrscheinlich seine Gesellenprüfung gerade noch bestanden hat (Note nicht bekannt). Der Weg zum „OCR-Meister“ wird aber schwer werden.
Obwohl ich nach einigem Arbeiten mit der SYNTEX-Version 1.2 dazu neige, die Unterschiede zur Vorgängerversion hervorzuheben, scheint es mir doch angebracht, zunächst das Gesamtkonzept noch einmal zu betrachten -denn es hat sich inzwischen etwas getan in der OCR-Landschaft: Das Programm AUGUR (vom selben „Lehrmeister“) wird kaum noch angeboten, vielleicht ist es ganz vom Markt verschwunden. Ähnlich auch SHERLOOK, das ursprünglich mit den Programmierern an die Firma 3K gegangen ist. Dort verspürt man derzeit wenig Neigung, den schmalen „OCR-Pfad“ zu gehen. Dann gab es einige Eintagsfliegen in Sachen OCR, auch in der PD-Ecke war mal was zu sehen - halt alles nicht das Gelbe vom Ei!
Nachdem sich ein amerikanisches Programm auf dem europäischen ATARI-Markt vorstellt und außerdem mit einigen Qualitäten aufzuwarten hat, muß der gesamte ATARI-OCR-Markt neu überdacht werden (mal sehen, wie lange es dauert, bis auf dem FALCON Texterkennung mit dem DSP möglich ist). Unter dieser Prämisse sollte man jetzt ganz anders in die Betrachtung von SYNTEX einsteigen.
Laut Handbuch hat man das Bewährte beibehalten - was auch sonst. So bietet sich uns weiterhin die streng zweigeteilte, starre Arbeitsoberfläche: oben Vorlage, unten Erkanntes; oder wahlweise das ganze links/rechts. Ebenso muß immer vorher der zu betrachtende Bildteil eingerahmt werden - selbersuchen hat SYNTEX noch immer nicht gelernt. Weiter ist die Zeichenbibliothek für niemanden zugänglich - unter welchen Kriterien welche Zeichen zugeordnet werden, bleibt nach wie vor ein Geheimnis. Damit ist auch ein Nachbearbeiten der Zeichenbibliothek nicht möglich. Scanner werden über eine IDC-Software-Schnittstelle angesteuert. (Wenngleich ich das IDC-Konzept für sinnvoll halte, hat es sich als Standard-Scanner-Treiber in der ATARI-Welt leider nicht durchgesetzt.) Auch geblieben ist die Wahl, SYNTEX entweder als PRG oder als ACC zu starten. Ebenso geblieben ist der höchst fragwürdige „Beschleunigerstecker“ (der Stecker, der OCR angeblich schneller macht), der in Wirklichkeit wohl eher als Pseudo-Kopierschutz fungieren soll.
Einige Dialogboxen haben ein Facelifting erfahren und arbeiten allesamt als „Fliegende“ (Fly Dials) mit „MAC-like-Buttons“ (Radioknöpfe). Als geradezu genial wird uns die Unterstützung des GEM-Klemmbretts angepriesen. Sicherlich hat der Texttransfer per Klemmbrett entscheidende Vorteile gegenüber dem stupiden Zwischenspeichern. Dann kommt ein völlig neuer Menüpunkt namens „Edit“ hinzu, was auch wieder mit dem Klemmbrett zu tun hat. Dann ist noch eine Sonderzeichenliste eingebaut, um auch jene Zeichen zu definieren, die nicht unmittelbar auf der Tastatur zu finden sind (wie wär’s mit der Eingabe als ASCII-Code?).
Bisher wahrhaftig störend war die starr voreingestellte Bildschirm Vergrößerung. Jetzt kann man zumindest zwischen vier Darstellungsgrößen wählen (warum nicht stufenlos?). Der absolut neue Texterkennungsalgorithmus soll um den Faktor 10 schneller arbeiten. Für Experten: Es wird das gewichtete zweite Differential als Entscheidungskriterium herangezogen. Gleichzeitig greift man auch auf Verfahren der Konturverfolgung zurück.
Der Weg zur Vollkommenheit ist für SYNTEX noch weit. Der Erkennungstext ergab einige Schwächen, die durch den „neuen“ Algorithmus beileibe noch nicht ausgemerzt sind.
Fall 1: Die Funktion ,Linien entfernen' hat geradewegs auch die normalen Textbuchstaben durchschnitten und dort konsequenterweise auch nichtvorhandene Linien „entfernt“. Die Texte sind dann für den Erkennungsvorgang unbrauchbar.
Fall 2: Wenn SYNTEX mir sagt, daß das kleine „t“, weil es oben etwas schwach abgezeichnet ist, doch eher nach einem kleinen „i“ aussieht, dann ist das gut. Wenn ich aber nachkorrigiere und durch Eingabe eines „t“ darauf bestehe, daß es doch ein „t“ sei, ändert das Programm kurzerhand alle bisher richtig erkannten „i“s auch in „t“s um. Natürlich soll man in diesem Fall aufmerksam im Handbuch blättern, und so habe ich die Lösung gefunden: Es gibt noch nicht genügend erkannte „t“s und „i“s, um klar zwischen ihnen unterscheiden zu können.
Fall 3: Wenn ich in derselben Textvorlage (alle Einstellungen gleich) einmal einen Rahmen ziehe und erkennen lasse, läuft alles einwandfrei. Wenn ich aber keinen Rahmen aufziehe, läuft die Texterkennung trotzdem, nur dann ignoriert das Programm einige Wortzwischenräume.
Ist SYNTEX nun eine wirkliche Weiterentwicklung, die einen Update-Aufwand rechtfertigt? SYNTEX 1.0 kostete vor Jahr und Tag DM 248,- und war rein preislich der Konkurrenz voraus. Mittlerweile ist die Konkurrenz fast auf 2 Programme geschrumpft, so daß aus SYNTEX ein Standardprogramm werden könnte. Die alte Version 1.0 ist für DM 149,- weiterhin lieferbar und leistet Zufriedenstellendes (wie in 11/90 nachzulesen ist). Mit der Version 1.2 erwartet man eine Weiterentwicklung, die der Nummernfolge entsprechend etwas aufgeräumt hat - und genau das ist geschehen und nicht mehr! Das Programm bekam ein zeitgemäßes Outfit, wenigstens in den Dialogboxen und leider nicht in der Oberfläche, es wurden viele Funktionen in Richtung GEM-Klemmbrett eingebaut (Absatzerkennung, verschiedene ASCII, Tabellenverarbeitung, selbst-wählbare Feldtrenner usw.), Sonderzeichen, Vergrößerung sind möglich. Die Versionsnummer täuscht also nicht, und auch auf Namenszusätze wie „Superplus“ oder „Hyperprofessional“ hat man verzichtet. Die Version 1.2 kostet DM 299,-,
Angesichts dessen, was SYNTEX wirklich leistet (auch in der Version 1.0!), und der wegschrumpfenden Konkurrenz könnte SYNTEX durchaus DAS OCR-Programm für ATARI-Rechner werden, nur steht ihm wahrscheinlich der Preis dabei im Wege.
DK
Bezugsquelle:
Richter-Distributor Hagener Straße 65 W-5820 Gevelsberg
Positiv:
läuft als Programm und Accessory
unterstützt Klemmbrett
bei großer Bibliothek sehr präzise
unterstützt IDC-Treiber
ausführliches Handbuch
Negativ:
Linienfunktion zerstört Text
Bibliothek nicht einsehbar
fragwürdiger „Beschleunigerstecker"
zu hoher Preis