← ST-Computer 12 / 1992

Syntex - Vom Lehrling zum Gesellen

Software

Als wir das OCR-Programm SYNTEX im Heft 11/90 zum ersten Mal genauer betrachteten, war es noch ein „Azubi“ im ersten Lehrjahr. Nachdem sein „Lehrmeister“, die Fa. MARVIN AG in der Schweiz, den weiteren Ausbildungsbetrieb zur Konkursmasse erklĂ€rt hat, nahm die Firma Richter-Distributor sich des verlorenen Kindes an. Mittlerweile kann man sagen, daß SYNTEX durchaus dazugelernt und wahrscheinlich seine GesellenprĂŒfung gerade noch bestanden hat (Note nicht bekannt). Der Weg zum „OCR-Meister“ wird aber schwer werden.

Obwohl ich nach einigem Arbeiten mit der SYNTEX-Version 1.2 dazu neige, die Unterschiede zur VorgĂ€ngerversion hervorzuheben, scheint es mir doch angebracht, zunĂ€chst das Gesamtkonzept noch einmal zu betrachten -denn es hat sich inzwischen etwas getan in der OCR-Landschaft: Das Programm AUGUR (vom selben „Lehrmeister“) wird kaum noch angeboten, vielleicht ist es ganz vom Markt verschwunden. Ähnlich auch SHERLOOK, das ursprĂŒnglich mit den Programmierern an die Firma 3K gegangen ist. Dort verspĂŒrt man derzeit wenig Neigung, den schmalen „OCR-Pfad“ zu gehen. Dann gab es einige Eintagsfliegen in Sachen OCR, auch in der PD-Ecke war mal was zu sehen - halt alles nicht das Gelbe vom Ei!

Nachdem sich ein amerikanisches Programm auf dem europĂ€ischen ATARI-Markt vorstellt und außerdem mit einigen QualitĂ€ten aufzuwarten hat, muß der gesamte ATARI-OCR-Markt neu ĂŒberdacht werden (mal sehen, wie lange es dauert, bis auf dem FALCON Texterkennung mit dem DSP möglich ist). Unter dieser PrĂ€misse sollte man jetzt ganz anders in die Betrachtung von SYNTEX einsteigen.

Was ist geblieben?

Laut Handbuch hat man das BewĂ€hrte beibehalten - was auch sonst. So bietet sich uns weiterhin die streng zweigeteilte, starre ArbeitsoberflĂ€che: oben Vorlage, unten Erkanntes; oder wahlweise das ganze links/rechts. Ebenso muß immer vorher der zu betrachtende Bildteil eingerahmt werden - selbersuchen hat SYNTEX noch immer nicht gelernt. Weiter ist die Zeichenbibliothek fĂŒr niemanden zugĂ€nglich - unter welchen Kriterien welche Zeichen zugeordnet werden, bleibt nach wie vor ein Geheimnis. Damit ist auch ein Nachbearbeiten der Zeichenbibliothek nicht möglich. Scanner werden ĂŒber eine IDC-Software-Schnittstelle angesteuert. (Wenngleich ich das IDC-Konzept fĂŒr sinnvoll halte, hat es sich als Standard-Scanner-Treiber in der ATARI-Welt leider nicht durchgesetzt.) Auch geblieben ist die Wahl, SYNTEX entweder als PRG oder als ACC zu starten. Ebenso geblieben ist der höchst fragwĂŒrdige „Beschleunigerstecker“ (der Stecker, der OCR angeblich schneller macht), der in Wirklichkeit wohl eher als Pseudo-Kopierschutz fungieren soll.

Und was ist neu?

Einige Dialogboxen haben ein Facelifting erfahren und arbeiten allesamt als „Fliegende“ (Fly Dials) mit „MAC-like-Buttons“ (Radioknöpfe). Als geradezu genial wird uns die UnterstĂŒtzung des GEM-Klemmbretts angepriesen. Sicherlich hat der Texttransfer per Klemmbrett entscheidende Vorteile gegenĂŒber dem stupiden Zwischenspeichern. Dann kommt ein völlig neuer MenĂŒpunkt namens „Edit“ hinzu, was auch wieder mit dem Klemmbrett zu tun hat. Dann ist noch eine Sonderzeichenliste eingebaut, um auch jene Zeichen zu definieren, die nicht unmittelbar auf der Tastatur zu finden sind (wie wĂ€r’s mit der Eingabe als ASCII-Code?).

Bisher wahrhaftig störend war die starr voreingestellte Bildschirm VergrĂ¶ĂŸerung. Jetzt kann man zumindest zwischen vier DarstellungsgrĂ¶ĂŸen wĂ€hlen (warum nicht stufenlos?). Der absolut neue Texterkennungsalgorithmus soll um den Faktor 10 schneller arbeiten. FĂŒr Experten: Es wird das gewichtete zweite Differential als Entscheidungskriterium herangezogen. Gleichzeitig greift man auch auf Verfahren der Konturverfolgung zurĂŒck.

Auf dem Weg zum Meister

Der Weg zur Vollkommenheit ist fĂŒr SYNTEX noch weit. Der Erkennungstext ergab einige SchwĂ€chen, die durch den „neuen“ Algorithmus beileibe noch nicht ausgemerzt sind.

Fall 1: Die Funktion ,Linien entfernen' hat geradewegs auch die normalen Textbuchstaben durchschnitten und dort konsequenterweise auch nichtvorhandene Linien „entfernt“. Die Texte sind dann fĂŒr den Erkennungsvorgang unbrauchbar.

Fall 2: Wenn SYNTEX mir sagt, daß das kleine „t“, weil es oben etwas schwach abgezeichnet ist, doch eher nach einem kleinen „i“ aussieht, dann ist das gut. Wenn ich aber nachkorrigiere und durch Eingabe eines „t“ darauf bestehe, daß es doch ein „t“ sei, Ă€ndert das Programm kurzerhand alle bisher richtig erkannten „i“s auch in „t“s um. NatĂŒrlich soll man in diesem Fall aufmerksam im Handbuch blĂ€ttern, und so habe ich die Lösung gefunden: Es gibt noch nicht genĂŒgend erkannte „t“s und „i“s, um klar zwischen ihnen unterscheiden zu können.

Fall 3: Wenn ich in derselben Textvorlage (alle Einstellungen gleich) einmal einen Rahmen ziehe und erkennen lasse, lÀuft alles einwandfrei. Wenn ich aber keinen Rahmen aufziehe, lÀuft die Texterkennung trotzdem, nur dann ignoriert das Programm einige WortzwischenrÀume.

Wie dem auch sei

Ist SYNTEX nun eine wirkliche Weiterentwicklung, die einen Update-Aufwand rechtfertigt? SYNTEX 1.0 kostete vor Jahr und Tag DM 248,- und war rein preislich der Konkurrenz voraus. Mittlerweile ist die Konkurrenz fast auf 2 Programme geschrumpft, so daß aus SYNTEX ein Standardprogramm werden könnte. Die alte Version 1.0 ist fĂŒr DM 149,- weiterhin lieferbar und leistet Zufriedenstellendes (wie in 11/90 nachzulesen ist). Mit der Version 1.2 erwartet man eine Weiterentwicklung, die der Nummernfolge entsprechend etwas aufgerĂ€umt hat - und genau das ist geschehen und nicht mehr! Das Programm bekam ein zeitgemĂ€ĂŸes Outfit, wenigstens in den Dialogboxen und leider nicht in der OberflĂ€che, es wurden viele Funktionen in Richtung GEM-Klemmbrett eingebaut (Absatzerkennung, verschiedene ASCII, Tabellenverarbeitung, selbst-wĂ€hlbare Feldtrenner usw.), Sonderzeichen, VergrĂ¶ĂŸerung sind möglich. Die Versionsnummer tĂ€uscht also nicht, und auch auf NamenszusĂ€tze wie „Superplus“ oder „Hyperprofessional“ hat man verzichtet. Die Version 1.2 kostet DM 299,-,

Angesichts dessen, was SYNTEX wirklich leistet (auch in der Version 1.0!), und der wegschrumpfenden Konkurrenz könnte SYNTEX durchaus DAS OCR-Programm fĂŒr ATARI-Rechner werden, nur steht ihm wahrscheinlich der Preis dabei im Wege.

DK

Bezugsquelle:

Richter-Distributor Hagener Straße 65 W-5820 Gevelsberg

Positiv:

lÀuft als Programm und Accessory
unterstĂŒtzt Klemmbrett
bei großer Bibliothek sehr prĂ€zise
unterstĂŒtzt IDC-Treiber
ausfĂŒhrliches Handbuch

Negativ:

Linienfunktion zerstört Text
Bibliothek nicht einsehbar
fragwĂŒrdiger „Beschleunigerstecker"
zu hoher Preis