Als wir das OCR-Programm SYNTEX im Heft 11/90 zum ersten Mal genauer betrachteten, war es noch ein âAzubiâ im ersten Lehrjahr. Nachdem sein âLehrmeisterâ, die Fa. MARVIN AG in der Schweiz, den weiteren Ausbildungsbetrieb zur Konkursmasse erklĂ€rt hat, nahm die Firma Richter-Distributor sich des verlorenen Kindes an. Mittlerweile kann man sagen, daĂ SYNTEX durchaus dazugelernt und wahrscheinlich seine GesellenprĂŒfung gerade noch bestanden hat (Note nicht bekannt). Der Weg zum âOCR-Meisterâ wird aber schwer werden.
Obwohl ich nach einigem Arbeiten mit der SYNTEX-Version 1.2 dazu neige, die Unterschiede zur VorgĂ€ngerversion hervorzuheben, scheint es mir doch angebracht, zunĂ€chst das Gesamtkonzept noch einmal zu betrachten -denn es hat sich inzwischen etwas getan in der OCR-Landschaft: Das Programm AUGUR (vom selben âLehrmeisterâ) wird kaum noch angeboten, vielleicht ist es ganz vom Markt verschwunden. Ăhnlich auch SHERLOOK, das ursprĂŒnglich mit den Programmierern an die Firma 3K gegangen ist. Dort verspĂŒrt man derzeit wenig Neigung, den schmalen âOCR-Pfadâ zu gehen. Dann gab es einige Eintagsfliegen in Sachen OCR, auch in der PD-Ecke war mal was zu sehen - halt alles nicht das Gelbe vom Ei!
Nachdem sich ein amerikanisches Programm auf dem europĂ€ischen ATARI-Markt vorstellt und auĂerdem mit einigen QualitĂ€ten aufzuwarten hat, muĂ der gesamte ATARI-OCR-Markt neu ĂŒberdacht werden (mal sehen, wie lange es dauert, bis auf dem FALCON Texterkennung mit dem DSP möglich ist). Unter dieser PrĂ€misse sollte man jetzt ganz anders in die Betrachtung von SYNTEX einsteigen.
Was ist geblieben?
Laut Handbuch hat man das BewĂ€hrte beibehalten - was auch sonst. So bietet sich uns weiterhin die streng zweigeteilte, starre ArbeitsoberflĂ€che: oben Vorlage, unten Erkanntes; oder wahlweise das ganze links/rechts. Ebenso muĂ immer vorher der zu betrachtende Bildteil eingerahmt werden - selbersuchen hat SYNTEX noch immer nicht gelernt. Weiter ist die Zeichenbibliothek fĂŒr niemanden zugĂ€nglich - unter welchen Kriterien welche Zeichen zugeordnet werden, bleibt nach wie vor ein Geheimnis. Damit ist auch ein Nachbearbeiten der Zeichenbibliothek nicht möglich. Scanner werden ĂŒber eine IDC-Software-Schnittstelle angesteuert. (Wenngleich ich das IDC-Konzept fĂŒr sinnvoll halte, hat es sich als Standard-Scanner-Treiber in der ATARI-Welt leider nicht durchgesetzt.) Auch geblieben ist die Wahl, SYNTEX entweder als PRG oder als ACC zu starten. Ebenso geblieben ist der höchst fragwĂŒrdige âBeschleunigersteckerâ (der Stecker, der OCR angeblich schneller macht), der in Wirklichkeit wohl eher als Pseudo-Kopierschutz fungieren soll.
Und was ist neu?
Einige Dialogboxen haben ein Facelifting erfahren und arbeiten allesamt als âFliegendeâ (Fly Dials) mit âMAC-like-Buttonsâ (Radioknöpfe). Als geradezu genial wird uns die UnterstĂŒtzung des GEM-Klemmbretts angepriesen. Sicherlich hat der Texttransfer per Klemmbrett entscheidende Vorteile gegenĂŒber dem stupiden Zwischenspeichern. Dann kommt ein völlig neuer MenĂŒpunkt namens âEditâ hinzu, was auch wieder mit dem Klemmbrett zu tun hat. Dann ist noch eine Sonderzeichenliste eingebaut, um auch jene Zeichen zu definieren, die nicht unmittelbar auf der Tastatur zu finden sind (wie wĂ€râs mit der Eingabe als ASCII-Code?).
Bisher wahrhaftig störend war die starr voreingestellte Bildschirm VergröĂerung. Jetzt kann man zumindest zwischen vier DarstellungsgröĂen wĂ€hlen (warum nicht stufenlos?). Der absolut neue Texterkennungsalgorithmus soll um den Faktor 10 schneller arbeiten. FĂŒr Experten: Es wird das gewichtete zweite Differential als Entscheidungskriterium herangezogen. Gleichzeitig greift man auch auf Verfahren der Konturverfolgung zurĂŒck.
Auf dem Weg zum Meister
Der Weg zur Vollkommenheit ist fĂŒr SYNTEX noch weit. Der Erkennungstext ergab einige SchwĂ€chen, die durch den âneuenâ Algorithmus beileibe noch nicht ausgemerzt sind.
Fall 1: Die Funktion ,Linien entfernen' hat geradewegs auch die normalen Textbuchstaben durchschnitten und dort konsequenterweise auch nichtvorhandene Linien âentferntâ. Die Texte sind dann fĂŒr den Erkennungsvorgang unbrauchbar.
Fall 2: Wenn SYNTEX mir sagt, daĂ das kleine âtâ, weil es oben etwas schwach abgezeichnet ist, doch eher nach einem kleinen âiâ aussieht, dann ist das gut. Wenn ich aber nachkorrigiere und durch Eingabe eines âtâ darauf bestehe, daĂ es doch ein âtâ sei, Ă€ndert das Programm kurzerhand alle bisher richtig erkannten âiâs auch in âtâs um. NatĂŒrlich soll man in diesem Fall aufmerksam im Handbuch blĂ€ttern, und so habe ich die Lösung gefunden: Es gibt noch nicht genĂŒgend erkannte âtâs und âiâs, um klar zwischen ihnen unterscheiden zu können.
Fall 3: Wenn ich in derselben Textvorlage (alle Einstellungen gleich) einmal einen Rahmen ziehe und erkennen lasse, lÀuft alles einwandfrei. Wenn ich aber keinen Rahmen aufziehe, lÀuft die Texterkennung trotzdem, nur dann ignoriert das Programm einige WortzwischenrÀume.
Wie dem auch sei
Ist SYNTEX nun eine wirkliche Weiterentwicklung, die einen Update-Aufwand rechtfertigt? SYNTEX 1.0 kostete vor Jahr und Tag DM 248,- und war rein preislich der Konkurrenz voraus. Mittlerweile ist die Konkurrenz fast auf 2 Programme geschrumpft, so daĂ aus SYNTEX ein Standardprogramm werden könnte. Die alte Version 1.0 ist fĂŒr DM 149,- weiterhin lieferbar und leistet Zufriedenstellendes (wie in 11/90 nachzulesen ist). Mit der Version 1.2 erwartet man eine Weiterentwicklung, die der Nummernfolge entsprechend etwas aufgerĂ€umt hat - und genau das ist geschehen und nicht mehr! Das Programm bekam ein zeitgemĂ€Ăes Outfit, wenigstens in den Dialogboxen und leider nicht in der OberflĂ€che, es wurden viele Funktionen in Richtung GEM-Klemmbrett eingebaut (Absatzerkennung, verschiedene ASCII, Tabellenverarbeitung, selbst-wĂ€hlbare Feldtrenner usw.), Sonderzeichen, VergröĂerung sind möglich. Die Versionsnummer tĂ€uscht also nicht, und auch auf NamenszusĂ€tze wie âSuperplusâ oder âHyperprofessionalâ hat man verzichtet. Die Version 1.2 kostet DM 299,-,
Angesichts dessen, was SYNTEX wirklich leistet (auch in der Version 1.0!), und der wegschrumpfenden Konkurrenz könnte SYNTEX durchaus DAS OCR-Programm fĂŒr ATARI-Rechner werden, nur steht ihm wahrscheinlich der Preis dabei im Wege.
DK
Bezugsquelle:
Richter-Distributor Hagener StraĂe 65 W-5820 Gevelsberg
Positiv:
lÀuft als Programm und Accessory
unterstĂŒtzt Klemmbrett
bei groĂer Bibliothek sehr prĂ€zise
unterstĂŒtzt IDC-Treiber
ausfĂŒhrliches Handbuch
Negativ:
Linienfunktion zerstört Text
Bibliothek nicht einsehbar
fragwĂŒrdiger âBeschleunigerstecker"
zu hoher Preis