SYNTEX - Klein, aber fein

Syntex ist als ACC betreibbar. Es kann in jedem anderen GEM-Programm gerufen werden.

Von der Firma Marvin AG aus der Schweiz gibt es schon eine kleine Auswahl an Texterkennungsprogrammen. Neben AUGUR und CORE reiht sich nun ein Produkt ein. das den Markt von unten (weil recht preisgünstig Laufrollen soll.

Seit etwa 4 Jahren arbeitet die Marvin AG auf dem Gebiet der optischen Zeichenerkennung. Obwohl sie auch durch Anpassung von Scanner-Modellen bekannt wurde, hat sie sich vor allem durch Standards in der Software-Richtung von OCR einen Namen gemacht. Übrigens, OCR heißt „Optical Character Recognition" und steht für optische Zeichenerkennung. So sei die unter Programmierern allgemein akzeptierte Norm für Scanneransteuerung „IDC“ (Intelligent Driver Concept) erwähnt, an der die Leute der Marvin AG vorrangig beteiligt waren.

Waren es vor Jahren noch die Mammutlösungen, hauptsächlich für Großbetriebe und Patentanwälte, bei denen es darauf ankam, mehrere hundert Seiten pro Tag in den Computer einzulesen (siehe z. B. Belegleser im Bankenbereich), so ist im Zuge der fortschrittlichen Grafik-, Text- und DTP-Programme der Wunsch der Anwender gewachsen, nicht nur Buchstaben auf den Ausdruck zu bringen, sondern ein Druckwerk mit Bildern und Grafik zu zieren. Der Schritt lag nahe, die damals noch als futuristisch geltende OCR-Technik auch Heim- und Hobbyanwendern zugänglich zu machen.

Gleichzeitig sind die Preise, vor allem für Hand-Scanner drastisch gesunken, und auch die sogenannten Flachbett-Scanner wären für den anspruchsvollen Benutzer durchaus erschwinglich.

Dabei kommt es dieser Nutzerschicht nicht zu sehr auf die zu verarbeitende Menge oder gar Extrem-Geschwindigkeit an, sondern fast immer auf ein ausgewogenes Preis/Leistungs-Verhältnis. Und so kam Syntex rechtzeitig zur ATARI Messe auf den Markt. Laut Werbeaussage will es DIE Schnittstelle zwischen Scanner und Desktop Publishing sein. „Syntex wandelt Bild und Grafik in IMG und Texte in ASCII“ (Originalzitat).

Neben Diskette und Handbuch erhält man einen kleinen Joystick-Port-Stecker, der als sogenannter "Beschleuniger" arbeiten soll. Ob dieses Bauteil mehr als Kopierschutzstecker oder als ROM-Modul-Derivat arbeiten soll, bleibt im Dunkeln, denn SYNTEX arbeitet sowohl mit als auch ohne, nur „mit“ geht es wirklich wesentlich schneller.

PRG oder ACC?

Ganz zu Anfang der Bemühungen steht die Frage, ob SYNTEX als normales Programm gestartet werden soll oder ob es interessanter wäre, es in Zusammenarbeit z.B. mit einer Textverarbeitung als Accessory zu installieren. Und das ist auch schon der entscheidende Vorteil: Der Text muß nicht mehr wie in anderen OCR-Programmen erst auf Diskette abgespeichert werden, um in eine Textverarbeitung überzuwechseln, von wo man ihn erst wieder auf den Schirm holen muß. Ist Syntex als ACC installiert, kann es aus jedem GEM-Programm gerufen werden, und der Texttransfer macht nicht mehr den Diskettenumweg. Er läuft direkt über das Betriebssystem-BIOS. Das Textverarbeitungsprogramm erhält den Text so, als würde er über die Tastatur eingetippt werden.

Für den Transfer von Pixelbildern steht leider kein so direkter Weg zuf Verfügung. Bildteile markiert man mit der Maus und speichert sie als IMG-Dateien ab. Dieses Standard-GEM-Format kann praktisch jedes grafikfähige Programm lesen.

Welcher Scanner?

Gleichgültig welchen Scanner Sie irgendwann einmal kaufen werden, das IDC-Treiber-System stellt sicher, daß Syntex mit jedem Gerät optimal zusammenarbeitet. Der IDC-Treiber muß zuvor als Accessory angemeldet sein und wird direkt von Syntex angesprochen. Im IDC-Accessory sind dann alle wichtigen Scanner-Parameter wie Kontrast, Helligkeit, Auflösung, Vorlagengröße, Qualität usw. einzustellen.

Das andere Aussehen

Um ehrlich zu sein: Die Verwandtschaft von AUGUR 1.4 zu AUGUR 1.5 und CORE 1.0 ist sehr deutlich erkennbar, während SYNTEX doch etwas anders aufgebaut ist. Alle Funktionen werden per Pull-Down-Menü oder Tastenkombination ausgelöst. Alle Operationen bezieht das Programm zunächst auf den gesamten Text (so lange der Arbeitsspeicher ausreicht), oder es werden vorher Rahmen gezogen. Die Bildaufteilung ist entsprechend vorgegeben: oben Vorlagen-, unten Lernfenster. In letztgenanntem arbeitet man vornehmlich mit den Cursor-Tasten. Natürlich kann man die Lage der Fenster verändern, um sie z.B. nebeneinander anzuordnen, wenn ein schmaler Spaltentext zur Erkennung ansteht.

Das andere Arbeiten

Bisher war es bei den OCR-Programmen die übliche Praxis, eine gehörig umfangreiche Ansammlung von ähnlichen Buchstaben zu verwalten und bei einem unbekannten Zeichen brav Bildpunkt für Bildpunkt diese Bibliothek zu durchforsten. Das Ergebnis war klar: Entweder wurde mit hinreichender Genauigkeit ein ähnliches Zeichen gefunden, dann war das ein Treffer, oder in der Bibliothek war nichts Vergleichbares, dann galt es als unbekanntes Zeichen und mußte neu „gelernt“ werden. Diese Methode des Vergleichs haben wir in einer früheren Ausgabe schon ausführlicher beschrieben.

Modernere Texterkennungsprogramme gehen nun einen ganz anderen Weg. Sie vergleichen nicht mehr die Buchstaben als Ganzes, sondern nur noch ihre typischen Merkmale und Ausprägungen. Das können Öffnungen, Bogen, Punkte oder bestimmte Winkelverhältnisse sein. Syntex speichert diese typischen Erscheinungen und ist dadurch unabhängig von Schriftgröße, -dicke oder -art, weil ein kleines „i“ oder ein großes „X“ in jeder Typabwandlung in ihren urtypischen Merkmalen immer gleich bleiben. Es werden aber nur solche Merkmale festgehalten, in denen sich ein Zeichen besonders prägnant von anderen unterscheiden läßt. Diese Methode der „adaptiven Merkmalsextraktion“ stellt sicher, daß für jeden Schriftsatz oder für ein Gemisch von Schriftsätzen nur die optimalen Merkmale zur Erkennung herangezogen werden. Deshalb ist Syntex so extrem schnell und hat eine relativ kleine Fehlerrate.

Das Arbeitsfenster bleibt zweigeteilt und relativ unbeweglich: oben das Original, unten das Ergebnis.
Syntex arbeitet mit dem IDC-Treiber zusammen, der ebenfalls als Accessory installiert sein muß.
Eine reiche Auswahl an Dialogboxen nehmen individuelle Einstellungen auf.

Einstellungssache

Syntex stellt die meisten Parameter für den Erkennungsvorgang nach der Analyse der Vorlage automatisch ein. Ein Filtern, Verdicken oder Ausdünnen von Schriften ist nicht mehr notwendig.

Lediglich eine Grobvoreinstellung sollte der Benutzer zu Anfang erledigen. Hierzu stehen ihm eine kleine Auswahl von Dialogboxen zur Verfügung. Diese globalen Parameter hängen aber nicht nur von der Qualität der Vorlage ab (Kontrast, Buchstabengröße, Druckqualität usw.), sondern auch vom beabsichtigten Anwendungsziel. Der Benutzer hat es also durchaus in der Hand, beispielsweise eine höhere Fehlerrate zugunsten einer höheren Lesegeschwindigkeit hinzunehmen.

So bedeutet die Einstellung „präzise segmentieren“, daß Syntex besonders auf eng gesetzte oder sich berührende Buchstaben achten soll und das dauert seine Zeit. Im Schnellesemodus können da schon einmal zwei zusammengewachsene Buchstaben (Fachausdruck: Ligaturen) als ein Zeichen verstanden, sowie als solche erkannt und gelernt werden.

Ebenfalls wichtig ist für den Erkennungsvorgang. ob der Buchstabenabstand „fixed spaced" (also fest, wie bei der normalen Schreibmaschine) oder „proportional" (d.h. variabel) ist.

Erkennen Sie?

Syntex ist dem alten Prinzip der OCR-Programme treu geblieben, erst den Umfang der Textpassagen gezeigt zu bekommen, durch Aufziehen von Rahmen. Nach dem Start des Erkennungsvorganges untersucht Syntex das Dokument auf seine Schräglage und teilt daraufhin die Zeilenzwischenräume (Fachausdruck: Durchschuß) ein. Das Programm toleriert bei einem DIN-A4-Blatt eine Zeilenverschiebung von maximal 5 mm auf die Blattbreite bezogen. Alles, was schräger ist, muß dann eben nochmal eingescannt werden.

Segmentieren heißt nun, daß auf der Zeile ein „Sucher" von Buchstabe zu Buchstabe wandert und dessen Abgrenzung zu den Nachbarn, sowie dessen typische Merkmale aufnimmt.

Bei einigen Zeichen kann es sehr leicht zu Fehlern kommen, weil das Programm durch deren große Ähnlichkeit verwirrt ist. So stößt man beispielsweise bei Groß-"I" und Klein "l" oder Klein-"I" und der Zahl „1" sehr schnell an die Grenzen solcher Programme. Sehen wir uns an einem Beispiel an, wie Syntex diese Problematik zu lösen vermag:

Es gilt das Wort „Allen" zu erkennen und es liegt erst die Zeichenkette „.llen" vor. Weil Syntex noch nicht wissen kann, was anstelle des Punktes kommt, nimmt es an, das Wort hieße „Ilen" und schreib deshalb den ersten Buchstaben groß. Wenn jetzt aber das A am Wortanfang definiert wird würde daraus „Allen" werden. Jetzt tritt die Fehlerbibliothek in Kraft und stellt fest, daß zwei Großbuchstaben üblicherweise nicht in einem Wort stehen können und daß nach einem Selbstlaut (hier: A) durchaus zwei gleiche Buchstaben folgen dürfen (hier: ll). Ähnlich ist die Prozedur bei Klein-"I" und der Zahl „1". Erst wenn die Fehlerautomatik erkennt, daß eine Zeichenkombination auf keinen Fall sein darf, dann werden tauglichere Zusammenstellungen gesucht. Diese Fehlerautomatik zeigt aber, wo fast alle OCR-Programme schnell passen müssen. Es können so große Ähnlichkeiten auftreten (besonders auch bei schlechten Vorlagen), daß das Programm keinen Unterschied mehr erkennt.

Der Arbeitsspeicher

Wenn Syntex als Programm gestartet wird, stellt die Größe des Arbeitsspeichers kein Problem dar, es steht praktisch der ganze RAM-Bereich zur Verfügung. Anders aber, wenn Syntex als ACC installiert ist. Viele Anwenderprogramme unterschlagen den ganzen freien RAM-Speicher, und da kann Syntex natürlich nicht mehrarbeiten. In einer Einstellung kann man dem ACC-Syntex schon beim Booten einen festen Arbeitsspeicher zu weisen lassen, der dann für es reserviert ist.

DTP-OCR?

Syntex gefällt! Es ist ein äußerst interessantes Texterkennungsprogramm, besonders weil es als einziges auf dem deutschen Markt auch als ACC lauffähig ist. Und da macht die Einordnung Sinn: Als Schnittstelle zwischen Scanner und DTP. Die Tatsache, daß die Schriftbibliotheken nicht angezeigt werden, man also keine direkte Kontrolle über den Zeichenvorrat hat, stellt keine schwerwiegende Einschränkung dar.

Das Handbuch ist für meine Begriffe akzeptabel und erklärt Vorgänge und Bedienungsweise auf 84 Seiten ausführlich. Der „Durchsatz" an Bildern hätte ruhig etwas reichhaltiger ausfallen können. Leider konnte man sich zu Hilfsmitteln wie Piktogrammen (leicht wiedererkennbare Symbole) oder Marginalien (Randbeschriftung) im Handbuch nicht durchringen. Die Kapitel sind brav Menüpunkt für Menüpunkt durchstrukturiert.

Übrigens: Syntex läuft klaglos auf dem ATARI TT und allen Großbildschirmen. Preisfrage: Wieviel kostet so ein Programm? Antwort: 248 DM! Eine voll funktionsfähige Demo-Version gibt es für 40 DM.

DK

Bezugsquelle

H. Richter -Distributor-Hagener Straße 65 5X20 Gevelsberg



Aus: ST-Computer 11 / 1990, Seite 36

Links

Copyright-Bestimmungen: siehe Über diese Seite