Der Falcon030 und seine Probleme beim Beschleunigen

So phantastisch das Falcon-System auch Ist, der Falcon-Anwender leidet schon seit je her an mangelnder Geschwindigkeit. Und so liegt es nicht fern, daß diverse Beschleunigungsversuche unternommen worden sind, die nicht selten zur System-Instabilität geführt haben.

Michael Ruge deckt die Schwächen des Falcon auf und zeigt Wege, eine zuverlässige Beschleunigung zu realisieren.

Liebe Leser, in diesem Artikel wird einiges an technischem Sachverstand vorausgesetzt! Sollten Sie sich entschließen, Ihrem Computer nach Durchlesen dieses Artikels zu Leibe zu rücken, so sind Sie ganz allein dafür verantwortlich, da weder ich noch die Redaktion nachprüfen können, ob Sie über das notwendige Werkzeug und handwerkliche Geschick verfügen!

Der Falcon030 wurde seinerseits von der ATARI Corporation für den Betrieb mit einem 16.042494 MHz Takt aus-gelegt. Bereits während der Ferti-gungs- und Verkaufsphase wurden Probleme mit dem 16.042494 MHz Takt bekannt, und es gab von ATARI aus Sunnyvale eine Reihe von Verbesserungsvorschlägen. Diese sind seit April 1994 unter dem berüchtigten Namen Falcon030 Clockpatch bekannt. Dazu benötigt man ein 74F04 IC und etwas Draht, um die Leitungsführung nach dem Entfernen der 3 33 Ohm SMD Widerstände (R216, R221 und R222 auf der Oberseite der Falcon030 Platine) zu ändern.

(Siehe Bild oben)

Der 16.042494MHz Taktpfad wurde von ATARI so geplant. An Pin 191 vom Combel Chip kommt er heraus, geht über den 0 Ohm Widerstand (mit reinen Drahtbrücken können heutige Bestückungsmaschinen in der industriellen Leiterplattenfertigung so gut wie nichts mehr anfangen) R217 und wird dann an den Filter- bzw. Dämpfungswiderständen R216, R221 und R222 an die 4 mit 16.042494MHz getaktenen Komponenten auf der Hauptplatine verteilt. So weit, so gut. Anfang 1994 stellte sich dann heraus, nachdem die Festplattenindustrie immer schnellere Festplatten produzierte, daß der SD-MA Chip bei schnellen SCSI Datentransfers Probleme bekam, wenn die angeschlossene Festplatte schneller als 1400 Kilobyte pro Sekunde Daten liefern bzw. schreiben konnte. Die Ursache fand sich dann schnell, und nach einigem anderen Patches einigte man sich dann auf die Lösung mit dem 74F04 IC im 16.042494MHz Taktpfad. Wie in der Digitaltechnik üblich, haben ICs einen vom Hersteller garantierten Funktionsbereich, wie man dem dazu gehörigen Datenblatt entnehmen kann, (siehe Tabelle 1)

Die Funktion dieses 74F04 ICs ist folgende: Der 16.042494MHz Takt wird am Pin 1 eingespeist, in diesem Gatter invertiert und kommt an Pin 2 wieder heraus. Der Pin 2 ist mittels einer Drahtbrücke mit den Pins 9, 11 und 13 verbunden. In diesen 3 Gattern wird das Signal wieder invertiert und damit wieder "richtig herumgedreht" an die verschiedenen Komponenten auf der Hauptplatine weitergeleitet. Dadurch, daß das 16.042494 MHz Signal auf seinem Weg durch das 74F04 IC durch zwei Gatter geführt wird, ergibt sich somit eine Gatterlaufzeit von über den Daumen gepeilt 7 Nanosekunden (weil der Hersteller auch nur einen gewissen Bereich garantiert aufgrund der Fertigungstoleranzen während der Chipproduktion). Diese 7 Nanosekunden sind zwar eigentlich nicht viel, und viele Falcon030 kommen auch damit zurecht und arbeiten dann auch zur Zufriedenheit ihrer Besitzer, leider gibt es aber auch bei den Customchips von ATARI (hier Combel, SDMA und Vi-del Chip) Fertigungstoleranzen. Diesen Problemrechnern muß man dann leider mit einen Oszilloskop (das sind diese kleinen schnuckligen Geräte mit dem grünen Bildschirm und diesen "komischen" Kurven auf der Bildröhre) zu Leibe rücken.

Dazu gibt es zwei Möglichkeiten:

Entweder man findet wirklich einen 74F04 IC mit der angegeben Mindestgatterlaufzeit von 1.5 Nanosekunden und kann so die Phasenverschiebung (siehe auch Abbildung PHASENVERSCHIEBUNG) der Signale auf ein Minimum reduzieren oder man trennt den FPU/SDMA Signalpfad auf und führt das Signal, welches für den SDMA Chip zuständig, ist über weitere Gatter; dies würde dann so aussehen.

# Tabelle 1

Auszugaus dem Datenblatt zum 74F04 IC von Motorola und Philips Semiconductors

Symbol Parameter Min Typ Max Größe
Vcc Versorgungsspannung 4.5 5.0 5.5 Volt
TA Temperaturbereich 0 25 70 Grad
10H Ausgangsstrom Highpegel -1.0 Milliampere
10L Ausgangsstrom Lowpegel 20 Milliampere
tPLH Gatterlaufzeit Highpegel 2.4 5.0 Nanosekunden
tPHL Gatterlaufzeit Lowpegel 1.5 4.3 Nanosekunden

Auszug aus dem Datenblatt zum DM7404 von Fairchild Semiconductors

Symbol Parameter Min Typ Max Größe
Vcc Versorgungsspannung 4.5 5.0 5.5 Volt
TA Temperaturbereich 0 25 70 Grad
I0H Ausgangsstrom Highpegel -0.4 Milliampere
I0L Ausgangsstrom Lowpegel 16 Milliampere
tPLH Gatterlaufzeit Highpegel 22 Nanosekunden
tPHL Gatterlaufzelt Lowpegel 15 Nanosekunden

Dazu muß kurz vor dem Pin 110 vom SDMA Chip (Platinenposition U36 unterhalb des Diskettenlaufwerkes) die Leiterbahn vorsichtig durchtrennt werden, wobei auch der grüne Lötstoplack vorsichtig auf der Seite zum SDMA Chip hin entfernt werden muß. Nun muß eine eventuell sogar abgeschirmte (die Abschirmung dieser Leitung nur an einer Seite mit der Masse der Hauptplatine verbinden durch Löten, niemals eine Abschirmung an beiden Seiten anschließen, da ansonsten ein Störstrom innerhalb der Abschirmung durch Potentialdifferenzen entstehen kann, welcher unerfreulicherweise wiederum eine Störspannung auf die Signalleitung des abgeschirmten Kabels induzieren könnte!) Leitung vom Punkt SDMA Chip am 74F04 IC zu dieser freigelegten Leiterbahn verlegt und angelötet werden.

Es kann durchaus sein, daß man noch einen weiteren 74F04 benötigt und das Taktsignal für den SDMA-Chip über weitere Gatter führen muß. Eine genaue Angabe der benötigten Gatter ist aufgrund der Produktionstoleranzen der ICs nicht möglich. Als sicherer Anhaltspunkt ist die absolute in Phasenlage der beiden Taktsignale als Referenz zu nehmen. Liegt das Taktsignal vom Pin 1 des 74F04 ICs absolut deckungsgleich mit dem SDMA Taktsignal übereinander, ist die Phasenlage korrekt und der Rechner sollte nun keine Probleme mehr bereiten. (siehe Frequenzdarstellung auf der nächsten Seite). Die Abbildung zeigt oben die Signalform des 16.042494MHz Taktes, welcher an Pin 191 aus dem Combel Chip herauskommt. Unten ist die Signalform des 32.084988 MHz Taktes am Ausgang vom Transistor Q107 zu sehen. Der 32.084988 MHz Takt wird über eine PLL vom Horizontalsyncsignal vom Monitoranschluß synchronisiert, um ein Zeilenfransen beim Betrieb eines Videodigitizers etc. zu vermeiden.

16.042494 MHz Takt am Ausgang des 74F04 nach dem Durchlaufen zwei Gattern

Die Abbildung der vorhergehenden Seite unten rechts zeigt die Idealform eines Taktsignales aus dem Datenblatt eines Quarzoszillators zur Anschauung.

"1" Level ist logisch High, also +5 Volt

"0" Level ist logisch Low, also Masse beziehungsweise Ground 1/2 Vdd ist die Hälfte der Versorgungsspannung, also die Hälfte von +5 Volt

Das Oszilloskop läßt veränderliche elektrische Vorgänge auf einer Elektronenröhre (ähnlich wie in einem Fernseher) sichtbar werden. Die Darstellung erfolgt durch einen sich bewegenden Leuchtpunkt auf dem Bildschirm selber. Üblicherweise ist die Geschwindigkeit des Leuchtpunktes so groß, daß er dem betrachtenden Auge als Linie erscheint (bedingt durch die Trägheit der Sehnerven). Der Leuchtpunkt wird in zwei senkrecht aufeinanderstehenden Richtungen abgelenkt und dadurch über die Bildschirmfläche als Koordinatenebene geführt. Ablenkung in horizontaler Richtung - auf der Koordinatenebene trägt sie die Bezeichnung X-Richtung.

Ablenkung in vertikaler Richtung - auf der Koordinatenebene trägt sie die Bezeichnung Y-Richtung (die Meßspannung und Signalform wird dem Y-Ein-gang zugeführt).

In horizontaler Richtung ist die Ablenkung in den meisten Fällen zeitlinear, das heißt der Leuchtpunkt bewegt sich mit konstanter Geschwindigkeit von links nach rechts über den Bildschirm. In vertikaler Richtung wird der zeitabhängige Verlauf der zu betrachtenden Eingangsspannung wiedergegeben. Er wird somit sicht- und auswertbar. Mit Hilfe der Triggerung, welche die verstärkte Meßspannung aus dem Horizontalteil (Sägezahnspannung des Ablenkgenerators in den meisten Fällen) wird der Ablenkgenerator so angesteuert, daß das Signal ruhig, also stehend auf dem Bildschirm angezeigt wird.

Hier das bei diesen Messungen verwendete Oszilloskop, vom Typ Hameg HM 1507 (ausgerüstet mit den folgenden Fähigkeiten: Die Abtastrate beträgt im Analogbetrieb 2 * 150 MHz und im Digitalbetrieb mit bis zu 200 Megasamples pro Sekunde und einer seriellen Schnittstelle.)

Der 32.084988MHz Takt vor der Glättung durch die Spule L102

Hinweis: Bei diesem Gerät ist ab ca. 70 MHz ein zunehmender Meßfehler zu berücksichtigen. Bei ca. 110 MHz beträgt der Abfall etwa 10 Prozent, der tatsächliche Spannungswert ist dann ca. 11 Prozent größer (laut Herstellerangabe) als der angezeigte Wert. Wegen den differierenden Bandbreiten der Vertikalverstärker (-3db im Bereich von 150 MHz bis 170 MHz) ist der Meßfehler nicht exakt definierbar. Bei Geräten mit geringeren Bandbreiten ist der zunehmende Meßfehler schon ab 10 MHz da, generell sollte man ein Oszilloskop verwenden, welches mindestens das Dreifache an Bandbreite kann wie die zu messende Frequenz groß ist, um diesen Meßfehler zu umgehen (siehe Foto). Handelsübliche Digitalmultimeter tasten das Eingangssignal nur mit einer Rate von 2 bis 3 Messungen pro Sekunde ab (TRUE RMS Geräte messen zwar bis 10 Kiloherz, sind aber hier ebenfalls ungeeignet, weil die Frequenz bis zu 48 MHz bei beschleunigten Falcon030 Computern betragen kann), sind also für das hier besprochene Problem völlig ungeeignet, um das Problem mit dem 16.042494MHz Takt zu beseitigen, außerdem stellen die Digitalmultimeter ausschließlich die Amplitude und nicht die Signalform der zu messenden Spannung beziehungsweise Größe dar.

Dieses Problem verstärkt sich dann erst recht, wenn der Bustakt von 32.084988 MHz mit 31.25nS auf 36 MHz mit 27.8nS oder 40 MHz mit 25ns Zykluszeit (oder gar auf 48MHz mit knapp 21nS Zykluszeit mit dem NEMESIS von Titan Designs U.K.) erhöht wird, hier muß man dann auch darauf achten, daß die Phasenlage bei allen Bustakten (auch den erhöhten) wieder übereinstimmt.

Ergänzende Informationen zum Thema Bus und CPU Takterhöhung beim Falcon030:

Die Spule L102, welche direkt hinter dem Ausgang vom Transistor Q107 sitzt, dient der Glättung des 32.084988MHz Taktes, was folgendermaßen dann aussieht (siehe Grafik auf der nächsten Seite):

Bei einigen Beschleunigermodulen (zum Beispiel dem PowerUp2 oder dem Skunk32), die ausschließlich den CPU Takt von 16.042494 MHz auf 32.084988 MHz verdoppeln, kann es notwendig sein, daß das neue CPU Taktsignal mittels einer Spule (ausgelötete Spule L102 und durch einen Draht überbrückt) oder mehreren Ferritringen geglättet wird, da sonst kein einwandfreier Betrieb möglich ist. Das Problem bei diesen Beschleunigermodulen liegt darin, daß der Takt nur dann auf 32.084988 MHz hochgeschaltet wird, wenn die CPU keine Buszugriffe tätigt, also intern in ihrem Cache arbeitet. Dazu muß noch gesagt werden, daß genau dieser Vorgang auftritt, wenn der Videochip auf das RAM zugreift, das heißt: Greift der Videochip mit 75 Zugriffen pro Sekunde auf das RAM zu, weil die Bildwiederholfrequenz 75 Hz beträgt, hat die CPU innerhalb einer Sekunde 75mal die Finger vom RAM zu lassen, in dieser Zeit wird die CPU also auf das doppelte hoch- und wieder runtergetaktet. Ist diese Synchronisation nicht gegeben, kommt es ebenfalls zu unmotivierten Bombenwürfen auf dem Bildschirm.

Versucht man den Falcon030 anders zu beschleunigen, zum Beispiel mit dem Auswechseln des 32.084988 MHz Quarzes gegen einen anderen Quarz, und springt der Computer danach gar nicht mehr an, so kann es an der geringen Amplitude des Signa-les vom Q107 liegen.

Hier sollte man den Transistor Q107 auslöten, den Platz U65 links neben Q107 mit einer Fassung versehen und dort einen Quarzoszillator einsetzen. Vorsicht, es gibt Quarzoszillatoren mit einem Pausen-/Impulsverhältnis von 60 zu 40, 50 zu 50 und 40 zu 60; es muß/kann also durchaus sein, daß der Rechner bereits mit einem Quarzoszillator problemlos läuft.

Alternativ kann man das Ausgangssignal des Quarzoszillator noch mit einem maximal 1 Kiloohm Widerstand nach +5V verbinden und einem Kondensator zwischen 33pf und 56pf gegen Masse legen, um einen höhere Amplitude (Signalspannung) zu erreichen.

Bootet der Rechner zwar mit einem höheren Takt und bleibt dann mit einem weißen Bildschirm hängen, nachdem die Floppy aus ist und das Boot-logo noch nicht gezeichnet wurde, gibt es zwei Möglichkeiten für diese Ursache:

A: Der Zugriff auf den Soundchip ging schief, ein Busfehler war die Folge und die Motorola CPUs stellen nach zwei Busfehlem die Arbeit ein und signalisieren das dem restlichen Komponenten auf der Hauptplatine mit einem LOW-Signal auf der HALT-Leitung.

B: Der Zugriff auf den Hauptspeicher ging schief, hier gibt es nur die eine Möglichkeit, es mit einer anderen ST-RAM Karte oder einem anderen PS/2 SIMM Modul nochmals zu versuchen.

C: Gepatchtes TOS verwenden, ab Systemstart werden die CPU und der Blitterchip auf 16 MHz geschaltet, nicht jeder Blitterchip verkraftet problemlos den erhöhten Takt von bis zu 24 MHz.

Alternativ kann man erst einmal versuchen, mit dem Lötpads unmittelbar vor dem Netzteil die Konfiguration zu ändern.

U46 Lötjumper 1 - Hauptspeicher Waitstate 
				Geschlossen - 0 Waitstate



	Offen -1 Waitstate	
U46 Lötjumper 3 -	Rom Waitstate		
U46 Lötjumper 4 -	Rom Waitstate		
	Geschlossen	Geschlossen -	- 0 Waitstate (100ns Eprom)
	Geschlossen	Offen	- 1 Waitstate (120ns Eprom)
	Offen	Geschlossen	- 2 Waitstate (150ns Eprom)
	Offen	Offen	- Reserviert (nicht verwendet)

Und noch ein Tip für die Musiker!

Läuft der Datentransfer über den SCSI Port stabil und ist man auch noch Besitzer von Cubase Audio, geht man weiter so vor:

Cubase Audio bei erhöhtem Systemtakt mit einem DEF.ALL starten, welche bereits eine Aufnahme Position beinhaltet. Nun wird der Monitor geöffnet, wenn man hier schon Knackser sieht, ist die Abstimmung der Gatterlaufzeit zwar schon gut, aber noch nicht optimal.

Sind im Monitor keine Knackser beziehungsweise Ausschläge zu sehen, sollte man nun den Position-Pointer mittels der Tasten 1 und 2 der Zehnertastatur wechselweise auf den Left- und Right Locator setzen, der in der DEF.ALL vorinstalliert ist. Dabei werden mit der SCSI Festplatte Leseoperationen durchgeführt. Ist bis hier alles in Ordnung, dann selektieren Sie einen Audiotrack (nicht den mit der vorhandenen Aufnahme) und schalten diesen in den Monitormodus (Info-Feld oder direkt im Monitor). Der Track ist sozusagen in Aufnahmebereitschaft und schleift das Signal zum DA-Wandler unter anderem durch. Wenn jetzt beim Setzen des Position-Pointers noch keine auch noch so kleinen kratzenden Geräusche wahrzunehmen sind, kann man Richtung Kühlschrank gehen und die Sektflasche köpfen.

Der letzte Test ist die Aufnahme einer bereits vorhandenen DAT-Aufnahme(l) via FDI zu der bereits vorhandenen Spur, die dabei zu hören sein soll. Ist auch dieses lupenrein geschehen, hat man es geschafft. Die Aufnahme via DAT nur als AD-Wandler reicht hingegen nicht aus, da offenbar der DSP noch die reinen Audiodaten von den z.B. Kopierschutz-Informationen etc. trennen muß und dieses die Anforderung nochmals hochschraubt.

Ganz zum Schluß noch ein Tip, der ebenfalls oft Ärger vermeiden hilft

Wenn der Falcon am PC-Netzteil im Tower Gehäuse nach dem Einschalten nicht stabil läuft oder sauber bootet, einfach den 1uF -Elko (C7 auf dem Mainboard, in der Nähe des Resettasters), der mit dem Pluspol direkt mit einem Kontakt des Resetschalters verbunden ist, durch einen Elko mit 4.7 oder 10uF ersetzen.

PC-Schaltnetzteile sind meist von geringer Qualität (Rauschen auf den Spannungen, Spannungseinbrüche etc.) und brauchen etwas mehr Zeit in Millisekunden, bis die Spannungen (Pegel der Spannungen) nach dem Einschalten stabil stehen als beim Falcon030 Original-Netzteil, da muß halt die Reset-Zeit beim Kaltstart (Po-wer-On) etwas verlängert werden.

Weiterhin kann es nötig sein, daß die Störspannungen (Ripple genannt) mehr als 100 Millivolt betragen (nur mit einem Oszilloskop feststellbar), dann sollte man am Elektrolytkondensator C1 (4700 uF, liegt etwas unterhalb der eingebauten IDE Festplatte) einen oder mehrere 4700uF Elektrolytkondensatoren parallel schalten und mit dem Oszilloskop die Störspannungen kontrollieren! Sollte das auch nicht helfen (sehr selten ist bei den PC üblichen Schaltnetzteilen die Schaltfrequenz angegeben), sollte man direkt an die Anschlußdrähte vom Elektrolytkondensator CI (ohne die Anschlußbeine zu verlängern!) einen Keramikkondensator von 10nF bis O.1uF anlöten, mehrere Werte ausprobieren und die +5V Spannungsversorgung wieder oszilloskopieren.

Der Witz an der Sache ist folgender:

Mehrere zusammengeschaltete Kondensatoren ergänzen sich in ihren elektrischen Eigenschaften zu einem einzigen Kondensator, bieten aber mit ihrem kleineren Ohmschen und kapazitiven Widerstand bei einer kleineren Induktivität erheblich bessere Werte als ein einziger großer Kondensator. Weshalb sich ein Kondensator nicht immer wie ein Kondensator verhält, sieht man aus dem oben abgebildeten Ersatzschaltbild.

So, liebe Leser, für diesmal ist nun Schluß, und falls noch Fragen offen sind, schreiben Sie bitte an die Redaktion. Wir beantworten dann Ihre Fragen in einer der nächsten Ausgaben.


Michael Ruge
Aus: ST-Computer 06 / 1998, Seite 36

Links

Copyright-Bestimmungen: siehe Über diese Seite