Ricke, Jens: Über die Optimierung von Waveletalgorithmen für die verlustbehaftete Kompression digitaler Röntgenbilddaten

64

Kapitel 3. Material und Methode

3.1 Bildmaterial

3.1.1 Phantome für Digitale Radiographien (DR)

Digitale Radiographien werden durch Digitale Direkt Radiographie [ siehe ] oder durch Digitale Lumineszenz Radiographie (DLR) [ siehe ] erstellt. In der vorliegenden Studie wurden ausschließlich Digitale Lumineszenz Radiographien verwendet (Digiscan, Siemens, Erlangen). In der DLR überführen aus dem Patienten austretende Röntgenquanten lichtstimulierbare Schwermetallhalogenidphosphorverbindungen einer Halbleiterfolie als latentes Bild auf ein höheres Energieniveau. Bei der Auslesung durch einen Helium-Neon-Laserstrahl mißt ein Photomultiplyer Lichtemmissionen der höherenergetischen Elektronen und wandelt diese in zeitabhängige elektrische Signale um. Die elektrischen Signale werden digitalisiert und weiterverarbeitet. Der Rohdatensatz eines Bildes des Siemens Digiscan besitzt eine Matrix von 2000 x 2000 Pixeln und weist eine Tiefe von 10 Bit entsprechend 1024 Graustufen auf. Nicht nachverarbeitete Rohdatenbilder zeichnen sich in aller Regel durch einen geringen, der Diagnostik nicht angemessenen Kontrast aus [ siehe ] und müssen entsprechend nachverarbeitet werden. Das Siemens Digiscan setzt hierfür einen Algorithmus ein, der eine beta- und gamma-Kurven Modifikation durchführt (Synonym: Kontrast- und Ortsfrequenzverarbeitung) [ siehe ]. Darüber hinaus muß eine Fensterung der Bilder zur Festlegung des Graustufenbereiches durchgeführt werden. Für diagnostische Zwecke werden die Bilder schließlich auf einem Graustufenmonitor mit einer 8 Bit Grafikkarte (entsprechend 256 Graustufen) visualisiert. Die zur Befundung nachverarbeiteten DLR-Aufnahmen demonstrieren regelhaft eine geringes Bildrauschen insbesondere im Vergleich zu tomografischen Aufnahmen der CT


65

oder MRT [ siehe ].

3.1.1.1 Niedrigfrequenzphantome DR

Für die Testung diagnostischer Validität im Niedrigfrequenzbereich wurde ein erwerbliches Phantom (im Folgenden: „Lungenrundherde“, TRG, Alvim, Jerusalem [ siehe ]) mit Details mit niedrigem Kontrast eingesetzt [Abb. 8, Seite 35].

Lungenrundherde

Das Phantom TRG besteht aus einem Grundkörper mit 12 senkrechten Spalten zur Aufnahme von je 10 Testkörpern. Von den 10 Testkörpern einer Spalte enthalten je 5 ein gleichartiges Detail, 5 sind ohne Detail. Die Körper mit oder ohne Detail können in der Spalte frei angeordnet werden. Die Details sind runde Bohrungen, deren Tiefe gleich dem Durchmesser ist. Der Durchmesser nimmt je Spalte von 0,9 bis 2,0 mm zu. In den Spalten 1-6 bestehen die Grundkörper aus PVC (PolyVinylChlorid), in den Spalten 7-12 aus PMMA (PolyMethylMethAcrylate: Plexiglas) [ siehe , siehe ]. Es wurden 5 Digitale Lumineszenz Radiographien des statistischen Testphantoms mit jeweils veränderter Verteilung der Details angefertigt. Als Streukörper wurden vor und hinter dem Phantom 5 cm Plexiglas angeordnet. Es wurde ein Film-Fokus-Abstand von 2 m und eine Röhrenspannung von 125 kV gewählt. Für den Röhrenstrom betrug die Voreinstellung 5,6 mAs.

3.1.1.2 Gemischt Hoch- und Niedrigfrequenzphantom DR

Für die Darstellung von Details, die sich aus hoch- und niedrigfrequenter Information zusammensetzen, wurde eigens ein Phantom konstruiert (im Folgenden: „Interstitielle Pneumonie“).


66

Interstitielle Pneumonie

Eine Spanholzplatte von 1,8 cm Dicke wurde in zehn Felder von 9 x 14 cm aufgeteilt und diese mit Metallmarkierungen numeriert. In Vorstudien wurden Naturschwammstücke mit um jeweils 1 cm ansteigender Dicke auf der Spanholzplatte positioniert, um für eine definierte Geräteeinstellung eine Dicke der Schwammstücke zu finden, die eine schwellenwertnahe Abbildung ähnlich einer interstitiellen Pneumonie im Thoraxröntgenbild generiert (Digitale Lumineszenz Radiographien; 60 kV, 250 mA). Ausgewählt wurde eine Dicke der Naturschwämme von 2,5 cm. In fünf der zehn Felder wurden Naturschwammstücke mit den Abmessungen 2,5 x 3 x 5 cm (Höhe x Breite x Länge) positioniert [Abb. 15]. Abschließend wurden 5 Aufnahmen der DLR mit wechselnder Positionierung der Naturschwammstücke in den numerierten Feldern erstellt und der Rohdatensatz abgespeichert.


67

Abb. 15: Phantom „Interstitielle Pneumonie“ mit gemischt hoch- und niedrigfrequenten Details
Fotografie (oben), Digitale Radiographie (unten)


68

3.1.1.3 Hochfrequenzphantom DR

Pneumothorax

Für die Evaluierung hochfrequenter Bilddetails wurde ebenfalls ein geeignetes Phantom entwickelt. 40 Rundkörper aus PMMA mit einem Durchmesser von 1,5 cm und einer Höhe von 0,5 cm wurden in vier Reihen zu je zehn Stück auf einer 0,2 cm dicken Plexiglasplatte angeordnet. Eine 1 cm dicke Plexiglasplatte wurde als Streukörper vorgeschaltet. Jeweils fünf Rundkörper jeder Säule zu 10 Rundkörpern wurden mit Stahlwolle beklebt. Die Dicke der Stahlwollefäden war in jeder Säule gleich, nahm jedoch von Säule zu Säule zu [Abb. 16]. Nach Vorauswahl anhand von Testaufnahmen wurden Dicken der Stahlwollefäden von 0.035 mm, 0.04 mm, 0.045 mm und 0.05 mm je Säule ausgewählt. Es wurden 5 Digitale Lumineszenz Radiographien mit fünf verschiedenen Anordnungen der Details bei einem Film-Fokus-Abstand von 2 m, 60 kV und 4,08 mAs angefertigt und der Rohdatensatz digital gespeichert.


69

Abb. 16: Phantom „Pneumothorax“ mit hochfrequenten Details.
Fotografie (oben), Digitale Radiographie (unten)


70

3.1.2 Phantom für Computertomographien (CT)

Die für die Studie eingesetzten Computertomographien wurden an einem Siemens Somatom Plus (Siemens, Erlangen) erstellt. Die an diesem Gerät generierten Computertomographien weisen 12 Bit Tiefe entsprechend 4096 Graustufen auf. Für die Diagnostik wird eine Fensterung der Grauwerte durchgeführt; die resultierenden Grauwerte werden auf 256 Graustufen entsprechend der Visualisierung mit 8 Bit Grafikkarten gestaucht oder gestreckt. Die Matrix der Bilder beträgt 512 x 512 Pixel. Im Vergleich zu Digitalen Radiographien fällt bei Computertomographien ein erhebliches Bildrauschen an, dessen Effekt auf die Diagnostik über die Fensterung der Grauwerte reduziert werden kann. Hochfrequente Information spielt bei Computertomographien diagnostisch keine wesentliche Rolle [ siehe ], es wurde daher nur ein Phantom für niedrigfrequente Information entwickelt (im Folgenden: „CT Raumforderungen“).

3.1.2.1 Niedrigfrequenzphantom CT

CT Raumforderungen

Auf eine aufrecht stehende Spanholzplatte wurden zehn Rundkörper aus PMMA mit einem Durchmesser von 4 cm und einer Höhe von 1 cm befestigt. In fünf der Rundkörper wurden Rundstifte aus PVC eingefügt, deren Dicke nach einer vorbereitenden Testreihe auf 0,5 cm festgelegt wurde [Abb. 17]. Es wurden insgesamt 5 Aufnahmen des Phantoms mit wechselnden Positionen der Rundkörper erstellt. Die Aufnahmen wurden mit einer Schichtdicke von 5 mm, einer Röhrenspannung von 120 kV und einem Röhrenstrom von 250 mA ausgeführt und als Rohdatensatz abgespeichert.


71

Abb. 17: Phantom „CT Raumforderungen“ mit niedrigfrequenten Details.
Fotografie (oben), Digitale Radiographie (unten)


72

3.2 Vorbereitung der Kompression

3.2.1 Kompressionsalgorithmus

Der in der Vorstudie (Kapitel 2.4) eingesetzte Waveletalgorithmus wurde auch in der fortsetzenden Hauptstudie zur Modifikation von Waveletalgorithmen durch optimale Filter verwendet. Das eingesetzte Waveletkompressionsverfahren „PACC“ (Partitioning, Aggregation, Conditional Coding) unterscheidet sich von herkömmlichen Waveletalgorithmen durch eine Präkodierung nach der Quantisierung zur Optimierung der erreichbaren Kompressionsrate [ siehe , siehe ]. Multiskalenanalyse, Quantisierung und Kodierung entsprechen den üblichen Techniken.

3.2.2 Konversion der Dateiformate

Die Kompression aller Testbilder erfolgte nach Konversion der DICOM-Rohdaten (Originalbittiefe: 10 Bit DLR respektive 12 Bit CT) in pgm Format. Die Bildrekonstruktion nach Kompression mit den Testfiltern erfolgte wieder aus pgm in DICOM mit Originalbittiefe. Für die eigentliche Bildansicht wurde zusätzlich eine Konversion in GIFF vorgenommen, um die einfache Visualisierung der Testbilder mit durch den Versuchsleiter für jede Gruppe von Phantomen eigens definierten Graustufenfenstern (Window/Center) zu ermöglichen. Die Einstellung der Fensterung entsprach dem klinischen Standard für die jeweiligen Fragestellungen (CT Phantom: Weichteilfenster Abdomen; DLR Phantome: Thorax bzw. Skelettbefundung).


73

3.3 Filterauswahl

Es wurden nach Literaturstudium, subjektiven Vorstudien durch visuelle Bewertung und mathematischer Auswertung der Kompressionsleistung vier im Multimediabereich etablierte Wavelet-Filter ausgewählt. Bei allen Filtern handelte es sich um Standardfilter, die für nicht-medizinische Anwendungen Verbreitung gefunden haben.

Es wurden ausschließlich symmetrische und damit notwendigerweise biorthogonale Filter selektiert. Symmetrische Filter ermöglichen eine Faltung und generieren dadurch reduzierten Rechenaufwand. Darüber hinaus fehlt asymmetrischen Filtern die lineare Phase, was zu einer Fehlerpotenzierung durch örtliche Verschiebung einzelner Approximationen und damit zu verstärkten Artefakten führt [ siehe ].

Formal auffälligstes Unterscheidungskriterium der Filter war die sehr unterschiedliche mathematische Komplexität der Filter insbesondere im Hinblick auf zu erwartende Rechenzeiten bei Kodierung und Rekonstruktion datenintensiver Röntgenbilder. Die Komplexität der Filter nimmt mit der ansteigenden Ordnungszahl der Koeffizienten zu (5.3 < 9.7 < 18.10 < 22.14).

3.3.1 Bicdf 5.3

Der Filter bicdf 5.3 zeichnet sich durch seine mathematisch niedrige Komplexität im Vergleich mit den anderen herangezogenen Filtern aus. Bicdf 5.3 wurde aufgrund der guten mathematischen Leistungen im verlustfreien Bereich bei gleichzeitig geringer Komplexität als Standardfilter für den verlustlosen Kompressionsmodus des JPEG 2000 Standards ausgewählt [ siehe , siehe , siehe ]. In unserer eigenen, vorbereitenden Evaluierung erhoben wir einen Abfall der mathematischen Effizienz (PSNR, Signal-Rausch-


74

Verhältnis, siehe Kapitel 3.6.3) bei höheren, verlustbehafteten Kompressionsraten.

3.3.2 Bicdf 9.7

Der Filter bicdf 9.7 hat sich als Standardfilter für natürliche Bilder im Multimediabereich durchgesetzt [ siehe , siehe ] und wird als Standardfilter für die verlustbehaftete Kompression in JPEG 2000 eingeführt [ siehe , siehe ]. In den Vorstudien fiel der Filter durch eine hohe PSNR als Indikator einer mathematisch effizienten Kompression auf.

3.3.3 Bivil 18.10

Der Filter bivil 18.10 wurde als Ersatzfilter in JPEG 2000 aufgenommen. Subjektiv und in der Wertung anderer Autoren bestehen Vorteile für Bilder mit überwiegend hochfrequenter Information [ siehe ].

3.3.4 Bicoif 22.14

Der Filter bicoif 22.14 weist in der Testserie die höchste Komplexität auf. Andere Autoren berichten von gegenüber bicdf 9.7 mathematisch besseren Kompressionsergebnissen durch einen geringeren quadratischen Fehler [ siehe ]. Subjektiv ergaben sich Vorteile der Qualität der rekonstruierten Bilder gegenüber bivil 18.10.


75

3.4 Erhebung geeigneter Kompressionsraten für die ROC-Analyse

Um den für die Studie geeigneten Qualitätsparameter herauszufinden, der für jedes Phantom eine schwellenwertnahe Darstellung der Details generierte, wurde jeweils eine Testreihe mit dem Filter „bicoif 22.14“ durchgeführt. Dabei wurde der Qualitätsparameter des Kompressionsalgorithmus um jeweils 10, im kritischen Bereich um 2 zugunsten einer zunehmende Kompressionsrate verändert. Der Qualitätsparameter des PACC-Algorithmus (s.o.) ist dimensionslos und führt zu einer Modifikation des Quantisierers. Mit zunehmendem Qualitätsparameter wird eine größere Anzahl Intervalle auf den resultierenden Koeffizienten abgebildet, so daß höhere Kompressionsraten bei steigenden Informationsverlusten erzielt werden. Durch den Versuchsleiter wurde die Schwelle definiert, bei der eine Einschränkung der Bildqualität für die interessierenden nieder- oder hochfrequenten Details sichtbar wurde. Als geeignete Qualitätsparameter wurden ermittelt: Für das Phantom „Pneumothorax“ 10, für „Interstitielle Pneumonie“ 32, für „Lungenrundherde“ 20, für „CT Raumforderungen“ 20.

Die erhobenen Qualitätsparameter definierten jeweils für eine Gruppe von Phantomen die durch die unterschiedlichen Filter zu erreichenden Zielgrößen der Enddatei. Die Zielgröße wurde durch eine Feinabstimmung des Qualitätsparameters erreicht. Eine Schwankung der Ergebnisgröße um maximal 1‰ wurde hierbei toleriert, da der bei der Filterung durch verschiedene Filter resultierende Bitstrom nicht gleichermaßen ideal für eine mathematische Weiterverarbeitung sein muß und damit häufig eine exakte Zielwerterreichung unmöglich war.


76

3.5 Visualisierungsumgebung

3.5.1 Visualisierungssoftware

Als Visualisierungssoftware wurde die frei verfügbare Software Irfan View [ siehe ] ausgewählt. Die Bilder wurden je Phantom nach Gruppen sortiert und dann in zufälliger Reihenfolge präsentiert. Die Visualisierung erfolgte für alle Befunder in identischer Reihenfolge in bildschirmfüllendem Format.

3.5.2 Hardwareinstallation und Eichung des Monitors

Die geeignete Hardwareinstallation für eine Evaluierung diagnostischer Röntgenbilder insbesondere im Hinblick auf den Einsatz von PCs an Stelle von Medizinischen Workstations wurde in Vorstudien eingehend untersucht [ siehe , siehe , siehe ]. Aufgrund der hohen Leuchtdichte von maximal 600 cd/m2 wurde schließlich für die Bildvisualisierung der Testserie ein Philips Graustufenmonitor Model 21 CY9 mit einer Matrix von 1024 x 864 Pixel (Philips, Eindhoven) ausgewählt. Die Optimierung der Kontrast- und Helligkeitsparameter des Monitors erfolgte vor Beginn der Testserie mit einem Java-basierten Testprogramm [ siehe ]. Anhand von Grau- und Farbkeilen in zwei- und dreidimensionaler Darstellung ermittelten zwei Beobachter im Konsens eine optimale Einstellung von Kontrast und Helligkeit des Testmonitors.

Als Computerapplikation wurde ein Standard Windows PC (Pentium II) mit einer Matrox Millenium® Grafikkarte verwendet, wie er auch in den zitierten Vorstudien zum Einsatz kam.

Die Bildbetrachtung der eigentlichen Studie durch vier Radiologen wurde bei abgedunkeltem Raum vorgenommen.


77

3.6 Datenerhebung

3.6.1 ROC-Analyse

Zur Erhebung einer Receiver-Operator-Characteristics Analyse (ROC) [ siehe , siehe ] wurden die Bilder der Testphantome von 4 erfahrenen Radiologen (3 in fortgeschrittener Weiterbildung, ein Facharzt) beurteilt. Der zu befundende Datensatz bestand aus fünf Variationen jedes der vier Phantome mit jeweils unterschiedlich positionierten Details. Jedes der 20 resultierenden Bilder war wiederum mit 4 unterschiedlichen Filtern komprimiert und rekonstruiert worden, so daß insgesamt 80 Einzelbilder zu befunden waren.

Für das Phantom „Pneumothorax“ wurde die zweite Säule von links mit einer Dicke der Stahlfäden von 0.045 mm [Abb. 16], für das Phantom „Lungenrundherde“ Reihe 11 mit Bohrungen von 1,8 mm [Abb. 8] zur Befundung festgelegt. Entsprechend ergaben sich für jeden Phantomtyp bei 20 Bildern pro Filter insgesamt 200 definierte Positionen, an denen die Existenz oder Abwesenheit eines Details über eine Bewertungsskala von 1 bis 5 angegeben werden mußte. Bei der Beurteilung galt 1 = sicher positiv, 2 = eher positiv, 3 = weder positiv noch negativ, 4 = eher negativ, 5 = sicher negativ. Eine Limitierung der Betrachtungszeit pro Bild bestand nicht. Die Bilder wurden den verblindeten Radiologen in zufälliger, für alle Radiologen jedoch identischer Reihenfolge bei identischen Umgebungsbedingungen im abgedunkelten Raum präsentiert.

Die von den vier Radiologen zu den jeweils 800 Positionen erhobenen gesamten 3200 Einzelbewertungen wurden mit einem im Internet frei erhältlichen ROC-Analyseprogramm verarbeitet [ siehe ]. Diese Software errechnet die individuellen Ergebniskurven der Beobachterleistungen sowie absolute Werte für die Flächen unter den


78

Kurven (AUC, Area under Curve).

3.6.2 Quantitative Analyse

Für die Analyse der Kompressionsraten respektive der Ergebnisgrößen wurden die Ausgangs- und die resultierenden Dateigrößen in KBit ermittelt. Als zusätzliche Information diente die Angabe der resultierenden Bit per Pixel (bpp) nach Kompression und Rekonstruktion. Die Bit per Pixel müssen hierbei in Beziehung zu den divergierenden Ausgangsbittiefen gesetzt werden (Computertomographie: 12 Bit; Digitale Lumineszenz Radiographie: 10 Bit).

3.6.3 Signal-Rausch-Verhältnis

Als mathematische Determinante der Kompressionswirkung eines Filters diente die PSNR (Pixel Signal to Noise Ratio). Die PSNR ist definiert als der Logarithmus des mittleren quadratischen Fehlers normiert auf die maximalen Pixelwerte:

Pixelwert = maximaler theoretischer Wert


79

3.6.4 Subtraktionsaufnahmen

Zur visuellen Verdeutlichung möglicher Informationsverluste wurden Subtraktionsaufnahmen durchgeführt. Der Bildinhalt rekonstruierter Bilder wurde vom Originalbild abgezogen und als Ergebnisbild dargestellt. Die visuelle Bewertung hinsichtlich identifizierbarer Strukturen des Originalbildes erfolgte durch Konsens zweier Beobachter.

3.6.5 Statistik

Zur statistischen Auswertung der ROC-Analyse wurde Student‘s t-test durchgeführt und die Beobachterkurven der Filter untereinander verglichen. Als Signifikanzniveau wurde p<0.05 festgelegt, p<0.001 galt als hoch signifikant.


© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.

DiML DTD Version 2.0
Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML - Version erstellt am:
Fri Feb 7 16:27:58 2003