StartseiteSitemapImpressumdeutschenglish
MHH Logo
Medizinische Hochschule Hannover | Tumorzentrum | Carl-Neuberg-Str.1 | 30625 Hannover | Tel.:(+49) 0511-532-0

H.I.T. - Skalenniveaus und Grunddatentypen

Unter Messen versteht man allgemein die Zuordnung von Objekten zu Zahlen oder Symbolen. Je nach Informationsdichte und Transformationsinvarianz dieser Zuordnungen können verschiedene Mess- bzw. Skalenniveaus unterschieden werden:

 

Nominalskala. Objekte werden Klassen zugeordnet. Einziges Merkmal ist die Eindeutigkeit. Bijektive Transformationen können ohne Informationsverlust durchgeführt werden. Viele in der Tumordokumentation verwendete Schlüsselsysteme haben nominales Skalenniveau.

 

Ordinalskala. Objekte werden Klassen zugeordnet, auf denen eine Ordnungsrelation definiert ist. Nur monotone bijektive Transformationen erhalten die Ordnung und damit den Informationsgehalt. Beispiele für Ordinalskalen in der Tumordokumentation sind Stadieneinteilungen zur Klassifikation der Ausbreitung der Erkrankung.

 

Intervallskala. Bildmenge des Messvorgangs ist ein Intervall reeller Zahlen. Dabei haben auch Differenzen von Messwerten eine Bedeutung. Intervallskalierte Daten sind invariant gegenüber linearen Transformationen der Form y=ax+b (a>0). Die Messung der Körpertemperatur hat etwa ein solches Skalenniveau. Bei Umrechnung z.B. von Grad Celsius in Fahrenheit vermöge der Formel y=1,8x+32 geht keine Information verloren. Das System H.I.T. differenziert hier noch in ganzzahlig und nicht ganzzahlig, was vor allen Dingen praktische Vorteile bei der Implementation der Ein- und Ausgabe hat.

 

Absolutskala. Zusätzlich zu den Eigenschaften der Intervallskala kommt ein absoluter Nullpunkt hinzu. Dadurch reduziert sich die Transformationsinvarianz auf die Form y=ax (a>0), da der Nullpunkt erhalten bleiben muss. Quotienten von Messwerten bleiben unverändert. Die Körpergröße etwa hat absolutes Messniveau. Eine Aussage der Form "x ist doppelt so groß wie y" ist sinnvoll und unabhängig von der verwendeten Maßeinheit. Auch hier wird noch zwischen ganzzahlig und nicht ganzzahlig unterschieden. Die Variable "Anzahl der Untersuchungen" etwa ist ganzzahlig und es gibt einen Nullpunkt. Aussagen der Form "durchschnittlich 2,2 Untersuchungen" sind möglich und sinnvoll.

Grunddatentypen

 

Ausgehend von den genannten Skalenniveaus werden im System H.I.T. die folgenden dreizehn Grunddatentypen verwendet. Jede im System gespeicherte und verarbeitete Angabe lässt sich einem dieser Grundtypen zuordnen. Dabei haben Datum, Uhrzeit und Zeitraum eine Sonderrolle, da man sie einerseits roh als nominalskaliert betrachten muss, andererseits jedoch als Punkt oder Intervall auf der Zeitachse auffassen und geeignet transformieren kann, so dass Intervallniveau gegeben ist.

<typohead type="3"></typohead>

Der Grunddatentyp bestimmt für die Datenbank den Invertierungsmodus. Dabei müssen insbesondere Texte unterschiedlich behandelt werden: Gewöhnlicher Text (z.B. in Briefen u.dergl.) muss nicht in einer invertierten Liste gehalten werden, bestimmte Bemerkungen, die zwar keinen Code darstellen, aber trotzdem genormt sind, müssen für eine schnelle Suche vorgesehen sein und Namen schließlich werden auch nach beliebigen Teilstücken sowie einem phonetischen Code invertiert.

Typ Inhalt Inversion Niveau
T Beliebiger Text. keine nominal
M Merktext. Nach einem Merktext soll schnell gesucht werden können. Anfangsstück nominal
N Name. Beliebige Teilstücke und phonetischer Code nominal
C Code. Ein Code repräsentiert einen klassifizierten Sachverhalt, der in einer Tabelle abgelegt ist. Jedem Dateninhalt ist darin genau ein Text zugeordnet oder es wird ein solcher mit Hilfe eines Ausdrucks berechnet. Ganzes Datenfeld nominal
O Rating. Der Code selbst hat eine Bedeutung und lässt sich ordnen. Als statistische Kenngrößen sind Minimum, Median und Maximum sowie beliebige Percentile berechenbar. Ganzes Datenfeld ordinal
I Ganze Zahl. Alle statistischen Kenngrößen, die keinen Nullpunkt voraussetzen, können berechnet werden. Ganzes Datenfeld intervall
P Nichtnegative ganze Zahl. Zusätzlich zu I ist ein Nullpunkt definiert. Ganzes Datenfeld absolut
R Beliebige Zahl. Zusätzlich zu I ist Interpolation und Intervallbildung sinnvoll. Ganzes Datenfeld intervall
A Nichtnegative beliebige Zahl. Zusätzlich zu R ist ein Nullpunkt definiert. Ganzes Datenfeld absolut
D Datum. Ein Datum wird stets auf das Format tt.mm.jjjj normiert. Nach tt, mm, jjjj und Tagnummer seit dem 31.12.1840 Datum
U Uhrzeit. Eine Uhrzeit wird stets in das Format hh:mm:ss gebracht. Nach hh, mm, ss und Sekunden seit dem 00:00:00 Uhrzeit
Z Zeitraum. Ein Zeitraum enthält die drei Angaben Anfangsdatum, Enddatum und Zeitdauer. Es dürfen ungenaue Datumsangaben vorkommen. Allerdings muss entweder das Anfangs- oder das Enddatum mindestens mit einem Jahr angegeben sein. Die Zeitdauer darf fehlen bzw. unbestimmt sein. Andererseits darf sie auch genauer sein als die Datumsangaben. Nach Tagnummer des Anfangs- und des Enddatums sowie nach der Dauer Zeitraum
V Referenz auf ein anderes Datenobjekt. Ein Verweis auf ein anderes Datenobjekt hat die Form "^Global^Systemnummer^Grundgesamtheit^Identifikation". Beispiele: "^VER^107^ARZT^1028", "^DOK^211^ONKO^4711", ... . Ganzes Datenfeld nominal

( Stand: April 2016 / Dr. Gerd Wegener )


Anschrift
Tumorzentrum der MHH
Medizinische Hochschule Hannover
Carl-Neuberg-Str. 1
30625 Hannover
Tel.: +49 (0)511 532-5060

Aktuelles aus der Abteilung

[mehr]

Aktuelle Veranstaltungen