Bevor eine relationale Datenbank erstellt werden kann, wird ein Modell der zu speichernden Daten modelliert und anschließend in Hinblick auf den effizienten Einsatz als relationales Datenschema optimiert.
Die Erstellung der Struktur einer relationalen Datenbank ist ein iterativer Prozess, bei dem auf Basis eines fachlichen Datenmodells ein technisches Datenmodell erstellt wird. Das physikalische Datenmodell legt dabei ganz genau fest, wie die Daten in einem DBMS strukturiert sind. Grundsätzlich ist das Vorgehen in etwa vergleichbar mit dem Entwurf von Klassen eines objektorientierten Systems. Das Ziel ist hierbei jedoch nicht die Implementierung eines Systems, sondern die Implementierung einer Datenbankstruktur.
Wie beim Systementwurf kann auch für den Entwurf und die Dokumentation von Datenbanken eine grafische Modellierungssprache eingesetzt werden. In der Regel wird hierzu ein Entity-Relationship-Diagramm (auch: ER-Diagramm) eingesetzt, mit dem alle wichtigen Elemente einer Datenbankstruktur dargestellt werden können.
Im Unterschied zu dem recht universellen UML-Klassendiagramm, das zur Modellierung von Datenstrukturen und Systemen eingesetzt werden kann, wird das ER-Diagramm nur zur Modellierung von Datenschemas eingesetzt. Im Gegensatz zu UML als Standardmodellierungssprache für IT-Systeme gibt es mehrere Varianten des ER-Diagramms, deren Notationselemente sich unterscheiden.
Die Modellelemente in einem ER-Modell sind Entitäten, Attribute, Schlüssel und Beziehungen. In der Praxis werden häufig künstliche Schlüssel (engl.: surrogate key) als Primärschlüssel eingesetzt. Ein künstlicher Schlüssel ist ein rein technisches Attribut, das keine fachliche Information trägt und keine Entsprechung in der Welt außerhalb des DBMS hat. Oft ist es eine ganze Zahl und wird vom DBMS automatisch befüllt und verwaltet.
Beziehung (engl.: relationship)
Entitäten können in Beziehung zueinander stehen. Eine Beziehung heißt zweistellig, wenn
zwei Entitäten in Beziehung stehen. Beziehungen können aber auch mehrstellig sein, d.h. mehr als zwei Entitäten in Beziehung
setzen. Eine Beziehung selber kann auch eigene Attribute haben.
| Hinweis |
| Beziehungen in ER-Modellen sind vergleichbar mit Beziehungen in UML-Klassendiagrammen. |
Die wichtigsten Notationselemente in grafischen ER-Diagrammen werden im Folgenden in jeweils drei verschiedenen Notationsformen dargestellt, der Chen-Notation, der Martin-Notation (auch: Krähenfußnotation) und als UML-Klassendiagramm.
Chen-Notation
Die folgende Abbildung zeigt Entitäten und Attribute in der Chen-Notation, die als erste grafische Notation
für relationale Datenmodelle gilt. In dieser Notationsform werden Entitäten durch ein Rechteck dargestellt und Attribute jeweils
in einem Oval, das mit der zugehörigen Entität verbunden ist. Primärschlüssel werden durch Unterstreichen des
Attributnamens gekennzeichnet.

Martin-Notation (auch: Krähenfußnotation)
Die folgende Abbildung stellt eine Entität mit Attributen in der Martin-Notation dar. Der Name der Entität wird über ein
Rechteck notiert. Der Primärschlüssel wird im oberen Bereich des Rechtecks notiert, alle anderen Attribute im unteren Bereich.

UML-Klassendiagramm
Mit dem UML-Klassendiagramm wird, wie in folgender Abbildung gezeigt, die Entität als Klasse mit
Attributen modelliert. Primärschlüssel werden als Eigenschaftswert des Attributes in geschweiften Klammern hinter dem Namen
notiert.

Die UML und auch die Martin-Notation sind in der Praxis kompakter darzustellen, da insbesondere die Modellierung der einzelnen Attribute nicht so viel Platz beansprucht und die Zugehörigkeit von Attributen zu Relationen mit einem Blick erschlossen werden kann.