Logo.CortexAG

Anmelden +

CSV-Dateien

Bei csv-Dateien ("comma separated values") handelt es sich um unformatierte Text-Dateien, in denen je Zeile ein Datensatz abgebildet wird. Der Spaltenaufbau jeder Zeile ist identische und die Inhalte sind durch Trennzeichen voneinander getrennt. Optional werden die Inhalte in Begrenzungszeichen eingefasst (z.B. Anführungszeichen).

Name;Vorname;Ort
Meier;Max;Hamburg
Müller;Peter;Berlin

Das Plugin des Import-Werkzeugs "ImPlex" erlaubt die einfache Zuweisung von Quellfeldern zu Zielfeldern innerhalb der Datenbank. Mit Hilfe des Plugins kann dann ein manueller Import gestartet oder die Konfiguration für einen regelmäßig ablaufenden Import exportiert werden.

Durchführung der Konfiguration

Nach dem Aufruf des Plugins und der Auswahl "csv-Modul" kann eine vorhandene csv-Datei ausgewählt oder hochgeladen werden. Hierbei ist zu beachten, dass die maximale Größe der csv-Datei durch den Webserver administrativ begrenzt ist. Jede Datei kann daher auch manuell in das entsprechende Unterverzeichnis abgelegt werden. Ausgehend vom Hauptverzeichnis der Cortex-Datenbank unter "www/Implex". Beachten Sie hier ggf. die Verzeichnis-/Datei-Rechte des Betriebssystems, da das Plugin die Quelldatei ansonsten nicht lesen kann.

Die dort abgelegten, bzw. manuell hochgeladenen Dateien stehen dann in der Auswahlliste "csv-Datei" zur Verfügung.

Plugin.Implex.csv-Screen

Import-Modus

Der Import-Modus des ImPlex unterscheidet zwischen drei grundlegenden Import-Verfahren. Sie können wählen...

  • ob die zu importierenden Daten neu angelegt
  • nur vorhandene Daten aktualisiert ("Update“)
  • oder ob neue Daten angelegt werden sollen, wenn keine passenden Daten zum Aktualisieren gefunden wurden.

Beachten Sie hierbei, dass beim Aktualisieren und ggf. beim Anlegen sogenannte "Referenzwerte" notwendig sind. Referenzwerte sind eindeutige Datenbank-Inhalte, nach denen gesucht wird. Findet der ImPlex einen einzelnen Datensatz anhand der Referenzwerte, kann dieser Datensatz aktualisiert werden. Findet der ImPlex mehrere Datensätze, ist keine Aktualisierung möglich. Kann anhand der Referenzwerte kein Datensatz gefunden werden, legt der ImPlex ggf. einen neuen Datensatz an.

Die Felder mit den Referenzwerten wählen Sie erst in der nachfolgenden Maske, wenn alle Import-Parameter festgelegt wurden.

Implex.Importmodus

Spaltenmodus

Üblicherweise beinhalten csv-Dateien in der ersten Zeile die sog. "Header-Informationen". In dem zuvor gezeigten Beispiel der Name, Vorname und Ort. Diese Informationen sind für den Import notwendig, weil darüber eine Zuweisung der Importdaten zu Zielfeldern möglich ist. Da nicht in jeder csv-Datei solche Header-Informationen vorliegen, kann für den Import ein eigener, "virtueller" Header genutzt werden. Anstatt einer Feldbezeichnung ist hier die Auswahl numerischer Werte (1,2,3,...) oder von Buchstaben (A,B,C,D,...) möglich.

Implex.Spaltenmodus

Zeichensatz

Jede erzeugte Datei besteht aus einzelnen Zeichen. Je nach Sprache kann eine Datei Sonderzeichen (z.B. Umlaute) enthalten. Um Sonderzeichen korrekt darzustellen, muss ein System feststellen, welcher Zeichensatz (die sog. "Kodierung“) genutzt wurde. Damit die Zeichen einer Quelldatei korrekt importiert werden können, muss dieser Zeichensatz daher bekannt sein und für den Import festgelegt werden.

Üblicherweise werden Dateien mit dem Zeichensatz UTF-8 ausgetauscht, weil hier alle Sonderzeichen aller Sprachen verwaltet werden können. Dennoch exportieren verschiedene Anwendungen Dateien auch in anderen Zeichensätzen. Daher stehen auch ISO-8859-1 und windows-1252 zur Verfügung.

Um den Zeichensatz einer Datei zu prüfen, benötigen Sie ein Programm, dass Ihnen diese Information liefert und ggf. den Zeichensatz konvertieren kann (z.B. "Notepad++“).

Hinweis: Die Standard-Windows-Programme "Editor“ (Notepad), "Wordpad“, "Word“ oder "Excel“ sind dafür nicht geeignet.

Feldtrenner und Feldbegrenzer

Damit innerhalb von csv-Dateien die Inhalte eindeutig voneinander getrennt werden können, sind sog. "Feldtrenner“ und "Feldbegrenzer“ notwendig. Ein Trennzeichen trennt also zwei Werte voneinander und ein Begrenzungszeichen wird direkt vor und hinter einem Wert gesetzt, um den Wert zu begrenzen.

Beide Zeichen können Sie aus der Quelldatei ersehen oder sollten bereits zuvor bekannt sein. In den untenstehenden Beispielen wird dieses verdeutlicht.

Beispiel ohne Feldbegrenzer mit dem Feldtrenner Semikolon:

Name;Vorname;Ort 
Meier;Max;Hamburg
Müller;Silvia;Berlin

Beispiel mit dem Feldbegrenzer Anführungszeichen und dem Feldtrenner Semikolon:

"Name";"Vorname";"Ort" 
"Meier";"Max";"Hamburg"
"Müller";"Silvia";"Berlin"

Wiederholfeldtrenner

Die von Ihnen definierten Felder innerhalb einer CortexDB können mehrfach (also wiederholend) in einem Datensatz verwendet werden. Innerhalb der Quelldaten können dann mehrere Werte zu einem Feld, getrennt durch ein weiteres Trennzeichen ausgegeben werden. Bei diesem Trennzeichen handelt es sich um den sog. "Wiederholfeldtrenner". Jeder einzelne Wert zwischen den Feldbegrenzern wird also als eigenständiger Wert eines Feldes in den neuen Datensatz importiert.

"Name";"Vorname";"Ort";"Hobbies" 
"Meier";"Max";"Hamburg";"Fußball,Hockey"

"0“-Zeichen ignorieren

Wenn Sie numerische Werte importieren möchten, kann es sein, dass die Zahl Null einen "echten“ Wert darstellt und ggf. ausgewertet werden soll. Möglicherweise handelt es sich aber auch nur um eine Angabe ohne weiteren Nutzen. In diesem Fall können Sie die Null ignorieren, wenn Sie die Option anhaken.

 

 

 Hinweise zur Online-Hilfe
 

© 2017 Cortex AG
(letzte Aktualisierung: 12.04.2017)

 Haftungsausschluss 

Impressum    AGB