Daten der nationalen RKI-Surveillance importieren:
Wählen Sie eine Metadaten-Datei im .tsv-Format aus, die die zu importierenden IMS-IDs enthält (Format
siehe "Datei-Spezifikationen und Prozesse").
Die entsprechenden Sequenzen und Informationen werden aus der Datenbank
des RKI heruntergeladen und in den Datensatz importiert
Metadaten-Datei (.tsv-Format)
Eigene Sequenz- und Falldaten importieren:
Wählen Sie eine Datei im FASTA-Format, die die zu importierenden viralen Sequenzdaten enthält,
und eine Datei im .tsv-Format, die die Metadaten der zu importierenden Fälle enthält (Format siehe
"Datei-Spezifikationen und Prozesse").
Die Daten werden überprüft und in den Datensatz eingebaut.
Metadaten-Datei (.tsv-Format)
Virale Sequenzdaten (FASTA-Format)
Datei-Spezifikationen und Prozesse
Die Datei besteht aus einer Tabelle mit einer Kopfzeile und einer weitere Zeile pro Fall. Die Spalten sind durch Tabs getrennt.
Solch eine Datei kann zum Beispiel erstellt werden in dem man die Tabelle zuerst in Excel erstellt und dann in eine Textdatei kopiert.
Die Spalten haben folgende Bedeutungen:
| 1. Action |
Gibt an welche Aktion mit dem entsprechendem Fall ausgeführt werden soll "a" : Neuen Fall hinzufügen oder bestehenden Fall mit gleichem Namen (fasta_ID) überschreiben. "d" : Fall aus dem Datensatz löschen |
|---|---|
| 2. fasta_ID |
Name des Falles. Falls keine IMS-ID angegeben ist muss sich in der FASTA Datei eine sequenz mit dieser ID befinden. Wenn dieses Feld leer bleibt muss eine IMS-ID angegeben die als Namen übernommen wird. |
| 3. IMS_ID | IMS-ID des Falles. Wenn dieses Feld leer bleibt muss eine fasta_ID angegeben werden. |
| 3. Group |
Anhand dieses Feldes können Fälle in Gruppen eingeordnet werden. Beispiel: "Hintergrund" oder "Ausbruch 1" |
| 4. Date | Datum des Falles. Muss dem ISO Format folgen (also z.B. "YYYY-MM-DD") |
| 5. other_metadata | Freies Textfeld für Notizen. |
Dieses Format könnte sich in Zukunft verändern um neue Funktionen zu ermöglichen.
FASTA Dateien haben die Dateiendugen ".fa" oder ".fasta".
Das Format ist hier beschrieben.
- Die Input Dateien werden auf Fehler in ihrem Format überprüft.
- Falls nötig werden Sequenzen und andere Informationen aus dem RKI Datensatz heruntergeladen.
- Mit Nextclade werden die genetischen Varianten und die Lineage berechnet.
Die einzigen Daten die den PC des Nutzers verlassen sind anonymisierte Sequenzen. - Die Fälle werden in die lokale Datenbank eingefügt / aus ihr gelöscht.
- Die paarweisen genetischen Distanzen werden berechnet indem aus den Varianten ein Alignment generiert wird und die Unterschiede gezählt werden.
Bei Fragen kontaktieren Sie und gerne.
Edit with files
Add new or edit or remove existing samples to the local Database.
Select a tab separated containing metadata and if needed a fasta file with the respective sequences.
When adding new samples there are two options. The first optoin is to give a fasta id with the
corresponding sequence.
Otherwise if the sample has been uploaded to the RKI, it is possible to simply give the IMS id. The
sequence and other infromation will be collected from the RKI.
Example files can be downloaded below the input fields. The following columns are needed (more might
be
added in the future to allow new functions):
| 1. Action | "a" : Add new or edit (overwrite) existing sample. "d" : delete sample. |
|---|---|
| 2. fasta_ID | Fasta id of the sample to be found in fasta file. If empty then the IMS id is needed. |
| 3. IMS_ID | IMS id of the sample. If empty a fasta id is needed. |
| 3. Group | An identifier of a certain group. Can be any string. For example "Outbreak_1" or "Background" |
| 4. Date | Sampling date following the ISO Date format "YYYY-MM-DD" . |
| 5. other_metadata | Free text field for notes. |
- Input Files are checked for errors.
- Collect data for IMS ids from the RKI.
- Calculate lineage, variants and count of ambiguous characters using nextlade.
The only data that leaves your pc are the sequences with anonymized ids. - Samples are added to / removed from the local database.
- Genetic distances are calculated by comparing the variants.