Chat aus Daten-Backup in HTML konvertieren

Stelle deine Frage öffentlich an die Threema-Forum-Community - über 3.000 Mitglieder helfen dir weiter. Los gehts!
Unterstützung von offizieller Seite erhältst du direkt bei Threema: Zum offiziellen Threema-Support
  • Als reine Threema-Bkp Frage stellte sich mir, ob Medien grundsätzlich in voller Auflösung vorhanden sind, oder down-sized.

    Im Backup werden die Größen/Auflösungen gesichert, die auch auf dem Gerät selbst noch vorliegen und wie sie verschickt oder empfangen wurden. Wenn du bspw. ein im Original 2400x2400 Bild an einen Kontakt schickst, die Auflösung in Threema jedoch nicht auf Extra oder Original gesetzt wird (oder als Datei schicken - dann mit Metadaten), wird das Bild vor dem Versand entsprechend verkleinert (z. B. auf 1600x1600). Eben diese letztere Version wird im Backup hinterlegt.


    Ausnahme: Zu jedem Bild (und auch Video, aber das ist hier irrelevant) wird auch ein Vorschaubild erzeugt. Wenn du nun in der Medienübersicht das Bild löscht, ist in der Chatübersicht weiterhin die Vorschau enthalten. Diese wird dann im Backup aufgenommen, ohne dass das "Original" enthalten ist. Wie denn auch? Das "Original" ist ja schon gelöscht.


    In der HTML werden jegliche Bilder kleiner angezeigt, beim Klick darauf öffnet sich jedoch das "Original" oder Vorschaubild - je nachdem, was vorhanden ist.


    Dann bin ich im html doch zufällig auf einen seltsamen Fall gestoßen.

    Kannst du den Fall noch etwas weiter erklären?

    Du hast ein Bild in einer Gruppe erhalten, welches zeitlich auf den 04.09.2020 datiert ist, aber eigentlich zum 03.09.2020 gehört? Und vorher und nachher sind Nachrichten/weitere Medien um das Bild mit dem 03.09.2020 vorhanden?


    Mich würde da einmal die Zeile (+1 davor und +1 danach) in der CSV-Datei interessieren. Handelt es sich hierbei ggf. um einen Chatpartner, der das Bild zwar schon am 03.09.2020 eingestellt hat, der Versand aber erst am 04.09.2020 erfolgte?

  • Danke für die Erklärung bzgl. Auflösungen!


    OK, csv Auszug habe ich per PN geschickt.


    Vermutung: das Foto ist relativ groß, evtl. wurde das Vollbild erst verzögert aufs Handy runtergeladen (e.g. per WLAN) - und das Skript verwendet den Zeitstempel der Mediendatei (nicht der Nachricht).

  • Skript funktioniert, SUB wird erstellt, html-Datei bleibt im Hauptverzeichnis.

    Aber: Wenn ich die html öffne, so steht bei allen Bildern:

    "Bild nicht gefunden

    <Datum> <Uhrzeit>"

    so sieht meine Commandozeile aus:

    PowerShell -ExecutionPolicy Bypass -File .\Backupaufdroeseln.ps1 .\group_message_06afb3b57b85c012-UZSAUMS8.csv


    Das ist ein Auszug aus der html-Datei, wo ich eigentlich einen Bild-Link erwarten würde:

    Code
    <div class="sent">
        <p class="msg"><i>Bild nicht gefunden.</i><br/></p>
        <p class="timestamp">29.02.2020, 11:28:12</p>
    </div>



    Super fände ich, wenn das Skript Media-Dateien gleich als solche im erstellten Verzeichnis speichert. (mit entsprechender Erweiterung)


    Herzlich TH

  • Wenn ich die html öffne, so steht bei allen Bildern:

    "Bild nicht gefunden

    Das passiert, wenn das Skript die entsprechenden Medien (oder Vorschaubilder dieser) nicht findet. Es kann leider nicht hexen, daher schreibt es einfach nur "nicht gefunden" rein.

    Ich habe mir mit auf die Liste genommen, dass im Quellcode wenigstens noch der eigentliche Dateiname mit aufgenommen wird bzw. der "nicht gefunden" String als Alternativname vergeben wird. Irgendwann dann bei Zeiten :)


    so sieht meine Commandozeile aus

    Die sieht gut aus.


    Super fände ich, wenn das Skript Media-Dateien gleich als solche im erstellten Verzeichnis speichert.

    Das Skript verschiebt gefundene Medien-Dateien automatisch in der erstellte Unterverzeichnis. Dabei löscht es ggf. vorhandene Vorschaubilder, da die nicht mehr benötigt werden, wenn das Original vorliegt.

    mit entsprechender Erweiterung

    Das war mal kurzzeitig enthalten, wurde dann aber wieder entfernt, da es doch leider nicht immer 100% eindeutig ist, was das denn für Dateien sind (z. B. ein DOCX ist eigentlich ein ZIP, nur eben mit anderer Endung).


    Außerdem: würde ich jede Medien-Datei umbenennen (egal ob den Namen oder um die Dateiendung erweitern), kann man diese nicht nochmal für ein erneutes Archiv-Konvertieren nutzen, sondern müsste sie vorab alle händisch umbenennen oder nochmal aus dem Backup-Archiv extrahieren.


    Workaround: wenn du die HTML im Browser anschaust, dann mache einen Rechtsklick auf die Datei und sag "Ziel speichern unter..." und dann sollten dir Bilder als Bilder, Videos als Videos und andere Dateien eben entsprechend als Download angeboten werden.