Text aus allen Dateien in einem Verzeichnis extrahieren
Posted by admin under Betriebssysteme, Software, Windows
Ich war mir nicht ganz klar wie ich diesen Artikel möglichst verständlich formulieren könnte und bin bei diesem etwas missverständlichem Konstrukt hängengeblieben. Im Grunde geht es darum, aus einer beliebigen Anzahl von Dateien in einem Verzeichnis bestimmte Strings herauszufiltern und in eine neue Datei zu übertragen. Könnte zum Beispiel nützlich sein um den Internetcache nach Bildern oder Dateien abzusuchen oder Listen die auf Webseiten angeboten worden sind in ein besseres Format zu bekommen.
So könnte man die gewonnenen Informationen in andere Programme übertragen und dort weiterverarbeiten. Win Text File Patch hat eine Größe von nur 84 Kilobyte was beachtlich ist wenn man bedenkt was sie leistet. Um mit der Software arbeiten zu können muss man dort einige Einstellungen anpassen.
So sind unbedingt das Quellverzeichnis, die Dateitypen die durchsucht werden sollen sowie die Zieldatei zu nennen. Dateitypen könnten zum Beispiel alle htm und html Dateien sein die in einem Verzeichnis liegen.
Der Textteil verlangt eine Einarbeitungszeit. Man muss wissen wie die Informationen in den zu durchsuchenden Dateien aufgebaut sind und wie man sie in eine ansprechendere Form bekommt. Wenn man zum Beispiel Bilder als Beispiel nimmt die in html Dateien hinterlegt sind muss man wissen, wie diese in den html Seiten dargestellt werden.
Win Text File Patch bietet zudem einen Weg die so gewonnenen Informationen umzuschreiben. Wenn zum Beispiel in den html Seiten relative Links verwendet worden sind kann man diese so umwandeln, dass hieraus absolute werden.
Mehr:
