hallo,
ich möchte in aus einer script sprache heraus (python) die dateiinformationen von Dateien auslesen (Title, Thema, Kategorie, Stichwörter, Kommentare).
diese infos sind in NTFS alternativen datenströmen (ads) gespeichert. daher nur auf ntfs laufwerken verfügbar.
bei heysoft kann man sich ein tool downloaden, welches die ads streams anzeigt.
dieses liefert z.b. folgendes ergebnis:
---
LADS - Freeware version 4.00
© Copyright 1998-2004 Frank Heyne Software (http://www.heysoft.de)
This program lists files with alternate data streams (ADS)
Use LADS on your own risk!
Scanning directory c:\daten\
size ADS in file
---------- ---------------------------------
120 c:\daten\test.txt:♣DocumentSummaryInformation
252 c:\daten\test.txt:♣SummaryInformation
0 c:\daten\test.txt:{4c8cc155-6c1e-11d1-8e41-00c04fb9386d}
---
Im ads SummaryInformation befindet sich beispielsweise folgender inhalt:
---
þÿ à…ŸòùOh«‘ +'³Ù0 Ì 8 €@ H \ p € ä test.txt information test A beschreibung asdlfsdf lk asjf asdfjö sdaflj
---
erreicht wird dies durch einen einfachen aufruf fopen(test.txt:♣SummaryInformation) wobei ♣ mit \005 codiert wird.
die von mir benötigten infos stehen also in diesem ads allerdings hintereinander in einem nicht spezifiziertem(?) format. Python bietet keine möglichkeit diese infos auszulesen (API)
ich suche jetzt eine möglichkeit mittels eines consolen basierten tools diese infos auszuleesen.
z.b. tool test.txt GetAuthor
besser würde mir der betriebssystem aufruf gefallen, welcher im hintergrund aufgerufen wird, wenn man im eigenschaften menü die eigenschaften einträgt.
bin mit dem tool filemon von sysinternals auf die system dll docprop und docprop2 aufmerksam geworden.
anscheinend erledigt diese das lesen und schreiben der dateiinformationen. habe anschließend versucht mit rundll an die infos ranzukommen.
die verfügbaren exported functions für den rundll aufruf währen:
docprop.dll:
- DllCanUnloadNow
- DllGetClassObject
docprop2.dll
- DllCanUnloadNow
- DllGetClassObject
- DllRegisterServer
- DllUnregisterServer
kann sein, das ich mit diesem docprop auf dem holzweg bin.
hat jemand eine idee/tool wie man die infos unter angabe des infonamens (thema, author, etc.) auslesen kann?
mfg uwe