Beiträge mit dem Tag ‘W2K Server’

Dokumente einfach aus Sharepoint 2001 und 2003 extrahieren

Werkzeuge für die Microsoft Sharepoint Portal Server (SPS) gibt es viele: Ausgefeilte, durchdachte, professionelle usw. Für die einfache Aufgabe, einen Dokumentenbaum auszulesen, genügen Grundkenntnisse der Struktur und ein paar Zeilen Programmcode. Wir betrachten im folgenden die beiden ersten Versionen von Microsoft Sharepoint Server, also 2001 und 2003:

Exportieren mit einer einzigen Zeile Shellscript: Sharepoint Portal Server 2001

Der SPS 2001 war für die Windows 2000 – Serverumgebung zugeschnitten; schon unter Windows 2003 Server läuft er nicht mehr. Microsoft hat aber neben HTTP und DAV einen Zugang per IFS (installable file system) vorgesehen, um lesenden Zugriff auf die Dokumentenstruktur eines Arbeitsbereichs zu erhalten. Das gleiche Verfahren wird übrigens auch noch von Exchange 2000 angewandt, sodaß man durch die „Hintertür“ Zugriff auf die Dateistrukturen hat.
Mit diesem Shell-Kommando auf dem W2K-Server selbst (via cmd.exe) wird ein Laufwerksbuchstabe zugeordnet:

 
subst M: \\.\backofficestorage

Arbeitet man mit dem Windows-Explorer, müssen versteckte Ordner und Dateien angezeigt werden, sonst sieht man den Ordner WORKSPACES nicht, der die eigentlichen Dateien enthält; der Arbeitsbereich  TESTDOCS unter „Anwendungen“ ist leer (Dokumentenverzeichnis grün markiert)

explorer-sharepoint2001

Eine Zusammenfassung  zum IFS drive und dem Microsoft Web Storage System finden sich hier: http://support.microsoft.com/kb/294312/en-us/

Der Artikel betont auch noch einmal, daß diese Methode zwar zum Extrahieren von Dokumenten geeignet ist, nicht aber zum Zurückschreiben, denn man wird aller Wahrscheinlichkeit nach die darunterliegende Autoren-/Rechtestruktur kompromittieren.

Sharepoint Server 2003 alias Sharepoint 2: Dokumentenexport mit IronPython

IronPython, Microsofts Python-Implementierung in der Version 2.6 bei codeplex ( http://ironpython.codeplex.com/ ) ermöglicht, Dotnet-Assemblies auf einfachste Weise einzuhängen, z.B. mit clr.AddReference(‚Microsoft.SharePoint‘)

Hier ist der Code, um eine einzelne Dokumentenbibliothek auszulesen und auf eine lokale Platte unter Beibehaltung der timestamps zu spiegeln:

# --------------------------------------------------------------------------------------
#
# Dokumentenimport von MS SharePoint.
# Die originale Ordnerstruktur wird abgebildet; Zeitstempel der Dokumente bleibt erhalten.
# Autor: weitlandt. Klaus Stein 29.10.09
#
# Umgebung: Ironpython 2.6+ (www.ironpython.com bzw. codeplex.com)
#
 
SAVE_TO = "C:/SHP2"
SITEURL = "http://localhost"
DOCROOT = "Shared Documents"
 
# -----------------------------
 
import os,sys,stat,array,io,clr
from datetime import *
from time import mktime as mktime
 
clr.AddReference('Microsoft.SharePoint')
from Microsoft.SharePoint import *
 
def storefile(f,basedir,relpath):
  ptmp,ntmp = os.path.split(relpath)
  if not os.path.isdir(basedir + ptmp):
    os.mkdir(basedir + ptmp)
  a = f.ModifiedBy.ToString()
  d = f.OpenBinary()
  m = datetime(f.TimeLastModified)
  print f.Name+" (" + d.Length.ToString()+"), Letzte Speicherung von "+a+": "+m.ToString()
  fullpath = basedir + relpath
  b = open(fullpath,mode="w+b")
  for i in d: #
    b.write(chr(i))
  b.close()
  ts = int(mktime(m.timetuple()))
  os.utime(fullpath,(ts,ts)) # timestamp setzen
 
# main()
 
tstart = datetime.now()
if not os.path.isdir(SAVE_TO):
  os.mkdir(SAVE_TO)
 
S = SPSite(SITEURL)
W = S.OpenWeb()
 
print "Importieren von: " + W.Title + " (" + W.Url + ")"
 
R = W.GetListsOfType(SPBaseType.DocumentLibrary)[DOCROOT] # nur diesen Ordner
skip = len(DOCROOT)
cnt = 0
for i in R.Items:
  relpath = i.File.ToString()[skip:] # Das Startverzeichnis abgeschneiden
  storefile(i.File,SAVE_TO,relpath)
  cnt = cnt + 1
 
print "\nFertig. Angelegt: " + cnt.ToString() + ", Zeit: " + str(datetime.now() - tstart)
W.Dispose()
S.Dispose()
# ----

…das ist alles! Für Erweiterungen bietet sich an, die Objekteigenschaften von ‚Items‘ einmal genauer anzusehen – da ist noch etliches nützliches dabei.