Der Betrieb von Rechenzentren erfolgt heutzutage oft ereignisgetrieben. Als Reaktion auf neue Kundenbedarfe werden weitere Hardwaresysteme in das Rechenzentrum integriert. Auf diese Weise entstehen mit der Zeit heterogene Hard- und Softwarearchitekturen, die einen hohen Administrations-, Wartungs- und damit auch Personalaufwand mit sich bringen.
Virtual und Adaptive Computing ermöglicht die logische Trennung von Hard- und Software. Die Nutzung von Software durch den Kunden wird damit weitgehend unabhängig von der zugrunde liegenden Hardwareinfrastruktur, da die Verfahren des Adaptive Computing die flexible Zuweisung von Anwendungen an bestimmte Server oder Speichersysteme ermöglichen. Daraus lässt sich die Idee herleiten, die Hard- und Softwarekomponenten der Systemlandschaft als Betriebsmittel eines Produktionsbetriebes für vom Rechenzentrum im industriellen Maßstab hergestellte IT-Dienstleistungen zu betrachten. In einer weiteren Dissertation wird deshalb die Kapazitätswirtschaft in virtualisierten Rechenzentren untersucht, d. h. Verfahren und Methoden, Anwendungen und Daten den Betriebsmitteln zuzuweisen.
Ziel dieser Dissertation ist die Ergänzung der Kapazitätswirtschaft um Verfahren für das Störungsmanagement. Der Begriff „Störung“ bezeichnet dabei die Abweichung eines Vorgangs von seinem festgelegten oder vorausberechneten Verlauf aufgrund einer unvorhergesehenen Einwirkung. Ziel des Störungsmanagements ist es, die Auswirkungen von Störungen zu minimieren bzw. ihr Auftreten zur vermeiden. Hierbei sollen Konzepte der operativen und taktischen Produktionsplanung und -steuerung (PPS) auf ihre Eignung für den Rechenzentrumsbetrieb untersucht, wenn möglich übertragen und wenn nötig angepasst werden.
Im Bereich der taktischen Produktionsplanung liegt dabei der Fokus auf dem Vermeiden von Störungen und der Verringerung der Auswirkung von Störungen durch Prävention. So lässt sich dem Ausfall von Betriebsmitteln – in Rechenzentren namentlich der Hard- und Software – durch Wartung vorbeugen. Als Wartung werden gemäß DIN 31051 Maßnahmen zur Verzögerung des Abbaus des vorhandenen Abnutzungsvorrates der Betrachtungseinheit verstanden. In Bezug auf die im Rechenzentrum verwendeten Betriebsmittel bedeutet dies in erster Linie den Ersatz von defekten Hardwarekomponenten. In Rechenzentren mit einer großen Zahl gleichartiger Hardwarekomponenten scheint es sinnvoll, aufgrund bekannter Ausfallwahrscheinlichkeiten den Bedarf an Ersatzteilen mit einem geeigneten Prognosemodell vorherzusagen. Dabei ist zu klären, ab welcher Größenordnung die Anwendung eines solchen Modells sinnvoll ist. Mit Hilfe eines solchen Prognosemodells sollen dann Verfahren zur optimalen Lagerhaltung aus der PPS, z. B. Losgrößenbildung, auf das Ersatzteilmanagement übertragen werden.
In der operativen Produktionssteuerung steht der Umgang mit aufgetretenen Störungen im Mittelpunkt. Störungen können hier vor allem durch den Ausfall von Betriebsmitteln bzw. durch ungeplante neue oder gegenüber der Planung verschobene Kundenaufträge (ungeplanter Abruf von Betriebsmittelkapazitäten) verursacht werden. Die Kapazitätsdisposition in der PPS kennt verschiedene Anpassungsmaßnahmen, z. B. intensitätsmäßige, quantitative oder terminliche Maßnahmen. Diese und weitere Verfahren aus der PPS sollen auf Ihre Eignung und Relevanz untersucht werden. In einem weiteren Schritt können geeignete Vorgehensweisen angepasst und wenn nötig weiter entwickelt werden.
Abschließend soll eine Evaluation der adaptierten Verfahren anhand historischer Daten aus Rechenzentren der Forschungspartner erfolgen. Es ist zu untersuchen, inwieweit sich die Modelle in der Praxis anwenden lassen und die hierfür benötigten operativen Daten verfügbar sind. Zu diesem Zweck sollen die Anforderungen an ein Fertigungsleitsystem für Rechenzentren beschrieben werden. Die speziellen Anforderungen für Funktionen eines Fertigungsleitsystems für Rechenzentren sollen aus den in der Dissertation entwickelten Verfahren für das Störungsmanagement hergeleitet werden.




