Integration der Open Business Intelligence-Suite Pentaho in ... - Journals

Das Framework ITIL stellt ein Best Practice Prozess-Modell für den Betrieb der IT-Infrastruktur und – .... banken MDX transformiert werden können. ... der beschriebenen Mapping-Informationen werden die Daten von Mondrian online aus.
733KB Größe 4 Downloads 414 Ansichten
Integration der Open Business Intelligence-Suite Pentaho in ein modellgetriebenes Analyse-Framework am Beispiel des Strategic Alignment Bernd Tilg*, Chistian Hechenblaikner**, Ruth Breu*** *TIWAG – Tiroler Wasserkraft AG, Abteilung IT A-6020 Innsbruck [email protected] **Firma media.res A-1150 Wien [email protected] ***Institut für Informatik Universität Innsbruck A-6020 Innsbruck [email protected]

Abstract: In diesem Paper skizzieren wir die Integration einer Business Intelligence Lösung in eine Analyse-Plattform für Unternehmensmodelle. Das Framework MDAE setzt konsequent die Methoden und Konzepten der modellgetriebenen Softwareentwicklung mit UML und MDA ein, um in Kombination mit den analytischen Funktionalitäten einer Business Intelligence Lösung domänenspezifische Analysen und Reports auf Basis von Unternehmensmodellen zu ermöglichen. Der Analyseschwerpunkt liegt im vorgestellten Projekt PRO²SA in ausgewählten Themenfeldern der IT-Governance. Als Business Intelligence Plattform kommt die seit kurzem verfügbare Open BI Suite Pentaho zum Einsatz.

1

Einleitung und Motivation

In diesem Artikel präsentieren wir einen Ansatz, der auf Basis von Unternehmensmodellen, deren Informationen in ein Business Intelligence System übernommen werden, auf eine verbesserte Kommunikation und eine „methodische Annäherung“ von ITManagement und strategischer Unternehmensführung abzielt. Einleitend wird in Abschnitt 1.1 die Problematik abgesteckt, indem aus unterschiedlichen Blickwinkeln (den veränderten Rahmenbedingungen des IT-Managements, aktuellen Trends der Wirtschaftsinformatik und den Fortschritten der modellgetriebenen Softwareentwicklung) die Konzeption eines auf Unternehmensmodellen basierenden Analyse-Frameworks sowie die Integration in eine Business Intelligence Plattform motiviert wird. Aufbauend auf dem bisherigen Entwicklungsstand und den mittelfristigen Zielsetzungen unseres modellgetriebenen Frameworks MDAE in 1.2 erfolgt in den anschließenden Kapiteln die

126

B. Tilg, C. Hechenblaikner, R. Breu

Darstellung des Integrationskonzepts sowie ein Überblick über Aufbau und Leistungsumfang der freien Open-Source-Business-Intelligence-Suite Pentaho. 1.1

Ausgangslage und Problemstellung

Die Anforderungen an das strategische Informationsmanagement haben sich in den letzten Jahren geändert. Wurden noch vor einigen Jahren Investitionen in die Informationstechnologie kaum hinterfragt, so werden aktuell sowohl Neu-Investitionen als auch bestehende IT-Ressourcen und -Lösungen sehr kritisch beleuchtet [ZBG2004]. Das ITManagement steht nun vor der Herausforderung, den eigenen unternehmerischen Wertbeitrag nachvollziehbar zu argumentieren und zu planen. Wurde bereits vor dem Internet-Hype die Rolle bzw. Bedeutung der IT im unternehmerischen Kontext z.B. unter dem Schlagwort „Produktivitätsparadoxon“ [Bryn1993] aus verschiedenen Standpunkten heftig diskutiert, so ist diese Diskussion nun erneut und ebenfalls kontrovers unter dem Titel „IT doesn´t matter“ aufgeflammt [Carr2003]; [HBR03]. In den letzten Jahren hat sich für die strategische Einbettung der Informationstechnologie im Unternehmen der Begriff „IT-Governance“ eingebürgert, wobei eine exakte Definition noch auf sich warten lässt [WR04]; [COBIT4]. Das IT-Governance Institute1 (ITGI) hat fünf zentrale Domänen der IT-Governance identifiziert, mit denen sich das IT-Management konfrontiert sieht: Strategic Alignment, Value Delivery, Risk Management, Performance Measurement und Resource Management. Jede dieser Domänen bzw. Anforderungen impliziert spezielle Fragestellungen und Analysen, sowohl für das IT- als auch für das Unternehmens-Management. Eine ergänzende Betrachtung dieser zentralen Anforderungen kann allgemein auch aus diesen vier Blickwinkeln erfolgen: der Effektivitäts- (unter anderem Themenstellungen des „Strategic Alignment“ und dem „Value of IT“), der Effizienz- (IT-Verantwortliche sehen sich einem erhöhten Kosten- und Standardisierungsdruck ausgesetzt), der Compliance- (werden alle notwendigen Normen und Gesetze eingehalten und wird z.B. den Anforderungen der Wirtschaftsprüfer entsprochen) und der Risiko-/Sicherheits-Perspektive (werden die richtigen Maßnahmen für relevante Bedrohungspotentiale durchgeführt und ist die Unternehmens-IT auch „sicher“). In der Informatik und speziell in der Wirtschaftsinformatik sind einige wesentliche Trends erkennbar. So haben sich z.B. die von der Object Management Group2 (OMG) ursprünglich im Umfeld der objektorientierten Softwareentwicklung eingeführten Methoden und Standards etabliert: Hier sind vor allem die Unified Modeling Language in der Version 2.0 (UML), die Model Driven Architecture (MDA) und die Meta Object Facility (MOF) zu nennen. So wird die UML nun in einem breiteren Umfeld eingesetzt. Es zeichnet sich ab, dass in Zukunft diese nicht nur für die objektorientierte Modellierung einzelner Systeme verwendet wird, sondern auch – dank der vorhandenen Erweiterungsmechanismen – in immer neuen Domänen Anwendung findet. Wesentliche Anwendungsgebiete werden die Modellierung der Geschäftsprozesse sowie die Dokumen-

1

IT-Governance Domains Practices and Competencies, http://www.itgi.org

2

Object Management Group, http://www.omg.org

Integration der Open Business Intelligence-Suite Pentaho

127

tation unternehmensweiter IT-Architekturen („IT-Architektur im Großen“) sein. Damit ist ein wesentlicher Vorteil dieses Ansatzes darin gegeben, dass sich die Einsatzgebiete nicht ausschließlich nur auf die Modellierung und Generierung von Applikationssystemen erstrecken, sondern, dass diese Konzepte und Methoden für beinahe beliebige Fachdomänen eingesetzt werden können [StaVöl2005]; [Fra2002]. Damit wird die UML nun vermehrt in der Unternehmensmodellierung und im Business Engineering eingesetzt werden. Ein weiterer Trend ist in der Konzeption und im Einsatz von Business Intelligence Lösungen zu beobachten. BI-Systeme zielen auf die Informationsaufbereitung großer Datenmengen für Analysen und (Management-) Entscheidungen ab [SGBS2004]. Die Integration in bestehende Lösungen – beginnend bei der Extraktion aus OLTP-Systemen bis hin zur Einbindung in Management-Informations-Systeme (z.B. in einem Web-Portal) – hat sich bedeutend verbessert. Die Bedeutung von Data Warehouse- bzw. umfassenden BI-Systemen in Unternehmen für Reporting, Analysen und Entscheidungsfindung ist damit größer denn je. Es existiert jedoch eine “methodische Lücke” zwischen den von der strategischen Unternehmensführung benötigten und den durch Methoden der Wirtschaftsinformatik bereitgestellten Management-Informationen. Es lässt sich festhalten, dass es aktuell noch keine methodische Integration gibt, um auf Basis bestehender IT-Methoden und – Techniken die eingangs erwähnten zentralen Fragestellungen der IT-Governance für das Management rasch und fundiert zu analysieren, aufzubereiten sowie für strategische Entscheidungen dem Management „vorzulegen“. Häufig im Umfeld des strategischen IT-Managements angewendete internationalen Standard-Frameworks stellen die „Control-Objectives for Information- and related Technologies“ Version 4.0 [COBIT4], die „Information Technology Infrastructure Library“ (ITIL3) sowie die Norm ISO177994 dar. Anstrengungen für eine umfassende und gemeinsame Betrachtung dieser Frameworks werden aktuell zwar unternommen, führen im Moment aber noch nicht zu einer methodischen Integration, sondern liegen lediglich in Form eines sog. „MethodenMappings“ [MAPCII] vor. Eine wesentliche Verbesserung wäre gegeben, wenn die eingangs skizzierten strategischen Fragestellungen mit Mitteln der Business Intelligence - in den in vielen Unternehmen bereits vorhandenen Management-Informations- und Data Warehouse-Systemen bzw. Balanced Scorecard-Modellen – integriert und entsprechend analysiert werden könnten. So stellt Hinterhuber im Zusammenhang mit der Einführung von ERPSystemen fest, dass Organisation, Kultur und Strategie wichtiger für den Erfolg sind als die Technologie selbst [HiRo2005].

3

Das Framework ITIL stellt ein Best Practice Prozess-Modell für den Betrieb der IT-Infrastruktur und – Applikationen dar, http://www.itil.co.uk

4

Stellt aktuell die Standardnorm für Aspekte des IT-Risko- und Sicherheitsmanagements dar, http://www.standardsdirect.org/iso17799.htm

128

B. Tilg, C. Hechenblaikner, R. Breu integrierter Managementansatz (inkludiert IT-Management) Informationstechnologie UnternehmensManagement Vision KEF

Mission

KPI ProduktManagement

Framework „narrowing

Strategische Geschäftsfelder Strategische Maßnahmen

BPR BPO

Business Development Projekt

Geschäftsprozesse

WertschöpfungsProzesskette Modellierung

ChangeProjektportfolio und ProjektMangement Roadmap Task-Force Veränderungsmgmt.

Business Transformation

Modellorientierter Ansatz: Metamodelle der Fachdomänen Unternehmensmodellierung mit UML Businessorientierter Ansatz: Erweiterbarkeit, Skalierbarkeit, Anpaßbarkeit Integration der Kennzahlen in die Modelle Umfassendes Business Analyzing z.B. für Strategic Business Alignment

IT-Prozesse IT-Wertbeitrag

strateg. IT-Management

UML

strategisches InformationsManagement

IT-Controlling

IT-Organisation

Strategy Management

Balanced StrategieStrategie- Scorecard Management

ProzessLandkarte

Strategic Business Alignment

PRO²SA the gap“

Requirements Engineering

Objektorientierung XML

J2EE

Programmierung SOA SoftwareDatenformate EAI Engineering SW-Architektur RE Programmiersprachen Infrastruktur Analysen IT-Architekturen Applikationen und Modellierung IT-Infrastruktur IT-Architekturen MDA

CRM

Applikationen, Anwendungssysteme

SCM IDV Datenbanken

WorkflowSysteme DMS

B2B B2C

Standard-Software

ManagementInformations-Systeme Office-Anwendungen Enterprise Ressource Planning

Abb. 1: „narrowing the gap“ [TB2006]

Unser (übergeordnetes) Ziel ist es, unterschiedliche Domänen des IT-Managements in die strategische Unternehmensführung zu integrieren. Dieser neue Ansatz basiert auf den Konzepten der modellgetriebenen Softwareentwicklung (MDSD), der konsequenten Unternehmensmodellierung und einer technischen Integration in ein Business Intelligence System. In diesem Paper werden die sich in Entwicklung befindlichen AnalyseFrameworks MDAE (domänen-unabhängig) und PRO²SA (domänen-spezifisch) kurz präsentiert, die auf die genannten Integrations-Aspekte von IT und Management fokussieren. 1.2

Überblick über aktuelle Vorhaben und Zielsetzungen

Das Projekt PRO²SA (process- and project-oriented strategic alignment) ist eingebettet in eine Projektreihe, die im Rahmen eines gemeinsamen Programms von Wissenschaft und Industrie durchgeführt wird. Ein erstes wesentliches Ziel ist es, ein domänenunabhängiges modellgetriebenes Framework für Qualitätssicherung und Analyse von Modellen aufzubauen. Ein weiteres Ziel ist es, die methodische Integration von IT- und Unternemens-Management zu verbessern. Im Projekt PRO²SA wird dies auf Basis von Unternehmensmodellen der drei Management-Domänen Strategie-, Prozess- und ChangeManagement durchgeführt und fokussiert damit auf die Aufbereitung von Managemententscheidungen der ITG-Domänen „strategic alignment“ und „value of IT“. Gemeinsam mit dem Projekt MedFlow wurde eine prototypische Implementierung eines domänenspezifischen Model-Repositorys für Geschäftsprozesse im medizinischen Umfeld durchgeführt. Dabei wurde auf Basis von freier Software ein modellgetriebenes Framework implementiert und ein entsprechendes Vorgehensmodell definiert, das für unterschiedliche Fachdomänen eingesetzt werden kann [OGIT2006].

Integration der Open Business Intelligence-Suite Pentaho

129

Abb. 2: Architektur der prototypischen Implementierung [OGIT2006]

Das in der Architektur-Abbildung ersichtliche Analyse-Tool wurde „konventionell“ implementiert und bringt gegenüber dem Einsatz professioneller Reporting-Systeme zwangsläufig Nachteile mit sich. Auf Basis dieser Erfahrungen und erkannter Verbesserungspotentiale wurden nun die Ziele für die Erweiterung des implementierten Prototyps definiert. Um die Domänen-Unabhängigkeit und die geplanten Analysen & Reports noch besser zu unterstützen wird nun die Zielarchitektur MDAE (model-driven analysis environment) entsprechend Abbildung 4 angestrebt. Ein weiteres Ziel ist die Anreicherung von Modellen um zusätzliche Informationen (v.a. Kennzahlen zu den Modellelementen) um aus den vielfältigen Daten der Modell-Repositorys bestmöglichste Informationen für IT- und Unternehmensmanagement zu erhalten. Als prototypische Implementierung dieser Erweiterungen werden die IT-Governance Domänen des Strategic Alignments und des Value of IT des ITGI implementiert. Die notwendigen Management-Analysen orientieren sich an den vier AlignmentPerspektiven des Strategic Alignement Models [VH1993] und die entsprechenden Anforderungen wurden in [Tilg2005] erläutert. Es soll hier lediglich herausgestrichen werden, dass zumindest drei Arten von dynamisch generierten Analysen (Modell-Checks, Management-Reports, -Dashboards und -Charts) unterstützt werden müssen, wobei nach unserer Meinung gerade den unternehmensindividuellen und hochaggregierten Management-Charts (z.B. Software- und IT-Architekturlandkarten sowie Solution-Maps) eine besondere Rolle zukommt (vgl. [TB2006] sowie das Konzept der Softwarekartographie). Zusammengefasst ergeben sich die folgenden grundlegenden Anforderungen an die Anbindung einer Business Intelligence – Plattform an unser Framework:

130

B. Tilg, C. Hechenblaikner, R. Breu



Da das Modell-Repository – abgespeichert in einer relationalen Datenbank – die OLTP-Umgebung darstellt, muss diese einfach in eine OLAP-Form überführt werden können.



Für die Analysen und Darstellungen müssen Erweiterungen programmtechnisch vorgenommen werden können, um z.B. die unternehmensindividuellen Management-Charts einfach in einem Web-Portal darstellen zu können.



Da für die Recherchen eine eigene Abfragesprache auf Basis der Metamodelle konzipiert wird, sollte diese in die Standardabfragesprache für OLAP-Datenbanken MDX transformiert werden können.

Es ergibt sich damit die in Abbildung 4 (in Abschnitt 2) skizzierte Zielarchitektur für die Einbindung in eine BI-Umgebung, die sich aktuell (April 2006) in Entwicklung befindet.

2

Integration von Pentaho in das modellgetriebene (Analyse-) Framework PRO²SA

Bei der Auswahl eines BI-Systems fiel die Wahl5 auf die nun seit kurzem frei verfügbare BI-Suite Pentaho6. Nachdem einleitend die Motivation und die übergeordneten methodischen Ziele skizziert wurden, stellt es nun das technische Ziel dar, die umfangreiche Funktionalität der Pentaho Plattform zu nutzen und in das MDAE/PRO²SA Framework zu integrieren. Dieses Kapitel erläutert zunächst die Integration aus einem eher technischen Gesichtspunkt. Im anschließenden Kapitel wird – für einen interessierten Leser – ein allgemeiner Überblick und kurzer Erfahrungsbericht über diese neue freie BI-Suite gegeben. Eine der ersten Fragestellungen ist es, die Nutzung des Modell-Repositorys als Quellsystem (OLTP) zu ermöglichen. Dabei kommt in der BI Suite Pentaho die ReportingKomponente JPivot in Verbindung mit dem OLAP-Server Mondrian zur Anwendung. Eine Voraussetzung für die Arbeit mit Mondrian ist die Definition eines entsprechendes (Mapping-) Schemas7 – eine XML Datei, welche das logische Modell beinhaltet: Cubes, Dimensionen, Members und Relationen werden in diesem Schema auf die Tabellen des Modell-Repositorys im RDBMS „gemappt“. Des Weiteren existieren so genannte „Calculated-Member“, die die Abbildung von Aggregatszuständen ermöglicht. Zielsetzung ist es nun, dieses Schema aus dem Modell-Repository bzw. auf Basis der Metamodelle automatisch zu generieren. Diese Generierung erfolgt mittels der so genannten Java Emitter Template (JET, [EDENHAUSER2005]) welche ein Teil des Eclipse Modeling

5

Siehe hierzu auch [HeSi2006]

6

Pentaho-Site, http://www.pentaho.org

7

Mondrian-Schema: http://mondrian.sourceforge.net/schema.html

Integration der Open Business Intelligence-Suite Pentaho

131

Framework (EMF)8 ist. Bei der Generierung des (Mapping-) Schemas können konzeptionell zwei unterschiedliche Verfahren betrachtet werden: −

Gemeinsam mit Generierung des Modell-Repositorys: Im Zuge der Erstellung des Modell-Repositorys kann mit Hilfe des verwendeten MDA-Tools zusätzlich die notwendige OLTP-OLAP Mapping-Datei erstellt werden. Die Meta-Modelle werden in diesem Fall um OLAP-Informationen (z.B. zu Dimensionen, Kennzahlen, u.s.w.) ergänzt. Der Aufwand ist zwar gering, jedoch gestalten sich Anpassungen aufwändig.



Erstellung aufgrund vorhandener Datenbankstruktur: Manuelle Pflege der Mapping-Informationen. Ein Vorteil ist dadurch gegeben, dass die Ausgestaltung des OLAP-Schemas individueller gestaltet bzw. beliebig angepasst werden kann – z.B. bei Nutzung bereits vorhandener Data-Marts.

Dadurch, dass die zu erwartende Datenmenge in den Repositorys im Vergleich zu typischen Data Warehouse-Anwendungen als gering abgeschätzt werden kann wird auf eine redundante Datenhaltung verzichtet. Die Extraktion der Daten aus dem ModellRepository erfolgt auf der technischen Ebene in Form einer MDX9.-Abfrage (Multi Dimensional Expression), die speziell für OLAP Datenbanken definiert wurde. Mit Hilfe der beschriebenen Mapping-Informationen werden die Daten von Mondrian online aus dem Modell-Repository ausgelesen. Im nächsten Schritt erfolgt auf Basis einer eigenen Abfragesprache die Einbindung in ein Web-Cockpit, um die erwähnten Analysen zu ermöglichen. In Abbildung 3 ist als Beispiel eine Solution-Map ersichtlich (eine Matrixdarstellung der wertschöpfenden Prozesse und Informationssysteme), die aus dem Modell-Repository erstellt werden soll. Die Darstellung der zwei aggregierten Kennzahlen erfolgt einerseits numerisch (Prozessabdeckungsgrad) und andererseits als farbkodierte Kreise (Anwenderzufriedenheit). Auf Basis dieser beiden Kennzahlen wird damit der gegenseitige Einfluss der IT auf die Geschäftsprozesse überschaubar visualisiert.

8

Eclipse Modeling Framework (EMF): http://www.eclipse.org/emf/

9

Siehe MDX Seite von Mondrian: http://mondrian.sourceforge.net/mdx.html

132

B. Tilg, C. Hechenblaikner, R. Breu Abfrage:

Management-Chart: Solution Map

2,7

BP4

2

BP3 BP2

Business Process

Transformation in MDX Datenabrage Darstellung in der gewünschten Art

BP1

Dimension InformationSystems Select InformationSystem ISLevel=“System“ and (ISLifeCylce=“inEntwicklung“ or ISLifeCylce=“Produktiv“)

2 2 3

3

Dimension BusinessProcesses Select BusinessProcess ProcType=„wertsch.“ and ProcLevel=„Geschäftsprozess“

3

Domain PRO²SA

Display as ManagementChart SolutionMap X: BusinessProcess Y: InformationSystem KZ „Anwenderzufriedenheit“ as numeric KZ „Abdeckungsgrad“ as color

2,3

4

2 2

5 3

1

4

1,7

1

3

2

2 5

1,5

3,3

InformationSytem

Abb. 3: Beispiel für ein generiertes Management-Chart

Diese Analyse-Reports und -Charts sollen automatisch aus den vorhandenen Metadaten und Modellinformationen generiert werden. Pentaho unterstützt derzeit drei unterschiedliche Frameworks für derartige Aufgabenstellungen (siehe Abschnitt 3), welche zur Generierung der Charts verwendet und als sehr ausgereift bezeichnet werden können: −

Eclipse BIRT10



JFreeReport11



JasperReports12

All diese Frameworks haben jedoch unterschiedliche Formate. Mit Pentaho BI ist es jedoch möglich, verschiedene Formate in gleichen „Solutions“ zu verwenden. Zum Gestalten der Reports oder Charts stellt jedes der drei Frameworks geeignete Werkzeuge zur Verfügung. Die Definition und Implementierung einer entsprechenden Abfragesprache ist Teil der aktuellen Konzeptions- und Implementierungsphase des PRO²SA–Projekts. Ziel hierbei ist es, dass die Modellinformationen im Repository anhand verschiedener Kriterien abgefragt werden können und die Management-Analysen bzw. Charts dynamisch generiert werden. Diese Möglichkeit soll im Rahmen des MDAE-Frameworks aber domänenunabhängig erfolgen. Abfragen sollen auf Basis der Metaebene definiert, mittels Mondrian die relevanten Daten aus dem Modell-Repository ausgelesen sowie anschließend die entsprechende Analyse- oder Chart-Darstellung generiert werden. In Abbildung 4 ist dieses Vorgehen und die gesamte Zielarchitektur schematisch dargestellt.

10

Siehe Eclipse BIRT Projekt: http://www.eclipse.org/birt/

11

Siehe JFreeReport Projekt: http://www.jfree.org/jfreereport/index.php

12

Siehe JasperReports Projekt: http://jasperreports.sourceforge.net/

Integration der Open Business Intelligence-Suite Pentaho Business Intelligence Analysis Tool

Meta-Modeling Environment Meta-Model MDAE (domain-independent) Model-Driven Analysis Environment

MDAE Query Language

...

Meta-Model PRO²SA Model-Driven Analysis (domain-specific) Environment Process- and Project oriented Strategic Alignment

MDA Framework

UML-Models PRO²SA UML-Models PRO²SA UML-Models PRO²SA

(Checks, Analysen, Charts)

Web – Cockpit (Dashboards)

OLTP/OLAP–Mapping & Data Extraction Repositorys (OLTP)

UML-Tool Adaptors

UML-Profil PRO²SA

ReportGenerator

MDXQuery

Mapping-Schema (OLTPY Y OLAP

Meta-Model MedFlow

Modeling Environment

133

Generic Repository Access Layer Meta-Model Java Classes O/R - Mapping

MDAE Repository (domainindependent)

PRO²SA ModelRepository (domain-specific) Domain 2 Domain 3

Abb. 4: Zielarchitektur mit Integration einer BI-Plattform

3

Die Open Business Intelligence Suite Pentaho – Überblick und Erfahrungen

Das Unternehmen Pentaho bezeichnet sich selbst als der Marktführer im Bereich der Open-Source-Business-Intelligence. Gegründet wurde das Unternehmen im Juni des letzten Jahres und im Dezember 2005 erschien bereits die Version 1.0 der Business Intelligence Suite und wird seitdem sehr dynamisch weiterentwickelt und um neue Funktionalitäten erweitert. Im Folgenden wird ein Überblick über die Komponenten der Open BI Suite Pentaho gegeben. Diese stellt vielfältige Funktionalität für Reports & Analysen, Dashboards, Data Mining und Workflow in einer integrierten Plattform bereit. Dabei setzt diese auf bereits bestehenden Open Source Komponenten auf, welche nun in der Pentaho BI Plattform integriert wurden. Erweiterungen oder das Austauschen verschiedener Komponenten sind mittels dieses modularen Aufbaus leicht realisierbar.

134

B. Tilg, C. Hechenblaikner, R. Breu

Abb. 5: Architektur der Pentaho BI Platform13

Neben Pentaho BI Suite, der Hauptkomponente der Plattform, ist die Firma Pentaho auch noch Sponsor und Eigentümer anderer Komponenten, welche wiederum ein Teil der gesamten Plattform sind: −

JFreeReport

Open Source Reporting



Kettle

Open Source Data Integration



Mondrian

Open Source OLAP Server

Ein effizientes Reporting ist eine Kernfunktionalität jedes Business Intelligence Systems. Mit Hilfe der Komponente Pentaho Reporting können Reports einfach erstellt werden, wobei relationale Datenbanken, OLAP, XML oder CSV als Datenquellen dienen. Die Ausgabe erfolgt wahlweise als Adobe PDF, HTML, Microsoft Excel, Rich Text oder Plain Text. Weiters können Reports auch zeitgesteuert gestartet werden – z.B. kann definierten Anwendern der Report mittels Email übermittelt werden. Neben dem Pentaho eigenen Projekt JFreeReport ist es möglich, sowohl Eclipse BIRT als auch JasperReports nahtlos zu integrieren. Pentaho legt besonderes Augenmerk auf die einfache Handhabung und bietet deshalb Pentaho Report Design Wizards und Pentaho Report Designer14 zum Download an. Mittels dieser Tools ist es ein Einfaches, Reports zu erstellen und zu deployen.

13

Siehe Architektur auf http://www.pentaho.org

14

Siehe Pentaho Download Site: http://www.pentaho.org/download/latest.html

Integration der Open Business Intelligence-Suite Pentaho

135

Abb. 6: Query von Mondrian als Ausgabe von Excel mittels JFreeReport

Pentaho Analyse beinhaltet Pivot Tabellen, verschiedene grafische Ausgabeformate (darunter auch Scalable Vector Graphics (SVG)15), Data Mining-, Portal- und Workflow-Integration. Daten können per MDX abgefragt werden – dazu dient der integrierte Open Source OLAP Server Mondrian. Genau genommen handelt es sich bei Mondrian um einen ROLAP (Relational Online Analytical Processing) Server. Die Daten werden in einer Relationalen Datenbank gespeichert und über JDBC (Java Database Connectivity) abgefragt. Auf die Vor- und Nachteile von ROLAP gegenüber anderen Varianten wir an dieser Stelle nicht näher eingegangen (vgl. hierzu z.B. [Ri2001]).

15

W3C Seite von Scalable Vector Graphics: http://www.w3.org/Graphics/SVG/

136

B. Tilg, C. Hechenblaikner, R. Breu

Abb. 7: OLAP Cube Mondrian, JPivot als Frontend mit zahlreichen Konfigurationsmöglichkeiten

Die technischen Anforderungen an die Komponente Pentaho Analyse gestalten sich wie folgt: −

Generierung von Pivot Tabellen Views von OLAP Daten



Erzeugung erweiterter, analytischer, grafischer Sichten auf OLAP Daten



Generierung einer intuitiven Benutzerführung für den Endbenutzer



Erzeugung eines “Drill-down” zu und von Geschäftsprozessen



Drilling, Rotation und Slide and Dice von Sichten



Integrierte Analyse mit Geschäftsprozessen



Erzeugung benutzerspezifischer Anpassungen und Präferenzen



Verwendung der besten Open Source Analyse Komponenten

Mit Hilfe der Pentaho Dashboard Funktionalität ist es möglich den gewünschten Inhalt auf einen Blick einzusehen und zu kontrollieren. Diese Funktionalität ist vor allem den Entscheidungsträgern eines Unternehmens dienlich. Die Reporting und Analyse Komponenten liefern die notwendigen Informationen um wirtschaftliche Entscheidungen auf Basis solider Fakten treffen zu können. Verschiedene vorgefertigte Schaltelemente wie z.B. Skalen können einfach benutzt werden. Darüber hinaus können eigene Anwendungen mit dem Dashboard Designer (ein Eclipse Plug-In, welches Bestanteil des Pentaho Design Studio ist) erzeugt werden. Weitere Anwendungen oder RSS (Really Simple

Integration der Open Business Intelligence-Suite Pentaho

137

Syndication)16 kann ebenso mit eingebunden werden. Filter für die Benutzer erleichtern es, die relevanten Informationen zu filtern und zu sortieren. Auf Entwicklerseite steht ein Rollen basiertes Berechtigungskonzept zur Verfügung, welches erlaubt, Lese- und Schreibrechte für die unterschiedlichen Sichten zu steuern.

Abb. 8: Dashboard Beispiel aus dem mitgelieferten Demo-Portal

Die Pentaho Workflow Engine ist, ähnlich wie bei Reports, lediglich ein Wrapper um bereits vorhandene Produkte. In diesem Fall handelt es sich um die Open Source Workflow Engine Enhydra Shark17. Als Workflow Definitionssprache wird die XML Process Definition Language (XPDL) verwendet. XPDL ist ein Standard der Workflow Management Coalition18 und somit sollte es relativ einfach sein, andere Engines einzubinden und damit „engine-unabhängig“ zu sein. Pentaho bezeichnet Data Mining als das „next level“ von Business Intelligence. Hier verwendet die Pentaho Data Mining Komponente Weka. Das Weka Projekt beschreibt sich als „the overall goal of our project is to build a state-of-the-art facility for developing machine learning (ML) techniques and to apply them to real-world data mining problems”19 und scheint somit die ideale Komponente für Pentaho Data Mining zu sein. Seit April 2006 verfügt das das Pentaho Projekt über eine ausgereifte Daten Integration und ETL (Extract, Transform and Load) Komponente – Kettle20. Damit ist eines der größten Mankos von Pentaho, dem Fehlen eines ETL Werkzeuges, beseitigt. Kettle kennt zahlreiche Ein- und Ausgabeformate und verfügt über zahlreiche Möglichkeiten zur Transformation der Daten. Besonders komfortabel erscheint die grafische Benutzeroberfläche welche „Spoon“ genannt wird. (vgl. Abb. 9Abb. 9: Kettle ETL). Weitere Werkzeuge von Kettle sind Pan, Chef und Kitchen, welche vor allem dazu dienen, zeitgesteuerte Dienste auszuführen und diese zu administrieren. 16

Siehe RSS Spezifikation: http://web.resource.org/rss/1.0/

17

Enhydra Shark, http://www.enhydra.org/workflow/shark/index.html

18

XPDL, http://www.wfmc.org/standards/XPDL.htm

19

Siehe Weka Projekt: http://www.cs.waikato.ac.nz/~ml/

20

Siehe Kettle Projekt: http://www.kettle.be/

138

B. Tilg, C. Hechenblaikner, R. Breu

Abb. 9: Kettle ETL – Grafische Oberfläche

4

Resümee und Ausblick

Das Framework MDAE/PRO²SA reiht sich in eine Gruppe weiterer – zum Teil kommerzieller – Modellierungsansätze ein. Als wesentlicher Vorteil kann aber herausgestrichen werden, dass zur Modellierung keine proprietären Methoden Anwendung finden, sondern inzwischen etablierte Konzepte der modellgetriebenen Softwareentwicklung im Rahmen der Erweiterungsmöglichkeiten (Metamodellierung, UML-Profile, usw.) der UML/MDA konsequent angewendet werden. Das eigentliche Ziel aber stellt die methodische Annäherung bzw. Integration des Informationsmanagements in die strategische Unternehmensführung durch Nutzung und Analyse der Modellinformationen dar. Auf der technischen Ebene wird dies durch Anbindung an eine BI-Plattform erreicht. Dadurch ist es in einem nächsten Schritt auch möglich, übergreifende Analysen mit typischerweise bereits in Data Warehouse-Systemen gespeicherten Daten (z.B. Kostenrechnung und Controlling) durchzuführen. Die bisherigen Erfahrungen mit der freien Open BI Suite Pentaho können für unsere Anforderungen als sehr gut bezeichnet werden. Der Einarbeitungsaufwand ist sehr gering: Es werden fertige Installations-Packages inklusive Demodaten und – beispielanwendungen zum Download bereitgestellt. Das Konzept bereits bewährte Komponenten in eine Plattform zu integrieren und auf die Erweiterbarkeit großen Wert zu legen, stellt einen wesentlichen Erfolgsfaktor dieses Projekts dar. Die verschiedenen Komponenten − alle davon Open Source − sind qualitativ hochwertig. Als Beispiele können der OLAP-Server Mondrian, das Reporting-Tool JasperReports sowie Eclipse BIRT genannt werden. Besonderes Augenmerk wird auch auf die Dokumentation gelegt,

Integration der Open Business Intelligence-Suite Pentaho

139

die beständig erweitert wird und sich auf dem neuesten Stand befindet – ein ansonsten häufiges Manko bei Open Source Projekten. Aufgrund des Umstandes, dass die erste Version erst seit wenigen Monaten zur Verfügung steht, ist es noch relativ schwierig, längerfristige Prognosen abzugeben. Seit kurzem bietet Pentaho zusätzlich eine kostenpflichtige „Pro Version“ an, die auf der gleichen Basis wie die Open Source Variante aufsetzt. Sie wurde um einige Features wie z.B. Excel Pivottabellen erweitert und bietet dem Administrator mehr Komfort. Diese Variante verfügt darüber hinaus über Load Balancing und Clustering für High-End Lösungen. Mittlerweile gibt es Partnerprogramme auf verschiedenen Levels. Zertifizierungen sind ebenfalls in Planung, welche einen wichtigen Faktor darstellen, um die Akzeptanz der Plattform bei Unternehmen zu erhöhen. Die in [HePf2005] beschriebenen Nachteile der Basiskomponenten Mondrian und JPivot relativieren sich nun angesichts des Umstandes, dass diese nun als Module in eine integrierte BI Suite integriert sind und durch die Komponente Kettle ein umfassendes ETL-Tool zur Verfügung steht. Aktuell befindet sich das Framework MDAE/PRO²SA auf Basis des in Kapitel 0 dargestellten und realisierten Prototypen in Weiterentwicklung. Die ersten Erfahrungen – sowohl konzeptionell als auch im technischen Umfeld mit UML, MDA-Tools und insbesondere der BI-Suite Pentaho – sind sehr viel versprechend.

5

Literaturverzeichnis

[Bryn1993] Brynjolfsson, E.: The productivity paradox of information technology. In Communications of the ACM, CACM 36, Nr. 12, 1993; p. 66-77. [Bu04]

Buchta, D; et al.: Strategisches IT-Management – Wert steigern, Leistung steuern, Kosten senken. Verlag Gabler, Wiesbaden, 2004.

[Carr2003] Carr, N.G.: IT doesn´t matter. Harvard Business Review, May 2003, Volume 81; p. 41-49. [COBIT4] ISACA (Hrsg.): Control Objectives for Information- and related Technologies, Version 4, http://www.isaca.org, Stand: November 2005. [EDENHAUSER2005] Codegeneration with Eclipse JET, Edenhauser, WS05, http://qeinformatik.uibk.ac.at/index.php?option=content&task=view&id=210&Itemid=119. [Fra2002]

Frankel, D.: Model Driven Architecture – Applying MDA to Enterprise computing, John Wiley & Sons, New York, 2002.

[HBR03]

Letters to the Editor: Does IT matter? An HBR debatte; HBR Review, June 2003, http://harvardbusinessonline.hbsp.harvard.edu

[HePf2005] Herden, O.; Pfrommer, B.: Aufbau eines DWH mit den Open-Source-Komponenten JPivot, Mondrian und MySQL – Eine Alternative zu kommerziellen Produkten?, Workshop ISOS, in Tagungsband 1 − Informatik 2005; S.96-100. [HeSi2006] Hechenblaikner, C.; Sigl, M.: Überblick zu Business Intelligence – kommerzielle und Open Source Business Intelligence Systeme, Seminararbeit, Forschungsgruppe QE, Institut für Informatik, Universität Innsbruck, https://qe-informatik.uibk.ac.at/

140

B. Tilg, C. Hechenblaikner, R. Breu components/com_docman/dl2.php?archive=0&file=c3MyMDA2X3NlcWU0X2hlY2 hlbmJsYWlrbmVyX3NpZ2xfYmkucGRm.

[HiRo2005] Hinterhuber, H. H.; Rothenberger S.: Die Integration von Enterprise Resource Planning(ERP) und strategischer Unternehmensführung – Eine neue Herausforderung für das Strategische Kompetenz-Management; Institut für Unternehmensführung, Universität Innsbruck; http://www2.uibk.ac.at/immt/strategic-management/down/hinter huber_integration_erp.pdf. [MAPCII] ISACA (Hrsg.): Aligning Cobit, ITIL and ISO17799 for business benefit – A Management briefing from ITGI and OGC, http://www.isaca.org, Stand: November 2005. [OGIT2006]Chimiak-Opoka, J. et. al.: Tool-Supported Systematic Model Assessment, in H.C. Mayr & R. Breu, ed.,, Gesellschaft für Informatik, Modellierung-2006; p. 183-192. [Ri2001]

Richter, W.: Virtual Communities und Customer Relationship Management, Diplomarbeit, Technische Universität Graz, http://www.iicm.edu/wrichter/thesisfinal/thesis-final.html, Stand: August 2001.

[SGBS2004]Schildhauer, T. et. al. (Hrsg.): Business Intelligence – durch eBusiness Strategien und Prozesse verbessern, Business Village GmbH, ISBN 3-934424-71-76. [StaVöl2005]Stahl, T.; Völter M.: Modellgetriebene Softwareenwicklung – Techniken, Engineering, Management. dpunkt.verlag, 2005. [TB2006]

Tilg, B.; Breu, R.: PRO²SA-Ein modellgetriebener Ansatz zur Integration des Strategic Business Alignments in die Business Intelligence. MKWI2006, Track Business Intelligence, Tagungsband 2; S. 97-110.

[Tilg2005] Tilg, B.: Anforderungen an ein modellbasiertes Strategic Business Alignment der IT, Workshop QUAM, in Tagungsband 2 – Informatik 2005; S.506-510. [VH1993] Henderson, J.C., Venkatraman, N.; Strategic Alignment: Leveragin information technology for transforming organizations. In IBM Systems Journal 32, 1993; S. 4-16. [WFG97]

Willcocks; Feeny; Islei: Managing IT as a Strategic Resource. McGraw Hill, 1997.

[WR04]

Weill, P.; Ross, J. W.: IT Governance – How Top Performers Manage IT Decision Rights for Superior Results. Harvard Business School Press, Boston, 2004.

[ZBG2004] Zarnekow, R, Brenner, W., Grohmann, H. (Hrsg.): Informationsmanagement – Konzepte und Strategien für die Praxis. dpunkt.verlag, ISBN 3-89864-278-X.

Unternehmensmodellierung: Methoden, Werkzeuge, Anwendungsszenarien

Leitung und Organisation des Tracks Prof. Dr. U. Frank, Universität Duisburg-Essen

Programmkomitee des Tracks Prof. Dr. J. Becker, Universität Münster Dr. M. Bertram, Commerzbank Frankfurt Dr. U. Dumslaff, sd&m Troisdorf Prof. Dr. W. Esswein, TU Dresden Prof. Dr. U. Frank, Universität Duisburg-Essen Prof. Dr. R. Jung, Universität Bern Prof. Dr. S. Leist, Universität Regensburg K.-W. Müller, BearingPoint München Prof. Dr. M. Nüttgens, Universität Hamburg Prof. Dr. M. Rebstock, Fachhochschule Darmstadt Dr. P. Rittgen, University College of Borås, Schweden Prof. Dr. E. J. Sinz, Universität Bamberg Dr. Peter Tabeling, Hasso-Plattner Institut Potsdam Prof. Dr. K. Turowski, Universität Augsburg