Microsoft Demo-Datasets für Power BI, Tabular Model und Power Pivot

Publiziert von

Wer mit Power BI, Tabular Model und Power Pivot arbeitet und/oder Trainings macht, benötigt neben den Echt-Datenbeständen auch immer wieder möglichst reichhaltige Demo-Datasets. Naturgemäß gibt es einen Tradeoff zwischen der Anzahl der Themen, die ein Demo-Dataset abdeckt und der zu beherrschenden Komplexität. Daher ist es pragmatisch, mit mehreren Demo-Datasets zu arbeiten.

Ziel dieses Beitrags ist es, die uns bekannten Microsoft BI Demo-Datasets überblicksartig vorzustellen und hoffentlich im Diskussionsbereich dieses Blogbeitrags interessante Inputs zu bekommen! Der Fokus des Beitrags liegt hier auf den (relationalen) Rohdaten, nicht auf den ebenfalls verfügbaren fertigen BI Demo-Anwendungen.

1. Datenbank-basierte Demo-Datasets: Adventure Works, Wide World Importers, Contoso und andere

Dominierend in der Microsoft BI ist das Adventure Works Dateaset, mit dem Erscheinen des neuen SQL Server 2016 Demo-Datasets Wide World Importers stellt sich aber die Frage, ob vielleicht besser dieser verwendet werden sollte. Dazu stößt man auch immer wieder auf das Contoso (Retail) Demo-Dataset und einigen weiteren.

Daher gleich vorweg die Evaluierung, was für die einzelnen Showcases spricht:

  1. Adventure Works wird zwar in SQL 2016 nur mehr reduziert ausgeliefert, für AW spricht aber die bisher dominierende Verwendung im BI Umfeld.
    Beispielsweise baut der Trainingscase des MOC „10989 Analyzing Data with Power BI“ (Course Outline und Trainingsbeispiele) ebenso wie zahllose Blogbeiträge auf den AW Showcase auf (hier als Beispiel ein sehr nützlicher Blogbeitrag in dem alle Power BI Visuals anhand des AW Showcases vorgestellt werden).
  2. Wide World Importers ist die neue Demodatenbank für SQL 2016, bisher ist die Verbreitung aber noch gering.
    Der Fokus liegt auf den neuen technischen Möglichkeiten von SQL Server 2016, das Datenmodell selbst ist übersichtlich strukturiert, fokussiert und vielversprechend. Daß es sich um eine Version 1.0 handelt überzeugt natürlich noch nicht, das Risiko daß noch größere Veränderungen stattfinden werden schätze ich als groß ein.
  3. Contoso spielt im BI Umfeld keine Rolle mehr, da das letzte Update für SQL 2008 erschienen ist, es sollte daher nicht mehr verwendet werden.

Adventure Works (SQL 2012 /2014 / 2016)

Adventure Works (AW) ist die nach wie vor dominierende Demo-Datenbank im Microsoft BI Stack. Sie soll durch die neue WWI-Datenbank abgelöst werden, wohl deshalb werden in der aktuellen SQL 2016 Version von AW nur noch die relationalen Datenbanken und leider keine SSAS Demos (Tabular Model und multidimensionale Cubes) mehr bereitgestellt. Wir gehen aber davon aus, daß die AW in dieser relationalen Form noch einige SQL Releases lang aktualisiert werden wird.

Hier die Downloadlinks für SQL 2016, SQL 2014 und SQL 2012 (hier gibt es die SQL 2012 AW sogar im Excel Format zum Download). :

Hier die Tabellen- und Viewstruktur der aktuellen relationalen DWH-Datenbank AdventureWorksDW2016CTP3 in der FLEX-TableManager! Tabellenansicht:

Die häufig als Datenmodell verwendete FactInternetSales mit den verbundenen 8 Dimensionstabellen wurden im Screenshot oben hervorgehoben, hier das fertige Datenmodell in Power BI:

Quelle: MOC 10989 (Power BI Musterlösung für Lab05)

Wide World Importers (ab SQL 2016)

Wide World Importers ist die neue Standard-Datenbank für SQL Server 2016 (Quelle), der Fokus liegt auf der Demonstration der neuen SQL Features. In der Praxis ist der neue Showcase naturgemäß noch nicht angekommen, sicherlich auch weil es sich um eine Version 1.0 handelt und derzeit schwer abzuschätzen ist, wie viele (tiefgreifende) Anpassungen es in den nächsten Versionen geben wird.

Hier der Link zum Download der WWI-Demos für SQL Server 2016 (hier gibt es erläuternde Infos zur OLTP- und OLAP-Database und hier Hilfe bei der Einrichtung):

Die Tabellen- und Viewstruktur der relationalen DWH-Datenbank WideWorldImportersDW ist sehr klar strukturiert, wie hier im FLEX-TableManager! in der Tabellenansicht zu sehen ist:

Hier das Datenmodell für die Sales-Faktentabelle und die verbundenen 5 Dimensionstabellen:

Quelle: insightquest.com (es ist sowohl eine fertige Power BI Demo als auch eine fertig Power Pivot Demo mit allen Fakten- und Dimensionstabellen zum Download verfügbar)

Contoso Retail (bis SQL 2008)

Der Contoso Showcase ist als umfassendes Set an Branchenlösungen konzipiert worden, wurde aber zuletzt für SQL Server 2008 aktualisiert. Contoso wurde insbesondere für Power Pivot Demos bis ins Jahr 2011 gerne verwendet. Möglicherweise spielt Contoso auch heute noch im AX/NAV-Umfeld eine Rolle (das ist nicht unser Fachgebiet), im BI Umfeld dürfte die Contoso aber ausgedient haben.

Der Download der Contoso Retail BI Datenbank kann nach wie vor hier bewerktstelligt werden:

Der Retail Showcase wurde im Jahr 2010 für diese Power Pivot Demo verwendet (powerpivotsdr.codeplex.com), Basis sind Auszüge aus der Contoso Retail-DB in Form einer Access-Datenbank. Auch in diesen Power Pivot Samples für Excel 2010/2013 wird ein Contoso Demo-Dataset verwendet.

Der Retail Showcase wurde im Jahr 2011 für das sehr gelungene Whitepaper DAX in the BI Tabular Model Whitepaper and Samples verwendet, neben dem Whitepaper kann auch die Power Pivot Excel Anwendung downgeloaded werden. Hier schemenhaft das dort vorgestellte Datenmodell:

Andere Demo-Datenbanken

Die Northwind Demo-DB steht auf Codeplexx nur bis SQL 2008 zur Verfügung, diese DB wird aber wohl nach wie vor auch in Microsoft Access als Demo-DB verwendet.

Im wirklich sehr empfehlenswerten edX-Training DAT207x Analyzing and Visualizing Data with Power BI wird das access-basierte Demo-Dataset Van Arsdel verwendet. Es erfüllt den Zweck für den Training recht gut, wir empfehlen die Verwendung als Demo-Dataset wegen des zu geringen Funktionsumfangs aber nicht.

File-basierte Demo-Datasets

Power BI Financial Sample

Das Financial Sample ist ein einfaches aber sehr nützliches Demo-Dataset: es sind nämlich Target-Values enthalten. Damit lassen sich dann die zahlreichen Deviation-Visuals von Power BI testen. Hier ein Auszug aus der Datentabelle:

Power BI Industry Samples

Die Industry Samples sind Excel Dateien mit integriertem Power Pivot Datenmodell und Power View Reports (die sich bei mir in Excel 2016 leider nicht öffnen lassen), die vermutlich mit den in PowerBI.com angebotenen Demos verwandt sind (habe ich aber nicht näher untersucht, einige klingen ähnlich). Der Nachteil dieser Demos ist, daß (1) die Rohdaten erst noch aus dem Datenmodell extrahiert werden müßten und (2) diese Daten unter einem Copyright eines Microsoft Partners stehen.

Hier der Überblick über die verfügbaren Samples:

Fazit

Es gibt zahlreiche Demo-Datasets im Microsoft BI Umfeld, für viele Zwecke sind die Adventure Works DW und das Financial Sample gut geeignet. Die neuere Wide World Importers muß sich noch bewähren, wir empfehlen die nächste Version abzuwarten (um das Ausmaß der Anpassungen einschätzen zu können).

Im Bereich der GEO-Daten ist es bisher schwierig, einen wirklich guten Datenbestand sowohl mit Regionen/Länder/Bundesländer/Gemeinden, PLZ als auch Längen- und Breitengraden zu finden. Hier sind sowohl das AW- als auch das WWI-Datasets schwach. Eine gute (aber auch nicht perfekte) Alternative sind die Geo-Daten aus der Websitestatistik in Google Analytics.

Es gibt auch von anderen Herstellern interessante Demos, etwa der SAP ® IDES Demo-Mandant. Hier ist naturgemäß mit einer hohen Aufbereitungskomplexität zu rechnen. Interessant wäre auch ein SAP HANA Demo-Mandant für die Auswertung mit Power BI …

Welche Demo-Datasets verwendest Du / verwenden Sie?

Robert Lochner

Robert Lochner ist seit 2001 als Unternehmer tätig und Gründer der Linearis. Er hält Trainings und Seminare und unterstützt Fachabteilungen bei der Umsetzung ihrer Business Intelligence Anforderungen.

Weitere Beiträge

Kategorien: Analyse, Power BI im Team nutzen, Power Pivot nutzen, SQL Server als DWH nutzen