Data Science as a Service: Cloud-basierte Analyse von IoT Daten

Data Science as a ServiceDie Vernetzung der realen Welt mit der digitalen und die Analyse der dadurch entstandenen Datenströme hat eine immer höhere Priorität in der strategischen Ausrichtung von Unternehmen. Daten als Ressource und die Analyse dieser haben sich zu einem kritischen Erfolgsfaktor entwickelt.

Companies that use data and business analytics to guide decision ma-king are more productive and experience  higher  returns  on  equity  than  competitors  that  don’t –Brown et al., McKinsey Global In-stitute, 2011 [1]

Alle zwei Jahre verdoppelt sich das Datenvolumen. Marktbeobachter von IDC schätzen, dass die Menge an Daten bis 2020 bei etwa 40 Zettabytes liegen wird — das ist 50-mal so hoch wie noch vor drei Jahren [2]. Im Jahr 2013 waren lediglich 22% der Daten analysefähig, wohingegen weniger als 5% davon tatsächlich ausgewertet wurden. Demgegenüber wächst die Anzahl relevanter Daten und soll bis 2020 auf 35% steigen. Dabei ist das IoT (Internet of Things) eine treibende Kraft, die zum stetigen Wachstum maßgeblich beiträgt.

Ein Resultat des immensen Datenwachstums sind große Datenmengen ohne Informationsmehrwert [3, 4, 5]. Die Informationsgewinnung stellt Unternehmen vor neue Herausforderungen und Möglichkeiten zur Geschäftstransformation [6, 7]. Dort wo klassische analyse Tools der BI (Business Intelligence) im Bezug auf Volumen, Geschwindigkeit und Komplexität der Daten an ihre Grenzen stoßen, spielt Data Science in der Cloud seine Stärken aus und ermöglicht mächtige prädiktive und präventieve Analysetechniken [8, 9].

Techniker arbeitet an einem AufzugThyssenKrupp Elevator (TKE) ist ein weltweit führender Produzent für Aufzugsanlagen. Mithilfe von innovativen Technologien will die TKE konkrete Ziele umsetzen und so gesteigerte Betriebszeiten und die Senkung von Wartungskosten realisieren. Die Ausfälle der Anlagen müssen deshalb auf ein Minimum reduziert werden. Die Zuverlässigkeit und Sicherheit sind dabei die wichtigsten Aspekte. In einem Pilotprojekt zur intelligenten Wartung bauen sie ihren Wettbewerbsvorsprung weiter aus [10, 11, 12, 13]. Sie vernetzten Aufzüge mit der Cloud und analysieren Daten aus Sensoren und Systemen – von der Motortemperatur über die Zuladung bis hin zu den Türmechanismen. Die dafür notwendige Technologie wurde in Zusammenarbeit mit Microsoft und dem IT-Dienstleister CGI entwickelt [14]. Das intelligente und vernetzte Monitoring-System basiert auf Windows Azure – einer Cloud Computing Plattform.

Eine mögliche technische Architektur zur Realisierung des Systems wird in Abbildung 1 dargestellt, die sich auch auf andere IoT Systeme übertragen lässt [15]. Geräte und Sensoren kommunizieren bidirektional mit einem Service Bus, einer Cloud-Messagingplattform. Er schützt die Anwendung vor temporären Spitzen, ermöglicht eine schnelle Kommunikation mit Millionen von Geräten, und verteilt Nachrichten an weitere Back-End Systeme. Die Rules Engine, eine oder mehrere Instanzen in der Cloud (Web- und Worker-Roles), laden die Daten mit konstanter Auslastung aus dem Services Bus (Queue-based Load Leveling Pattern [16]), führen Transformationen durch und leiten die Daten zur persistenten Speicherung und Weiterverarbeitung in die jeweiligen Speicher. Die Rules Engine bildet auch regelbasierten Prozesse der Bussines Logik ab und dient zur Verarbeitung von Resultaten des Azure Machine Learnings (Azure ML).

Architektur zur Analyse von IoT Daten auf Basis der Windows Azure Cloud PlattformAbbildung 1: Architektur zur Analyse von IoT Daten auf Basis der Azure Cloud Plattform

Die Berechnung der Vorhersagen erfolgt mit Hilfe von Azure ML. Einer der Vorteile von Azure ML ist, dass die populäre Programmiersprache R mit zahlreichen Modulen für statistisches Rechnen verwendet werden kann. Analysten erstellen und pflegen in einer Weboberfläche dynamische Modelle. Sie können vorhandene Module nutzen, neue mit R entwickeln, Daten laden, Berechnungen ausführen und die Ergebnisse in der Cloud abspeichern. Mit einem Internet-fähigen Endgerät haben Techniker Zugriff auf das responsive Dashboard, in dem für sie Visualisierungen, Fehlermeldungen und KPIs bereitgestellt werden. Das Dashboard basiert auf modernen Web Technologien (ASP.NET, HTML5, CSS3, MVC JavaScript).

Business Intelligence (BI) adressiert die beschreibende und diagnostische Analyse von Daten. Mit den Möglichkeiten des Data Science in der Cloud wird das klassische BI um skalierbare prädikative und präventieve Analyse erweitert [9]. Das Pilotprojekt der TKE zeigt wie durch das Zusammenspiel der Technologien eine signifikante Verbesserung der Geschäftsprozesse möglich ist. Die Zuverlässigkeit der Anlagen wurde verbessert, die Betriebszeit gesteigert und die Kosten für TKE und seine Kunden reduziert [12, 13]. Mit der vorgestellten Architektur werden nicht nur Kosten gesenkt – der Dienst kann auch an weitere Hersteller angebunden und das Wartungsgeschäft mit einem neuen, gewinnbringenden Geschäftsfeld (Data Science as a Service) erweitert werden.

PDF Version des Artikels:
M. L. Jung, D. Mihaljevic – Data Science as a Service

Referenzen

[1] B. Brown, M. Chui, and J. Manyika, Are you ready for the era of ‘big data’? , Oktober, 2011.
[Bibtex]
@misc{Brown:2011,
Author = {Brad Brown and Michael Chui and James Manyika},
Date-Added = {2015-03-25 06:18:22 +0000},
Date-Modified = {2015-06-07 20:52:55 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Oktober},
Title = {Are you ready for the era of 'big data'?},
Url = {http://www.mckinsey.com/insights/strategy/are_you_ready_for_the_era_of_big_data},
Year = {2011},
Bdsk-Url-1 = {http://www.mckinsey.com/insights/strategy/are_you_ready_for_the_era_of_big_data}}
[2] IDC, The Digital Universe of Opportunities: Rich Data and the Increasing Value of the Internet of Things , April, 2014.
[Bibtex]
@misc{IDC:2014,
Author = {IDC},
Date-Added = {2015-03-28 10:43:54 +0000},
Date-Modified = {2015-06-07 21:22:15 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {April},
Title = {The Digital Universe of Opportunities: Rich Data and the Increasing Value of the Internet of Things},
Url = {http://www.emc.com/leadership/digital-universe/2014iview/executive-summary.htm},
Year = {2014},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}
[3] L. Columbus, 84% Of Enterprises See Big Data Analytics Changing Their Industries’ Competitive Landscapes In The Next Year , Oktober, 2014.
[Bibtex]
@misc{Columbus:2014,
Author = {Louis Columbus},
Date-Added = {2015-03-28 10:49:55 +0000},
Date-Modified = {2015-06-07 21:05:05 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Oktober},
Title = {84% Of Enterprises See Big Data Analytics Changing Their Industries' Competitive Landscapes In The Next Year},
Url = {http://www.forbes.com/sites/louiscolumbus/2014/10/19/84-of-enterprises-see-big-data-analytics-changing-their-industries-competitive-landscapes-in-the-next-year/},
Year = {2014},
Bdsk-Url-1 = {http://www.forbes.com/sites/louiscolumbus/2014/10/19/84-of-enterprises-see-big-data-analytics-changing-their-industries-competitive-landscapes-in-the-next-year/}}
[4] L. Columbus, Roundup Of Analytics, Big Data & Business Intelligence Forecasts And Market Estimates , Juni, 2014.
[Bibtex]
@misc{Columbus:Roundup:2014,
Author = {Louis Columbus},
Date-Added = {2015-03-28 10:52:17 +0000},
Date-Modified = {2015-06-07 21:04:49 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Juni},
Title = {Roundup Of Analytics, Big Data & Business Intelligence Forecasts And Market Estimates},
Url = {http://www.forbes.com/sites/louiscolumbus/2014/06/24/roundup-of-analytics-big-data-business-intelligence-forecasts-and-market-estimates-2014/},
Year = {2014},
Bdsk-Url-1 = {http://www.forbes.com/sites/louiscolumbus/2014/10/19/84-of-enterprises-see-big-data-analytics-changing-their-industries-competitive-landscapes-in-the-next-year/}}
[5] Experton Group AG, Datenexplosion in der Unternehmens-IT , Mai, 2012.
[Bibtex]
@misc{BT:2012,
Author = {{Experton Group AG}},
Date-Added = {2015-03-28 11:31:09 +0000},
Date-Modified = {2015-06-07 21:23:16 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Mai},
Title = {Datenexplosion in der Unternehmens-IT},
Year = {2012},
Bdsk-Url-1 = {http://www.microsoft.com/de-de/server-cloud/customer-stories/thyssen-krupp-elevator.aspx}}
[6] W. Vogels, Observations on the Importance of Cloud-based Analytics , März, 2015.
[Bibtex]
@misc{Vogels:2015,
Author = {Werner Vogels},
Date-Added = {2015-03-28 10:55:03 +0000},
Date-Modified = {2015-06-07 21:04:22 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {M{\"a}rz},
Title = {Observations on the Importance of Cloud-based Analytics},
Url = {http://www.allthingsdistributed.com/2015/03/the-importance-of-cloud-based-analytics.html},
Year = {2015},
Bdsk-Url-1 = {http://www.forbes.com/sites/louiscolumbus/2014/10/19/84-of-enterprises-see-big-data-analytics-changing-their-industries-competitive-landscapes-in-the-next-year/}}
[7] G. Brunetti, T. Feld, L. Heuser, J. Schnitter, and C. Webel, Future Business Software: Current Trends in Business Software Development, Springer International Publishing, 2014.
[Bibtex]
@book{Brunetti:2014,
Author = {Brunetti, G. and Feld, T. and Heuser, L. and Schnitter, J. and Webel, C.},
Date-Added = {2015-03-28 10:57:53 +0000},
Date-Modified = {2015-03-28 10:58:06 +0000},
Isbn = {9783319041445},
Publisher = {Springer International Publishing},
Series = {Progress in IS},
Title = {Future Business Software: Current Trends in Business Software Development},
Url = {https://books.google.de/books?id=znq5BQAAQBAJ},
Year = {2014},
Bdsk-Url-1 = {https://books.google.de/books?id=znq5BQAAQBAJ}}
[8] A. Fox, R. Griffith, A. Joseph, R. Katz, A. Konwinski, G. Lee, D. Patterson, A. Rabkin, and I. Stoica, “Above the clouds: A Berkeley view of cloud computing,” Dept. Electrical Eng. and Comput. Sciences, University of California, Berkeley, Rep. UCB/EECS, vol. 28, p. 13, 2009.
[Bibtex]
@article{Fox:2009,
Author = {Fox, Armando and Griffith, Rean and Joseph, A and Katz, R and Konwinski, Andrew and Lee, Gunho and Patterson, D and Rabkin, Ariel and Stoica, Ion},
Date-Added = {2015-03-28 11:17:33 +0000},
Date-Modified = {2015-03-28 11:17:56 +0000},
Journal = {Dept. Electrical Eng. and Comput. Sciences, University of California, Berkeley, Rep. UCB/EECS},
Pages = {13},
Title = {Above the clouds: A Berkeley view of cloud computing},
Volume = {28},
Year = {2009}}
[9] V. Fontama, R. Barga, and W. H. Tok, Predictive Analytics with Microsoft Azure Machine Learning: Build and Deploy Actionable Solutions in Minutes, Apress, 2014.
[Bibtex]
@book{Fontama:2014,
Author = {Fontama, V. and Barga, R. and Tok, W.H.},
Date-Added = {2015-03-24 19:09:07 +0000},
Date-Modified = {2015-06-07 21:22:07 +0000},
Isbn = {9781484204467},
Publisher = {Apress},
Title = {Predictive Analytics with Microsoft Azure Machine Learning: Build and Deploy Actionable Solutions in Minutes},
Url = {https://books.google.de/books?id=WHh\_oAEACAAJ},
Year = {2014},
Bdsk-Url-1 = {https://books.google.de/books?id=WHh%5C_oAEACAAJ}}
[10] Microsoft, Internet der Dinge bei Thyssen Krupp Elevator , 2014.
[Bibtex]
@misc{Microsoft:2014,
Author = {Microsoft},
Date-Added = {2015-03-25 14:56:59 +0000},
Date-Modified = {2015-06-07 21:05:13 +0000},
Lastchecked = {M{\"a}rz 2015},
Title = {Internet der Dinge bei Thyssen Krupp Elevator},
Url = {http://www.microsoft.com/de-de/server-cloud/customer-stories/thyssen-krupp-elevator.aspx},
Year = {2014},
Bdsk-Url-1 = {http://www.microsoft.com/de-de/server-cloud/customer-stories/thyssen-krupp-elevator.aspx}}
[11] Microsoft, The Internet of Things gives the world’s cities a major lift , Juli, 2014.
[Bibtex]
@misc{Microsoft:MajorLift:2011,
Author = {Microsoft},
Date-Added = {2015-03-27 10:06:59 +0000},
Date-Modified = {2015-06-07 21:02:18 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Juli},
Title = {The Internet of Things gives the world's cities a major lift},
Url = {http://blogs.microsoft.com/firehose/2014/07/16/the-internet-of-things-gives-the-worlds-cities-a-major-lift/},
Year = {2014},
Bdsk-Url-1 = {http://www.microsoft.com/de-de/server-cloud/customer-stories/thyssen-krupp-elevator.aspx}}
[12] ThyssenKrupp, ThyssenKrupp Elevator entwickelt bahnbrechende Servicelösung , Juli, 2014.
[Bibtex]
@misc{ThyssenKrupp:2014,
Author = {ThyssenKrupp},
Date-Added = {2015-03-27 10:09:05 +0000},
Date-Modified = {2015-06-07 21:22:27 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Juli},
Title = {ThyssenKrupp Elevator entwickelt bahnbrechende Servicel{\"o}sung},
Url = {http://thyssenkrupp-elevator.com/Eintrag-anzeigen.104.0.html?&L=0&cHash=f3c078bb1eaf0465ac2bb69a5cf59673&tx_ttnews%5Btt_news%5D=488},
Year = {2014},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}
[13] ThyssenKrupp, CeBIT: ThyssenKrupp Elevator präsentiert innovative Servicelösung , März, 2015.
[Bibtex]
@misc{ThyssenKrupp:CBIT:2014,
Author = {ThyssenKrupp},
Date-Added = {2015-03-27 10:11:16 +0000},
Date-Modified = {2015-06-07 21:21:36 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {M{\"a}rz},
Title = {CeBIT: ThyssenKrupp Elevator pr{\"a}sentiert innovative Servicel{\"o}sung},
Url = {http://thyssenkrupp-elevator.com/Eintrag-anzeigen.104.0.html?&L=0&cHash=69a618b12ef7a0af31ef32229918561e&tx_ttnews%5Btt_news%5D=573},
Year = {2015},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}
[14] C. UK, ThyssenKrupp Elevator Americas: Using rich data insight to drive proactive, predictive maintenance , 2014.
[Bibtex]
@misc{CGI:2011,
Author = {CGI UK},
Date-Added = {2015-03-25 14:30:37 +0000},
Date-Modified = {2015-06-07 21:22:22 +0000},
Lastchecked = {M{\"a}rz 2015},
Title = {ThyssenKrupp Elevator Americas: Using rich data insight to drive proactive, predictive maintenance},
Url = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf},
Year = {2014},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}
[15] J. Shewchuk, Enabling Manufacturing Transformation in a Connected World , Dezember, 2014.
[Bibtex]
@misc{Shewchuk,
Author = {John Shewchuk},
Date-Added = {2015-03-28 09:47:44 +0000},
Date-Modified = {2015-06-07 21:03:17 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {Dezember},
Title = {Enabling Manufacturing Transformation in a Connected World},
Url = {https://opcfoundation.org/wp-content/uploads/2014/08/MS-2_Shewchuk_OPC_Foundation.pdf},
Year = {2014},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}
[16] Microsoft, Cloud Design Patterns: Prescriptive Architecture Guidance for Cloud Applications , January, 2014.
[Bibtex]
@misc{Mirosoft:AzurePatterns:2014,
Author = {Microsoft},
Date-Added = {2015-03-25 20:04:30 +0000},
Date-Modified = {2015-06-07 21:02:54 +0000},
Lastchecked = {M{\"a}rz 2015},
Month = {January},
Title = {Cloud Design Patterns: Prescriptive Architecture Guidance for Cloud Applications},
Url = {https://msdn.microsoft.com/de-de/library/dn568099.aspx},
Year = {2014},
Bdsk-Url-1 = {https://www.cgi.com/sites/default/files/pdf/thyssenkrupp-elevator-americas.pdf}}