Jekyll2022-06-01T20:19:26+00:00https://42ways.github.io/feed.xml42ways GmbHAt 42ways we fully support our customers on their journey from good ideas to great softwareOLAP - Online Analytical Processing2022-04-04T00:00:00+00:002022-04-04T00:00:00+00:00https://42ways.github.io/wording/2022/04/04/olap<p><strong>OLAP - Online Analytical Processing</strong> ist ein Ansatz zur Auswertung von Daten mittels <strong>multidimensionaler Datenanalyse</strong>.</p>
<p><strong>OLAP</strong> zählt zu den analytischen Informationssystemen und kann weiterhin den <strong>hypothesengestützten Analysemethoden</strong> zugeordnet werden.
Demnach muss der Analyst vor der eigentlichen Untersuchung wissen, welche Anfragen er an das <strong>OLAP-System</strong> stellen möchte.
Seine Hypothesen werden dann durch das <strong>Analyseergebnis</strong> bestätigt oder widerlegt.</p>
<p><img src="/assets/images/42_OLAP.jpeg" alt="image-middle" class="align-center" width="80%" /></p>
<p>Die zu analysierenden Datenbestände bezieht das <strong>OLAP-System</strong> entweder direkt aus <strong>operativen Datenbeständen</strong> (z.B. CRM oder ERP-Systemen),
oder bei größeren Datenbeständen aus einem zentralen <a href="/wording/2022/03/22/datawarehouse.html"><strong>Data Warehouse</strong></a>.</p>
<p>Die Modellierung der Daten erfolgt über die Festlegung von beliebig vielen <strong>Dimensionen</strong>,
anhand derer die Daten kategorisiert werden können. So kann beispielsweise der Umsatz nach den Dimensionen Region, Kunde, Jahr, Land oder Produkt ausgewertet werden.</p>
<p>Ergebnis ist eine <strong>Kennzahl</strong> der Schnittmengen der Dimensionen.
Die Darstellung der Dimensionen erfolgt meist über den so genannten <strong>OLAP-Cube</strong> (Datenwürfel).
Dieser folgt einer <strong>multidimensionalen und datenpunktorientierten Logik</strong>.
Jeder <strong>OLAP-Würfel</strong> verfügt über mindestens eine, oder aber auch bis zu Hunderten von Kennzahlen,
die aus den gespeicherten Informationen abgeleitet werden.</p>
<p>Das Hauptziel des <strong>OLAP - Online Analytical Processing</strong> ist es, informationsbasierte <strong>Entscheidungsgrundlagen</strong> durch die multidimensionale Betrachtung
der zu Grunde liegenden Daten zu schaffen. Typischerweise werdern <strong>OLAP</strong> Systeme daher für Management, Controlling, Produktion, Finanzbuchhaltung, H&R etc. eingesetzt.</p>
<p><strong>Vorteile von OLAP:</strong></p>
<ul>
<li>Durchführung <strong>komplexer Analysen</strong>, die ein sehr hohes Datenaufkommen verursachen</li>
<li><strong>Vielschichtige</strong> Betrachtung von Daten</li>
<li>Schaffung von <strong>Transparenz</strong> in Datenbeständen</li>
<li>Kombination von heterogenen <strong>Datenbeständen</strong></li>
<li>Basis für <a href="/wording/2022/03/14/bi.html"><strong>Business Intelligence</strong></a> Anwendungen</li>
</ul>
<p>Unser Lese-Tipp: <a href="https://www.computerweekly.com/de/definition/Online-Analytical-Processing-OLAP">Online Analytical Processing (OLAP)</a></p>OLAP - Online Analytical Processing ist ein Ansatz zur Auswertung von Daten mittels multidimensionaler Datenanalyse.Data Warehouse2022-03-22T00:00:00+00:002022-03-22T00:00:00+00:00https://42ways.github.io/wording/2022/03/22/datawarehouse<p>Ein <strong>Data Warehouse</strong> ist eine <strong>strukturierte Sammlung</strong>, Zusammenführung und Archivierung aller in einem Unternehmen oder Unternehmensbereich
vorhandenen Daten, diese werden dann konsolidiert, verdichtet, analysiert und zur <strong>Entscheidungsfindung</strong> aufbereitet.</p>
<p>Hauptnutzen des <strong>Data Warehouse</strong> sind demnach die vielfältigen <strong>Auswertungsmöglichkeiten</strong> im Hinblick auf <strong>Unternehmenskennzahlen</strong> und spezielle Reports.</p>
<p><strong>Data Warehousing kann in vier Teilprozesse untergliedert werden:</strong></p>
<ul>
<li><strong>Datenbeschaffung</strong> - Beschaffung und Extraktion der Daten aus heterogenen Datenquellen</li>
<li><strong>Datenhaltung</strong> - Speicherung und Archivierung der Daten</li>
<li><strong>Datenversorgung</strong> - Bereitstellung der Daten für nachgelagerte Systeme</li>
<li><strong>Datenauswertung</strong> - Analysen und Auswertungen der Daten</li>
</ul>
<p>Das <strong>Data Warehouse</strong> stellt demzufolge ein <strong>zentrales Datenbanksystem</strong> dar, das zu Analysezwecken im Unternehmen einsetzbar ist.
Die bereitgestellten Daten lassen sich nach bestimmten Mustern analysieren und zur Ermittlung von betrieblichen Kennzahlen einsetzen.</p>
<p><strong>Vorteile des Data Warehouse im Unternehmen:</strong></p>
<ul>
<li>Globale Sicht auf die <strong>zentral</strong> abgelegten Daten</li>
<li>Schnelle und <strong>flexible</strong> Bereitstellung von Daten für Statistiken, Reports und Kennzahlen</li>
<li>Ermittlung von <strong>Zusammenhängen</strong> und Mustern</li>
<li>Schaffung von <strong>Transparenz</strong> für unternehmerische Entscheidungen</li>
<li>Bereitstellung umfangreicher <strong>Informationen</strong> zu Geschäftsobjekten</li>
</ul>
<p><strong>Beispiele aus der Praxis - STIWAs Lösung zur Anlagenüberwachung - Intelligente Analysesoftware mit Data Warehouse</strong></p>
<blockquote>
<p><strong>STIWA</strong>, ein führender Hersteller im Bereich <strong>Hochleistungsautomation</strong>, hat eine passende Lösung für die Verarbeitung von großen Datenmengen
<strong>(<a href="/wording/2022/01/20/bigdata.html">Big Data</a>)</strong>: Ein spezielles <strong>Datenanalysetool</strong> mit integriertem Data Warehouse, welches die Daten nicht nur erfasst
und miteinander verknüpft, sondern auch visualisiert und auswertet. Dafür muss die Software in die Produktionsanlagen bis auf Komponentenebene hineinzoomen können.</p>
<p>Dies setzt eine automatische und lückenlose Erfassung von Maschinen-, Prozess- und Produktdaten voraus.</p>
<p>Ein Ziel ist die <strong>Gesamteffektivität</strong> der Anlage zu erhöhen, STIWA rechnet hier mit einer durchschnittlichen Steigerung um bis zu 15 Prozent.</p>
<p>Ferne können durch eine <strong>genaue Analyse und Auswertung</strong> von ungeplanten Stillständen und Fehlern auch die Gesamtlaufzeit der Anlage sowie Instandhaltungsintervalle optimiert werden.</p>
<p>– <a href="https://www.bigdata-insider.de/7-beispiele-fuer-erfolgreiche-bi-und-big-data-projekte-a-752259/">7 Beispiele für erfolgreiche BI- und Big-Data-Projekte</a></p>
</blockquote>Ein Data Warehouse ist eine strukturierte Sammlung, Zusammenführung und Archivierung aller in einem Unternehmen oder Unternehmensbereich vorhandenen Daten, diese werden dann konsolidiert, verdichtet, analysiert und zur Entscheidungsfindung aufbereitet.NULL-Werte ohne Ausnahmen2022-03-21T00:00:00+00:002022-03-21T00:00:00+00:00https://42ways.github.io/tipps/2022/03/21/nullable<p>Welcher Softwareentwickler kennt das nicht?</p>
<p>Trotz des <a href="https://de.wikipedia.org/wiki/Gesetz_von_Demeter">Gesetz von Demeter</a> kommt es immer wieder vor,
dass man eine Methode an einem Objekt aufrufen möchte, welches man selbst wiederum erst durch einen Methodenaufruf erhalten hat.</p>
<p>Ein typisches Beispiel hierfür ist die Abfrage der Postleitzahl der Adresse einer Person, um beispielsweise Briefe für einen optimierten Versand
nach den Postleitzahlen sortiert zu drucken.</p>
<p>In <code class="language-plaintext highlighter-rouge">Java</code> würde das dann etwa so aussehen:</p>
<div class="language-java highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="kd">public</span> <span class="nc">PlzType</span> <span class="nf">getPlzForPerson</span><span class="o">(</span><span class="nc">Person</span> <span class="n">person</span><span class="o">)</span> <span class="o">{</span>
<span class="k">return</span> <span class="n">person</span><span class="o">.</span><span class="na">getAddress</span><span class="o">().</span><span class="na">getPLZ</span><span class="o">();</span>
<span class="o">}</span>
</code></pre></div></div>
<p>Das Problem dabei: Angefangen vom übergebenen Objekt <code class="language-plaintext highlighter-rouge">person</code> können alle Zwischenergebnisse dieser Kette von Aufrufen möglicherweise leer sein, also <code class="language-plaintext highlighter-rouge">null</code>.</p>
<p>Um hier keine <code class="language-plaintext highlighter-rouge">NullPointerException</code> (sog. NPE) zu erhalten, muss man also alle Werte prüfen und endet damit bei deutlich komplexerem Code, selbst bei unserem kleinen
Beispiel mit nur zwei aufeinanderfolgenden Methodenaufrufen in der Kette:</p>
<div class="language-java highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="kd">public</span> <span class="nc">PlzType</span> <span class="nf">getPlzForPerson</span><span class="o">(</span><span class="nc">Person</span> <span class="n">person</span><span class="o">)</span> <span class="o">{</span>
<span class="k">if</span> <span class="o">(</span><span class="n">person</span> <span class="o">==</span> <span class="kc">null</span><span class="o">)</span>
<span class="k">return</span> <span class="kc">null</span><span class="o">;</span>
<span class="k">else</span> <span class="nf">if</span> <span class="o">(</span><span class="n">person</span><span class="o">.</span><span class="na">getAdress</span><span class="o">()</span> <span class="o">==</span> <span class="kc">null</span><span class="o">)</span>
<span class="k">return</span> <span class="kc">null</span><span class="o">;</span>
<span class="k">else</span>
<span class="k">return</span> <span class="n">person</span><span class="o">.</span><span class="na">getAddress</span><span class="o">().</span><span class="na">getPLZ</span><span class="o">();</span>
<span class="o">}</span>
</code></pre></div></div>
<p>Seit der Einführung der Klasse <a href="https://docs.oracle.com/javase/8/docs/api/java/util/Optional.html"><code class="language-plaintext highlighter-rouge">Optional</code></a> in <code class="language-plaintext highlighter-rouge">Java 8</code> gibt es jedoch eine
Möglichkeit, die Behandlung von <code class="language-plaintext highlighter-rouge">null</code>-Werten in solchen Methodenketten um einiges kompakter zu formulieren:</p>
<div class="language-java highlighter-rouge"><div class="highlight"><pre class="highlight"><code><span class="kd">public</span> <span class="nc">PlzType</span> <span class="nf">getPlzForPerson</span><span class="o">(</span><span class="nc">Person</span> <span class="n">person</span><span class="o">)</span> <span class="o">{</span>
<span class="nc">Optional</span><span class="o">.</span><span class="na">ofNullable</span><span class="o">(</span><span class="n">person</span><span class="o">).</span>
<span class="n">map</span><span class="o">(</span><span class="nl">Person:</span><span class="o">:</span><span class="n">getAddress</span><span class="o">).</span>
<span class="n">map</span><span class="o">(</span><span class="nl">Address:</span><span class="o">:</span><span class="n">getPLZ</span><span class="o">).</span>
<span class="n">orElse</span><span class="o">(</span><span class="kc">null</span><span class="o">);</span>
<span class="o">}</span>
</code></pre></div></div>
<p>Anstelle von <code class="language-plaintext highlighter-rouge">null</code> geben die <code class="language-plaintext highlighter-rouge">map</code>-Methoden von <code class="language-plaintext highlighter-rouge">Optional</code> einfach ein leeres <code class="language-plaintext highlighter-rouge">Optional</code>-Objekt zurück. <code class="language-plaintext highlighter-rouge">orElse</code> gibt dann am Ende den Inhalt des <code class="language-plaintext highlighter-rouge">Optional</code> zurück,
oder eben den hier angegebenen Default-Wert.</p>
<p>Statt des abschließenden <code class="language-plaintext highlighter-rouge">orElse</code>, welches den Rückgabewert im Falle eines <code class="language-plaintext highlighter-rouge">null</code> irgendwo in der Aufrufkette festlegt, kann man auch die Methoden
<code class="language-plaintext highlighter-rouge">orElseGet</code> (Aufruf einer anderen Funktion) oder <code class="language-plaintext highlighter-rouge">orElseThrow</code> (werfen einer Exception) verwenden.</p>
<p>Die ebenfalls auf der <a href="https://en.wikipedia.org/wiki/Java_virtual_machine">JVM (Java Virtual Machine)</a> basierende Programmiersprache <code class="language-plaintext highlighter-rouge">Kotlin</code> vermeidet
das Problem der <code class="language-plaintext highlighter-rouge">NullPointerException</code> weitestgehend, indem sie <code class="language-plaintext highlighter-rouge">null</code> zunächst einmal gar nicht als Wert einer Variable zulässt.</p>
<p>Man kann allerdings Variablen auch in <code class="language-plaintext highlighter-rouge">Kotlin</code> explizit als <em>nullable</em> deklarieren, zudem können sich <code class="language-plaintext highlighter-rouge">null</code>-Werte natürlich auch durch die Interaktion mit
Java-Code einschleichen.</p>
<p>Die Sprache macht den Zugriff dann aber mit ihrem <em>Safe Call Operator</em> recht einfach und elegant:</p>
<div class="language-kotlin highlighter-rouge"><div class="highlight"><pre class="highlight"><code> <span class="n">person</span><span class="o">?.</span><span class="n">address</span><span class="o">?.</span><span class="n">plz</span>
</code></pre></div></div>
<p>Zudem kann mit Hilfe der Nutzung des <a href="https://kotlinlang.org/docs/null-safety.html#elvis-operator">Elvis-Operators</a> <code class="language-plaintext highlighter-rouge">?:</code> ebenfalls ein Default-Wert angegeben werden.</p>
<p>Ähnliche Mechanismen gibt es auch in vielen anderen Programmiersprachen, beispielsweise in <code class="language-plaintext highlighter-rouge">Ruby</code>.</p>
<p>Seit der Ruby-Version 2.3.0 kann man mit Hilfe des <em>Safe Navigation Operator</em> anstatt</p>
<div class="language-ruby highlighter-rouge"><div class="highlight"><pre class="highlight"><code> <span class="n">person</span><span class="p">.</span><span class="nf">address</span><span class="p">.</span><span class="nf">plz</span> <span class="k">if</span> <span class="n">person</span> <span class="o">&&</span> <span class="n">person</span><span class="p">.</span><span class="nf">plz</span>
</code></pre></div></div>
<p>auch einfach</p>
<div class="language-ruby highlighter-rouge"><div class="highlight"><pre class="highlight"><code> <span class="n">person</span><span class="o">&</span><span class="p">.</span><span class="nf">address</span><span class="o">&</span><span class="p">.</span><span class="nf">plz</span>
</code></pre></div></div>
<p>schreiben.</p>
<p>Eine Übersicht zum <a href="https://en.wikipedia.org/wiki/Safe_navigation_operator">Safe Navigation Operator</a> in verschiedenen Sprachen
ist auf <a href="https://en.wikipedia.org/wiki/Safe_navigation_operator">Wikipedia</a> zu finden.</p>
<p>Der Erfinder der <code class="language-plaintext highlighter-rouge">null</code>-Referenz, <a href="https://en.wikipedia.org/wiki/Tony_Hoare">C.A.R. Hoare</a>, hat sich übrigens 2009 auf einer Software-Konferenz
bei der Community für diesen <a href="https://en.wikipedia.org/wiki/Tony_Hoare#Apologies_and_retractions">Billion Dollar Mistake</a> offiziell entschuldigt.</p>Welcher Softwareentwickler kennt das nicht?Business Intelligence2022-03-14T00:00:00+00:002022-03-14T00:00:00+00:00https://42ways.github.io/wording/2022/03/14/bi<p>Unter <strong>Business Intelligence</strong> versteht man die <strong>Integration</strong> von unternehmensbezogenen Prozessen, Strategien und Techniken,
um aus verteilten und komplexen Unternehmens- und Marktdaten <strong>erfolgskritisches Wissen</strong> über Status, Potenziale und Perspektiven zu erarbeiten und zu visualisieren.</p>
<p><strong>Die Ziele dabei sind</strong></p>
<ul>
<li>die Beschleunigung und Verbesserung von <strong>Entscheidungsprozessen</strong></li>
<li>die Optimierung interner <strong>Geschäftsprozesse</strong></li>
<li>die Steigerung der betrieblichen <strong>Effizienz</strong> und</li>
<li>die Generierung von <strong>Wettbewerbsvorteilen</strong></li>
</ul>
<p><strong>Business Intelligence</strong> umfasst daher eine Vielzahl von Anwendungen, Technologien (Bsp. Datenaufbereitung mittels <a href="/wording/2022/04/04/olap.html"><strong>OLAP</strong></a>)
und Methoden (Software und IT-Systeme), die es Unternehmen ermöglichen, Daten aus internen und externen Quellen zu sammeln, diese für die Analyse vorzubereiten,
Abfragen zu entwickeln und auszuführen, sowie Berichte und Dashboards (<strong>Datenvisualisierungen</strong>) zu erstellen.</p>
<p>Die Analyseergebnisse können so sowohl den relevanten <strong>Entscheidungsträgern</strong> als auch Mitarbeitern zur Verfügung gestellt werden.</p>
<p>Gerade im Zusammenhang mit großen und komplexen Datenmengen (<a href="/wording/2022/01/20/bigdata.html"><strong>Big Data</strong></a>) wird die analytische Komponente immer wichtiger.</p>
<p>Hinzu kommt der Paradigmenwechsel (Stichwort: <a href="/wording/2021/11/16/industrie4.0.html"><strong>Industrie 4.0</strong></a>),
vom automatischen System zur Verbreitung von Informationen an die verschiedenen Bereiche von Industrie-, Wissenschafts- und Regierungsorganisationen
hin zum <strong>Business Performance Measurement</strong>.</p>Unter Business Intelligence versteht man die Integration von unternehmensbezogenen Prozessen, Strategien und Techniken, um aus verteilten und komplexen Unternehmens- und Marktdaten erfolgskritisches Wissen über Status, Potenziale und Perspektiven zu erarbeiten und zu visualisieren. Die Ziele dabei sindAbgrenzung Data Mining & Big Data2022-02-24T00:00:00+00:002022-02-24T00:00:00+00:00https://42ways.github.io/wording/2022/02/24/datam-vs-bigdata<p><strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> befasst sich ausschließlich mit <strong>großen Datenmengen</strong>, welche,
aufgrund ihrer <strong>Komplexität</strong>, mit herkömmlichen Technologien nicht effizient analysiert werden können.</p>
<p><strong><a href="/wording/2022/02/17/datamining.html">Data Mining</a></strong> wird ebenfalls häufig bei großen Datenmengen eingesetzt, ist aber nicht auf <strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> beschränkt.</p>
<p><strong><a href="/wording/2022/02/17/datamining.html">Data Mining</a></strong> bezieht sich vielmehr auf den eigentlichen Vorgang
der Analyse von Daten sowie auf die <strong>Erkennung vorhandener Muster</strong>.
Es kann also auch bei <strong>kleineren Datenmengen</strong> eingesetzt werden.</p>
<p><img src="/assets/images/42_datamingvbigdata.jpg" alt="image-middle" class="align-center" width="80%" /></p>
<p>Während <strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> also neben großen Datenmengen auch eine geeignete
technische Plattform für eine <strong>effiziente Verarbeitung</strong> liefern muss,
fokussiert sich das <strong><a href="/wording/2022/02/17/datamining.html">Data Mining</a></strong> ausschließlich auf den Vorgang
der <strong>Generierung von Erkenntnissen</strong> aus den bestehenden Daten.</p>Big Data befasst sich ausschließlich mit großen Datenmengen, welche, aufgrund ihrer Komplexität, mit herkömmlichen Technologien nicht effizient analysiert werden können.Data Mining2022-02-17T00:00:00+00:002022-02-17T00:00:00+00:00https://42ways.github.io/wording/2022/02/17/datamining<p>Der Begriff <strong>Data Mining</strong> beschreibt einen Prozess, der mittels <strong>systematischer Nutzung</strong>
computergestützter Methoden, in bestehenden Datenbeständen Muster, Trends und Zusammenhänge
identifiziert und beschreibt.</p>
<p><img src="/assets/images/data-mining-4x3.jpg" alt="image-middle" class="align-center" width="80%" /></p>
<p>Ziel des Data Mining ist es, <strong>Hypothesen</strong> aus vorhandenen Bestandsdaten zu generieren.</p>
<p>Hier kommt es, im Zuge der <strong>Mustererkennung</strong>, zur Anwendung verschiedener <strong>Algorithmen</strong> und Verfahren
(Bsp. Lineare Regression).</p>
<p>Die eingesetzten Algorithmen basieren auf verschiedenen Methoden aus den Bereichen Statistik, Mathematik, und Informatik.</p>
<p>Data Mining beschreibt demnach einen <strong>interdisziplinären Prozess</strong>, bei welchem auch Verfahren
der <strong>künstlichen Intelligenz</strong> sowie des Maschinen Lernens zum Einsatz kommen,
um große Datenbestände <strong>(<a href="/wording/2022/01/20/bigdata.html">Big Data</a>)</strong>
hinsichtlich neuer <strong>Trends oder Muster</strong> zu untersuchen.</p>
<p>Innerhalb einer produzierenden Unternehmenseinheit dient Data Mining oftmals der <strong>Vorhersage</strong>
von Maschinenausfällen.</p>
<p>In diesem Zusammenhang wird auch von <strong>Predictive Maintenance</strong> gesprochen.
Mittels Data Mining sollen dabei Trends und Anomalien besser erkannt werden,
um so <strong>frühzeitig</strong> Vorhersagen über das Maschinenverhalten zu treffen.</p>
<p>Unternehmerische Entscheidungen können mit Hilfe des <strong>Data Mining</strong> deutlich <strong>zielführender</strong> getroffen werden.</p>Der Begriff Data Mining beschreibt einen Prozess, der mittels systematischer Nutzung computergestützter Methoden, in bestehenden Datenbeständen Muster, Trends und Zusammenhänge identifiziert und beschreibt.Data Lake2022-02-10T00:00:00+00:002022-02-10T00:00:00+00:00https://42ways.github.io/wording/2022/02/10/datalake<p>Ein <strong>Data Lake</strong> ist ein System, in welchem sehr große Datenmengen
<strong>(<a href="/wording/2022/01/20/bigdata.html">Big Data</a>)</strong>, aus unterschiedlichen Quellen,
im <strong>Rohdatenformat</strong> abgelegt sind.</p>
<p>Demnach können die gespeicherten Daten sowohl <strong>strukturiert</strong> (Bsp. text- oder zahlenbasierte
CSV- oder XML Dateien) als auch <strong>unstrukturiert</strong> (Bsp. Emails, Bilder, PDFs, Ton- oder Videoaufnahmen) sein.</p>
<p>Die enthaltenen Daten müssen demnach nicht vorab validiert oder umformatiert werden,
im Gegensatz zu normalen Datenbanken, werden alle Daten in Ihrem <strong>Ursprungsformat</strong> gespeichert.
Erst bei Nutzung der Daten erfolgt ggf. eine Formatierung und Strukturierung.</p>
<p>Ein <strong>Data Lake</strong> kann so als <strong>Gesamtspeicher für alle Unternehmensdaten</strong> verwendet werden und dient
somit als <strong>Grundlage</strong> für <strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> Analysen.</p>
<p>Anforderungsorientiert betrachtet muss der Data Lake demnach verschiedene Grundfunktionen bieten:</p>
<ul>
<li>Zunächst muss es möglich sein Daten in <strong>unterschiedlichsten Formaten</strong>, egal ob strukturiert oder
unstrukturiert abzulegen. Eine dezentrale Datenablage wird so vermieden.</li>
<li>Ferner muss ein Data Lake gängige <strong>Frameworks und Protokolle</strong> der Datenbanksysteme und -anwendungen
unterstützen, um eine Auswertung mittels <strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> Analysemethoden
zu ermöglichen.</li>
<li>Der Zugriff auf die Daten muss durch eine Kontrolle, den Vorgaben des <strong>Datenschutzes und der Datensicherheit</strong>,
entsprechen. Dies kann u.a. durch eine <strong>Verschlüsselung</strong> der Daten erfolgen.</li>
<li>Zusätzlich müssen Sicherungsmechanismen zur Wiederherstellung der Daten vorgewiesen werden können.</li>
</ul>Ein Data Lake ist ein System, in welchem sehr große Datenmengen (Big Data), aus unterschiedlichen Quellen, im Rohdatenformat abgelegt sind.Smart Factory2022-02-03T00:00:00+00:002022-02-03T00:00:00+00:00https://42ways.github.io/wording/2022/02/03/smartfactory<p>Die <strong>“intelligente Fabrik”</strong> (Smart Factory) ist die (zum Teil bereits realisierte)
<strong>Vision</strong> einer Fertigungsumgebung,
in welcher sich <strong>“intelligente Maschinen”</strong> und <strong>Logistiksysteme</strong> selbst organisieren.</p>
<p>Die <strong>“intelligenten Maschinen”</strong> sammeln dabei alle relevanten Produkt- und Prozessdaten
(<a href="/wording/2022/01/20/bigdata.html">Big Data</a>).
Die Steuerung der einzelnen Fertigungsschritte erfolgt durch
die Kommunikation dieser Daten mittels <strong>Vernetzung</strong> aller Produktionssysteme, Geschäftsprozesse und Engineering.</p>
<p>Es wird eine <strong>virtuelle Kopie</strong> der realen Produktion erzeugt. Die <strong>“intelligente Fabrik”</strong> kann so selbst
Anpassungen verschiedener Prozesse vornehmen (beispielsweise automatisches Nachbestellen von Teilen).</p>
<p>Nehmen wir beispielsweise eine Joghurt-Fabrik, hier könnten alle produktberührten Rohrleitungen mit
<strong>speziellen Sensoren</strong> versehen sein. Diese messen z.B. Temperatur und Druck des Mediums (hier der Joghurt).</p>
<p>Das gesamte Rohrleitungssystem kann demnach <strong>digital abgebildet</strong> werden und der Fluss des Mediums überwacht
und kontrolliert werden. Ferner könnte aus den <strong>Sensordaten</strong> (z.B. Druck und Temperatur)
auch die Viskosität berechnet werden.</p>
<p>Anhand dieser Daten, in Kombination mit den <strong>verfügbaren Maschinendaten</strong>
(z.B. der Pumpen) könnte dann per <strong>digitaler Steuerung</strong> in den Produktionsprozess eingegriffen werden.</p>
<p>So könnte die Drehzahl des Pumpenlaufrads und somit die Fördermenge der Marmelade angepasst werden.</p>
<p>Unser Lese-Tipp: https://www.vth-verband.de/technischer-handel/erfolgsgeschichten/wartung-digitalisieren/</p>Die “intelligente Fabrik” (Smart Factory) ist die (zum Teil bereits realisierte) Vision einer Fertigungsumgebung, in welcher sich “intelligente Maschinen” und Logistiksysteme selbst organisieren.Smart Data2022-01-27T00:00:00+00:002022-01-27T00:00:00+00:00https://42ways.github.io/wording/2022/01/27/smartdata<p><strong>Smart Data</strong> beschreibt Datenbestände,
die mit Hilfe von <strong>Algorithmen</strong> aus sehr großen Datenmengen <strong>(<a href="/wording/2022/01/20/bigdata.html">Big Data</a>)</strong> extrahiert wurden und sinnvoll strukturierte Informationen enthalten.</p>
<p><img src="/assets/images/42_smartdata.jpg" alt="image-middle" class="align-center" width="80%" /></p>
<p>Im Zuge dessen werden die Datenbestände vorab <strong>geordnet und analysiert</strong>, um sie für den Verbraucher nutzbar zu machen.</p>
<p><strong>Smart Data</strong> stellt demnach quasi eine <strong>Weiterentwicklung</strong> von <strong><a href="/wording/2022/01/20/bigdata.html">Big Data</a></strong> dar. Im Mittelpunkt steht hier die richtige Auswahl an Daten sowie deren <strong>sinnvolle Verwertung</strong>.</p>
<p>Ziel ist es mittels <strong>Smart Data</strong> die <strong>Geschwindigkeit</strong> und <strong>Qualität datengestützter Entscheidungen</strong> zu erhöhen.</p>
<p><strong>Smart Data</strong> kann genutzt werden, um aus Rohdaten neue Erkenntnisse zu gewinnen, aber auch um <strong>mathematische Modelle</strong> zu schaffen, die für die Analyse weiterer Daten verwendet werden können.</p>
<p><strong>Beispiel aus der Praxis</strong></p>
<blockquote>
<p>Mit dem Ziel effektiv <strong>Energie und Wasser zu sparen</strong> kommen in vielen Haushalten <strong>smarte Energiezähler</strong> zum Einsatz.</p>
<p>Die gesammelten und analysierten Verbrauchsdaten (Big Data) aus Wasser-, Gas- und Stromzähler, werden <strong>zielführend</strong> aufbereitet <strong>(Smart Data)</strong>.</p>
<p>Die Daten können mittels Funk, Stromleitung oder WLAN an das mobile oder stationäre Endgerät übermittelt werden. Der Nutzer kann nun, beispielsweise via APP auf dem Smartphone, die <strong>visualisierten Daten</strong> ansehen und auf einen Blick erkennen, wo der <strong>Hauptverbrauch</strong> von Energie und Wasser zu finden ist.</p>
<p>Dies ermöglicht eine <strong>individuelle</strong> Anpassung des Nutzungsverhaltens und demnach die Ausschöpfung von Einsparungspotentialen. Einsparpotenziale von bis zu 10 Prozent können so erreicht werden.</p>
<p>– <a href="https://www.focus.de/digital/experten/smart-data-fuenf-bereiche-in-denen-datenanalyse-heute-schon-unseren-alltag-veraendert_id_5863657.html">Smart Data - Fünf Bereiche, in denen Datenanalyse heute schon unseren Alltag verändert</a></p>
</blockquote>Smart Data beschreibt Datenbestände, die mit Hilfe von Algorithmen aus sehr großen Datenmengen (Big Data) extrahiert wurden und sinnvoll strukturierte Informationen enthalten.Big Data2022-01-20T00:00:00+00:002022-01-20T00:00:00+00:00https://42ways.github.io/wording/2022/01/20/bigdata<p><strong>Big Data</strong> beschreibt eine, meist sehr große, Datenmenge, welche aufgrund ihre <strong>Komplexität</strong>, <strong>Größe</strong> und/oder <strong>schwacher Strukturierung</strong> nicht effizient mit herkömmlicher Technologie verarbeitet werden kann.</p>
<p><img src="/assets/images/42_bigdata.jpg" alt="image-middle" class="align-center" width="80%" /></p>
<p>Damit einher geht die Definition einer leistungsstarken Technologie (beispielsweise <strong>Data & Process Mining</strong> oder <strong>Business Intelligence</strong>), welche in der Lage ist, eben genau diese <strong>Daten auszuwerten</strong>.</p>
<p>Basis dieser Technologie sind immer <strong>statistisch mathematische Methoden</strong> zur Erkennung von Mustern.</p>
<p><strong>“Big Data” lässt sich durch 5 Dimensionen darstellen:</strong></p>
<ul>
<li>Volume (Datenmenge bzw. -volumen)</li>
<li>Variety (Bandbreite der Datenquellen und -typen)</li>
<li>Velocity (Geschwindigkeit der Datenübertragung)</li>
<li>Validity (Neu generierte Qualität der Daten)</li>
<li>Value (Geschaffener Mehrwert)</li>
</ul>
<p><strong>Beispiel aus der Praxis</strong></p>
<blockquote>
<p>Die <strong>Saarstahl AG</strong> wird mit der <strong>iPRODICT-Lösungsarchitektur</strong> in die Lage versetzt, die während der Produktion erhobenen <strong>Mess- und Videodaten</strong> (Big Data) in <strong>Echtzeit</strong> zu verarbeiten und proaktiv auf Basis von <strong>Vorhersagen</strong> zu agieren.</p>
<p>Analyse-, Empfehlungs- und Dashboard-Techniken vermitteln den Prozessverantwortlichen <strong>detaillierte Einblicke</strong> in laufende Produktionsprozesse und können Entscheidungen schneller und besser fundiert treffen.</p>
<p>Das Walzwerk kann den Ausschuss verringern und die <strong>Kapazität besser auslasten</strong>. Das bedeutet eine deutliche Kostenreduktion.</p>
<p>–<a href="https://www.bitkom.org/sites/default/files/file/import/151229-Big-Data-und-GM-Innovationen.pdf">Big Data und Geschäftsmodell - Innovationen in der Praxis</a></p>
</blockquote>Big Data beschreibt eine, meist sehr große, Datenmenge, welche aufgrund ihre Komplexität, Größe und/oder schwacher Strukturierung nicht effizient mit herkömmlicher Technologie verarbeitet werden kann.