Big Data: Wie Daten sprechen lernen

F?r jedes Unternehmen kann durch die Anwendung von Big Data-Technologien ein Nutzen erzielt werden. Hierzu gilt es die Daten beispielsweise aus der Produktion, die meist schon vorliegen, zu erfassen, zu analysieren und Modelle zu erzeugen, die zur Analyse der betrachteten technischen Produktionsprozesse und deren Verbesserung genutzt werden k?nnen. Im folgenden Artikel werden die Analyse und die Modellierung beschrieben.

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)


Liegen kausalrichtige Datens?tze vor, kann die eigentliche Analyse durchgef?hrt werden. Zur Analy123352 se gibt es eine ganze Reihe statistischer Methoden, die Korrelationen auffinden und diese in Form von Modellen f?r die Optimierung des Prozesses nutzbar machen k?nnen. Der einfachste Weg zum Auffinden von Ursachen und Wirkungen in einem Prozess sind Korrelationsanalysen. Es empfiehlt sich in jedem Falle als ersten Schritt immer die Anwendung dieser Verfahren, um eine Orientierung zu erhalten, welche Variablen wichtig f?r einen Prozess sind und welche nicht. Die Korrelationsverfahren sind f?r die Beurteilung unbekannter Zusammenh?nge sehr wichtig, sollten jedoch immer mit vorhandenem A-priori-Wissen ?ber Prozesszusammenh?nge kombiniert werden. Dieses Prozesswissen ist bei der Nutzung solcher Methoden wichtig, um sie mit Erfolg verwenden zu k?nnen. Zudem ist auch zu beachten, dass eine Korrelation keine Kausalit?t sein muss, jedoch auf eine solche hinweisen kann. Auch diese Beurteilung erfordert fundamentales Prozesswissen.
Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Korrelationen ermitteln

Im einfachsten Falle sind Korrelationen deutlich und linear; im komplexesten Falle sind sie nichtlinear und mehrdimensional. Die folgenden Methoden sind die typischen Verfahren zur Ermittlung von Korrelationen und gehen von sehr einfachen Verfahren bis zu den komplexesten Verfahren, die erst in den letzten Jahren entwickelt wurden. In einem zweidimensionalen Koordinatensystem werden die Daten entsprechend zweier, in der Regel stetig verteilter zu korrelierender Merkmale aufgetragen (Bild oben). Dieser Diagrammtyp ist nicht gut f?r die Darstellung von diskreten Daten geeignet, da die sich ergebende ?berlagerung der Punkte die Interpretation erschwert. Durch farbliche Codierung oder Symbole kann eine weitere Dimension in das Diagramm eingebracht werden. Das ist dann in der Regel ein diskretes Merkmal, zum Beispiel der Lieferant eines Rohstoffs. Das menschliche Auge erkennt in solchen Diagrammen sehr schnell auch nichtlineare Zusammenh?nge, die bei der linearen Korrelationsanalyse nicht erkannt werden. In der Datenanalyse entlang einer gesamten Produktionskette tritt immer wieder der Fall auf, dass man sehr viele Variablen hat und die Zahl der F?lle vergleichsweise gering ist.

Die Diskriminanzanalyse

In diesem Stadium der Analyse ist eine Vorauswahl der signifikanten Variablen mithilfe einer Diskriminanzanalyse sinnvoll. Dazu ist die Einteilung der Zielgr??e in verschiedene Klassen notwendig. Oftmals bietet sich die Einteilung in oder au?erhalb der Spezifikation an. Dabei ist bei gut gef?hrten Prozessen darauf zu achten, dass beide Gruppen f?r die Analyse ausreichend viele F?lle aufweisen. Die Diskriminenzanalyse sucht nach einer Linearkombination von Variablen, die eine m?glichst gute Trennung der Gruppen erlauben. Darstellen lassen sich die Trennungen mithilfe von kategorisierten Streudiagrammen und mithilfe von Parallelkoordinaten. Auch Entscheidungsb?ume mit den automatisch gew?hlten Variablen helfen beim Prozessverst?ndnis und bei der weiteren Analyse. Ebenso k?nnen Assoziations- und Abweichungsanalyse-Methoden helfen, um wichtige Einflussgr??en zu analysieren und Zusammenh?nge in charakteristischen Subgruppen zu identifizieren. Zur einfachen ersten Visualisierung der Zusammenh?nge zwischen mehreren Variablen in Prozessen kann es hilfreich sein, die Datens?tze in einem Parallelkoordinatensystem zu visualisieren. Insbesondere, wenn es einfache Zusammenh?nge gibt und wenige Datens?tze gegeben sind, kann diese Analysemethode sehr schnell hilfreich sein. Ebenso gibt sie eine erste Orientierung ?ber Zusammenh?nge. Durch F?rbung (Schichtung) verschiedener Produkttypen, Ausbeuten oder Betriebszust?nde lassen sich sofort einfache Zusammenh?nge erkennen, die in Betriebsanweisungen umgesetzt werden k?nnen. Entscheidungsb?ume sind eine Methode zur formalen Darstellung von Entscheidungsproblemen und Regeln zu deren L?sung. Werden sie aus Datens?tzen automatisch generiert, k?nnen sie Daten in formale Entscheidungen umwandeln und diese verdeutlichen.

Das könnte Sie auch interessieren

Vom 22. bis zum 26. April wird Hannover zum Schaufenster für die Industrie. Neben künstlicher Intelligenz sollen insbesondere Produkte und Services für eine nachhaltigere Industrie im Fokus stehen.‣ weiterlesen

Eine Umfrage von Hewlett Packard Enterprise (HPE) unter 400 Führungskräften in Industrie-Unternehmen in Deutschland zeigt, dass zwei Drittel der Befragten den Data Act als Chance wahrnehmen. Der Data Act stieß unter anderem bei Branchenverbänden auf Kritik.‣ weiterlesen

Deutsche Unternehmen nehmen eine zunehmende Bedrohung durch Cyber-Angriffe wahr. Das zeigt eine aktuelle Umfrage vom Markt- und Meinungsforschungsinstitut YouGov im Auftrag von 1&1 Versatel, an der mehr als 1.000 Unternehmensentscheider teilnahmen.‣ weiterlesen

Carbon Management-Technologien stehen im Fokus, um CO2-Emissionen zu reduzieren und zu managen. Die Rolle des Maschinenbaus und mögliche Entwicklungspfade betrachtet eine neue Studie des VDMA Competence Center Future Business.‣ weiterlesen

Nach Bitkom-Berechnungen fehlen bis zum Jahr 2040 mehr als 660.000 IT-Fachkräfte. Welche Maßnahmen helfen könnten, diesem Trend entgegenzuwirken, hat der Verband beleuchtet. Potenziale liegen unter anderem darin, mehr Frauen für IT-Berufe zu begeistern oder den Quereinstieg zu erleichtern.‣ weiterlesen

Laut einer Studie der Unternehmensberatung Bain & Company könnten Unternehmen ihre Produktivität durch digitale Tools, Industrie 4.0-Technologien und Nachhaltigkeitsmaßnahmen steigern. Deren Implementierung von folgt oft jedoch keiner konzertierten Strategie.‣ weiterlesen

Hohe Geschwindigkeit und hohe Erkennungsraten sind die Anforderungen an die Qualitätskontrolle in der Verpackungsbranche. Wie diese Anforderungen erreicht werden können, zeigt das Unternehmen Inndeo mit einem Automatisierungssystem auf Basis von industrieller Bildverarbeitung und Deep Learning.‣ weiterlesen

Jeder zweite Betrieb investiert laut einer Betriebsräte-Befragung der IG Metall zu wenig am Standort. Demnach verfügen rund 48 Prozent der Unternehmen über eine Transformationsstrategie. Zudem sehen die Betriebsräte ein erhöhtes Risiko für Verlagerungen.‣ weiterlesen

Ob es sich lohnt, ältere Maschinen mit neuen Sensoren auszustatten, ist oft nicht klar. Im Projekt 'DiReProFit' wollen Forschende dieses Problem mit künstlicher Intelligenz zu lösen.‣ weiterlesen

Ziel des neuen VDMA-Forums Manufacturing-X ist es, der zunehmenden Bedeutung von Datenräumen als Basis für neue, digitale Geschäftsmodelle Rechnung zu tragen. Wie der Verband mitteilt, soll das Forum auf dem aufbauen, was in der letzten Dekade durch das VDMA-Forum Industrie 4.0 erarbeitet wurde. ‣ weiterlesen

Wie kann eine Maschine lernen, sich in unserer Lebenswelt visuell zu orientieren? Mit dieser Frage setzen sich die Wissenschaftler am Deutschen Forschungsinstitut für Künstliche Intelligenz (DFKI) aktuell auseinander – und entwickeln Lösungen.‣ weiterlesen