Big Data: Wie Daten sprechen lernen

F?r jedes Unternehmen kann durch die Anwendung von Big Data-Technologien ein Nutzen erzielt werden. Hierzu gilt es die Daten beispielsweise aus der Produktion, die meist schon vorliegen, zu erfassen, zu analysieren und Modelle zu erzeugen, die zur Analyse der betrachteten technischen Produktionsprozesse und deren Verbesserung genutzt werden k?nnen. Im folgenden Artikel werden die Analyse und die Modellierung beschrieben.

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)


Liegen kausalrichtige Datens?tze vor, kann die eigentliche Analyse durchgef?hrt werden. Zur Analy123352 se gibt es eine ganze Reihe statistischer Methoden, die Korrelationen auffinden und diese in Form von Modellen f?r die Optimierung des Prozesses nutzbar machen k?nnen. Der einfachste Weg zum Auffinden von Ursachen und Wirkungen in einem Prozess sind Korrelationsanalysen. Es empfiehlt sich in jedem Falle als ersten Schritt immer die Anwendung dieser Verfahren, um eine Orientierung zu erhalten, welche Variablen wichtig f?r einen Prozess sind und welche nicht. Die Korrelationsverfahren sind f?r die Beurteilung unbekannter Zusammenh?nge sehr wichtig, sollten jedoch immer mit vorhandenem A-priori-Wissen ?ber Prozesszusammenh?nge kombiniert werden. Dieses Prozesswissen ist bei der Nutzung solcher Methoden wichtig, um sie mit Erfolg verwenden zu k?nnen. Zudem ist auch zu beachten, dass eine Korrelation keine Kausalit?t sein muss, jedoch auf eine solche hinweisen kann. Auch diese Beurteilung erfordert fundamentales Prozesswissen.
Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Mit der Diskriminanzanalyse k?nnen die relevanten Variablen eingegrenzt werden. (Bild: VDI Verein Deutscher Ingenieure e.V.)

Korrelationen ermitteln

Im einfachsten Falle sind Korrelationen deutlich und linear; im komplexesten Falle sind sie nichtlinear und mehrdimensional. Die folgenden Methoden sind die typischen Verfahren zur Ermittlung von Korrelationen und gehen von sehr einfachen Verfahren bis zu den komplexesten Verfahren, die erst in den letzten Jahren entwickelt wurden. In einem zweidimensionalen Koordinatensystem werden die Daten entsprechend zweier, in der Regel stetig verteilter zu korrelierender Merkmale aufgetragen (Bild oben). Dieser Diagrammtyp ist nicht gut f?r die Darstellung von diskreten Daten geeignet, da die sich ergebende ?berlagerung der Punkte die Interpretation erschwert. Durch farbliche Codierung oder Symbole kann eine weitere Dimension in das Diagramm eingebracht werden. Das ist dann in der Regel ein diskretes Merkmal, zum Beispiel der Lieferant eines Rohstoffs. Das menschliche Auge erkennt in solchen Diagrammen sehr schnell auch nichtlineare Zusammenh?nge, die bei der linearen Korrelationsanalyse nicht erkannt werden. In der Datenanalyse entlang einer gesamten Produktionskette tritt immer wieder der Fall auf, dass man sehr viele Variablen hat und die Zahl der F?lle vergleichsweise gering ist.

Die Diskriminanzanalyse

In diesem Stadium der Analyse ist eine Vorauswahl der signifikanten Variablen mithilfe einer Diskriminanzanalyse sinnvoll. Dazu ist die Einteilung der Zielgr??e in verschiedene Klassen notwendig. Oftmals bietet sich die Einteilung in oder au?erhalb der Spezifikation an. Dabei ist bei gut gef?hrten Prozessen darauf zu achten, dass beide Gruppen f?r die Analyse ausreichend viele F?lle aufweisen. Die Diskriminenzanalyse sucht nach einer Linearkombination von Variablen, die eine m?glichst gute Trennung der Gruppen erlauben. Darstellen lassen sich die Trennungen mithilfe von kategorisierten Streudiagrammen und mithilfe von Parallelkoordinaten. Auch Entscheidungsb?ume mit den automatisch gew?hlten Variablen helfen beim Prozessverst?ndnis und bei der weiteren Analyse. Ebenso k?nnen Assoziations- und Abweichungsanalyse-Methoden helfen, um wichtige Einflussgr??en zu analysieren und Zusammenh?nge in charakteristischen Subgruppen zu identifizieren. Zur einfachen ersten Visualisierung der Zusammenh?nge zwischen mehreren Variablen in Prozessen kann es hilfreich sein, die Datens?tze in einem Parallelkoordinatensystem zu visualisieren. Insbesondere, wenn es einfache Zusammenh?nge gibt und wenige Datens?tze gegeben sind, kann diese Analysemethode sehr schnell hilfreich sein. Ebenso gibt sie eine erste Orientierung ?ber Zusammenh?nge. Durch F?rbung (Schichtung) verschiedener Produkttypen, Ausbeuten oder Betriebszust?nde lassen sich sofort einfache Zusammenh?nge erkennen, die in Betriebsanweisungen umgesetzt werden k?nnen. Entscheidungsb?ume sind eine Methode zur formalen Darstellung von Entscheidungsproblemen und Regeln zu deren L?sung. Werden sie aus Datens?tzen automatisch generiert, k?nnen sie Daten in formale Entscheidungen umwandeln und diese verdeutlichen.

Das könnte Sie auch interessieren

Die Industrie arbeitet daran, die Barrieren zwischen IT und OT abzubauen. So können Unternehmen ihre Produktion effizienter und innovativer gestalten und im immer härter werdenden globalen Wettbewerb bestehen. Francis Chow von Red Hat erklärt, welche Rolle Open-Source-Technologien dabei spielen.‣ weiterlesen

3 Prozent der großen Industrieunternehmen setzen GenAI bereits großflächig ein, und rund ein Viertel hat erste Pilotprojekte gestartet. Laut einer Untersuchung der Unternehmensberatung McKinsey kann die Mehrheit der Unternehmen den Mehrwert der Technologie für den Unternehmenserfolg bislang aber noch nicht beziffern.‣ weiterlesen

Ein Bericht von ABI Research und Palo Alto Networks über den Stand der OT-Sicherheit zeigt, dass im vergangenen Jahr eines von vier Industrieunternehmen seinen Betrieb aufgrund eines Cyberangriffs vorübergehend stilllegen musste. Die Komplexität beim Einsatz von OT-Sicherheitslösungen stellt für die Befragten das größte Hindernis dar.‣ weiterlesen

Für dauerhafte Wettbewerbsfähigkeit müssen deutsche Hersteller angesichts weiterhin drohender Rezession und hoher Energiekosten die nächste Stufe der Digitalisierung erreichen. Die Mehrheit der Unternehmen bereitet sich in diesem Zug auf Smart Manufacturing vor, wie eine von Statista durchgeführte und Avanade beauftragte Studie zeigt.‣ weiterlesen

Vom 22. bis zum 26. April wird Hannover zum Schaufenster für die Industrie. Neben künstlicher Intelligenz sollen insbesondere Produkte und Services für eine nachhaltigere Industrie im Fokus stehen.‣ weiterlesen

Eine Umfrage von Hewlett Packard Enterprise (HPE) unter 400 Führungskräften in Industrie-Unternehmen in Deutschland zeigt, dass zwei Drittel der Befragten den Data Act als Chance wahrnehmen. Der Data Act stieß unter anderem bei Branchenverbänden auf Kritik.‣ weiterlesen

Mit der Do-it-yourself-Automatisierung sollen Unternehmen ihre Automatisierungskonzepte selbst gestalten können. Die Komponenten dafür werden über eine Plattform bereitgestellt. Etienne Lacroix, CEO der DIY-Plattform Vention erklärt das Konzept.‣ weiterlesen

Fraunhofer-Forschende haben für Fahrer und Fahrerinnen von Baumaschinen einen Helm mit integriertem Beschleunigungssensor entwickelt. Die Helm-Sensorik misst die Vibrationen der Baumaschinen. Die Sensorsignale werden analysiert, eine Software zeigt die Belastung für den Menschen an.‣ weiterlesen

Deutsche Unternehmen nehmen eine zunehmende Bedrohung durch Cyber-Angriffe wahr. Das zeigt eine aktuelle Umfrage vom Markt- und Meinungsforschungsinstitut YouGov im Auftrag von 1&1 Versatel, an der mehr als 1.000 Unternehmensentscheider teilnahmen.‣ weiterlesen

Carbon Management-Technologien stehen im Fokus, um CO2-Emissionen zu reduzieren und zu managen. Die Rolle des Maschinenbaus und mögliche Entwicklungspfade betrachtet eine neue Studie des VDMA Competence Center Future Business.‣ weiterlesen

Rund 2.700 Aussteller aus mehr als 50 Ländern werden vom 10. bis 14. Juni zur Achema in Frankfurt erwartet. Mit mehr als 1.000 Rednern setzt das begleitende Kongress- und Bühnenprogramm darüber hinaus Impulse für eine erfolgreiche Transformation der Prozessindustrie. An allen fünf Messetagen sollen zudem Angebote für den Nachwuchs zur Zukunftssicherung der Branche beitragen.‣ weiterlesen