Transcript
Page 1: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Mardi 7 octobre

Big data dans l'industrie, cimetière de données ou mine d'opportunités ?

Philippe MACK, PEPITe

Page 2: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Avec le soutien de :

Page 3: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 1 Slide | 1

Page 4: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 2 Slide | 2

Big data dans l'industrie, cimetière de données ou mine d'opportunités ?

Philippe MACK

CEO PEPITE SA

Page 5: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 3 Slide | 3

PRESENTATION

•  Pepite SA (www.pepite.be), founded in 2002 to provide predictive analytics applications in industry

•  Product quality (off-spec reduction)

•  Operational performance (utilities and raw materials efficiency) •  Maintenance performance (avoidance of excessive degradation of assets)

•  2 main assets : •  DATAmaestro :

»  cloud based data mining software »  provide the most advanced data mining technologies »  designed for users that are not data scientists »  based on 20+ years of research at the Machine Learning Laboratory at the University of

Liege, Belgium

•  ENERGYmaestro »  an energy performance management solution »  based on DATAmaestro »  change management and continuous improvement techniques

Page 6: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 4 Slide | 4

•  Dedicated people •  Project managers •  Process engineers

•  Development team

•  Dedicated tools •  DATAmaestro© data

mining & predictive analytics in the cloud

•  Technological partnerships

•  Focus on industry •  Pulp and paper, steel,

aluminium, cement, energy production, food and beverage, chemicals

WHO WE ARE? Introducing

Basis Weight: 45.0 lb PPS Smoothness: 1.20 µm Brightness: 74 % Color b*: 2.5 Gloss: 53 % Caliper: 58 µm Opacity: 94 %

Page 7: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 5 Slide | 5

THE BIG DATA DEFINITIONS…

Page 8: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 6 Slide | 6

BIG DATA IN PRACTICE

Velocity

Variety

Volume

“BIG” qualifier changes with time

“BIG” qualifier changes with application

Page 9: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 7 Slide | 7

WHY SO MUCH DATA ?

!$!0.01!!

!$!0.10!!

!$!1.00!!

!$!10.00!!

!$!100.00!!

!$1!000.00!!

!$10!000.00!!

!$100!000.00!!

!$1000!000.00!!

1975! 1980! 1985! 1990! 1995! 2000! 2005! 2010! 2015!

Cost%($/GB)%

Year%

Yearly%trend%of%storage%cost%

Cost/MB!

Year

Sto

rag

e co

sts

($/

Gb

)

1E#01%

1E+00%

1E+01%

1E+02%

1E+03%

1E+04%

1E+05%

1E+06%

1E+07%

1E+08%

1E+09%

1E+10%

1E+11%

1E+12%

1E+13%

1950% 1960% 1970% 1980% 1990% 2000% 2010% 2020%

!Cost!p

er!!G

igaFlops!(in!USD

)!

Year!Year

Cos

t p

er G

flop

s (i

n $

)

Page 10: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 8 Slide | 8

WHAT MEANS BIG DATA IN A PLANT ?

Laboratory Information Management Systems Enterprise

Resources Planning

Distributed Control System

Supervisory Control And Data Acquisition

Computerized Maintenance Management Systems

Historian

BUT still very difficult to have a consistent and holistic view of plant operational performance !

Manufacturing Execution Systems

Energy Management System

Page 11: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 9 Slide | 9

WHERE TO START…?

1.  Scope the problem and elaborate the right business question

2.  Understand what can impact this question 3.  Identify and collect the data that you could

help to formulate the answer(s) 4.  Create the data mining process that will

hopefully help you to design a quantitative answer

5.  Validate the answer and deploy it and check that you problem is indeed solve !

A good reference is the DMAIC (Define Measure Analyze Improve Control) improvement process

Page 12: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 10 Slide | 10

THE ANALYTICS (R)EVOLUTION

Source : GARTNER

Page 13: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 11 Slide | 11

THE PROCESS TO CREATE HIGHER VALUE FROM DATA WITH ANALYTICS

Cross Industry Standard Process for Data-Mining

Page 14: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 12 Slide | 12 Source : McKinsey

Page 15: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 13 Slide | 13 13

EXAMPLE VALUE EXTRACTED FROM « BIG DATA »

SOURCE: Electricity Consumers Resource Council estimated the cost of August 213 blackout in US between $4.5 and $8.2 billions

Predict and understand root causes of breaks in paper sheets

Collect data from hatcheries and provides analytics features to decrease malformation rates

Use historical data to predict real- time steel quality

Increase yield and reduce scrap by 5%

Paper making

Chemicals

Steel making

Hatcheries

Type of project Impact

Forecast dynamic security of transmission grid

Avoid costly curtailment of loads or generations; in the worst case avoid black-outs (several billions $)

Predictive Maintenance project to enhance O&M services

Reduced unplanned down time Cost saving of 10% (lower insurance costs)

Wind mills

Electrical network

Analyze drilling operation data to increase ROP

Faster drilling and less downtimes due to reduced well head failure

E&P drilling operations

Optimize use of energy in exothermic processes

Reduce shutdowns and increases OEE by 5%

Reduce energy costs by 15%

Reduce malformation rates of fish by 20%

Page 16: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 14 Slide | 14 14

PREDICTIVE MAINTENANCE

Page 17: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 15 Slide | 15

AGITATEUR

Page 18: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 16 Slide | 16

MAINTENANCE REPORT RECORDED IN THE CMMS

Date début plf Désignation

19/01/2004 avl rota gh bouche a/c 333

10/08/2004 Garniture A/C 333 monte en pression

26/10/2005 FUITE IMPORTANTE D HUILE RED A/C333

02/10/2006 Fuite externe à la garniture AC 333

05/02/2007 Garnit A/C 333 à remplacer (VC ds bout)

06/02/2007 Garnit A/C 333 à remplacer (VC ds bout)

20/04/2010 MONTEE PRESSION GM DE L AGT A/C 333

Select a critical event

Page 19: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 17 Slide | 17

PROCESS DATA RECORDED IN HISTORIAN

tag Descriptif Mesure Gamme Unités Rem FHA918F2 Débit min Garniture Hydraulique AGT AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON FLA918F1 Débit max Garniture Hydraulique AGT AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON LHA918L2 Niveau Haut Rs Garniture Mecanique AGT AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON LLA918L1 Niveau Bas Rs Garniture Mecanique AGT AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON MA518/J Puissance AGT Petite Vitesse AC WA218 analogique 0 100 % Puissance 0-100% par rapport à la puissance nominale MA518/M Puissance AGT grande Vitesse AC WA218 analogique 0 100 % Puissance 0-100% par rapport à la puissance nominale PA218P1 Pression 1 Autoclave WA218 analogique 0 25 bar Abs PA218P2 Pression 2 Autoclave WA218 analogique 0 25 bar Abs PA918P Pression Rs Garniture Mecanique AGT AC WA218 analogique 0 20 bar SA518S2 Vitesse réelle agitateur AC WA218 analogique 0 130 tr/min TA218T1 Température 1 Autoclave WA218 analogique 0 100 °C TA218T2 Température 2 Autoclave WA218 analogique 0 100 °C YA5181G Retour contacteur AGT Grande Vitesse AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON

YA5181P Retour contacteur AGT Petite Vitesse AC WA218 digitale 0 100 - info digitale 0 = OFF, 100 = ON

Hourly value from June 2008 to June 2010

Page 20: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 18 Slide | 18

Scatter-Plot of (TIME-UTC,Sa518S2) vs. AFTER-EVENT-1

TIME-UTC

Sa518S2

1,26E9 1,2625E9 1,265E9 1,2675E9 1,27E9 1,2725E9 1,275E9 0

25

50

75

100

125

BEFORE AFTER -AFTER-EVENT-1-

( Correlation factor (**) : 0,066 )

LABEL HISTORICAL RECORDS TO IDENTIFY SYSTEM CONFIGURATION BEFORE AND AFTER FAILURE

System states before failure After corrective actions

+/- 80 000 records

31/12/2009 20/5/2010

20/4/2010

Page 21: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 19 Slide | 19

WHAT ARE THE PARAMETERS THAT HAVE SIGNIFICANTLY CHANGED BEFORE VS AFTER CURATIVE ACTIONS ? Variable importance for AFTER-EVENT-1 with Extra-trees (4 rand. tests, 25 trees)

Attribute

% Info

Pa918P Lha918L2 Pa218P2 Pa218P1 Ta218T1 Ma518_M Ta218T2 Ma518_J Sa518S2 Fla918F1 Ya5181P Ya5181G Lla918L1 Fha918F2

0

4

8

12

16

20

24

28

32

36

40 •  PA918P : Pression Rs Garniture

Mécanique AGT AC WA218 •  LHA918L2 : Niveau Haut Rs Garniture

Mécanique AGT AC WA218

Page 22: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 20 Slide | 20

ABNORMAL BEHAVIOR OF A PRESSURE SENSOR Scatter-Plot of (TIME-UTC,Pa918P) vs. AFTER-EVENT-1

TIME-UTC

Pa918P

1,26E9 1,2625E9 1,265E9 1,2675E9 1,27E9 1,2725E9 1,275E9 0

1

2

3

4

5

6

BEFORE AFTER -AFTER-EVENT-1-

( Correlation factor (**) : 0,087 )Pressure level

Time

Page 23: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 21 Slide | 21

“CUSUM” ON HEALTH LEVEL INDICATOR VISUALIZATION CAN HELP TO DIAGNOSE VARIOUS LEVELS IN DEGRADATIONS

Close to failure zone ! Health level is lower ! the slope of “cusum” is lower

Healthy operations

Healthy operations after curative action

Cusum of health level indicator

Page 24: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 22 Slide | 22

IDENTIFICATION OF ABNORMAL CONDITIONS – SMART ALARMS CAN GENERATE WORK ORDERS IN THE CMMS

Dégradation!

Normal avant dégradation!

Dégradation!

Normal après action curative!

Page 25: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 23 Slide | 23

ROTATING MACHINE MONITORING FRAMEWORK

DB Historian

DB CMMS

DATAmaestro analytics

Web Portal

Smart Agents

Offline

Online

Weather data

IR image

Vibration analysis

Page 26: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 24 Slide | 24

END USER INTERFACE

Page 27: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 25 Slide | 25 25

PERFORMANCE ANALYTICS

Page 28: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 26 Slide | 26

ASU is divide into two separation columns : -  HP column -  LP column Data collected are located on the LP part of the process.

AIR SEPARATION UNIT

Page 29: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 27 Slide | 27

PRODUCTION OF O2 (IN NM3/HOUR)

Production of O2 (in Nm3/h)

O2 @input

O2 @output

Date

Page 30: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 28 Slide | 28

SPECIFIC ENERGY CONS. (KWH/T O2)

KWh/T

Date

Page 31: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 29 Slide | 29

LOAD CURVE FOR O2 PRODUCTION

Production O2

Spec. Energy

Page 32: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 30 Slide | 30

IDENTIFICATION OF CORRELATIONS BETWEEN MEASUREMENTS

Page 33: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 31 Slide | 31

WHAT EXPLAIN VARIABILITY OF KWH/T OF O2 ?

Page 34: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 32 Slide | 32

PREDICT THE KWH/T WITH OPERATION PARAMETERS

Learning set Test set

Page 35: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 33 Slide | 33

DIAGNOSTIC OF THE ERROR WITH THE CUSUM

Drift of the model starts here

Page 36: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 34 Slide | 34

WHAT EXPLAINS THE DRIFT USING NON POWER PARAMETERS

Automatic Pareto analysis (1) and decision tree (2) helps us to diagnose the drift and understand which and how parameters explain the drift. Obvioiusly T° plays a strong role in the model drift => we need to include it as an input in the model; we cannot change the T° !

1 2

Page 37: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 35 Slide | 35

KWH/T PREDICTIVE MODEL V2

By including the T° we are much better to predict the KWh/T

Page 38: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 36 Slide | 36

CONCLUSIONS

•  Big data combined with predictive analytics can help to improve performance and maintenance of production assets

•  Proven approach to support lean program or any other performance management program

•  Data collection/quality remains a major roadblock in industrial applications

•  Still a lack of understanding of what is big data and analytics

•  Still a big gap between data scientists and business people •  Always think about the business value! KISS and 80/20

rules…

Page 39: Big data dans l'industrie, cimetière de données ou mine d'opportunités ? par Philippe MACK | LIEGE CREATIVE, 07.10.14

Slide | 37 Slide | 37

QUESTIONS