Gemmer du dine data?

…eller opbevarer du dem bare midlertidigt?

Jeg tror de fleste med daglig gang i forskellige grene af eksperimentel videnskab kender til problemet med håndtering af data. Det er som om, det er et punkt, hvor teoretikerne bare er 10.000 år foran os andre. Jeg har aldrig mødt en teoretiker som ikke liiige kan finde den der beregning af båndgapet i silicumdioxid eller den oversigt over smeltepunkter af 4000 legeringer han lavede sidste år. Det forekommer også, at astronomer har utroligt velorganiserede databaser over alt mellem (bogstavlig talt) himmel og jord. Vi eksperimentalister derimod…  data har det med at være spredt ud over en hærskare af forskellige mapper, computere og netværksdrev i en pærevælling hvor ambitionsniveauet normalt rækker til at forsøge at holde et overblik længe nok til at artiklen kan skrives hvorefter data typisk diffunderer rundt til et punkt hvor de reelt er umulige at finde igen.

Sådan er det også i vores lab, eller rettere, sådan var det i vores lab. For snart en del år siden var vi nogle stykker som tænkte, at det kunne da ikke være så svært at få lidt organisering på den lille sag. Men det viser sig ret hurtigt, at der er gode grunde til, at det netop er i de eksperimentelle laboratorier, at kaos råder; mængden af forskellige dimser, apparater, filformater, billedformater og spektroskopidata er ganske overvældende og det viser sig derfor at være et betydeligt stort projekt at organisere det hele. Faktisk har det udviklet sig til et efterhånden større software projekt som vi løbende har holdt opdateret under det mundrette navn PyExpLabSys hvor vi vedligeholder drivere og filformat-parsere til et stadigt større antal apparater. Alt dette har en lang række fordele, som vi kan gemme til en anden god gang, men bare fordelene omkring datahåndtering har enormt potentiale. Faktisk så meget, at det har vist sig at kunne publiseres.

Og hvad er det så man får ud af at kunne kommunikere med sine dimser med eget software i stedet for det program eller filformat, man normalt har brugt. Svaret er, at det giver fantastiske muligheder for at organisere data på tværs af formater og datatyper. Hvis jeg eksempelvis gerne vil kende trykket i et af vores vakuumkamre, er oplysningen kun et klik væk, og bare fordi jeg kan, har jeg for demonstrationens skyld lige plottet vandflowet gennem kammerets røntgenkanon på den anden akse:

stm_pressure_and_flow

Disse oplysninger er ofte utroligt nyttige i forbindelse med fejlfinding eller ved simpel koordinering og vedligehold af en eksperimentel opstilling. Afstanden fra en graf som denne og til at opstille et simpelt alarmsystem som sender emails eller sms’er hvis parametre falder uden for fastsatte rammer er meget kort, og det er derfor en simpel sag altid at vide, at ens opstilling er sund og rask.

Vi har nu adgang til alt fra STM-billeder og XPS-spektre til værdier for tryk og temperatur af kølevand og central forsyning af Argon.  Princippet kan udvides til stort set enhver faggruppe, eksempelvis kunne det jo være rart at kende temperaturen af sin 80 graders fryser gennem de sidste par år – både for at kunne dokumentere at ens prøver er uskadte, og for at kunne fange potentielle problemer i opløbet. Hvis effektforbruget af en fryser gennem nogle uger stiger stødt kunne det jo være en god anledning til at få den serviceret inden den faktisk gik i stykker. Udvid selv til dit eget fag.

Hele projektet er open source og vi håber meget at andre laboratorier og grupper kunne få lyst til at være med i projektet. Jo flere der deltagere jo flere instrumenter kan vi inkludere.

I et senere blogindlæg vil jeg vise hvordan systemet ikke kun kan bruges til at holde styr på helbredsdata for udstyr men også i meget høj grad kan bidrage til både at kunne organisere, visualisere og sammenligne rigtige eksperimentelle data. I mellemtiden kan man kigge lidt på denne kurve over temperatur og tryk af kølevandet i vores bygning.  Blå  kurve er kølevand på vej frem fra varmeveksleren, rød kurve er på vej tilbage. Sort kurve viser trykket af kølevandet.

Quiz: hvorfor er der en invers korrelation mellem trykket og temperaturen af vandet?

kølevand