Zespół polskich naukowców w ramach eksperymentu ALICE w Wielkim Zderzaczu Hadronów w CERN bada algorytmy sztucznej inteligencji wyspecjalizowane w analizie nieuporządkowanych zbiorów Big Data. W ten sposób badacze chcą nie tylko poznać zasady funkcjonowania Wszechświata w skali kwantowej, lecz także usprawnić procesy analizy informacji giełdowych oraz przetwarzanie szerokiego zasobu danych na potrzeby sektora medycznego.
– Badanie oddziaływań między silnie działającymi na siebie cząstkami oparte na korelacji i uczeniu maszynowym to projekt w ramach eksperymentu ALICE w Wielkim Zderzaczu Hadronów w CERN. We współpracy między wieloma jednostkami badawczymi analizowane są kwarki, podstawowe cząstki budujące materię. Nasza grupa stara się odgadnąć i odpowiedzieć na fundamentalne pytania dotyczące tego, z czego powstał Wszechświat, jak po Wielkim Wybuchu wyglądały oddziaływania między ciężkimi kwarkami i jak one ze sobą rozmawiały, tworząc w efekcie wielu przemian dzisiejszą Ziemię w takim stanie, w jakim ona jest – mówi agencji informacyjnej Newseria Innowacje dr hab. inż. Tomasz Trzciński, adiunkt na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej.
Choć nadrzędnym celem projektu „Badanie fundamentalnych własności materii jądrowej w eksperymencie ALICE na Wielkim Zderzaczu Hadronów LHC w CERN” było pozyskanie wiedzy na temat procesów fizycznych zachodzących we wnętrzach gwiazd neutronowych, doświadczenia przeprowadzane w ramach tego programu pozwolą usprawnić proces przetwarzania i analizy dużych, chaotycznych zbiorów informacji.
Eksperymenty przeprowadzone przez polski zespół dowiodły, że zastosowanie narzędzi z zakresu uczenia maszynowego pozwala algorytmom sztucznej inteligencji sprawniej wyszukiwać błędne informacje w obszernych zasobach Big Data. Tym samym dane pozyskane i przetworzone przy wykorzystaniu technologii modelowania generatywnego charakteryzują się wyższą precyzją niż te analizowane za pośrednictwem klasycznych narzędzi badawczych.
– W ramach grantu zajmujemy się wykorzystaniem i rozwojem metod uczenia maszynowego takich jak sieci neuronowe. Eksperyment daje jako rezultaty terabajty danych, które są zbierane podczas zderzeń dwóch wiązek pod ziemią. Kiedy zbieramy te dane w ramach detektorów rejestrujących pole magnetyczne, okazuje się, że część z nich jest nieprawidłowa, wykazuje jakieś anomalie. Standardowym podejściem jest modelowanie tych procesów przy użyciu symulacji takich jak Monte Carlo, ale te symulacje są obciążające, dlatego staramy się wykorzystać modele generatywne, żeby ten proces przyspieszyć – tłumaczy ekspert.
W trakcie projektu zapoczątkowanego w 2017 roku udało się opublikować szereg prac naukowych przybliżających wykorzystanie algorytmów sztucznej inteligencji do katalogowania danych, wychwytywania anomalii oraz nieregularności w zasobach Big Data. Praca Polaków doprowadziła m.in. do upowszechnienia modeli generatywnych w algorytmach wykorzystywanych przez fizyków w procesie analizy rezultatów badań na potrzeby publikacji w takich magazynach naukowych jak „Nature”. Technologię tę wykorzystano m.in. w trakcie prac nad artykułem poświęconym dziwnym kwarkom oraz oddziaływań, jakie zachodzą między nimi.
O potędze algorytmów uczenia maszynowego w procesie analizy Big Data przekonani są także naukowcy z Uniwersytetu Waszyngtońskiego, którzy we współpracy z zespołem Microsoft Research eksperymentują z wykorzystaniem ich w procesach predykcyjnych prognozy pogody. Na bazie archiwalnych danych pogodowych z ostatnich 40 lat opracowali mechanizm przewidywania zmian atmosferycznych z dużą dokładnością przy wykorzystaniu okrojonej liczby informacji. Eksperymentalny algorytm błyskawicznie generuje modele predykcyjne oparte na ściśle wyselekcjonowanych danych. Dzięki temu zużywa w procesie prognozowania aż 7 tys. razy mniej mocy niż klasyczne narzędzia predykcyjne.
Z praktycznych narzędzi do wykrywania anomalii w strumieniu danych korzysta już Elektrownia Łagisza należąca do firmy Tauron. Oprogramowanie analizuje informacje pozyskiwane z czujników przemysłowych i za pośrednictwem algorytmów sztucznej inteligencji poszukuje błędów, które mogą świadczyć o nieprawidłowym działaniu systemu. Narzędzie potrafi także analizować dane historyczne, aby stworzyć modele predykcyjne eksploatacji poszczególnych urządzeń funkcjonujących w sieci.
– Badanie anomalii czy nieregularności w zbiorach danych jest stosowane nie tylko w fizyce wysokich energii. Natomiast fizyka wysokich energii ma swoje specyficzne atrybuty, takie jak parametry fizyczne czy też ich złożoność obliczeniową, które wymagają dostosowania algorytmów. Zastosowanie samych metod można rozszerzyć np. na analizę danych medycznych czy analizę ciągów czasowych, np. podczas badania zachowań na giełdzie czy też w innych miejscach, gdzie szereg czasowy wskazuje jakieś punkty w czasie i anomalie w nim występujące są istotne, żeby je wychwycić – wyjaśnia dr hab. inż. Tomasz Trzciński.