Sieć Badawcza Łukasiewicz – Instytut Technik Innowacyjnych EMAG
poniedziałek, 28 czerwiec 2021

Ruszyły prace nad projektem ROLAP-ML

Koncepcja Relational On-Line Analytical Processing bazująca na symbolicznych metodach maszynowego uczenia – ROLAP-ML

Projekt ma na celu zastosowanie metod maszynowego uczenia, w szczególności metod wykrywania wzorców danych, do automatyzacji z możliwością zachowania interakcji z użytkownikiem procesu poszukiwania silnych i ukierunkowanych na wstępne hipotezy użytkownika zależności w bazach danych. Rozwinięte zostaną metody automatycznego podsumowywania danych dla różnego rodzaju problemów eksploracyjnych m.in. problem opisu grup (klasyfikacja w tym subgroup discovery), objaśniania zmian wartości zmiennej(ych) (regresja, analiza przeżycia i analiza niezawodności), objaśniania różnic pomiędzy grupami (tzw. constrast set mining), objaśnienie sytuacja wyjątkowych (m.in. exception rule mining) oraz problem planowania akcji.
Badania w tym kierunku prowadzone są w zespole realizatorów od wielu lat.
Rozwój i opracowanie nowych metod ukierunkowane będą na możliwość uruchamiania ich w środowiskach obliczeń rozproszonych.

W ramach projektu wykonane zostaną prace eksperymentalne – analiza zbiorów benchmarkowych (z repozytoriów Kaggle i UCI) oraz 3 analizy typu proof-of-concept pokazujące użyteczność opracowanych metod. W efekcie opracowany zostanie zbiór narzędzi, który w sposób automatyczny lub w interakcji z użytkownikiem przeszukuje bazy danych w kierunku odkrywania w nich interesujących zależności. Interakcje z użytkownikiem realizowane będą poprzez specjalny język definiowania hipotez.