Kwestionariusz Przewodniczącego Centrum Badawczego POB – Cyberbezpieczeństwo i analiza danych
Jak działalność naukowa POB CyberDS wpisuje się we współpracę Politechniki Warszawskiej z przemysłem? Jak profesor Krzysztof Szczypiorski ocenia poziom przesłanych zgłoszeń do konkursu CyberiADa-1? Zapraszamy do przeczytania kwestionariusza Przewodniczącego POB CyberDS.
Czym zajmuje się Centrum Badawcze Priorytetowego Obszaru Badawczego Cyberbezpieczeństwo i analiza danych? Jakie są Państwa plany badawcze?
Centrum Badawcze Priorytetowego Obszaru Badawczego Cyberbezpieczeństwo i analiza danych skupia się na dwóch częściowo rozłącznych podobszarach: cyberbezpieczeństwo (ang. Cybersecurity) oraz analiza danych (ang. Data Science)
W ramach pierwszego podobszaru prowadzone są badania wokół szerokiego, interdyscyplinarnego i długofalowego tematu, jakim jest bezpieczeństwo teleinformatyczne. Ze szczególnym naciskiem na następujące zagadnienia: kryptografia postkwantowa, systemy zapewniające niezaprzeczalność (w tym systemy oparte na blockchain), metody ochrony informacji wykorzystujące mechanizmy uczenia maszynowego, wykrywanie nieznanych ataków na systemy teleinformatyczne za pomocą algorytmów big data/fast data, zautomatyzowane systemy zarządzania bezpieczeństwem.
Podobszar analizy danych obejmuje tematykę badawczą w czterech głównych działach: analiza danych biomedycznych, przetwarzanie Big Data i strumieniowa analiza danych, zaawansowane metody uczenia maszynowego, matematyczne podstawy analizy danych.
Analiza danych biomedycznych (ang. BioMed Data Science – BMDS) to przede wszystkim bioinformatyka, biostatystyka oraz medycyna obliczeniowej. W badaniach biomedycznych przetwarza się wielkie zbiory danych o złożonej strukturze, co wymaga zastosowania skalowalnych narzędzi bioinformatycznych, w szczególności rozproszonych algorytmów i metod statystycznych do analizy wielowymiarowych danych genomicznych oraz transkryptomicznych generowanych przy użyciu wysokoprzepustowych metod sekwencjonowania następnej generacji. Narzędzia te są wykorzystywane do rozwiązywania problemów, takich jak odkrywanie nowych korelacji genotypowo-fenotypowych, biomarkerów, a także znajdują bezpośrednie zastosowania w procesie diagnostyki molekularnej.
Przetwarzanie Big Data i strumieniowa analiza danych (ang. Big and Stream Data Science – BSDS) jest obszarem skoncentrowanym na metodach przetwarzania danych Big Data, rozproszonym składowaniu danych oraz wsadowej i strumieniowej analizie danych (inteligentne miasta, genomika). Zastosowania danych Big Data i danych strumieniowych wymagają algorytmów, metod i złożonych systemów, które łączą warstwę składowania danych z warstwą przetwarzania danych w trybie wsadowym oraz warstwą przetwarzania danych w trybie strumieniowym. Metody z tego podobszaru są wykorzystywane do budowy m.in. systemów inteligentnego dynamicznego planowania połączeń z wykorzystaniem różnych środków transportu dedykowanych dla transportu publicznego. Systemy te łączą analizę strumieni danych, metody uczenia maszynowego i metody teorii grafów.
Zaawansowane metody uczenia maszynowego (ang. Advanced Machine Learning – AML) skoncentrowane na rozwoju algorytmów i oprogramowania wyjaśniającego decyzje podejmowane przez algorytmy uczenia maszynowego, w tym narzędzia weryfikujące transparentność modeli predykcyjnych, narzędzia automatyzujące i wspierające eksplorację danych i modeli. Opracowane narzędzia są wdrażane w obszarach z regulatorem takich jak spersonalizowana medycyna (indywidualna rekomendacja leczenia wymaga wyjaśnień), czy ryzyko kredytowe (indywidualna decyzja kredytowa wymaga uzasadnienia).
Matematyczne podstawy analizy danych (ang. Mathematical Foundations for Data Science – MFDS) skupiają się na modelowania danych i ich analizie, statystyce, rachunku prawdopodobieństwa, teorii grafów i sieci oraz obliczeniach miękkich. Obiektem zainteresowań jest tutaj modelowanie różnego rodzaju procesów (w sieciach złożonych, badaniach operacyjnych, zastosowaniach finansowych, systemach wspomagania podejmowania decyzji, analityce danych sportowych itd.) przy użyciu szerokiego aparatu matematycznego, jaki udostępniają obszary badawcze związane ze stochastyką, równaniami różniczkowymi, układami złożonymi, sieciami złożonymi, matematyką dyskretną czy zbiorami rozmytymi. Opracowane wyniki pozwalają nie tylko dokonywać predykcji nieobserwowanych do tej pory obserwacji, ale i uzyskiwać wgląd w naturę własności procesów, które nimi rządzą.
To dopiero początek działalności POB. Jakie wyzwania czekają Państwa w ciągu najbliższych kilku lat?
Czwarta rewolucja przemysłowa jest oparta o dane. Rosnąca dostępność dużych zbiorów danych stawia nowe wyzwania w zakresie cyberbezpieczeństwa, wydajnego przetwarzania danych, a także ekstrakcji wiedzy. Transformacja cyfrowa zmienia oblicze praktycznie każdego obszaru ludzkiej aktywności: przez medycynę, biologię, aż po usługi finansowe. Innowacje w tym obszarze wymagają silnych podstaw w matematyce, statystyce, uczeniu maszynowym i ochronie informacji.
Nasze plany na przyszłość są skoncentrowane na wytworzeniu synergii pomiędzy podobszarami, w szczególności pomiędzy cyberbezpieczeństwem, a BSDS oraz AML. Z perspektywy cyberbezpieczeństwa kluczowym zagadnieniem jest analiza dużych zbiorów danych pod kątem korelacji zjawisk powiązanych z atakami. Istotnym zagadnieniem jest zarówno szybkość algorytmów (tzw. fast data), najlepiej działających w czasie rzeczywistym lub zbliżonym do niego, jak i wiarygodność wyników (eliminowanie błędów pierwszego i drugiego rodzaju - false positives and false negatives). Kolejną ważną cechą jest możliwość utrzymywania historii zdarzeń w celu późniejszej analizy ewentualnych związków między zdarzeniami naruszającymi bezpieczeństwo. Wymaga to przemyślanej redukcji danych poddawanych dalszej analizie.
Planujemy znacznie zwiększyć skalę badań realizowanych przez zespoły badawcze w ramach POB Cyberbezpieczeństwo i analiza danych w celu:
- zwiększenia udziału międzynarodowych projektów badawczych w pracach grupy; efekt ten zostanie osiągnięty poprzez stymulowanie składania wniosków o wysokiej jakości w programach finansowania UE i innych międzynarodowych, ze szczególnym uwzględnieniem tematyki z pogranicza cyberbezpieczeństwa i analizy danych,
- zarządzania prawami własności intelektualnej, które obejmie wykorzystanie otwartego licencjonowania części oprogramowania opracowanego przez grupę w celu promowania współpracy z międzynarodowymi zespołami badawczymi w obszarze POB,
- zwiększenia udziału grupy w najważniejszych akademickich i branżowych wydarzeniach międzynarodowych (prezentacje, współorganizowanie warsztatów i sesji o charakterze badawczo-edukacyjnym), w celu wzmocnienia współpracy z zagranicznymi grupami badawczymi w takich obszarach jak wysokowydajne metody analizy strumieni danych (stream mining),
- zainicjowania programu Summer Data Schools for Central Europe, aby przyciągnąć najlepszych młodych naukowców do współpracy z grupami PW.
Co dla Pana oznacza słowo „innowacyjność”? Jak „innowacyjność” wpasowuje się w działalności POB Cyberbezpieczeństwo i analiza danych?
Innowacyjność stanowią rewolucyjne zmiany stanu obecnego, które mogą dotyczyć każdego obszaru ludzkiego życia, w tym także nauki. Nowatorstwo jest wpisane w filozofię działania naszego Centrum, w którym preferujemy odważne pomysły, pasję oraz współpracę. Odważne pomysły to część innowacyjności, która w połączeniu z pasją może prowadzić do osiągnięcia konkretnych przełomowych wyników. Współpraca zwiększa szansę na lepsze wykorzystanie indywidualnych cech ludzkich i potencjału zespołu. Natomiast interdyscyplinarność i różny stopień doświadczenia zawodowego (także wynikającego z wieku metrykalnego) pozwalają na zbudowanie dojrzałej współpracy wspomagającej proces innowacji, a także dzięki wytrwałości, doprowadzenie tego procesu do końca.
Działalność POB, a przemysł. Jakie macie Państwo plany względem tej współpracy?
Obydwa podobszary, cyberbezpieczeństwo, jak i analiza danych, są ściśle powiązane z badaniami stosowanymi oraz rozwojowymi, stąd też naturalnie będąc mocno „aplikacyjnymi” są blisko tzw. przemysłu. Oczywiście punkt styku nauki z przemysłem oprócz niewątpliwych szans takich jak na przykład komercjalizacja, niesie ryzyko prowadzenia badań zgodnie z zasadą „nasz klient nasz Pan”, który może wypaczać pryncypia rzetelnych badań, jednak wierzymy, że w tym zetknięciu jest więcej korzyści niż potencjalnych strat. Od dawna prowadzimy z przemysłem dialog oraz różne interesujące projekty, które później mają zastosowanie w świecie rzeczywistym. Tę współpracę zamierzamy rozwijać.
Za nami pierwszy konkurs na granty badawcze CyberiADa-1. Jak ocenia Pan zainteresowanie naukowców konkursem oraz poziom przesłanych zgłoszeń?
W pierwszym konkursie CyberiADa-1 ogłoszonym przez Centrum Badawcze POB Cyberbezpieczeństwo i analiza danych otrzymaliśmy 30 wniosków grantowych, na łączną kwotę ponad 5,6 mln PLN. Wnioski pochodziły z 8 wydziałów, średnia wnioskowana kwota wyniosła ok. 187.000 PLN, a mediana ok. 185.000 PLN. Ostatecznie sfinansowano 11 wniosków (z 5 wydziałów) na łączną kwotę ponad 2 mln PLN (średnia to ok. 191.000 PLN, a mediana ok. 198.000 PLN). Wskazuje to na ogromne zainteresowanie konkursem, jak również na fakt, iż obszar cyberbezpieczeństwa i analizy danych jest istotnym obszarem badawczym na naszej uczelni.