Povesti de succes
Iuliana MARIN
Asistent universitar, Facultatea Inginerie in Limbi Straine - Universitatea Politehnica din Bucuresti Curs "Technologies for Big Data Analysis"- Categorie premiu:
Big Data - 2021 - Universitatea Politehnica - Bucuresti
- Bucuresti
Recompensa este mult mai mare atunci când poți călăuzi oameni. A acționa după visele tale în fiecare zi este ca și cum ai planta semințe în fiecare zi.”
Iuliana MARIN
- Ce impact a avut cursul in anul universitar incheiat?
Cursul datează de acum 6 ani. Inițial au fost 40 de studenți, dintre care 20 de studenți străini din Franța, Italia, Portugalia, Spania, Irak. Pe vremea aceea, Big Data era la începuturi. La Facultatea de Automatică și Calculatoare se învăța NoSQL. După un an de la inaugurarea cursului, s-a încheiat un contract cu Cloudera din Silicon Valley, care ulterior a fuzionat cu Hortonworks. Facultatea de Inginerie în Limbi Străine a fost prima facultate din cadrul Universității Politehnica din București care a predat un curs de Big Data. Conținutul cursului și al laboratoarelor a fost actualizat în toți cei 6 ani. În primul an, s-au folosit materialele de la Cloudera, după care s-a constatat că studenții nu știau standardul SQL, un aspect necesar pentru viitorii ingineri software. Această situație a determinat adăugarea a 4 laboratoare noi. Am ținut legătura cu experți de la diverse companii pentru a fi informați cu privire la ultimele tendințe referitoare la instrumente și tehnologii Big Data (Cloudera-Alexandru Ciobanu), Oracle Cloud Infrastructure (Oracle-Alexandru Dimofte), securitate în Cloud folosind Azure (Microsoft-Liviana Zurcher), Machine learning cu AWS (Amazon-Dragos Madarasan, Liviu Gherman). De la MapReduce au fost prezentate concepte precum Databricks bazat pe Apache Spark data lake. Data warehouse a fost completat de Data Mesh, Delta Lake și Data Virtualization. Am antrenat studenții prin folosirea limbajelor Scala și Kafka, actualizând astfel laboratoarele. Deși cursul nu are ca obiectiv inteligența artificială, Big data beneficiază de aceasta și de aceea la un laborator am depistat fraude bancare. Algoritmii de învățare automată au fost Decision Tree Classifier, Random Forests și Naïve Bayes. În cadrul cursului ne-a preocupat și securitatea datelor, fiind introdus un nou laborator care are la bază cursul lui Arup Nanda.
- Cum a fost primit cursul de catre studenti?
Numărul de studenți s-a menținut constant, între 20 și 40 de studenți per an universitar. În anul academic curent sunt înscriși 41 de studenți la cursul de Tehnologii pentru analiza volumelor mari de date (Technologies for Big Data Analysis). Aceștia, cât și cei din generațiile precedente au ales ca teme de disertație Big Data, privind Data Lake, Delta Mesh. Studenții au fost receptivi la interacțiunea cu specialiștii implicați în domeniul Big Data, înțelegând amploarea fenomenului Big Data și multitudinea de posibilități de dezvoltare a unei cariere profesionale.
- Cum te-a influentat aceasta recunoastere?
Mă simt onorată pentru că am fost remarcată prin activitatea pe care am desfășurat-o în cadrul procesului de predare, cât și încurajată să îmi continui misiunea de a inspira alți tineri să urmeze o carieră în domeniul tehnologiei informației. Voi folosi sponsorizarea pentru a achiziționa diverși senzori care pot fi plasați în cadrul locuințelor, încât să îmi continui cercetarea doctoratului meu, prin a analiza ambientul, a optimiza procesarea lor și a facilita luarea deciziilor în cazuri de extremă urgență, cum ar fi incendii sau scurgeri de gaz. În plus, voi investi sponsorizarea pentru a participa la câteva cursuri de formare.
- Ce te-a determinat sa ramai la catedra si sa nu urmezi o cariera intr-o companie privata?
Realitatea digitală a ultimelor decenii arată că circa 10% din datele utilizate de companii se regăsesc sub forma unor structuri de date prelucrate cu tehnologiile disponibile pentru baze de date relaționale. Restul de 90% din date nu pot fi puse în valoare cu metodele tradiționale. Aceasta este misiunea cursului Tehnologii pentru analiza volumelor mari de date (Technologies for Big Data Analysis), să pună la dispoziția viitorilor ingineri informaticieni instrumente moderne de analiză și prelucrare pentru volume mari de date, a căror punere în valoare depinde de costul efortului de prelucrare (ceea ce presupune arhitecturi noi și metode originale de optimizare), în condiții de securitate ridicată. Domeniul Big Data este unul complex, tehnologiile acoperite fiind standardul SQL, Apache Hadoop (sistem de fisiere distribuit + ecosistem: Sqoop, Flume, NoSQL, Pig, Hive, Yarn, Impala, Zookeeper), programare Java, Python, medii moderne de analiză și prelucrare a informației tip Big Data: Spark, Scala, Kafka. În cadrul laboratoarelor sunt aplicate noțiuni de statistică (prognoză, predicții), modele pentru simulări și deprinderi de matematică aplicată. În plus, există un deficit de sute de ingineri perfecționați Big Data.
- Ce te-a determine sa alegi aceasta tema a cursului?
M-am angajat în timpul masterului la o companie privată, unde am lucrat la un proiect european de cercetare. După un an și jumătate am fost numită director de proiect pe un alt proiect european. Am considerat că în viață trebuie să returnezi ceea ce ai primit în timpul anilor de studiu, așa că m-am angajat și ca asistent universitar în cadrul Universității Politehnica din București, la Facultatea de Inginerie în Limbi Străine, ocupându-mă în paralel de propriul doctorat. Este foarte plăcut ca după câțiva ani să ai studenți care să își aducă aminte de tine și să îți comunice că nu și-au întrerupt studiile datorită ție. Simt o mare bucurie atunci când o nouă generație a ajuns la capăt de drum în cadrul studiilor de licență sau masterat, și că mi-am dus la bun sfârșit misiunea de a oferi din cunoașterea mea. Recompensa este mult mai mare atunci când poți călăuzi oameni. A acționa după visele tale în fiecare zi este ca și cum ai planta semințe în fiecare zi. Nu le vei vedea gata pentru recoltare într-o clipă. Este nevoie de timp pentru ca acea sămânță să crească și să fie coaptă pentru recoltare, încât să dea naștere unor noi generații de ingineri pasionați de știința calculatoarelor.