{"id":199,"date":"2020-04-22T19:40:23","date_gmt":"2020-04-22T19:40:23","guid":{"rendered":"http:\/\/imuno-srbija.com\/data-science\/?p=199"},"modified":"2021-03-18T09:30:43","modified_gmt":"2021-03-18T09:30:43","slug":"kako-poceti-u-data-science-u","status":"publish","type":"post","link":"https:\/\/imuno-srbija.com\/data-science\/2020\/04\/22\/kako-poceti-u-data-science-u\/","title":{"rendered":"Kako po\u010deti u Data Science-u?"},"content":{"rendered":"<p>Nakon \u0161to smo krajem marta odr\u017eali jedan meetup na temu \u201cData Science \u2013 \u0161ta je to\u201d, javilo mi se puno ljudi da im po\u0161aljem neke uvodne materijale koji bi im pomogli da krenu sa u\u010denjem.<\/p>\n<p>Trebalo mi je mnogo vremena da sednem i krenem da sastavljam listu, jer izvora je mnogo, i ono u \u0161ta sam duboko sigurna je da \u0107u na kraju zavr\u0161iti sa re\u010denicom \u2013 najbolje je da krene\u0161 sa nekim realnim primerom koji je tebi zanimljiv, jer se najvi\u0161e u\u010di kroz ve\u017ebu. Pritome, ne postoji neko zlatno pravilo po kome bi taj put u\u010denja trebalo da se odvija, pa je ba\u0161 nezahvalno i napraviti neki spisak materijala i smernica, a osigurati da se time ne unese \u201cbias\u201d, odnosno prokletstvo tog \u201cusmerenog\u201d kretanja, jer sam ja tako u\u010dila, pa jedino tako mo\u017ee. Pored toga, ja sam neko ko se isklju\u010divo bavi primenom napredne analitike u okviru biznisa, gde je glavni fokus izmeriti performanse pomo\u0107u neke mere uspeha kao \u0161to su profit, ili tro\u0161kovi. A napredna analitika se mo\u017ee koristiti u raznoraznim naukama i oblastima istra\u017eivanja, i ne mora biti vezana za poslovni svet.\u00a0 Me\u0111utim, do\u0161la sam na jednu sjajnu ideju da \u0161ta god ovde napisala, dozvolim kolegama iz struke da ovu listu pro\u0161ire, ili da i oni podele svoje iskustvo, tako da ih ovim putem pozivam da daju svoj mali doprinos, i tako postanu pokreta\u010di velikih stvari.<\/p>\n<p>FAQ su neizbe\u017ena sekcija ovog teksta, i do\u0107i \u0107emo do njih, ali pre toga bih \u017eelela da se osvrnem na neke osnove koje je neophodno da spomenem, kako bih pozvala na razmi\u0161ljanje, i mo\u017eda probudila inspiraciju onima koji bi \u017eeleli da se upuste u Data Science vode.<\/p>\n<p>Jedan ooogroman disclaimer na samom po\u010detku \u2013 ako o\u010dekujete od ovog teksta da vam bude kristalno jasno kako da sutra krenete i \u0161ta prvo da u\u010dite \u2013 budite svesni da je to prakti\u010dno nemogu\u0107e. Pored toga \u0161to sadr\u017eaj, kompleksnost i sfera Data Science-a kojom \u0107ete se baviti pre svega zavisi od va\u0161eg interesovanja i predznanja, Data Science je toliko \u0161iroka oblast da bi bilo potrebno pro\u0107i ceo jedan program u nivou osnovnih akademskih studija da biste mogli da ka\u017eete da imate neku baznu osnovu. Ono \u0161to je moj cilj je da vam ovim tekstom pomognem(o) da razvijete\u00a0<b>pristup<\/b>\u00a0<b>u\u010denju<\/b>, da budete u svakom trenutku svesni nekih \u010dinjenica koje ovde navodimo, a materijale i kurseve \u0107ete potom tra\u017eiti i sami. ? Me\u0111utim, neka lista proverenih kurseva nije na odmet, tako da \u0107emo je prika\u010diti uz ovaj tekst.<\/p>\n<h3>Preduslov za sve<\/h3>\n<p>Koliko god privla\u010dan bio, Data Science nije za svakog. Kao i bilo koje drugo zanimanje, zahteva posve\u0107enost. Ono \u0161to je osnovni preduslov za uspeh u ovoj oblasti jeste da mora da se voli. Dakle, zaista treba da vas interesuje analitika, da volite da \u201crudarite\u201d po podacima danono\u0107no, kako biste iz istih izvukli maksimum.<\/p>\n<p>U Data Science-u tako\u0111e va\u017ei zlatni Pareto. 80% je prljavog posla, u smislu pripreme i in\u017eenjeringa podataka, dok je ovaj \u201cfancy\u201d deo koji se ti\u010de samih modela \u010de\u0161\u0107e tek nekih 20%. Modeli postoje, i ako koristite R ili Python biblioteke, uglavnom se svedu na svega par linija koda. Ono \u0161to je ve\u0107i problem je izvla\u010denje maksimalne informativne mo\u0107i iz podataka, i naravno pronala\u017eenje optimalne konfiguracije modela. Na kraju, model je nemo\u0107an, ukoliko podaci nisu dobri \u2013 \u201cgarbage in, garbage out\u201d.<\/p>\n<p>Ono \u0161to se \u010desto zanemaruje u Data Science-u je taj zna\u010daj eksploratorne analize. De\u0161ava se da se koraci preska\u010du, od \u017eelje da se \u0161to pre krene sa privla\u010dnim i sofisticiranim modelima ma\u0161inskog u\u010denja. Me\u0111utim, dobra eksploratorna analiza je nekad i vi\u0161e od pola obavljenog posla. Tu se radi sa podacima, ulazi se u njihovu prirodu, sti\u010de se razumevanje, na osnovu kojeg su jasni prediktivna mo\u0107 i ograni\u010denja koja postoje u skupu podataka.<\/p>\n<p>Ako ne volite to tzv. rudarenje po podacima, i preska\u010dete eksploratornu analizu, vrlo verovatno ne\u0107ete tako brzo napredovati u poslu. Ili prosto \u2013 ovo nije za vas. I to je sasvim okej, prona\u0107i \u0107ete ne\u0161to drugo \u0161to vam bolje fituje. U\u00a0<a href=\"http:\/\/veekaybee.github.io\/2019\/02\/13\/data-science-is-different\/\">ovom tekstu<\/a>\u00a0mo\u017eete da prona\u0111ete jo\u0161 detaljnije obja\u0161njenje i argumente koji se ti\u010du po\u010detaka u Data Science-u, prevelikih o\u010dekivanja, i realnosti koja ne odgovara istim.<\/p>\n<h3>Data Science vs. Machine learning vs. Artificial intelligence<\/h3>\n<p>O ovome sam pri\u010dala i na webinaru, tako da ne\u0107u da se ponavljam, ali jako je bitno da razgrani\u010dite da ova tri pojma nisu istva stvar, i da postoji povezanost me\u0111u njima, a da dokle god mislite da su ista stvar \u2013 luta\u0107ete. Mo\u017eda \u0107e vam\u00a0<a href=\"http:\/\/varianceexplained.org\/r\/ds-ml-ai\/\">ovaj tekst<\/a>\u00a0pomo\u0107i da malo bolje razumete razliku. Ukoliko ne, ima dosta varijacija na temu, izaberite svoju. Ne\u0107ete mnogo pogre\u0161iti.<\/p>\n<h3>Gradivni elementi Data Science-a<\/h3>\n<p>Kako se naj\u0107e\u0161\u0107e tvrdi, Data Science je spoj razli\u010ditih oblasti \u2013 biznisa, odnosno datog domena, IT-a i matematike, odnosno statistike. U zavisnosti od predznanja, kada kre\u0107ete u Data Science-u, va\u0161e ve\u0161tine su ja\u010de u nekoj od ovih oblasti, a slabije u drugoj. I to je sasvim u redu. Ono \u0161to je bitno jeste da prepoznate \u0161ta je to va\u0161a ja\u010da strana, jer vas to razlikuje od drugih. Kada znate \u0161ta je va\u0161a ja\u010da strana, a \u0161ta je to \u0161to vam fali od ve\u0161tina \u2013 jasno vam je \u0161ta treba da u\u010dite kako biste napredovali. Npr. ako dolazite iz dru\u0161tvenih nauka, vi odli\u010dno znate specifi\u010dnosti oblasti kojom se bavite, ali vam fali znanje iz IT-a, a mo\u017eda i statistike. Ovo zna\u010di da, ako \u017eelite da se jednog dana bavite computer visionom npr., prvi kurs koji treba da pre\u0111ete treba da bude vezan za programiranje. I to ne savladavanje biblioteka (to dolazi kasnije), ve\u0107 elementarno programiranje, koncepti datog programskog jezika, paradigme, kontrola toka, strukture podataka, pa zatim da krenete sa matematikom i algoritmima. Ukoliko dolazite iz IT-a, ve\u0107 bi trebalo da dovoljno dobro poznajete programiranje i matematiku, ali vam fali malo detaljnije znanje statistike, tako da bi neki kurs za statisti\u010dku analizu dobro do\u0161ao. Domen, odnosno biznis \u2013 je ne\u0161to \u0161to se savladava sa iskustvom. Ne postoji savr\u0161eni kurs koji mo\u017ee da vas pripremi za to, ali naravno uvek mo\u017eete pro\u010ditati neku knjigu, koja \u0107e vam pribli\u017eiti domen u kome biste \u017eeleli da radite. Na kraju, mo\u017eda ste apsolutni po\u010detnik, i mislite da vam fali elementarno znanje iz svih ovih oblasti. Krenite sa jednom, kada savladate neku elementarnu osnovu, krenite sa drugom, i tako dok ne budete dovoljno spremni da mo\u017eete (ili ne budete primorani) da \u017eonglirate i u hodu u\u010dite vi\u0161e stvari.<\/p>\n<h3>Profili Data Scientist-a<\/h3>\n<p>\u0160to se ti\u010de profila Data Scientista, u zavisnosti od toga \u010dime se bave u svakodnevnom poslu, kakvi su zahtevi koje re\u0161avaju i \u0161ta je potrebno od ve\u0161tina da poseduju kako bi na njih odgovorili \u2013 razlikuje se nekoliko tipova Data Scientista. Svima je zajedni\u010dko da vole Data Science i Machine learning, me\u0111utim, razlikuju im se fokusi.<\/p>\n<p>Analiti\u010dari su vi\u0161e fokusirani na eksploraciju, utvr\u0111ivanje paterna i obja\u0161njavanje odre\u0111enog pona\u0161anja i uzro\u010dno-posledi\u010dnih veza. Dakle, vi\u0161e su po prirodi statisti\u010dari, nego \u0161to su developeri. I malo te\u017ee barataju sa produkcionalizacijom re\u0161enja i serviranjem modela.<\/p>\n<p>In\u017eenjeri najvi\u0161e vole da rade sa deep learning problemima, gde ima dosta kompleksnih formulacija, gde mogu da isprobavaju razli\u010dite arhitekture mre\u017ea i da se igraju sa razli\u010ditim konfiguracijama.<\/p>\n<p>Developeri su uglavnom fokusirani na isporuku modela, kako \u0107e se sve to realizovati u produkciji, da li \u0107e biti skalabilno i responzivno, kako da kod bude \u010dist i lako nadogradiv, kako \u0107e se neki ML model retrenirati itd.<\/p>\n<p>Story-tellerima je najbitnije kako \u0107e re\u0161enje da prodaju biznisu. \u0160ta je osnovni benefit njihovog re\u0161enja, kako \u0107e biznis od toga profitirati, i za\u0161to je bilo bitno baviti se odre\u0111enim problemom.<\/p>\n<p>Profil dosta zavisi i od interesovanja, kao i polazne osnove. Ne\u0107ete na isti na\u010din pristupati Data Science-u ukoliko dolazite iz biznis domena, i npr. iz sveta IT-a. Me\u0111utim, odgovornosti i zahtevane ve\u0161tine zavise i od same kompanije. Prvenstveno od toga da li kompanija ima mogu\u0107nost da zapo\u0161ljava vi\u0161e razli\u010ditih profila kao \u0161to su Data Scientist, Data Engineer, Machine Learning Engineer, Developer i DevOps. Ukoliko da \u2013 onda \u0107e sigurno posao Data Scientista u ovoj kompaniji da se razlikuje od posla u kompaniji koja ne mo\u017ee sebi da priu\u0161ti sve te profile \u2013 te \u0107e Data Scientist biti u obavezi da prokriva vi\u0161e sfera.<\/p>\n<h3>Metodologije razvoja<\/h3>\n<p>Jedna od najjednostavnijih metodologija razvoja analiti\u010dkih projekata je CRISP-DM metodologija. I sve druge su uglavnom varijacija na temu, ako se dobro upoznate sa ovom, ima\u0107ete ve\u0107 stabilnu osnovu da odradite svoj prvi mini-projekat za ve\u017ebu. Metodologije razvoja su bitne zato \u0161to ure\u0111uju na\u010din na koji se pristupa nekom problemu, kao i razvoju re\u0161enja, osiguravaju fokus kao i rezultat.<\/p>\n<h3>Re\u0161enje vs. Proizvod<\/h3>\n<p>Kada pri\u010damo o Data Science projektima, uglavnom se odvajaju dve vrste projekata: re\u0161enja i proizvodi. Vi\u0161e o tome mo\u017eete prona\u0107i npr.\u00a0<a href=\"https:\/\/hackernoon.com\/products-and-solutions-do-you-know-the-difference-4ff9169cefe3\">ovde<\/a>.<\/p>\n<p>Re\u0161enja su projekti koji su specijalizovani za odre\u0111eni problem, dakle razvijeni su za potrebe datog domena, na osnovu definisanog problema, specifi\u010dne su prirode, i retko mogu da se 1\/1 primene na isti na\u010din kod vi\u0161e razli\u010ditih klijenata, ili u razli\u010ditim biznis domenima. Re\u0161enje mo\u017ee biti npr. neki izve\u0161taj,\u00a0 fajl sa rezultatima, ili neki dashboard. Ukoliko projekat uklju\u010duje razvoj modela predvi\u0111anja neke vremenske serije, npr. prodaje u nekom maloprodajnom lancu, koje specifi\u010dno odgovara modelovanju pona\u0161anja tog maloprodajnog lanca, u smislu sezonalnosti, trendova, posebnih akcija, i tako dalje \u2013 to je re\u0161enje razvijeno specifi\u010dno za potrebe tog maloprodajnog lanca, i ne mo\u017ee se tek tako primeniti u domenu telekomunikacija npr. gde se pojam sezonalnosti i trenda druga\u010dije do\u017eivljava i opisuje.<\/p>\n<p>Proizvodi, i to data proizvodi, su projekti koji integri\u0161u naprednu analitiku i alate ma\u0161inskog u\u010denja, kako bi unapredili poslovanje u ulozi decision-support sistema. Proizvodi su kreirani tako da su lako skalabilni, i da mogu da se upotrebe u okviru razli\u010ditih sistema i razli\u010ditih biznis domena, jer mogu da re\u0161avaju vi\u0161e razli\u010ditih problema, te tako mogu lak\u0161e da se prilago\u0111avaju potrebama klijenata. Proizvodi zahtevaju jako detaljno planiranje, temeljno razvijenu arhitekturu i dosta tehni\u010dkih funkcionalnosti, kako bi mogli da odgovore na razli\u010dite potrebe klijenata. Ako pravimo analogiju sa primerom re\u0161enja, proizvod bi podrazumevao tehni\u010dki sistem koji omogu\u0107ava da se na osnovu vremenske serije dobije predikcija, bez obzira na to da li se radi o maloprodajnom lancu, telekomunikacijama, logistici, i tako dalje.<\/p>\n<p>Ve\u0107 bi trebalo da vam se polako stvaraju obrisi onoga da svaki od ova dva tipa re\u0161enja podrazumeva (mada, ne nu\u017eno) razli\u010diti skup ve\u0161tina i znanja. Re\u0161enja mogu da variraju \u0161to se kompleksnosti ti\u010de, dok su proizvodi izuzetno tehni\u010dki zahtevni, i potrebno je veliko iskustvo u smislu developmenta, kako bi se razvio proizvod koji je responzivan, skalabilan i pouzdan. Naravno, oba zahtevaju poznavanje metoda i alata napredne analitike.<\/p>\n<p>Tako da, u zavisnosti od toga \u0161ta je vama zanimljivije, ili \u0161ta je va\u0161em potencijalnom poslodavcu glavni fokus razvoja, postoji potreba da razvijate tehni\u010dke ve\u0161tine koje \u0107e vam pomo\u0107i da budete kompetentni za odre\u0111ene pozicije na koje biste voleli da konkuri\u0161ete.<\/p>\n<h3>R vs. Python vs. ne\u0161to tre\u0107e<\/h3>\n<p>Ovo je zaista (skoro) nebitno. Kada sam kretala sa u\u010denjem, pisala sam rekurentu mre\u017eu u Javi. I od tada, Javi nisam ni pri\u0161la (sem kad mi Spark izbaci neku gre\u0161ku ? ). Ono \u0161to je zaista bitno je da hvatate koncepte. Lako \u0107ete izguglati ono \u0161to vam treba. Koncepti dataframe-ova, grupisanja i agregiranja postoje i u R, i u Pythonu, i u Sparku, a pre svega su inspirisani manipulacijama koje se mogu raditi u SQL-u, tako da, ve\u0107 vidite o \u010demu pri\u010dam. Ako govorimo o modelima ma\u0161inskog u\u010denja, tu se de\u0161ava da ima nekih varijacija \u0161to se ti\u010de implementacije u razli\u010ditim jezicima, me\u0111utim, najbitnije je razumeti kako algoritam radi, a implementaciju mo\u017eete savladati kroz dokumentaciju ili Stackoverflow.<\/p>\n<p>R je fantasti\u010dan jezik, ima odli\u010dan community, dosta biblioteka i funkcija, fantasti\u010dne mogu\u0107nosti vizualizacije. I ukoliko ne mislite da se bavite razvojem ozbiljnih tehni\u010dkih sistema (za koje vam ipak treba programski jezik namenjen toj svrsi), R je dobar izbor.<\/p>\n<p>Ka\u017eu da je Python drugi najbolji jezik za sve. Ako vam ovo ne\u0161to govori \u2013 krenite tim putem. ? U su\u0161tini, general purpose je, mo\u017eete peglati ML, mo\u017eete peglati Deep learning, mo\u017eete praviti vizualizacije i interaktivne dashboarde, kao i API-eve, bukvalno\u00a0 \u2013 \u0161tagod vam padne na pamet. Sa tim \u0161to ne mogu da tvrdim da sve \u0161to postoji u R-u, postoji i u Pythonu. \u0160to ne zna\u010di da se i to uskoro ne\u0107e promeniti.<\/p>\n<p>Mnogi za scientific programming, a u poslednje vreme \u2013 i za naprednu analitiku, koriste Juliu. Me\u0111utim, mislim da je Julia jos daleko od nivoa popularnosti, podr\u0161ke i community-ja koji imaju R i Python.<\/p>\n<p>Spark je tako\u0111e dobra opcija, ali Spark nije uvek nu\u017ena opcija. Uglavnom, ukoliko vam ne treba osnovna prednost Sparka \u2013 a to je mogu\u0107nost paralelizacije kompleksnih procesa nad velikom koli\u010dinom podataka \u2013 po meni, ne bi trebalo da vam je prvi izbor. Opet ako se \u010dak i desi da treba da se shiftujete na Spark, nemojte se pla\u0161iti, sve mo\u017ee da se savlada.<\/p>\n<p>Postoje i razli\u010diti alati za razvoj ML modela \u2013 Orange, RapidMiner, SAS \u2013 gde sve funkcioni\u0161e po principu drag&amp;drop, ali opet je bitno da razumete metodologiju razvoja i modele koje upotrebljavate, kako biste napravili sistem koji radi. Ako se ne pronalazite u programiranju, ovo mo\u017ee biti dobar izbor.<\/p>\n<h3>Moram li da \u010ditam nau\u010dne radove\/imam PhD?<\/h3>\n<p>PhD je najve\u0107a zabluda sa kojom sam se susretala tokom ovih godina, \u010ditaju\u0107i razli\u010dite tekstove, i FAQ na temu kako krenuti sa Data Science-om. Ono \u0161to treba da razumete \u2013 PhD je bitan ukoliko se bavite nau\u010dno-istra\u017eiva\u010dkim radom. I onda kada vi razvijate nove algoritme ma\u0161inskog u\u010denja, i to ne kao titula, ve\u0107 u smislu znanja i iskustva koje je neophodno da bi se novi algoritmi razvijali. Ovo podrazumeva da imate izuzetno poznavanje linearne algebre, numeri\u010dke analize, kombinatorike, i mno\u0161tva jo\u0161 stvari (za \u0161ta je zaista potrebna vi\u0161egodi\u0161nja posve\u0107enost). Sa druge strane, PhD iz nekog odre\u0111enog domena mo\u017ee biti korisna referenca, budu\u0107i da u tom slu\u010daju poznajete specifi\u010dnosti domena u kom biste mogli da primenjujete naprednu analitiku. Me\u0111utim, isto tako mo\u017ee biti i problemati\u010dno sa siroma\u0161nim prakti\u010dnim iskustvom. Da li \u0107e vam titula pomo\u0107i da br\u017ee, ili da uop\u0161te do\u0111ete do posla u Data Science-u? Ne mora da zna\u010di. Istina je negde na sredini.<\/p>\n<p>\u0160to se ti\u010de \u010ditanja nau\u010dnih radova \u2013 ovo je obavezno. Data Science podrazumeva svakodnevno prelistavanje, i\u0161\u010ditavanje i pore\u0111enje nau\u010dnih radova, jer akademija je ta koja (zajedno sa industrijom) pomera granice. Kada radite na nekom Data Science problemu, najbitnije je da budete svesni limita, \u0161ta je sve \u0161to je mogu\u0107e odraditi. Granice su definisane onim dokle je akademija stigla sa istra\u017eiva\u010dkim radom, i onim \u0161to je u industriji mogu\u0107e primeniti. Kada ste svesni ovih mogu\u0107nosti \u2013 mo\u0107i \u0107ete da re\u0161ite bilo koji problem sa kojim se susretnete.<\/p>\n<h3>Za\u0161to su influenseri va\u017eni?<\/h3>\n<p>Pored knjiga, kurseva, i blog postova, postoji jo\u0161 jedan, \u201cinstant\u201d, na\u010din da dolazite do relevantnih informacija i saznanja, a to su dru\u0161tvene mre\u017ee.\u00a0 LinkedIn, Reddit i Twitter su do sada moji favoriti, mada naravno tu su i ostali. Ovim putem mo\u017eete da pratite lidere u ovoj oblasti, da uvek budete u toku, da se pove\u017eete sa ljudima sli\u010dnih interesovanja i da delite iskustva i znanja, kao i da zauzvrat, dobijate. Ja sam u<a href=\"https:\/\/thingsolver.com\/friday-talks-a-data-science-project\/\">\u00a0svom tekstu\u00a0<\/a>ve\u0107 pri\u010dala na ovu temu, i ono \u0161to mogu re\u0107i posle godinu dana je da \u2013 i dalje tako mislim. ?<\/p>\n<h3>Ok, hajde da konkretizujemo stvari:<\/h3>\n<p>&nbsp;<\/p>\n<ul>\n<li><b><a href=\"https:\/\/www.coursera.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">Coursera<\/a><\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Statistical learning by T. Hastie and R. Thibsirani (ovaj kurs je povezan sa knjigom An introduction to statistical learning, koja je oka\u010dena ispod):\u00a0<a href=\"https:\/\/online.stanford.edu\/courses\/sohs-ystatslearning-statistical-learning\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/online.stanford.edu\/courses\/sohs-ystatslearning-statistical-learning<\/a><\/li>\n<li>ML by Andrew Ng:\u00a0<a href=\"https:\/\/www.coursera.org\/learn\/machine-learning#about\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.coursera.org\/learn\/machine-learning#about<\/a><\/li>\n<li>Deep Learning Specialization by Andrew Ng:\u00a0<a href=\"https:\/\/www.coursera.org\/specializations\/deep-learning\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.coursera.org\/specializations\/deep-learning<\/a><\/li>\n<li>Jedan od najboljih kurseva za sisteme za preporuku, kome to bude zanimljivo (uz ovaj kurs valja dr\u017eati pored sebe i ovu knjigu (dole link) kao neki recept, gde mo\u017ee\u0161 da dublje pro\u010dita\u0161 neke pojedinosti, ne preporu\u010dujemo da se knjiga \u010dita od 1 do poslednje strane. Ve\u0107 se samo \u010dupa \u0161ta ti treba:\u00a0<a href=\"https:\/\/www.amazon.com\/Recommender-Systems-Handbook-Francesco-Ricci-ebook\/dp\/B00D8D1Y10\" target=\"_blank\" rel=\"noopener noreferrer\">Recommender Systems Handbook<\/a>)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p><a href=\"https:\/\/www.coursera.org\/specializations\/recommender-systems?#courses\">https:\/\/www.coursera.org\/specializations\/recommender-systems?#courses<\/a><\/p>\n<p>&nbsp;<\/p>\n<ul>\n<li><b><a href=\"https:\/\/www.kaggle.com\/\" target=\"_blank\" rel=\"noopener noreferrer\">Kaggle<\/a><\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Kursevi:\u00a0<a href=\"https:\/\/www.kaggle.com\/learn\/overview\">https:\/\/www.kaggle.com\/learn\/overview<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>DataCamp<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"https:\/\/www.datacamp.com\/search?utf8=%E2%9C%93&amp;q=&amp;tab=courses&amp;facets%5Btechnology%5D%5B%5D=Python&amp;facets%5Btopic%5D%5B%5D=Case+Studies\">Case studies<\/a>\u00a0\u2013 pored klasi\u010dnih kurseva za Python i ML biblioteke, prolazak kroz neke real world probleme u Data Science-u<\/li>\n<\/ul>\n<\/li>\n<li><b>PluralSight<\/b>\u00a0(free of charge April, valja iskoristiti)\n<ul>\n<li>Python fundamentals:\u00a0<a href=\"https:\/\/www.pluralsight.com\/browse\/software-development\/python\">https:\/\/www.pluralsight.com\/browse\/software-development\/python<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>Podcasts<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"https:\/\/www.superdatascience.com\/\">SuperDataScience<\/a><\/li>\n<li><a href=\"http:\/\/lineardigressions.com\/\">LinearDigressions<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>Books<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"http:\/\/shop.oreilly.com\/product\/0636920252528.do\">Introducing Python<\/a><\/li>\n<li><a href=\"https:\/\/www.amazon.com\/Hands-Machine-Learning-Scikit-Learn-TensorFlow\/dp\/1491962291\">Hands-On Machine Learning with Scikit-Learn and TensorFlow<\/a><\/li>\n<li><a href=\"https:\/\/books.google.rs\/books\/about\/Learning_Spark.html?id=tOptBgAAQBAJ&amp;source=kp_cover&amp;redir_esc=y\">Learning Spark<\/a><\/li>\n<li><a href=\"https:\/\/books.google.rs\/books\/about\/Learning_PySpark.html?id=HVQoDwAAQBAJ&amp;printsec=frontcover&amp;source=kp_read_button&amp;redir_esc=y\">Learning PySpark<\/a><\/li>\n<li><a href=\"https:\/\/www.amazon.com\/Mining-Massive-Datasets-Jure-Leskovec\/dp\/1107077230\">Mining massive datasets<\/a>\u00a0(postoji i standford kurs na osnovu ove knjige, koji je bruka dobar\u00a0<a href=\"https:\/\/online.stanford.edu\/courses\/soe-ycs0007-mining-massive-data-sets\">https:\/\/online.stanford.edu\/courses\/soe-ycs0007-mining-massive-data-sets<\/a>)<\/li>\n<li><a href=\"http:\/\/faculty.marshall.usc.edu\/gareth-james\/ISL\/\">Introduction to statistical learning<\/a>\u00a0(obja\u0161njava sve osnovne koncepte statisti\u010dkog u\u010denja, kroz algoritme i primere)<\/li>\n<li><a href=\"https:\/\/web.stanford.edu\/~hastie\/ElemStatLearn\/\">The Elements of Statistical Learning<\/a>\u00a0(pokriva sli\u010dne oblasti kao prethodna, sa ozbiljnom matematikom, prethodna je pisana na osnovu ove i bli\u017ea je po\u010detnicima)<\/li>\n<li>Sjajna knjiga za po\u010detnike u R-u:\u00a0<a href=\"https:\/\/www.amazon.com\/Data-Science-Transform-Visualize-Model\/dp\/1491910399\">https:\/\/www.amazon.com\/Data-Science-Transform-Visualize-Model\/dp\/1491910399<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>Blogs<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"https:\/\/towardsdatascience.com\/\">Towards Data Science<\/a><\/li>\n<li><a href=\"https:\/\/www.analyticsvidhya.com\/blog\/\">Analytics Vidhya<\/a><\/li>\n<li><a href=\"https:\/\/machinelearningmastery.com\/\">Machine learning mastery<\/a><\/li>\n<li><a href=\"https:\/\/www.datasciencecentral.com\/\">Data Science Central<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>Deep learning<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Martin Gorner\u2019s presentation, \u201c<a class=\"mfp-iframe lightbox-added\" href=\"https:\/\/www.youtube.com\/watch?v=u4alGiomYP4\">TensorFlow and Deep Learning without a PHD (Part 1 and 2)<\/a>\u201d<\/li>\n<li>Pretty detailed and comprehensive blog about deep learning:\u00a0<a href=\"http:\/\/colah.github.io\/\">Colah\u2019s blog<\/a><\/li>\n<li><a href=\"https:\/\/www.coursera.org\/specializations\/deep-learning\">Deep learning specialization<\/a>\u00a0\u2013\u00a0najbolji materijali za deep learning ikada. Prvi kurs \u2013 kakva je struktura mre\u017ee i kako funkcioni\u0161e, drugi kurs \u2013 parametri i tjuniranje, tre\u0107i \u2013 konceptualni (kako provaliti da mre\u017ea gre\u0161i i \u0161ta raditi), \u010detvrti \u2013 konvolucija (computer vision), peti \u2013 RNN (nlp, audio)<\/li>\n<li>Knjiga:\u00a0<a href=\"http:\/\/www.deeplearningbook.org\/lecture_slides.html\">http:\/\/www.deeplearningbook.org\/lecture_slides.html<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li><b>Communities<\/b><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"http:\/\/www.datascience.rs\/\">Data Science Srbija<\/a><\/li>\n<li><a href=\"https:\/\/www.datasciconference.com\/\">Data Science conference<\/a><\/li>\n<li><a href=\"https:\/\/sisteranalyst.org\/\">SysterAnalyst<\/a><\/li>\n<li><a href=\"http:\/\/serbianaisociety.com\/\">Serbian AI Society<\/a><\/li>\n<li><a href=\"https:\/\/www.lazybrain.org\/\">LazyBrain<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h3>Naredni koraci<\/h3>\n<ul>\n<li>Uklju\u010di se u community \u2013 pose\u0107uj sve mogu\u0107e meetup-e, konferencije i predavanja, na takvim doga\u0111ajima uvek mo\u017ee\u0161 dobiti dobar savet, ideju, nova znanja i sl.<\/li>\n<li>Upoznaj se sa teorijskim osnovama napredne analitike (metodologije razvoja, eksploracija podataka, statisti\u010dki testovi, algoritmi ma\u0161inskog u\u010denja,\u2026)<\/li>\n<li>Prona\u0111i primer koji ti je zanimljiv, kroz koji bi bilo mogu\u0107e da primenjuje\u0161 to \u0161to u\u010di\u0161 i pro\u0161iruje\u0161 svoje znanje i iskustvo (UCI machine learning repository i Google dataset search repository imaju na milione open datasetova, sigurno \u0107e\u0161 prona\u0107i ne\u0161to \u0161to tebe zanima)<\/li>\n<li>GUGLAJ<\/li>\n<li>Projekat na kome radis oka\u010di na svoj GitHub profil, to je obavezna i najbitnija stavka u tvom CV-u<\/li>\n<li>Napravi izve\u0161taj u kome \u0107e\u0161 objasniti \u0161ta je ra\u0111eno, koji je problem re\u0161avan, \u0161ta su koraci, koji su to najve\u0107i izazovi bili, koji zaklju\u010di su izvedeni i na osnovu \u010dega, koje su mogu\u010dnosti za pobolj\u0161anja, \u2026<\/li>\n<li>Pitaj nekog iz community-ja ko se bavi oblastima koje te zanimaju za savet kako da krene\u0161<b>\u00a0ba\u0161 u toj oblasti<\/b>\u00a0(data science je \u0161irok pojam)<\/li>\n<li>Apliciraj za praksu\/posao, gde \u0107e\u0161 uz mentora najbolje i najbr\u017ee u\u010diti i razvijati se. Ukoliko postoji tehni\u010dki test prilikom selekcije \u2013 i to je savr\u0161ena prilika da nau\u010di\u0161 ne\u0161to. Iskoristi je!<\/li>\n<\/ul>\n<h3>Acknowledgements<\/h3>\n<p>Hvala svima koji su pomogli da se ovaj dokument realizuje, pre svega mojim kolegama iz\u00a0<a href=\"https:\/\/thingsolver.com\/\" target=\"_blank\" rel=\"noopener noreferrer\">Things Solver<\/a>\u00a0tima (hvala\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/andjela-culibrk-velimirovic-233a015b\/\" target=\"_blank\" rel=\"noopener noreferrer\">An\u0111ela<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/jasminaglisovic\/\" target=\"_blank\" rel=\"noopener noreferrer\">Jasmina<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/tijana-dragojevi%C4%87-9715a6152\/\" target=\"_blank\" rel=\"noopener noreferrer\">Tijana<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/marijamiljkovic\/\" target=\"_blank\" rel=\"noopener noreferrer\">Marija<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/strahinja-demi%C4%87-731a29130\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strahinja<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/marko-%C5%A1ejat-49b39986\/\" target=\"_blank\" rel=\"noopener noreferrer\">Marko<\/a>,\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/bogdan-savkovi%C4%87-8569551a5\/\" target=\"_blank\" rel=\"noopener noreferrer\">Bogdane<\/a>). A posebne zahvalnice idu i mojim kolegama\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/bojana-soro-73ba65131\/\" target=\"_blank\" rel=\"noopener noreferrer\">Bojani Soro<\/a>\u00a0iz\u00a0<a href=\"https:\/\/contentinsights.com\/\" target=\"_blank\" rel=\"noopener noreferrer\">Content Insights<\/a>-a i\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/srdjansantic\/\" target=\"_blank\" rel=\"noopener noreferrer\">Sr\u0111anu \u0160anti\u0107u<\/a>\u00a0iz\u00a0<a href=\"https:\/\/logikka.ai\/\" target=\"_blank\" rel=\"noopener noreferrer\">Logikka<\/a>-e. Zajedni\u010dkim snagama, sastavili smo listu po\u010detnih materijala i oblikovali ovaj dokument. HVALA SVIMA! Nadam se da \u0107e ovaj dokument biti od koristi po\u010detnicima, i da \u0107emo ga putem zajednice pobolj\u0161avati i oboga\u0107ivati.<\/p>\n<p><em><strong>Autor :\u00a0<a href=\"https:\/\/www.linkedin.com\/in\/valentina-%C4%91or%C4%91evi%C4%87\/\" target=\"_blank\" rel=\"noopener noreferrer\">Valentina \u0110or\u0111evi\u0107<\/a>,\u00a0<\/strong><\/em>Head of Data Science\u00a0u kompaniji\u00a0Things Solver<\/p>\n<!--themify_builder_content-->\n<div id=\"themify_builder_content-199\" data-postid=\"199\" class=\"themify_builder_content themify_builder_content-199 themify_builder tf_clear\">\n    <\/div>\n<!--\/themify_builder_content-->\n","protected":false},"excerpt":{"rendered":"<p>Nakon \u0161to smo krajem marta odr\u017eali jedan meetup na temu \u201cData Science \u2013 \u0161ta je to\u201d, javilo mi se puno ljudi da im po\u0161aljem neke uvodne materijale koji bi im pomogli da krenu sa u\u010denjem. Trebalo mi je mnogo vremena da sednem i krenem da sastavljam listu, jer izvora je mnogo, i ono u \u0161ta [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":200,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[4],"tags":[],"_links":{"self":[{"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/posts\/199"}],"collection":[{"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/comments?post=199"}],"version-history":[{"count":2,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/posts\/199\/revisions"}],"predecessor-version":[{"id":605,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/posts\/199\/revisions\/605"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/media\/200"}],"wp:attachment":[{"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/media?parent=199"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/categories?post=199"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/imuno-srbija.com\/data-science\/wp-json\/wp\/v2\/tags?post=199"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}