{"id":2040,"date":"2021-01-11T20:49:48","date_gmt":"2021-01-11T20:49:48","guid":{"rendered":"http:\/\/www.datascience.rs\/?p=2035"},"modified":"2021-03-17T16:46:16","modified_gmt":"2021-03-17T16:46:16","slug":"mojih-top-5-resursa-za-data-science","status":"publish","type":"post","link":"http:\/\/imuno-srbija.com\/data-science\/en\/2021\/01\/11\/mojih-top-5-resursa-za-data-science\/","title":{"rendered":"Mojih top 5 resursa za data science &#8211; Milica Petrovi\u0107"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Ja sam <a href=\"https:\/\/www.linkedin.com\/in\/milica-petrovic\/\" target=\"_blank\" rel=\"noopener\">Milica Petrovi\u0107<\/a>, zavr\u0161ila sam master studije iz statistike i od 2017. radim kao data sciencist. Kao i drugi u ovoj oblasti, i ja imam neke u\u017ee teme o kojima sam dosta istra\u017eivala, \u010ditala i u\u010dila: automatizacija pra\u0107enja kvaliteta podataka, operacionalizacija modela, itd. Me\u0111utim, umesto da delim izvore iz tih konkretnih oblasti, mislim da je daleko korisnije za mnogo ve\u0107i broj ljudi da podelim neke generalne izvore preko kojih se mogu na\u0107i korisne informacije na te i mnoge druge teme. Probala sam da izaberem neke sajtove za koje mi se \u010dini da nisu ba\u0161 poznati ili uobi\u010dajeni, ali su svejedno sjajni. <\/span><\/p>\n<p><span style=\"font-weight: 400;\">Nadam se da \u0107e vam koristiti!<\/span><\/p>\n<p><b>5.Tutorijali<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Dobrih tutorijala ima gomila, i najbolje je ako imate vremena za \u010ditave kurseve na portalima kao \u0161to su Coursera ili Udacity. Ali kad vam treba brzi tutorijal na neku temu a nemate vremena za ceo kurs, dobri sajtovi su <\/span><a href=\"https:\/\/www.analyticsvidhya.com\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Analytics Vidhya<\/span><\/a><span style=\"font-weight: 400;\"> (konkretno <\/span><a href=\"https:\/\/www.analyticsvidhya.com\/blog\/author\/pjoshi15\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">tutorijali i blogovi<\/span><\/a><span style=\"font-weight: 400;\"> od Prateek Joshi-ja) i kanal <\/span><a href=\"https:\/\/www.youtube.com\/c\/sentdex\/playlists\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Sentdex<\/span><\/a><span style=\"font-weight: 400;\"> na youtube-u.<\/span><\/p>\n<p><b>4.Podaci<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Za data science su najva\u017eniji podaci (ovo je 4. stavka na listi samo zato \u0161to je prvo mesto zauzeto jednim jo\u0161 zanimljivijim resursom vezanim za podatke). <\/span><span style=\"font-weight: 400;\">Neki generalni poznati resursi korisni za sve su <\/span><a href=\"http:\/\/archive.ics.uci.edu\/ml\/index.php\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">UCI Machine Learning Repository<\/span><\/a><span style=\"font-weight: 400;\">, <\/span><a href=\"https:\/\/data.worldbank.org\/\"><span style=\"font-weight: 400;\">The World Bank Data<\/span><\/a><span style=\"font-weight: 400;\"> i srpski zvani\u010dni <\/span><a href=\"https:\/\/data.gov.rs\/sr\/\"><span style=\"font-weight: 400;\">Portal otvorenih podataka<\/span><\/a><span style=\"font-weight: 400;\">. Jedan manje poznat koji je meni bio vrlo koristan je <\/span><a href=\"https:\/\/data.world\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Data World<\/span><\/a><span style=\"font-weight: 400;\"> Na kraju par \u010disto zabavnih izvora: <\/span><a href=\"https:\/\/cran.r-project.org\/web\/packages\/janeaustenr\/index.html\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">janeaustenr<\/span><\/a><span style=\"font-weight: 400;\">, paket koji sadr\u017ei cele romane D\u017eejn Ostin i mo\u017ee se koristiti za analizu teksta, i <\/span><a href=\"https:\/\/www.kaggle.com\/theriley106\/panic-at-the-dataset\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Panic! at the dataset<\/span><\/a><span style=\"font-weight: 400;\">, set koji se sastoji od tekstova pesama benda <\/span><i><span style=\"font-weight: 400;\">Panic! at the disco<\/span><\/i><span style=\"font-weight: 400;\"> obele\u017eenih za sentiment analysis.<\/span><\/p>\n<p><b>3.Edukativni blog<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Kada poku\u0161avam da nau\u010dim ili razumem ne\u0161to vezano za ma\u0161insko u\u010denje, kratka pretraga me \u010desto odvede na sajtove poput Medium-a (konkretno Towards Data Science), koji ponekad ima odli\u010dne tekstove korisne kao uvod u neku temu, ili Stack Overflow, ako imam neko konkretno pitanje (usput, SO tako\u0111e ima i svoj kul newsletter, <\/span><a href=\"https:\/\/stackoverflow.blog\/newsletter\/\"><span style=\"font-weight: 400;\">The Overflow<\/span><\/a><span style=\"font-weight: 400;\">). Me\u0111utim, na oba ta sajta tekstove i objave pi\u0161e gomila razli\u010ditih ljudi. Ako treba izabrati jednog \u010doveka koji je sam napisao mno\u0161tvo odli\u010dnih tekstova na razne tema iz te oblasti, to bi za mene bio Jason Brownlee sa svojim sajtom <\/span><a href=\"https:\/\/machinelearningmastery.com\/\"><span style=\"font-weight: 400;\">Machine Learning Mastery<\/span><\/a><span style=\"font-weight: 400;\">. Kod njega sam prvi put uspela da razumem kako funkcioni\u0161u u teoriji i prakti\u010dno <\/span><a href=\"https:\/\/machinelearningmastery.com\/keras-functional-api-deep-learning\/\"><span style=\"font-weight: 400;\">neuralne mre\u017ee sa vi\u0161e razli\u010ditih ulaznih slojeva<\/span><\/a><span style=\"font-weight: 400;\">. Taj i drugi tekstovi na njegovom blogu slu\u017ee kao odli\u010dni uvodi, obja\u0161njenja i smernice. Ja gomilu njegovih tekstova imam u sa\u010duvanim linkovima za kad mi opet zatrebaju.<\/span><\/p>\n<p><b>2.Liste resursa<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Ovo sada deluje kao inception ili <\/span><i><span style=\"font-weight: 400;\">listception<\/span><\/i><span style=\"font-weight: 400;\">, ali za mene je bilo fantasti\u010dno otkri\u0107e. Github, osim za deljenje open-source koda, \u010desto slu\u017ei i za pravljenje lista resursa na odre\u0111enu temu. Za mene su od ogromne pomo\u0107i bile <\/span><a href=\"https:\/\/github.com\/mathsyouth\/awesome-text-summarization\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">lista resursa posve\u0107enih sa\u017eimanju teksta<\/span><\/a><span style=\"font-weight: 400;\">, <\/span><a href=\"https:\/\/github.com\/neulab\/Text-Summarization-Papers\"><span style=\"font-weight: 400;\">lista nau\u010dnih \u010dlanaka o sa\u017eimanju teksta<\/span><\/a><span style=\"font-weight: 400;\">, <\/span><a href=\"https:\/\/github.com\/Separius\/awesome-sentence-embedding\"><span style=\"font-weight: 400;\">lista resursa o sentence &amp; word embedding modelima<\/span><\/a><span style=\"font-weight: 400;\">, <\/span><a href=\"https:\/\/github.com\/niderhoff\/nlp-datasets\"><span style=\"font-weight: 400;\">lista otvorenih setova tekstualnih podataka za NLP<\/span><\/a><span style=\"font-weight: 400;\"> i <\/span><a href=\"https:\/\/github.com\/jphall663\/awesome-machine-learning-interpretability\"><span style=\"font-weight: 400;\">lista resursa o intepretiranju i obja\u0161njavanju modela<\/span><\/a><span style=\"font-weight: 400;\">, jer sam se tim konkretnim temama bavila. Ali ako guglate \u201cgithub curated lists\u201d ili liste na neku odre\u0111enu temu koja vas zanima, na\u0107i \u0107ete sjajne i vrlo op\u0161irne liste.<\/span><\/p>\n<p><b>1.Newsletter<\/b><\/p>\n<p><span style=\"font-weight: 400;\">Internet je prepun raznih nedeljnih biltena, od kojih se skoro svi bave najnovijim otkri\u0107ima ili primenama ve\u0161ta\u010dke inteligencije u raznim oblastima. Ali ja znam samo za jedan koji se bavi samim podacima: <\/span><a href=\"https:\/\/tinyletter.com\/data-is-plural\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Data is plural<\/span><\/a><span style=\"font-weight: 400;\">. Nekome su neki podaci bili potrebni i\/ili zanimljivi pa ih je sakupio, strukturirao i objavio da budu dostupni svima. O takvim malim i nepoznatim setovima nas izve\u0161tava ovaj newsletter koji sastavlja Jeremy Singer-Vine.<\/span><\/p>\n<p><span style=\"font-weight: 400;\"><strong>Bonus:<\/strong> Za one koje zanima igranje tekstom, konkretno imenima, ovo je super zabavan blog: <\/span><a href=\"https:\/\/medium.com\/@nateparrott\/give-your-kids-futuristic-names-with-a-neural-network-9078bed0894d\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">Give your kids futuristic names with a neural network!<\/span><\/a><\/p>\n<!--themify_builder_content-->\n<div id=\"themify_builder_content-2040\" data-postid=\"2040\" class=\"themify_builder_content themify_builder_content-2040 themify_builder tf_clear\">\n    <\/div>\n<!--\/themify_builder_content-->","protected":false},"excerpt":{"rendered":"<p>Ja sam Milica Petrovi\u0107, zavr\u0161ila sam master studije iz statistike i od 2017. radim kao data sciencist. Kao i drugi u ovoj oblasti, i ja imam neke u\u017ee teme o kojima sam dosta istra\u017eivala, \u010ditala i u\u010dila: automatizacija pra\u0107enja kvaliteta podataka, operacionalizacija modela, itd. Me\u0111utim, umesto da delim izvore iz tih konkretnih oblasti, mislim da je daleko korisnije za mnogo ve\u0107i broj ljudi da podelim neke generalne izvore preko kojih se mogu na\u0107i korisne informacije na te i mnoge druge teme. Probala sam da izaberem neke sajtove za koje mi se \u010dini da nisu ba\u0161 poznati ili uobi\u010dajeni, ali su svejedno sjajni.<\/p>","protected":false},"author":1,"featured_media":2076,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[4],"tags":[],"_links":{"self":[{"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/posts\/2040"}],"collection":[{"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/comments?post=2040"}],"version-history":[{"count":2,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/posts\/2040\/revisions"}],"predecessor-version":[{"id":2077,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/posts\/2040\/revisions\/2077"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/media\/2076"}],"wp:attachment":[{"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/media?parent=2040"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/categories?post=2040"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/imuno-srbija.com\/data-science\/en\/wp-json\/wp\/v2\/tags?post=2040"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}