Viimeiset kahdeksan vuotta olen työskennellyt projektipäällikkönä (en kirjoita koodia töissä), mikä luonnollisesti vaikuttaa negatiivisesti teknologiseen taustajärjestelmääni. Päätin kuroa umpeen teknologisen aukon ja hankkia tietoinsinöörin ammatin. Tietosuunnittelijan ydinosaamista on kyky suunnitella, rakentaa ja ylläpitää tietovarastoja.
Tein harjoitussuunnitelman, uskon, että siitä on hyötyä paitsi minulle. Suunnitelma keskittyy itseopiskeluun. Etusijalla ovat ilmaiset venäjän kielen kurssit.
Jaksot:
Algoritmit ja tietorakenteet. Avainosio. Opi se ja kaikki muukin toimii. On tärkeää saada koodi käsiisi ja käyttää perusrakenteita ja -algoritmeja.
Tietokannat ja tietovarastot, Business Intelligence. Siirrymme algoritmeista tiedon tallentamiseen ja käsittelyyn.
Hadoop ja Big Data. Kun tietokanta ei ole kiintolevyllä tai kun tiedot on analysoitava, mutta Excel ei voi enää ladata niitä, alkaa suuri data. Mielestäni on välttämätöntä edetä tähän osioon vasta kahden edellisen syvällisen tutkimuksen jälkeen.
Algoritmit ja tietorakenteet
Suunnitelmaani sisällytin Pythonin oppimisen, matematiikan perusteiden toistamisen ja algoritmisoinnin.
Tietokannat ja tietovarastot, Business Intelligence
Kirja: Martin Kleppman - Erittäin ladatut sovellukset. Ohjelmointi, skaalaus, tuki. Kirjassa kuvataan eri tietomallien toimintaa, niiden toteutusta sisältä, rajoituksia ja valintoja tehtävän mukaan.
Tietovarastojen rakentamiseen, ETL-, OLAP-kuutioihin liittyvät aiheet ovat erittäin riippuvaisia työkaluista, joten en anna tässä dokumentissa linkkejä kursseille. Tällaisia järjestelmiä on suositeltavaa tutkia työskennellessäsi tietyn projektin parissa tietyssä yrityksessä. ETL:ään tutustumista varten voit kokeilla Talend tai Ilmavirta.
Mielestäni on tärkeää tutkia nykyaikaista Data Vault -suunnittelumetodologiaa 1-linkki, 2-linkki. Ja paras tapa oppia se on ottaa se käyttöön ja toteuttaa se yksinkertaisella esimerkillä. GitHubissa on useita Data Vault -toteutusesimerkkejä linkki. Moderni tietovarasto -kirja: Hans Hultgrenin ketterän tietovaraston mallintaminen Data Vaultilla.
Tutustuaksesi loppukäyttäjien Business Intelligence -työkaluihin voit käyttää ilmaista raporttien, kojetaulujen ja minitietovarastojen suunnittelijaa Power BI Desktopia. Oppimateriaalit: 1-linkki, 2-linkki.
Hadoop ja Big Data
Sinun on aloitettava MapReducen itsenäisellä toteutuksella ilman kolmannen osapuolen kirjastoja. Tämä mahdollistaa paremman ymmärryksen monisäikeisistä toteutuksista tulevaisuudessa. Kuvataan erinomainen esimerkki Pythonista täällä.
Kaikkea oppimaasi ei voi soveltaa työssä. Siksi tarvitset valmistumisprojektin, jossa yrität soveltaa uutta tietoa.
Suunnitelmassa ei ole data-analyysiin ja koneoppimiseen liittyviä aiheita. tämä koskee enemmän Data Scientist -ammattia. Myöskään AWS-pilviin, Azureen, liittyviä aiheita ei ole. nämä teemat ovat erittäin riippuvaisia alustan valinnasta.
Kysymyksiä yhteisölle:
Kuinka riittävä tasoitussuunnitelmani on? Mitä poistaa tai lisätä?
Mitä projektia suosittelisit opinnäytetyöksi?