ืืขืื ืืืืืขืจ! ืืขืจ ืืืื ืคืื ืืขื ืึทืจืืืงื ืจืขืื ืคึฟืึทืจ ืืื. ืืื ืึทื ืืืกืึทืคึผืืืฉืึทื ืคืื ืื ืึธื ืืืื ืคืื ืืขื ืงืืจืก
ื ืคึผืฉืื ืืืขืืืืืึทืืขืจ ืืื ืฆื ืืึทืคึผื ืื ืืึทืืึท ืืื ืืฉืขื ืืจืืข ืืืืึทืืืข ืืื ื ืืฉื ืืึธืื ืขืก ืฉืืขืคึผื ืืืจ ืืื ืืขืจ ืชืืื.
ืขืก ืืืื ื ืืื ืึทืืขืืขื ืืืื ืฆื ืืืขืจื ืึท ืืึทืืึท ืกืกืืขื ืืืกื ืื ืืขื. ืึธืืขืจ ืืืึธืก ืืืขืื ืืึทืืึท ืืื ืืฉืขื ืืจืืข? ืืกืขื ืฉืึทืื, ืืึธืก ืืื ืึท ืืื ืคืื ืืืืืจืื ืคืื ืึท ืืึทืื ืึทื ืึทืืืกื ืืื ืึท ืืึทืื ืืขืืขืจื ืืขืจ; ื ืืึทืื ืื ืืฉืขื ืืจ ืืื ืืืคึผืืงืื ืคืึทืจืึทื ืืืืึธืจืืืขื ืคึฟืึทืจ ืึธื ืคืืจืื ื ืืืึธืจืงืคืืึธืื, ืคึผืจืึทืกืขืกืื ื ืคึผืืืคึผืืืื ื ืืื ETL ืคึผืจืึทืกืขืกืึทื. ืจืขืื ืฆื ืืขืจ ืืืืืืืงืืื ืคืื ืื ืคืึทื ืืงืฉืึทื ื, ืืึธืก ืืื ืืขืจืืืืึทื ืื ืื ืืขืจ ืคืึธืืงืก ืคืึทืืืึทื ืืฉืึทืจืืึธื ืืืึธืก ืืื ืึทืงืืืืืื ืืืื ืื ื ืืึธืืขื ืืื.
ืืืื ืกืึทืืขืจืื ืืื ืจืืืืง ืคืึธืืขืจืื ื ืืขื ืขื ืืืืื ืึท ืงืืืื ืืืื ืคืื ืืืึธืก ืืืื ืืขื ืึทืจืืขื ืืึธืจ ืึทืืจืึทืงืืืื! ืืืื ืืืจ ืืืืื ืฆื ืคืึทืจืืื ืื ืื ืจืืืขื ืคืื ืืขืืื, ืขืก ืืื ืงืืื ืืึธื ืฆื ืฉืคึผืขื ืฆื ืึธื ืืืืื ืืขืจื ืขื. ืืื ืืขื ืคึผืึธืกืื, ืืื ืืึธืื ืืขืืืืื ืึทืืข ืื ื ืืืืืง ืืื ืคึฟืึธืจืืึทืฆืืข ืฆื ืืขืืคื ืืืจ ื ืขืืขื ืืืื ืขืจืฉืืขืจ ืกืืขืคึผืก.
ืึทืืื, ืืึธืื 'ืก ืึธื ืืืืื!
ืืืึธืก ืืื ืืึทืืึท ืืื ืืฉืขื ืืจืืข?
ืืึธื ืขืกืืื, ืขืก ืืื ืงืืื ืืขืกืขืจ ืืขืจืงืืขืจืื ื ืืื ืืขื:
"ื ืืขืืขืจื ืืขืจ ืงืขื ืขื ืึทื ืืืขืงื ืึท ื ืืึท ืฉืืขืจื, ืึธืืขืจ ืขืจ ืงืขื ื ืืฉื ืืึทืื ืืืื ืขืจ. ืขืจ ืืืขื ืืึธืื ืฆื ืคืจืขืื ืึทื ืืื ืืฉืขื ืืจ ืฆื ืืึธื ืืึธืก ืคึฟืึทืจ ืืื."
โ ืืึธืจืืึธื ืืื ืืื ืืืขื
ืืืื, ืื ืจืึธืืข ืคืื โโืึท ืืึทืื ืื ืืฉืขื ืืจ ืืื ืืึทื ืฅ ืืึทืืืึทืืืง.
ืืื ืืขืจ ื ืึธืืขื ืกืึทืืืืฉืขืก, ืืึทืื ืื ืืฉืขื ืืขืจืืข ืืื ืืืจืื ืืื ืืึทืื, ื ืืืืื ืื ืขืงืกืคึผืจืขืก, ืกืืึธืจืืืืฉ ืืื ืคึผืจืึทืกืขืกืื ื. ืึทืงืงืึธืจืืื ืืื, ืื ืืืืคึผื ืึทืจืืขื ืคืื ืขื ืืืฉืึทื ืืจื ืืื ืฆื ืฆืืฉืืขืื ืึท ืคืึทืจืืึธืืืขื ืื ืคืจืึทืกืืจืึทืงืืฉืขืจ ืคึฟืึทืจ ืืึทืื. ืืืื ืืืจ ืงืืงื ืืื ืื AI ืืืืขืจืึทืจืงื ืคืื ืืืืขืจืคืขื ืืฉื, ืืึทืื ืื ืืฉืขื ืืขืจืืข ืึทืงืืึทืคึผืืื ืื ืขืจืฉืืขืจ 2-3 ืกืืึทืืขืก: ืืึทืืืื ื, ืืึทืืืขืืื ื ืืื ืกืืึธืจืืืืฉ, ืืึทืื ืฆืืืจืืืืื ื.
ืืืึธืก ืืื ืึท ืืึทืื ืื ืืฉืขื ืืจ?
ืืื ืื ืึทืืืืขื ื ืคืื ืืจืืืก ืืึทืื, ืื ืคืึทืจื ืขื ืคืื ืคึฟืึทืจืึทื ืืืืึธืจืืืขืืงืืื ืืื ืืขืืืื ืืจืึทืืึทืืืงืื. ืืืื ืื ืขืงืกืคึผืขืจืฅ ืคืจืืขืจ ืืขืฉืจืืื ืืจืืืก ืกืงื ืงืืืืจืื ืืื ืืืกืืืื ืืึทืื ื ืืฆื ืืืฉืืจืื ืึทืืึท ืืื Informatica ETL, Pentaho ETL, Talend, ืืืฆื ืื ืจืขืงืืืืจืขืืขื ืฅ ืคึฟืึทืจ ืืึทืื ืขื ืืืฉืึทื ืืจื ืืึธืื ืืขืืืืงืกื.
ืจืืึฟ ืงืึธืืคึผืึทื ืืขืก ืืื ืึธืคึฟื ืืืึทืงืึทื ืกืืขืก ืคึฟืึทืจ ืื ืฉืืขืืข ืคืื โโืืึทืื ืื ืืฉืขื ืืจ ืืึธืื ืื ืคืืืืขื ืืข ืจืขืงืืืืจืขืืขื ืฅ:
- ืืืกืืขืฆืืืื ื ืืืืกื ืคืื SQL ืืื Python.
- ืืขืจืคืึทืจืื ื ืืื ืืืึธืืงื ืคึผืืึทืืคืึธืจืืก, ืกืคึผืขืฆืืขื ืึทืืึทืืึธื ืืืขื ืืึทืืื ืื ืืก.
- ืืืืืขืจ ืืืืกื ืคืื Java / Scala.
- ืืื ืคืืจืฉืืื ื ืคืื SQL ืืื NoSQL ืืึทืืึทืืืืกืื (ืืึทืืึท ืืึธืืขืืื ื, ืืึทืื ืืืขืจืืึทืืืื ื).
ืืึทืืื ืืื ืืืื ืื ื, ืืึธืก ืืขื ืขื ืืืืื ืื ืขืกืกืขื ืืืึทืืก. ืคึฟืื ืืขืจ ืจืฉืืื, ืขืก ืงืขื ืขื ืืืื ืื ืืขื ืืืขื ืึทื ืืึทืื ืขื ืืืฉืึทื ืืจื ืืขื ืขื ืกืคึผืขืฉืึทืืึทืกืฅ ืืื ืื ืคืขืื ืคืื ืืืืืืืืืจื ืึทื ืืืืืงืืื ื ืืื ืืึทืงืขื ื.
ืคึฟืึทืจ ืืืึทืฉืคึผืื, ืืืื ืึท ืคืืจืืข ืืืืื ืฆื ืืืฉืขื ืขืจืืื ืึท ืืจืืืก ืกืืืข ืคืื โโืืึทืื ืคึฟืื ืคืึทืจืฉืืื ืงืืืืื, ืืืื ืึทืจืืขื ืืื ืึท ืืึทืื ืื ืืฉืขื ืืจ ืืื ืฆื ืึธืจืืึทื ืืืืจื ืื ืืึทืืืื ื ืคืื ืืื ืคึฟืึธืจืืึทืฆืืข, ืืืึทื ืคึผืจืึทืกืขืกืื ื ืืื ืกืืึธืจืืืืฉ.
ืื ืจืฉืืื ืคืื ืืืฉืืจืื ืืขื ืืฆื ืืื ืืขื ืคืึทื ืงืขื ืืืื ืึทื ืืขืจืฉ, ืขืก ืึทืืข ืืขืคึผืขื ืืก ืืืืฃ ืื ืืึทื ื ืคืื ืื ืืึทืื, ืื ืืืืงืืึทื ืคืื ืื ืงืึทืืึธืืข ืืื ืืขืืขืจืึทืืืฉืื ืืึทืื. ืจืืึฟ ืงืึธืืคึผืึทื ืืขืก ืืึธื ื ืื ืืึทื ืืืขื ืืื ืืจืืืก ืืึทืื, ืึทืืื ืืื ืึท ืกืขื ืืจืึทืืืืื ืจืืคึผืึทืืึทืืึธืจื, ืึท ืึทืืื ืืขืจืืคืขื ืข ืืึทืื ืืืขืจืืึทืืก, ืืืจ ืงืขื ืขื ื ืืฆื ืึท SQL ืืึทืืึทืืืืก (PostgreSQL, MySQL, ืืื"ื ื) ืืื ืึท ืงืืืื ืืึทื ื ืคืื ืกืงืจืืคึผืก ืืืึธืก ืงืึธืจืืขื ืื ืืึทืื ืืื. ืื ืืืขืจืืึทืืก.
IT ืืืฉืืืึทื ืฅ ืึทืืึท ืืื Google, ืึทืืึทืืึธื, ืคืึทืกืขืืึธืึธืง ืึธืืขืจ ืืจืึธืคึผืืึธืงืก ืืึธืื ืืขืืขืจ ืจืขืงืืืืจืขืืขื ืฅ: ืืืืกื ืคืื Python, Java ืึธืืขืจ Scala.
- ืืขืจืคืึทืจืื ื ืืื ืืจืืืก ืืึทืื: Hadoop, Spark, Kafka.
- ืืืืกื ืคืื ืึทืืืขืจืืืึทืื ืืื ืืึทืื ืกืืจืึทืงืืฉืขืจื.
- ืคืืจืฉืืื ื ืื ืืึทืกืืงืก ืคืื ืคืื ืื ืืขืจืืขืืืืื ืกืืกืืขืืขื.
- ืืขืจืคืึทืจืื ื ืืื ืืึทืื ืืืืืฉืืืึทืืึทืืืืฉืึทื ืืืฉืืจืื ืึทืืึท ืืื ืืึทืืืขืึทื ืึธืืขืจ ElasticSearch ืืืขื ืืืื ืึท ืคึผืืืก.
ืึทื ืืื, ืขืก ืืื ืึท ืงืืึธืจ ืืืขืจืจืืง ืฆื ืืจืืืก ืืึทืื, ื ืืืืื ืืื ืืืึทื ืคึผืจืึทืกืขืกืื ื ืืื ืืขืจ ืืืื ืืึธืืื. ืื ืงืึธืืคึผืึทื ืืขืก ืืึธืื ืืขืืืืงืกื ืจืขืงืืืืจืขืืขื ืฅ ืคึฟืึทืจ ืกืืกืืขื ืฉืืื ืืึธืืขืจืึทื ืฅ.
ืืึทืืึท ืขื ืืืฉืึทื ืืจื ืืืก. ืืึทืื ืกืืืึทื ืืืก
ืึธืืงืื, ืืึธืก ืืื ืืขืืืขื ืึท ืคึผืฉืื ืืื ืืึธืื ืข ืคืึทืจืืืืึทื (ืืึธืจื ืืฉื ืคึผืขืจืืขื ืืขื), ืึธืืขืจ ืืื ืคืึทืงื ืขืก ืืื ืคืื ืืขืจ ืงืึธืืคึผืืืฆืืจื.
ืขืจืฉืืขืจ, ืืืจ ืืึธื ืืืืกื ืึทื ืขืก ืืื ืึท ืคึผืืึทืฅ ืคืื ืึทืืืืืืืึทืื ืืื ืื ืืืืื ืืืฉืึทื ืคืื ืื ืจืึธืืขืก ืืื ืกืงืืื ืคืื ืึท ืืึทืื ืืขืืขืจื ืืขืจ ืืื ืึท ืืึทืื ืื ืืฉืขื ืืจ. ืืึธืก ืืื, ืืืจ ืงืขื ืขื ืืืืื ืืืื ืฆืขืืืฉื ืืืขืื ืืืึธืก ืกืงืืื ืืืจ ืืึทืจืคึฟื ืฆื ืืืื ืึท ืืขืจืึธืื ืืึทืื ืื ืืฉืขื ืืจ. ืคืื ืงืืจืก, ืขืก ืืขื ืขื ืืืืขืจ ืกืงืืื ืืืึธืก ืึธืืืืขืจืืึทืคึผ ืืื ืืืืืข ืจืึธืืขืก. ืืืขืจ ืขืก ืืขื ืขื ืืืื ืึท ื ืืืขืจ ืคืื ืืืึทืืขืืจืืงืื ืงืขืื ืกืงืืื.
ืืึทืืึท ืืืืกื ืฉืึทืคึฟื ืืื ืึท ืขืจื ืกื ืืขืฉืขืคื, ืึธืืขืจ ืืืจ ืืึทื ืฆื ืึท ืืืขืื ืคืื ืคืึทื ืืงืฉืึทื ืึทื ืืึทืื ืืืืกื ืฉืึทืคึฟื ืืื ืคึผืจืึทืงืืืฉื ืขืจื ืืขื ืขื ืืืืืืช ืฆื ืืึธื ืืืืขืจ ืืืืืขื ืข ืึทื ืึทืืืืืงืก. ืฆื ืืขืื ืืึทืื ืคึผืืืคึผืืืื ื ืืื ืื ืึทืืจืืืืื ืืึทืื ืกืืจืึทืงืืฉืขืจื, ืืืจ ืืึทืจืคึฟื ืืึทืื ืขื ืืืฉืึทื ืืจื, ื ืืฉื ืืึทืื ืกืืืึทื ืืืก.
ืืื ืึท ืืึทืื ืื ืืฉืขื ืืจ ืืขืจ ืืื ืืึธื ืขื ืืื ืึท ืืึทืื ืืขืืขืจื ืืขืจ?
- ืืึธ, ืืืืึทื ืืืืืขืจ ืืืจ ืงืขื ืขื ืืึทืื ืืขืจ ืฉืืืงื, ืืืจ ืืึทืจืคึฟื ืฆื ืขืจืฉืืขืจ ืฉื ืื, ืฉืึธืืขืืฅ ืืื ืืึทืืขืจ ืงืขืจืึทืฅ!
ื ืืึทืื ืื ืืฉืขื ืืจ ืคืืจืฉืืืื ืคึผืจืึธืืจืึทืืืื ื ืืขืกืขืจ ืืื ืงืืื ืืึทืื ืืขืืขืจื ืืขืจ, ืึธืืขืจ ืืืขื ืขืก ืงืืื ืฆื ืกืืึทืืืกืืืง, ืืขืจ ืคืึทืจืงืขืจื ืืื ืืืช.
ืึธืืขืจ ืืึธ ืืื ืื ืืืึทืืข ืคืื โโืึท ืืึทืื ืื ืืฉืขื ืืจ:
ืึธื ืืื / ืืืจ, ืื ืืืขืจื ืคืื ืื ืคึผืจืึธืืืึทืืืืคึผ ืืึธืืขื, ืจืืึฟ ืึธืคื ืงืึทื ืกืืกืืื ื ืคืื ืึท ืฉืืืง ืคืื ืฉืจืขืงืืขื ืงืืืึทืืืืขื ืงืึธื ืืื ืึท ืคึผืืืืึธื ืืขืงืข, ืืืงืืืขื ืคืื ืึท ืืึทืื ืืขืืขืจื ืืขืจ ืืื ืขืคืขืก ืคึผืจืึธืืืฆืืจื ืึท ืจืขืืืืืึทื, ืืขื ืื ืฆื ื ืื.
ืึธื ืึท ืืึทืื ืื ืืฉืขื ืืจ, ืืขื ืงืึธื ืืืขื ืงืืื ืืึธื ืืืขืจื ืึท ืคึผืจืืืขืงื ืืื ืงืืื ืืขืฉืขืคื ืคึผืจืึธืืืขื ืืืขื ืืืื ืืคืขืงืืืืืื ืกืึทืืืื. ืืขืจ ืืึทืื ืื ืืฉืขื ืืจ ืืื ืืจืืื ื ืฆื ืืืขื ืื ืึทืืข ืืขื ืืื ืึท ืคึผืจืึธืืืงื.
ืืงืขืจืืืง ืืื ืคึฟืึธืจืืึทืฆืืข ืืืึธืก ืึท ืืึทืื ืื ืืฉืขื ืืจ ืืึธื ืืืืกื
ืึทืืื, ืืืื ืื ืึทืจืืขื ืืจืขื ืื ืืืืก ืื ืืืื ืืื ืืืจ ืืื ืืืจ ืืขื ื ืื ืืืืืึทืกืืืง - ืืืจ ืงืขื ืขื ืืขืจื ืขื ืขืก, ืืืจ ืงืขื ืขื ืืขื ืึทืืข ืื ื ืืืืืง ืกืงืืื ืืื ืืืขืจื ืึท ืคืึทืงืืืฉ ืฉืืืื ืฉืืขืจื ืืื ืื ืคืขืื ืคืื ืืึทืื ืื ืืฉืขื ืืขืจืืข. ืืื, ืืึธ, ืืืจ ืงืขื ืขื ืฆืืขื ืืขื ืึทืืืขืง ืืคืืื ืึธื ืคึผืจืึธืืจืึทืืืื ื ืกืงืืื ืึธืืขืจ ืื ืืขืจืข ืืขืื ืืฉ ืืืืกื. ืขืก ืืื ืฉืืืขืจ, ืึธืืขืจ ืืขืืืขื!
ืืืึธืก ืืขื ืขื ืื ืขืจืฉืืขืจ ืืจืื?
ืืืจ ืืึธื ืืึธืื ืึท ืืขื ืขืจืึทื ืืขืืึทื ืง ืคืื ืืืึธืก ืืื ืืืึธืก.
ืขืจืฉืืขืจ ืคืื ืึทืืข, ืืึทืืึท ืืื ืืฉืขื ืืจืืข ืจืขืคืขืจืก ืฆื ืงืึธืืคึผืืืืขืจ ืืืืกื ืฉืึทืคึฟื. ืืขืจ ืกืคึผืึทืกืืคืืงืื, ืืืจ ืืืื ืคึฟืึทืจืฉืืืื ืขืคืขืงืืืื ืึทืืืขืจืืืึทืื ืืื ืืึทืื ืกืืจืึทืงืืฉืขืจื. ืฆืืืืืื ืก, ืืื ื ืืึทืื ืขื ืืืฉืึทื ืืจื ืึทืจืืขื ืืื ืืึทืื, ืขืก ืืื ื ืืืืืง ืฆื ืคึฟืึทืจืฉืืืื ืื ืคึผืจืื ืกืึทืคึผืึทืื ืคืื ืืึทืืึทืืืืกืื ืืื ืื ืกืืจืึทืงืืฉืขืจื ืืืึธืก ืึทื ืืขืจืืืืื ื ืืื.
ืคึฟืึทืจ ืืืึทืฉืคึผืื, ืงืึทื ืืืขื ืฉืึทื ืึทื ื-ืืืื ืกืงื ืืึทืืึทืืืืกืื ืืขื ืขื ืืืืืจื ืืืืฃ ืื ื-ืืจื ืืึทืื ืกืืจืืงืืืจ, ืืื ืืขืืื ื ืืื, ืืื ืืึธืืขืจื ืคืื ืื ืืขืจืืขืืืืื ืจืืคึผืึทืืึทืืึธืจืื, LSM-Tree ืืื ืื ืืขืจืข ืืึธืืืคืืงืึทืืืึธื ืก ืคืื ืืึทืฉ ืืืฉื.
* ืื ืกืืขืคึผืก ืืขื ืขื ืืืืืจื ืืืืฃ ืึท ืืจืืืก ืึทืจืืืงื
1. ืึทืืืขืจืืืึทืื ืืื ืืึทืื ืกืืจืึทืงืืฉืขืจื
ื ืืฆื ืื ืจืขืื ืืึทืื ืกืืจืืงืืืจ ืงืขื ืขื ืืืืืืืืง ืคึฟืึทืจืืขืกืขืจื ืื ืคืึธืจืฉืืขืืื ื ืคืื ืึท ืึทืืืขืจืืืึทื. ืืืขืึทืืื, ืืืจ ืืึธื ืึทืืข ืืขืจื ืขื ืืืขืื ืืึทืื ืกืืจืึทืงืืฉืขืจื ืืื ืึทืืืขืจืืืึทืื ืืื ืืื ืืืขืจ ืฉืืื, ืึธืืขืจ ืืึธืก ืืื ืจืึทืจืขืื ืืึธืืื ืืืืขืงื. ืืื ืงืืื ืคืึทื, ืขืก ืืื ืงืืื ืืึธื ืฆื ืฉืคึผืขื ืฆื ืืึทืงืืืขื ืืึทืงืึทื ื.
ืืึธ ืืขื ืขื ืืืื ืืึทืืืืกืืข ืคืจืื ืงืึธืจืกืึทื ืคึฟืึทืจ ืืขืจื ืขื ืืึทืื ืกืืจืึทืงืืฉืขืจื ืืื ืึทืืืขืจืืืึทืื:
ืคืื ืคึผืฉืื ืฆื ืงืึธืืคึผืืขืงืก: ืืึทืื ืกืืจืึทืงืืฉืขืจื (Udemy) ืึทืืืขืจืืืึทืื, ืืืื ืืื (ืงืืจืกืขืจืึท) ืึทืืืขืจืืืึทืื, ืืืื ืื (ืงืืจืกืขืจืึท)
ืคึผืืืก ืืึธื ื ืื ืคืึทืจืืขืกื ืืืขืื Thomas Corman ืก ืงืืึทืกืืฉ ืึทืจืืขื ืืืืฃ ืึทืืืขืจืืืึทืื -
- ืฆื ืคึฟืึทืจืืขืกืขืจื ืืืื ืกืงืืื, ื ืืฆื
Leetcode .
ืืืจ ืงืขื ื ืืืื ืื ืืขืจืืืงื ืืื ืืื ืืขืจ ืืืขืื ืคืื ืืึทืืึทืืืืกืื ืืื ืึทืืืืืื ื ืืืืืืืก ืคืื Carnegie Mellon ืืื ืืืืขืจืกืืืขื ืืืืฃ ืืึธืืืืืข:
ืืงืืื ืฆื ืืึทืืึทืืึทืกืข ืกืืกืืขืืขื .ืึทืืืึทื ืกืืจืืข ืืึทืืึทืืึทืกืข ืกืืกืืขืืก .
2. ืืขืจื ืกืงื
ืืื ืืืขืจ ืืึทื ืฅ ืืขืื ืืื ืืึทืื. ืืื ืืื ืกืืจ ืฆื ืขืงืกืืจืึทืงื ืื ืืึทืื ืคืื ืื ืืึทืืึทืืืืก, ืืืจ ืืึทืจืคึฟื ืฆื "ืจืขืื" ืื ืืขืืืข ืฉืคึผืจืึทื ืืื ืืื.
SQL (Structured Query Language) ืืื ืื ืฉืคึผืจืึทื ืคืื ืงืึธืืื ืืงืึทืฆืืข ืืื ืื ืืึทืื ืคืขืื. ืจืขืืึทืจืืืขืกืก ืคืื ืืืึธืก ืืืขืจ ืขืก ืื ืืืื, SQL ืืื ืืขืืขืื, ืืื ืืขืืขืืืง ืืื ืืืขื ืืขืื ืคึฟืึทืจ ืึท ืืืืขืจ ืืึทื ื ืฆืืื.
ืืืื ืืืจ ืืึธืื ืฉืืื ืืื ืึทื ืืืืืงืืื ื ืคึฟืึทืจ ืึท ืืึทื ื ืฆืืึทื, ืืืจ'ืืืข ืืืกืืึธืืข ืืืืขืจืงื ืึทื ืจืืืึธืจืก ืืืขืื ืื ืึธื-ืึธื ืืืื ืคืื SQL ืงื ืึทื ืึทืจืืืฃ ืคึผืืจืืึทืืืงืื. ืื ืฉืคึผืจืึทื ืืื ืืขืืืขืืึธืคึผืขื ืืื ืื ืคืจื 70 ืก ืืื ืืื ื ืึธื ืืืืขืจ ืคืึธืืงืก ืฆืืืืฉื ืึทื ืึทืืืก, ืืขืืืขืืึธืคึผืขืจืก ืืื ืคืฉืื ืขื ืืืืืึทืกืฅ.
ืึธื ืืืืกื ืคืื SQL ืขืก ืืื ืืึธืจื ืืฉื ืฆื ืืึธื ืืื ืืึทืื ืื ืืฉืขื ืืขืจืืข, ืืืืึทื ืืืจ ืืืขื ืื ืขืืืึทืืึทืืื ืืึธืื ืฆื ืฉืึทืคึฟื ืงืืืืจืื ืฆื ืฆืืจืืงืงืจืืื ืืึทืื. ืื ืืึธืืขืจื ืืจืืืก ืืึทืื ืืืขืจืืึทืืืื ืฉืืืฆื SQL:
- ืึทืืึทืืึธื ืจืขืืฉืืคื
- HP Vertica
- ืึธืจืึทืงื
- ืกืงื ืกืขืจืืืืจืขืจ
... ืืื ืคืืืข ืื ืืขืจืข.
ืฆื ืึทื ืึทืืืื ืึท ืืจืืืก ืฉืืืืข ืคืื โโืืึทืื ืกืืึธืจื ืืื ืคืื ืื ืืขืจืืขืืืืื ืกืืกืืขืืขื ืึทืืึท ืืื HDFS, ืกืงื ืขื ืืืฉืึทื ื ืืขื ืขื ืื ืืืขื ืืึทื: ืึทืคึผืึทืืฉื ืืืืืข, ืืืคึผืึทืืึท, ืืื"ื ื. ืืขื, ืขืก ืืื ื ืืฉื ืืขืืื ืืขื ืขืจืืขืฅ.
ืืื ืฆื ืืขืจื ืขื SQL? ื ืึธืจ ืืึธื ืขืก ืืื ืคืืจ.
ืฆื ืืึธื ืืึธืก, ืืื ืจืขืงืึธืืขื ืืืจื ืฆื ืงืึธื ืืจืึธืืืจื ืึท ืืืกืืขืฆืืืื ื ืืืืึธืจืืึทื, ืืืึธืก, ืืืจื ืืขื ืืืขื, ืืื ืคืจืื
ืืืึธืก ืืืื ืื ืงืึธืจืกืึทื ืกืคึผืขืฆืืขื ืืื ืึทื ืืื ืืึธืื ืึทื ืื ืืขืจืึทืงืืืื ืกืืืืืืข ืืื ืืืจ ืงืขื ืขื ืฉืจืืึทืื ืืื ืืืืคื SQL ืงืืืืจืื ืืื ืืืื ืืืขืืขืจืขืจ. ืืืื
3. ืคึผืจืึธืืจืึทืืืื ื ืืื ืคึผืืืืึธื ืืื ื'ืืื / ืกืงืึทืืึท
ืคืืจืืืืก ืืืจ ืืึธื ืืขืจื ืขื ืื Python ืคึผืจืึธืืจืึทืืืื ื ืฉืคึผืจืึทื, ืืื ืฉืืื ืืขืฉืจืืื ืืื ืืขื ืึทืจืืืงื
- ืึทืคึผืึทืืฉื ืงืึทืคืงืึท (ืกืงืึทืืึท)
- Hadoop, HDFS (Java)
- ืึทืคึผืึทืืฉื ืกืคึผืึทืจืง (ืกืงืึทืืึท)
- ืึทืคึผืึทืืฉื ืงืึทืกืึทื ืืจืึท (ืืืฉืึทืืืึท)
- HBase (Java)
- ืึทืคึผืึทืืฉื ืืืืืข (ืืืฉืึทืืืึท)
ืฆื ืคึฟืึทืจืฉืืืื ืืื ืื ืืืฉืืจืื ืึทืจืืขื, ืืืจ ืืึทืจืคึฟื ืฆื ืืืืกื ืื ืฉืคึผืจืึทืื ืืื ืืืึธืก ืืื ืืขื ืขื ืืขืฉืจืืื. Scala ืก ืคืึทื ืืงืฉืึทื ืึทื ืฆืืืึทื ื ืึทืืึทืื ืืืจ ืฆื ืืคืขืงืืืืืื ืกืึธืืืืข ืคึผืึทืจืึทืืขื ืืึทืื ืคึผืจืึทืกืขืกืื ื ืคึผืจืึธืืืขืืก. Python, ืืืืืขืจ, ืงืขื ืขื ื ืืฉื ืืึทืจืืืขืจืืึท ืคืื ืืืืงืืึทื ืืื ืคึผืึทืจืึทืืขื ืคึผืจืึทืกืขืกืื ื. ืืื ืึทืืืขืืืื, ืืืืกื ืคืื ืขืืืขืืข ืฉืคึผืจืึทืื ืืื ืคึผืจืึธืืจืึทืืืื ื ืคึผืขืจืึทืืืื ืืื ืืื ืคึฟืึทืจ ืื ืืจืืื ืคืื ืึทืคึผืจืึธืืืฉืื ืฆื ืกืึทืืืืื ื ืคึผืจืึธืืืขืืก.
ืฆื ืื ืืขืจืืืงื ืืื ืืื ืื ืกืงืึทืืึท ืฉืคึผืจืึทื, ืืืจ ืงืขื ืขื ืืืืขื ืขื
ืืื ืคึฟืึทืจ ืคึผืืืืึธื, ืืื ืืืืืื
4. ืืืฉืืจืื ืคึฟืึทืจ ืืจืืขืื ืืื ืืจืืืก ืืึทืื
ืืึธ ืืื ืึท ืจืฉืืื ืคืื ืื ืืขืจืกื ืคืึธืืงืก ืืืฉืืจืื ืืื ืืขืจ ืืืขืื ืคืื ืืจืืืก ืืึทืื:
- ืึทืคึผืึทืืฉื ืกืคึผืึทืจืง
- ืึทืคึผืึทืืฉื ืงืึทืคืงืึท
- Apache Hadoop (HDFS, HBase, Hive)
- ืึทืคึผืึทืืฉื ืงืึทืกืึทื ืืจืึท
ืืืจ ืงืขื ืขื ืืขืคึฟืื ืขื ืืขืจ ืืื ืคึฟืึธืจืืึทืฆืืข ืืืขืื ืืืืขื ืืจืืืก ืืึทืื ืืืึทืงืก ืืื ืืขื ืึทืืืืืื ื
- ืึท ืืงืืื ืฆื Hadoop ืงืขื ืขื ืืืื
ืื ืืึทื ืฅ ืืืื ืฆื ืืึทืกืืขืจืื ื Hadoop (ืคืจืื) . - ืื ืืขืจืกื ืคืืืฉืืขื ืืืง ืคืืจืขืจ ืฆื ืึทืคึผืึทืืฉื ืกืคึผืึทืจืง ืคึฟืึทืจ ืืืจ ืืื -
Spark: ืื ืืึทื ืฅ ืืืื .
5. ืงืืึธืื ืคึผืืึทืืคืึธืจืืก
ืืืืกื ืคืื ืืืึท ืืื ืืกืืขืจ ืืืื ืืืึธืืงื ืคึผืืึทืืคืึธืจืืข ืืื ืืืืฃ ืืขืจ ืจืฉืืื ืคืื ืืงืขืจืืืง ืืืืขืจืคืขื ืืฉื ืคึฟืึทืจ ืึทืคึผืืืงืึทื ืฅ ืคึฟืึทืจ ืื ืฉืืขืืข ืคืื โโืืึทืื ืื ืืฉืขื ืืจ. ืขืืคึผืืืืขืจืก ืืขืื ืืืืขืจืืึทื ื ืฆื ืึทืืึทืืึธื ืืืขื ืืึทืืื ืื ืืก, ืืื Google ืืืึธืืงื ืคึผืืึทืืคืึธืจืืข ืืื ืฆืืืืื ืคึผืืึทืฅ ืืื Microsoft Azure ืจืึทืื ืืื ื ืื ืฉืคึผืืฅ ืืจืื.
ืืืจ ืืืื ืืึธืื ืืื ืืืืกื ืคืื Amazon EC2, AWS Lambda, Amazon S3, DynamoDB.
6. ืคืื ืื ืืขืจืืขืืืืื ืกืืกืืขืืขื
ืืจืืขืื ืืื ืืจืืืก ืืึทืื ืืืคึผืืืื ืื ืืืึทืืืึทื ืคืื ืงืืึทืกืืขืจื ืคืื ืื ืืืคึผืขื ืืึทื ืืื ืึทืคึผืขืจืืืืื ื ืงืึธืืคึผืืืืขืจืก, ืฆืืืืฉื ืืืึธืก ืงืึธืืื ืืงืึทืฆืืข ืืื ืืืจืืืขืงืึธืื ืืืืขืจ ืึท ื ืขืฅ. ืื ืืจืขืกืขืจืข ืื ืงื ืืื, ืื ืืจืขืกืขืจ ืื ืืึทืฉืืึธืขืก ืคืื ืืืจืืคืึทื ืคืื ืืืึทื ืืืืืืื ื ืึธืืื. ืฆื ืืืขืจื ืึท ืืจืืืก ืืึทืื ืืขืืขืจื ืืขืจ, ืืืจ ืืึทืจืคึฟื ืฆื ืคึฟืึทืจืฉืืืื ืื ืคึผืจืึธืืืขืืก ืืื ืืืืืกืืื ื ืกืึทืืืฉืึทื ื ืคึฟืึทืจ ืคืื ืื ืืขืจืืขืืืืื ืกืืกืืขืืขื. ืื ืืขืื ื ืืื ืึทืื ืืื ืงืึธืืคึผืืืฆืืจื.
ืื ืืจืื ืืื ืขื ืืืื ืืืขืจื ืืขืจืขืื ื ืืื ื ืคืืื ืขืจ ืืื ืืขื ืืขืืื. ืคึฟืึทืจ ืื ืืืืก ืืขื ืขื ื ืืฉื ืืขืจืฉืจืึธืงื ืคืื ืืขืึธืจืืข, ืืื ืจืขืงืึธืืขื ืืืจื ืืืื ืืื
ืืื ืืึทืืจืึทืืื
ืคึฟืึทืจ ืื ืืืืก ืืื ืฆื ืืขื ืืืืืืืก, ืขืก ืืื ืึท ืงืืจืก ืืืืฃ ืืึธืืืืืข
7. ืืึทืืึท ืคึผืืืคึผืืืื ื
ืืึทืืึท ืคึผืืืคึผืืืื ื ืืขื ืขื ืขืคึผืขืก ืืืจ ืงืขื ืขื ื ืืฉื ืืขืื ืึธื ืืื ืึท ืืึทืื ืื ืืฉืขื ืืจ.
ืจืืึฟ ืคืื ืื ืฆืืื, ืึท ืืึทืื ืื ืืฉืขื ืืจ ืืืืขื ืึท ืึทืืื ืืขืจืืคืขื ืข ืืึทืื ืจืขืจื - ืืื ืืข, ืืึธืก ืืื, ืขืจ ืงืจืืืืฅ ืึท ืคึผืจืึธืฆืขืก ืคึฟืึทืจ ืืืืืืืขืจืื ื ืืึทืื ืคืื ืืืื ืึธืจื ืฆื ืื ืืขืจื. ืืึธืก ืงืขื ืืืื ืื ืื ืกืงืจืืคึผืก ืืืึธืก ืืืื ืฆื ืึท ืคืื ืืจืืืกื ืืืง ืกืขืจืืืืก ืึทืคึผื ืึธืืขืจ ืืึทืื ืึท SQL ืึธื ืคึฟืจืขื, ืคืึทืจืืจืขืกืขืจื ืื ืืึทืื ืืื ืฉืืขืื ืขืก ืืื ืึท ืกืขื ืืจืึทืืืืื ืงืจืึธื (ืืึทืืึท ืืืขืจืืึทืืก) ืึธืืขืจ ืึท ืึทื ืกืืจืึทืงืืฉืขืจื ืืึทืื ืงืจืึธื (ืืึทืืึท ืืึทืงืขืก).
ืฆื ืกืึทืืขืจืืื: ืื ืืงืขืจืืืง ืืฉืขืงืืืกื ืคึฟืึทืจ ืึท ืืึทืื ืื ืืฉืขื ืืจ
ืฆื ืกืึทืืขืจืืื, ืึท ืืื ืคืืจืฉืืื ื ืคืื ืื ืคืืืืขื ืืข ืืื ืคืืจืืื ืื:
- ืืื ืคึฟืึธืจืืึทืฆืืข ืกืืกืืขืืขื;
- ืืืืืืืืืจื ืึทื ืืืืืงืืื ื (ืืืืืงืืึทื, ืืขืืืึธืคึผืก, ืคึผืืึทื ืืขืงื ืืงืก, ืกืึธืึท);
- ืคืื ืื ืืขืจืืขืืืืื ืกืืกืืขืืขื ืืื ืคึผืึทืจืึทืืขื ืคึผืจืึธืืจืึทืืืื ื;
- ืืึทืืึทืืึทืกืข ืคืื ืืึทืืขื ืืึทืืก โโ- ืคึผืืึทื ืืจืื ื, ืคึผืืึทื, ืึธืคึผืขืจืึทืฆืืข ืืื ืืจืึธืืืืขืฉืึธืึธืืื ื;
- ืคึผืืึทื ืคืื ืืงืกืคึผืขืจืึทืืึทื ืฅ - ื / ื ืืขืกืฅ ืฆื ืืึทืืืืึทืื ืงืึทื ืกืขืคึผืก, ืืึทืฉืืืืขื ืจืืืืืึทืืืืึทืื, ืกืืกืืขื ืคืึธืจืฉืืขืืื ื ืืื ืึทื ืืืืืงืืขื ืคืึทืจืืึธืืืขื ืคึผืึทืืก ืฆื ืฆืืฉืืขืื ืืื ืกืึทืืืฉืึทื ื ืืขืฉืืืื ื.
ืืึธืก ืืขื ืขื ืืืืื ืึท ืืืกื ืคืื ืื ืืืืขืจืคืขื ืืฉื ืฆื ืืืขืจื ืึท ืืึทืื ืื ืืฉืขื ืืจ, ืึทืืื ืืขืจื ืขื ืืื ืคึฟืึทืจืฉืืืื ืืึทืื ืกืืกืืขืืขื, ืืื ืคึฟืึธืจืืึทืฆืืข ืกืืกืืขืืขื, ืงืขืกืืืืขืจืืืง ืขืงืกืคึผืจืขืก / ืืืคึผืืืืืึทื ื / ืื ืืึทืืจืืืฉืึทื, ืคึผืจืึธืืจืึทืืืื ื ืฉืคึผืจืึทืื ืืื ืื ืืขืจืข ืงืึธืืคึผืืืืขืจ ืืืืกื ืฉืึทืคึฟื ืืขืืขืก (ื ืื ืึทืืข ืื ืืขืจืืขื ืืง ืืขืืืื).
ืืื ืฆืื ืกืืฃ, ืื ืืขืฆืืข ืึธืืขืจ ืืืืขืจ ืืืืืืืง ืืึทื ืืื ืืืืื ืฆื ืืึธืื.
ืืขืจ ืืืขื ืฆื ืืืขืจื ืืึทืืึท ืืื ืืฉืขื ืืจืืข ืืื ื ืืฉื ืึทืืื ืคึผืฉืื ืืื ืขืก ืงืขื ืืืกืงืืืขื. ืขืจ ืืืื ื ืื, ืขืจ ืคืจืึทืกืืจืืืฅ, ืืื ืืืจ ืืืื ืืืื ืฆืืืขืืจืืื ืคึฟืึทืจ ืืขื. ืขืืืขืืข ืืึธืืืึทื ืฅ ืืื ืืขื ื ืกืืขื ืงืขื ืฉืืืคึผื ืืืจ ืฆื ืืขืื ืึทืจืืืฃ. ืืืขืจ ืืึธืก ืืื ืคืึทืงืืืฉ ืึทืจืืขื ืืื ืึท ืืขืจื ืขื ืคึผืจืึธืฆืขืก.
ื ืึธืจ ืืึธื ื ืื ืฆืืงืขืจ ืงืึธืื ืขืก ืคืื ืื ืึธื ืืืื. ืื ืืื ืฆืข ืคืื ื ืคืื ืืจืึทืืืึทืืื ื ืืื ืฆื ืืขืจื ืขื ืืื ืคืื ืืื ืืขืืืขื ืืื ืืืื ืืจืืื ืคึฟืึทืจ ื ืืึทืข ืืฉืึทืืึทื ืืืฉืื.
ืืึธ ืืื ืึท ืืจืืืก ืืืื ืืืึธืก ืืื ืืขืคึฟืื ืขื ืืขื ืคืื ื ืืขืืื ื:
ืืื ืืึธ, ืืขืืขื ืงืขื ืฆื ืืืกืืืืื ืืขืจื ืึทืื ืืื ืื ืืื. ืืึธืก ืืื ืืืื ืืืืขืจ ืืืืืืืง. ืืึธื ืืืึทื ืืื ืืึทืื!
ืืืึธืก ืืึธื ืืืจ ืืจืึทืืื ืืืขืื ืืขื ืึทืจืืืงื, ืคืจืืื ื? ืืืจ ืืึทืื ืืืจ ืฆื
ืืงืืจ: www.habr.com