Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

Π₯Π΅ΠΉ Π₯Π°Π±Ρ€!

ΠœΠΈΠ½Π°Π»Π°Ρ‚Π° СсСн Kaggle бСшС Π΄ΠΎΠΌΠ°ΠΊΠΈΠ½ Π½Π° ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅ Π·Π° класифициранС Π½Π° Ρ€ΡŠΡ‡Π½ΠΎ рисувани ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΈ, Quick Draw Doodle Recognition, Π² ΠΊΠΎΠ΅Ρ‚ΠΎ, Π½Π°Ρ€Π΅Π΄ с Π΄Ρ€ΡƒΠ³ΠΈ, участва Π΅ΠΊΠΈΠΏ ΠΎΡ‚ R-ΡƒΡ‡Π΅Π½ΠΈ: ΠΡ€Ρ‚ΡŒΠΎΠΌ ΠšΠ»Π΅Π²Ρ†ΠΎΠ²Π°, Π£ΠΏΡ€Π°Π²ΠΈΡ‚Π΅Π» Π€ΠΈΠ»ΠΈΠΏΠ° ΠΈ АндрСй ΠžΠ³ΡƒΡ€Ρ†ΠΎΠ². Няма Π΄Π° описвамС ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅Ρ‚ΠΎ, Ρ‚ΠΎΠ²Π° Π²Π΅Ρ‡Π΅ Π΅ Π½Π°ΠΏΡ€Π°Π²Π΅Π½ΠΎ Π² ΡΠΊΠΎΡ€ΠΎΡˆΠ½Π° публикация.

Π’ΠΎΠ·ΠΈ ΠΏΡŠΡ‚ Π½Π΅ сС ΠΏΠΎΠ»ΡƒΡ‡ΠΈ с ΠΎΡ‚Π³Π»Π΅ΠΆΠ΄Π°Π½Π΅Ρ‚ΠΎ Π½Π° ΠΌΠ΅Π΄Π°Π»ΠΈ, Π½ΠΎ бСшС Π½Π°Ρ‚Ρ€ΡƒΠΏΠ°Π½ ΠΌΠ½ΠΎΠ³ΠΎ Ρ†Π΅Π½Π΅Π½ ΠΎΠΏΠΈΡ‚, Ρ‚Π°ΠΊΠ° Ρ‡Π΅ Π±ΠΈΡ… искал Π΄Π° Ρ€Π°Π·ΠΊΠ°ΠΆΠ° Π½Π° общността Π·Π° Ρ€Π΅Π΄ΠΈΡ†Π° ΠΎΡ‚ Π½Π°ΠΉ-интСрСснитС ΠΈ ΠΏΠΎΠ»Π΅Π·Π½ΠΈ Π½Π΅Ρ‰Π° Π½Π° Kagle ΠΈ Π² Π΅ΠΆΠ΅Π΄Π½Π΅Π²Π½Π°Ρ‚Π° Ρ€Π°Π±ΠΎΡ‚Π°. Π‘Ρ€Π΅Π΄ ΠΎΠ±ΡΡŠΠΆΠ΄Π°Π½ΠΈΡ‚Π΅ Ρ‚Π΅ΠΌΠΈ: Ρ‚Ρ€ΡƒΠ΄Π΅Π½ ΠΆΠΈΠ²ΠΎΡ‚ Π±Π΅Π· OpenCV, Π°Π½Π°Π»ΠΈΠ· Π½Π° JSON (Ρ‚Π΅Π·ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΈ Ρ€Π°Π·Π³Π»Π΅ΠΆΠ΄Π°Ρ‚ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ Π½Π° C++ ΠΊΠΎΠ΄ Π² скриптовС ΠΈΠ»ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ Π² R, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ Rcpp), парамСтризация Π½Π° скриптовС ΠΈ докСризация Π½Π° ΠΊΡ€Π°ΠΉΠ½ΠΎΡ‚ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅. ЦСлият ΠΊΠΎΠ΄ ΠΎΡ‚ ΡΡŠΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π² подходяща Π·Π° изпълнСниС Ρ„ΠΎΡ€ΠΌΠ° Π΅ Π΄ΠΎΡΡ‚ΡŠΠΏΠ΅Π½ Π² Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π°.

Π‘ΡŠΠ΄ΡŠΡ€ΠΆΠ°Π½ΠΈΠ΅:

  1. Π•Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π·Π°Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ ΠΎΡ‚ CSV Π² MonetDB
  2. ΠŸΡ€ΠΈΠ³ΠΎΡ‚Π²ΡΠ½Π΅ Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ
  3. Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ΠΈ Π·Π° Ρ€Π°Π·Ρ‚ΠΎΠ²Π°Ρ€Π²Π°Π½Π΅ Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ ΠΎΡ‚ Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ
  4. Π˜Π·Π±ΠΎΡ€ Π½Π° ΠΌΠΎΠ΄Π΅Π»Π½Π° Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°
  5. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° скрипта
  6. ДокСризация Π½Π° скриптовС
  7. ИзползванС Π½Π° мноТСство GPU Π² Google Cloud
  8. ВмСсто Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

1. Π•Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ Π·Π°Ρ€Π΅Π΄Π΅Ρ‚Π΅ Π΄Π°Π½Π½ΠΈ ΠΎΡ‚ CSV Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ MonetDB

Π”Π°Π½Π½ΠΈΡ‚Π΅ Π² Ρ‚ΠΎΠ²Π° ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅ сС прСдоставят Π½Π΅ ΠΏΠΎΠ΄ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° Π³ΠΎΡ‚ΠΎΠ²ΠΈ изобраТСния, Π° ΠΏΠΎΠ΄ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° 340 CSV Ρ„Π°ΠΉΠ»Π° (ΠΏΠΎ Π΅Π΄ΠΈΠ½ Ρ„Π°ΠΉΠ» Π·Π° всСки клас), ΡΡŠΠ΄ΡŠΡ€ΠΆΠ°Ρ‰ΠΈ JSON с ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ΠΈ Π½Π° Ρ‚ΠΎΡ‡ΠΊΠΈ. Π‘Π²ΡŠΡ€Π·Π²Π°ΠΉΠΊΠΈ Ρ‚Π΅Π·ΠΈ Ρ‚ΠΎΡ‡ΠΊΠΈ с Π»ΠΈΠ½ΠΈΠΈ, ΠΏΠΎΠ»ΡƒΡ‡Π°Π²Π°ΠΌΠ΅ ΠΊΡ€Π°ΠΉΠ½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ с Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΈ 256x256 пиксСла. Π‘ΡŠΡ‰ΠΎ Ρ‚Π°ΠΊΠ° Π·Π° всСки запис ΠΈΠΌΠ° Π΅Ρ‚ΠΈΠΊΠ΅Ρ‚, ΡƒΠΊΠ°Π·Π²Π°Ρ‰ Π΄Π°Π»ΠΈ снимката Π΅ Π±ΠΈΠ»Π° Ρ€Π°Π·ΠΏΠΎΠ·Π½Π°Ρ‚Π° ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ ΠΎΡ‚ класификатора, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ ΠΏΠΎ Π²Ρ€Π΅ΠΌΠ΅ Π½Π° ΡΡŠΠ±ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ Π½Π° Π½Π°Π±ΠΎΡ€Π° ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ, Π΄Π²ΡƒΠ±ΡƒΠΊΠ²Π΅Π½ ΠΊΠΎΠ΄ Π½Π° страната Π½Π° ΠΏΡ€Π΅Π±ΠΈΠ²Π°Π²Π°Π½Π΅ Π½Π° Π°Π²Ρ‚ΠΎΡ€Π° Π½Π° снимката, ΡƒΠ½ΠΈΠΊΠ°Π»Π΅Π½ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€, ΠΊΠ»Π΅ΠΉΠΌΠΎ Π·Π° Π²Ρ€Π΅ΠΌΠ΅ ΠΈ ΠΈΠΌΠ΅ Π½Π° клас, ΠΊΠΎΠ΅Ρ‚ΠΎ ΡΡŠΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²Π° Π½Π° ΠΈΠΌΠ΅Ρ‚ΠΎ Π½Π° Ρ„Π°ΠΉΠ»Π°. ΠžΠΏΡ€ΠΎΡΡ‚Π΅Π½Π° вСрсия Π½Π° ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ Ρ‚Π΅ΠΆΠΈ 7.4 GB Π² Π°Ρ€Ρ…ΠΈΠ²Π° ΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»Π½ΠΎ 20 GB слСд Ρ€Π°Π·ΠΎΠΏΠ°ΠΊΠΎΠ²Π°Π½Π΅, ΠΏΡŠΠ»Π½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ слСд Ρ€Π°Π·ΠΎΠΏΠ°ΠΊΠΎΠ²Π°Π½Π΅ Π·Π°Π΅ΠΌΠ°Ρ‚ 240 GB. ΠžΡ€Π³Π°Π½ΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΈΡ‚Π΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€Π°Ρ…Π°, Ρ‡Π΅ ΠΈ Π΄Π²Π΅Ρ‚Π΅ вСрсии Π²ΡŠΠ·ΠΏΡ€ΠΎΠΈΠ·Π²Π΅ΠΆΠ΄Π°Ρ‚ Π΅Π΄Π½ΠΈ ΠΈ ΡΡŠΡ‰ΠΈ рисунки, ΠΊΠΎΠ΅Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π²Π°, Ρ‡Π΅ ΠΏΡŠΠ»Π½Π°Ρ‚Π° вСрсия Π΅ излишна. Π’ΡŠΠ² всСки случай, ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Π½Π΅Ρ‚ΠΎ Π½Π° 50 ΠΌΠΈΠ»ΠΈΠΎΠ½Π° изобраТСния Π² Π³Ρ€Π°Ρ„ΠΈΡ‡Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΈΠ»ΠΈ ΠΏΠΎΠ΄ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° масиви Π²Π΅Π΄Π½Π°Π³Π° бСшС счСтСно Π·Π° Π½Π΅Ρ€Π΅Π½Ρ‚Π°Π±ΠΈΠ»Π½ΠΎ ΠΈ Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° ΠΎΠ±Π΅Π΄ΠΈΠ½ΠΈΠΌ всички CSV Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΎΡ‚ Π°Ρ€Ρ…ΠΈΠ²Π° train_implified.zip Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ с послСдващо Π³Π΅Π½Π΅Ρ€ΠΈΡ€Π°Π½Π΅ Π½Π° изобраТСния с нСобходимия Ρ€Π°Π·ΠΌΠ΅Ρ€ β€žΠ² Π΄Π²ΠΈΠΆΠ΅Π½ΠΈΠ΅β€œ Π·Π° всяка ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°.

Π—Π° Π‘Π£Π‘Π” бСшС ΠΈΠ·Π±Ρ€Π°Π½Π° Π΄ΠΎΠ±Ρ€Π΅ Π΄ΠΎΠΊΠ°Π·Π°Π½Π° систСма MonetDB, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ рСализация Π·Π° R ΠΊΠ°Ρ‚ΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚ MonetDBLite. ΠŸΠ°ΠΊΠ΅Ρ‚ΡŠΡ‚ Π²ΠΊΠ»ΡŽΡ‡Π²Π° Π²Π³Ρ€Π°Π΄Π΅Π½Π° вСрсия Π½Π° ΡΡŠΡ€Π²ΡŠΡ€Π° Π½Π° Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ ΠΈ Π²ΠΈ позволява Π΄Π° Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ ΡΡŠΡ€Π²ΡŠΡ€Π° Π΄ΠΈΡ€Π΅ΠΊΡ‚Π½ΠΎ ΠΎΡ‚ R сСсия ΠΈ Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΡ‚Π΅ с Π½Π΅Π³ΠΎ Ρ‚Π°ΠΌ. Π‘ΡŠΠ·Π΄Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° Π±Π°Π·Π° Π΄Π°Π½Π½ΠΈ ΠΈ ΡΠ²ΡŠΡ€Π·Π²Π°Π½Π΅Ρ‚ΠΎ с нСя сС ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π°Ρ‚ с Π΅Π΄Π½Π° ΠΊΠΎΠΌΠ°Π½Π΄Π°:

con <- DBI::dbConnect(drv = MonetDBLite::MonetDBLite(), Sys.getenv("DBDIR"))

Π©Π΅ трябва Π΄Π° създадСм Π΄Π²Π΅ Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ: Π΅Π΄Π½Π°Ρ‚Π° Π·Π° всички Π΄Π°Π½Π½ΠΈ, Π΄Ρ€ΡƒΠ³Π°Ρ‚Π° Π·Π° слуТСбна информация Π·Π° ΠΈΠ·Ρ‚Π΅Π³Π»Π΅Π½ΠΈΡ‚Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ (ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, Π°ΠΊΠΎ Π½Π΅Ρ‰ΠΎ сС ΠΎΠ±ΡŠΡ€ΠΊΠ° ΠΈ ΠΏΡ€ΠΎΡ†Π΅ΡΡŠΡ‚ трябва Π΄Π° бъдС възобновСн слСд изтСглянС Π½Π° няколко Ρ„Π°ΠΉΠ»Π°):

БъздаванС Π½Π° Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ

if (!DBI::dbExistsTable(con, "doodles")) {
  DBI::dbCreateTable(
    con = con,
    name = "doodles",
    fields = c(
      "countrycode" = "char(2)",
      "drawing" = "text",
      "key_id" = "bigint",
      "recognized" = "bool",
      "timestamp" = "timestamp",
      "word" = "text"
    )
  )
}

if (!DBI::dbExistsTable(con, "upload_log")) {
  DBI::dbCreateTable(
    con = con,
    name = "upload_log",
    fields = c(
      "id" = "serial",
      "file_name" = "text UNIQUE",
      "uploaded" = "bool DEFAULT false"
    )
  )
}

Най-Π±ΡŠΡ€Π·ΠΈΡΡ‚ Π½Π°Ρ‡ΠΈΠ½ Π·Π° Π·Π°Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ бСшС Π΄ΠΈΡ€Π΅ΠΊΡ‚Π½ΠΎ ΠΊΠΎΠΏΠΈΡ€Π°Π½Π΅ Π½Π° CSV Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° SQL - ΠΊΠΎΠΌΠ°Π½Π΄Π° COPY OFFSET 2 INTO tablename FROM path USING DELIMITERS ',','n','"' NULL AS '' BEST EFFORTΠšΡŠΠ΄Π΅Ρ‚ΠΎ tablename - ΠΈΠΌΠ΅ Π½Π° Ρ‚Π°Π±Π»ΠΈΡ†Π° ΠΈ path - ΠΏΡŠΡ‚Ρ Π΄ΠΎ Ρ„Π°ΠΉΠ»Π°. По Π²Ρ€Π΅ΠΌΠ΅ Π½Π° Ρ€Π°Π±ΠΎΡ‚Π° с Π°Ρ€Ρ…ΠΈΠ²Π° бСшС ΠΎΡ‚ΠΊΡ€ΠΈΡ‚ΠΎ, Ρ‡Π΅ Π²Π³Ρ€Π°Π΄Π΅Π½Π°Ρ‚Π° рСализация unzip Π² R Π½Π΅ Ρ€Π°Π±ΠΎΡ‚ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ с Ρ€Π΅Π΄ΠΈΡ†Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΎΡ‚ Π°Ρ€Ρ…ΠΈΠ²Π°, Π·Π°Ρ‚ΠΎΠ²Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ систСмата unzip (с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚ΡŠΡ€Π° getOption("unzip")).

Ѐункция Π·Π° запис Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ

#' @title Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ ΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Ρ„Π°ΠΉΠ»ΠΎΠ²
#'
#' @description
#' Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ CSV-Ρ„Π°ΠΉΠ»ΠΎΠ² ΠΈΠ· ZIP-Π°Ρ€Ρ…ΠΈΠ²Π° ΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° ΠΈΡ… Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…
#'
#' @param con ΠžΠ±ΡŠΠ΅ΠΊΡ‚ ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΊ Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… (класс `MonetDBEmbeddedConnection`).
#' @param tablename НазваниС Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ….
#' @oaram zipfile ΠŸΡƒΡ‚ΡŒ ΠΊ ZIP-Π°Ρ€Ρ…ΠΈΠ²Ρƒ.
#' @oaram filename Имя Ρ„Π°ΠΉΠ»Π° Π²Π½ΡƒΡ€ΠΈ ZIP-Π°Ρ€Ρ…ΠΈΠ²Π°.
#' @param preprocess Ѐункция ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ, которая Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½Π° ΠΈΠ·Π²Π»Π΅Ρ‡Ρ‘Π½Π½ΠΎΠΌΡƒ Ρ„Π°ΠΉΠ»Ρƒ.
#'   Π”ΠΎΠ»ΠΆΠ½Π° ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ `data` (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ `data.table`).
#'
#' @return `TRUE`.
#'
upload_file <- function(con, tablename, zipfile, filename, preprocess = NULL) {
  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²
  checkmate::assert_class(con, "MonetDBEmbeddedConnection")
  checkmate::assert_string(tablename)
  checkmate::assert_string(filename)
  checkmate::assert_true(DBI::dbExistsTable(con, tablename))
  checkmate::assert_file_exists(zipfile, access = "r", extension = "zip")
  checkmate::assert_function(preprocess, args = c("data"), null.ok = TRUE)

  # Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ Ρ„Π°ΠΉΠ»Π°
  path <- file.path(tempdir(), filename)
  unzip(zipfile, files = filename, exdir = tempdir(), 
        junkpaths = TRUE, unzip = getOption("unzip"))
  on.exit(unlink(file.path(path)))

  # ΠŸΡ€ΠΈΠΌΠ΅Π½ΡΠ΅ΠΌ функция ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ
  if (!is.null(preprocess)) {
    .data <- data.table::fread(file = path)
    .data <- preprocess(data = .data)
    data.table::fwrite(x = .data, file = path, append = FALSE)
    rm(.data)
  }

  # Запрос ΠΊ Π‘Π” Π½Π° ΠΈΠΌΠΏΠΎΡ€Ρ‚ CSV
  sql <- sprintf(
    "COPY OFFSET 2 INTO %s FROM '%s' USING DELIMITERS ',','n','"' NULL AS '' BEST EFFORT",
    tablename, path
  )
  # Π’Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ запроса ΠΊ Π‘Π”
  DBI::dbExecute(con, sql)

  # Π”ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ записи ΠΎΠ± ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΠΉ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ΅ Π² ΡΠ»ΡƒΠΆΠ΅Π±Π½ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ
  DBI::dbExecute(con, sprintf("INSERT INTO upload_log(file_name, uploaded) VALUES('%s', true)",
                              filename))

  return(invisible(TRUE))
}

Ако трябва Π΄Π° трансформиратС Ρ‚Π°Π±Π»ΠΈΡ†Π°Ρ‚Π°, ΠΏΡ€Π΅Π΄ΠΈ Π΄Π° я Π·Π°ΠΏΠΈΡˆΠ΅Ρ‚Π΅ Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ, Π΄ΠΎΡΡ‚Π°Ρ‚ΡŠΡ‡Π½ΠΎ Π΅ Π΄Π° ΠΏΠΎΠ΄Π°Π΄Π΅Ρ‚Π΅ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π° preprocess функция, която Ρ‰Π΅ трансформира Π΄Π°Π½Π½ΠΈΡ‚Π΅.

Код Π·Π° послСдоватСлно Π·Π°Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ:

ЗаписванС Π½Π° Π΄Π°Π½Π½ΠΈ Π² Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ

# Бписок Ρ„Π°ΠΉΠ»ΠΎΠ² для записи
files <- unzip(zipfile, list = TRUE)$Name

# Бписок ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠΉ, Ссли Ρ‡Π°ΡΡ‚ΡŒ Ρ„Π°ΠΉΠ»ΠΎΠ² ΡƒΠΆΠ΅ Π±Ρ‹Π»Π° Π·Π°Π³Ρ€ΡƒΠΆΠ΅Π½Π°
to_skip <- DBI::dbGetQuery(con, "SELECT file_name FROM upload_log")[[1L]]
files <- setdiff(files, to_skip)

if (length(files) > 0L) {
  # ЗапускаСм Ρ‚Π°ΠΉΠΌΠ΅Ρ€
  tictoc::tic()
  # ΠŸΡ€ΠΎΠ³Ρ€Π΅ΡΡ Π±Π°Ρ€
  pb <- txtProgressBar(min = 0L, max = length(files), style = 3)
  for (i in seq_along(files)) {
    upload_file(con = con, tablename = "doodles", 
                zipfile = zipfile, filename = files[i])
    setTxtProgressBar(pb, i)
  }
  close(pb)
  # ΠžΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌ Ρ‚Π°ΠΉΠΌΠ΅Ρ€
  tictoc::toc()
}

# 526.141 sec elapsed - ΠΊΠΎΠΏΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ SSD->SSD
# 558.879 sec elapsed - ΠΊΠΎΠΏΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ USB->SSD

Π’Ρ€Π΅ΠΌΠ΅Ρ‚ΠΎ Π·Π° Π·Π°Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ ΠΌΠΎΠΆΠ΅ Π΄Π° Π²Π°Ρ€ΠΈΡ€Π° Π² зависимост ΠΎΡ‚ скоростнитС характСристики Π½Π° използвания диск. Π’ нашия случай Ρ‡Π΅Ρ‚Π΅Π½Π΅Ρ‚ΠΎ ΠΈ записванСто Π² Ρ€Π°ΠΌΠΊΠΈΡ‚Π΅ Π½Π° Π΅Π΄Π½ΠΎ SSD ΠΈΠ»ΠΈ ΠΎΡ‚ Ρ„Π»Π°ΡˆΠΊΠ° (ΠΈΠ·Ρ…ΠΎΠ΄Π΅Π½ Ρ„Π°ΠΉΠ») към SSD (DB) ΠΎΡ‚Π½Π΅ΠΌΠ° ΠΏΠΎ-ΠΌΠ°Π»ΠΊΠΎ ΠΎΡ‚ 10 ΠΌΠΈΠ½ΡƒΡ‚ΠΈ.

ΠžΡ‚Π½Π΅ΠΌΠ° ΠΎΡ‰Π΅ няколко сСкунди, Π·Π° Π΄Π° ΡΡŠΠ·Π΄Π°Π΄Π΅Ρ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½Π° с цСлочислСн Π΅Ρ‚ΠΈΠΊΠ΅Ρ‚ Π½Π° клас ΠΈ ΠΊΠΎΠ»ΠΎΠ½Π° с индСкс (ORDERED INDEX) с Π½ΠΎΠΌΠ΅Ρ€Π° Π½Π° Ρ€Π΅Π΄ΠΎΠ²Π΅, ΠΏΠΎ ΠΊΠΎΠΈΡ‚ΠΎ Π½Π°Π±Π»ΡŽΠ΄Π΅Π½ΠΈΡΡ‚Π° Ρ‰Π΅ Π±ΡŠΠ΄Π°Ρ‚ Π²Π·Π΅Ρ‚ΠΈ ΠΏΡ€ΠΎΠ±ΠΈ ΠΏΡ€ΠΈ създаванС Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ:

БъздаванС Π½Π° Π΄ΠΎΠΏΡŠΠ»Π½ΠΈΡ‚Π΅Π»Π½ΠΈ ΠΊΠΎΠ»ΠΎΠ½ΠΈ ΠΈ индСкс

message("Generate lables")
invisible(DBI::dbExecute(con, "ALTER TABLE doodles ADD label_int int"))
invisible(DBI::dbExecute(con, "UPDATE doodles SET label_int = dense_rank() OVER (ORDER BY word) - 1"))

message("Generate row numbers")
invisible(DBI::dbExecute(con, "ALTER TABLE doodles ADD id serial"))
invisible(DBI::dbExecute(con, "CREATE ORDERED INDEX doodles_id_ord_idx ON doodles(id)"))

Π—Π° Π΄Π° Ρ€Π΅ΡˆΠΈΠΌ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° със ΡΡŠΠ·Π΄Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π° Π² Π΄Π²ΠΈΠΆΠ΅Π½ΠΈΠ΅, Ρ‚Ρ€ΡΠ±Π²Π°ΡˆΠ΅ Π΄Π° постигнСм максимална скорост Π½Π° ΠΈΠ·Π²Π»ΠΈΡ‡Π°Π½Π΅ Π½Π° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»Π½ΠΈ Ρ€Π΅Π΄ΠΎΠ²Π΅ ΠΎΡ‚ Ρ‚Π°Π±Π»ΠΈΡ†Π°Ρ‚Π° doodles. Π—Π° Ρ†Π΅Π»Ρ‚Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ 3 Ρ‚Ρ€ΠΈΠΊΠ°. ΠŸΡŠΡ€Π²ΠΈΡΡ‚ бСшС Π΄Π° сС Π½Π°ΠΌΠ°Π»ΠΈ размСрността Π½Π° Ρ‚ΠΈΠΏΠ°, ΠΊΠΎΠΉΡ‚ΠΎ ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π° ID Π½Π° Π½Π°Π±Π»ΡŽΠ΄Π΅Π½ΠΈΠ΅Ρ‚ΠΎ. Π’ оригиналния Π½Π°Π±ΠΎΡ€ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ Ρ‚ΠΈΠΏΡŠΡ‚, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌ Π·Π° ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Π½Π΅ Π½Π° ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€Π°, Π΅ bigint, Π½ΠΎ броят Π½Π° Π½Π°Π±Π»ΡŽΠ΄Π΅Π½ΠΈΡΡ‚Π° позволява Π΄Π° сС ΠΏΠΎΠ±Π΅Ρ€Π°Ρ‚ Ρ‚Π΅Ρ…Π½ΠΈΡ‚Π΅ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ΠΈ, Ρ€Π°Π²Π½ΠΈ Π½Π° порСдния Π½ΠΎΠΌΠ΅Ρ€, Π² Ρ‚ΠΈΠΏΠ° int. Π’ Ρ‚ΠΎΠ·ΠΈ случай Ρ‚ΡŠΡ€ΡΠ΅Π½Π΅Ρ‚ΠΎ Π΅ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠΎ-Π±ΡŠΡ€Π·ΠΎ. Вторият Ρ‚Ρ€ΠΈΠΊ бСшС Π΄Π° сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° ORDERED INDEX β€” стигнахмС Π΄ΠΎ Ρ‚ΠΎΠ²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π΅ΠΌΠΏΠΈΡ€ΠΈΡ‡Π½ΠΎ, слСд ΠΊΠ°Ρ‚ΠΎ ΠΏΡ€Π΅ΠΌΠΈΠ½Π°Ρ…ΠΌΠ΅ ΠΏΡ€Π΅Π· всички Π½Π°Π»ΠΈΡ‡Π½ΠΈ ΠΎΠΏΡ†ΠΈΠΈ. ВрСтият бСшС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΠ·ΠΈΡ€Π°Π½ΠΈ заявки. Π‘ΡŠΡ‰Π½ΠΎΡΡ‚Ρ‚Π° Π½Π° ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π΅ Π΄Π° сС изпълни ΠΊΠΎΠΌΠ°Π½Π΄Π°Ρ‚Π° вСднъТ PREPARE с послСдващо ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π° ΠΏΠΎΠ΄Π³ΠΎΡ‚Π²Π΅Π½ ΠΈΠ·Ρ€Π°Π· ΠΏΡ€ΠΈ създаванС Π½Π° ΠΊΡƒΠΏ заявки ΠΎΡ‚ ΡΡŠΡ‰ΠΈΡ Ρ‚ΠΈΠΏ, Π½ΠΎ Π²ΡΡŠΡ‰Π½ΠΎΡΡ‚ ΠΈΠΌΠ° прСдимство Π² сравнСниС с проста SELECT сС ΠΎΠΊΠ°Π·Π° Π² ΠΎΠ±Ρ…Π²Π°Ρ‚Π° Π½Π° статистичСска Π³Ρ€Π΅ΡˆΠΊΠ°.

ΠŸΡ€ΠΎΡ†Π΅ΡΡŠΡ‚ Π½Π° ΠΊΠ°Ρ‡Π²Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ консумира Π½Π΅ ΠΏΠΎΠ²Π΅Ρ‡Π΅ ΠΎΡ‚ 450 MB RAM. Π’ΠΎΠ²Π° ΠΎΠ·Π½Π°Ρ‡Π°Π²Π°, Ρ‡Π΅ описаният ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π²ΠΈ позволява Π΄Π° прСмСстватС Π½Π°Π±ΠΎΡ€ΠΈ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ, Ρ‚Π΅ΠΆΠ°Ρ‰ΠΈ дСсСтки Π³ΠΈΠ³Π°Π±Π°ΠΉΡ‚ΠΈ, Π½Π° ΠΏΠΎΡ‡Ρ‚ΠΈ всСки Π±ΡŽΠ΄ΠΆΠ΅Ρ‚Π΅Π½ Ρ…Π°Ρ€Π΄ΡƒΠ΅Ρ€, Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»Π½ΠΎ някои устройства с Π΅Π΄Π½Π° ΠΏΠ»Π°Ρ‚ΠΊΠ°, ΠΊΠΎΠ΅Ρ‚ΠΎ Π΅ доста Π³ΠΎΡ‚ΠΈΠ½ΠΎ.

Всичко, ΠΊΠΎΠ΅Ρ‚ΠΎ остава, Π΅ Π΄Π° сС ΠΈΠ·ΠΌΠ΅Ρ€ΠΈ скоростта Π½Π° ΠΈΠ·Π²Π»ΠΈΡ‡Π°Π½Π΅ Π½Π° (случайни) Π΄Π°Π½Π½ΠΈ ΠΈ Π΄Π° сС ΠΎΡ†Π΅Π½ΠΈ ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ ΠΏΡ€ΠΈ Π²Π·Π΅ΠΌΠ°Π½Π΅ Π½Π° ΠΏΡ€ΠΎΠ±ΠΈ ΠΎΡ‚ ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ с Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΈ:

Π•Ρ‚Π°Π»ΠΎΠ½ Π½Π° Π±Π°Π·Π° Π΄Π°Π½Π½ΠΈ

library(ggplot2)

set.seed(0)
# ΠŸΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΊ Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ…
con <- DBI::dbConnect(MonetDBLite::MonetDBLite(), Sys.getenv("DBDIR"))

# Ѐункция для ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ запроса Π½Π° сторонС сСрвСра
prep_sql <- function(batch_size) {
  sql <- sprintf("PREPARE SELECT id FROM doodles WHERE id IN (%s)",
                 paste(rep("?", batch_size), collapse = ","))
  res <- DBI::dbSendQuery(con, sql)
  return(res)
}

# Ѐункция для извлСчСния Π΄Π°Π½Π½Ρ‹Ρ…
fetch_data <- function(rs, batch_size) {
  ids <- sample(seq_len(n), batch_size)
  res <- DBI::dbFetch(DBI::dbBind(rs, as.list(ids)))
  return(res)
}

# ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π·Π°ΠΌΠ΅Ρ€Π°
res_bench <- bench::press(
  batch_size = 2^(4:10),
  {
    rs <- prep_sql(batch_size)
    bench::mark(
      fetch_data(rs, batch_size),
      min_iterations = 50L
    )
  }
)
# ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°
cols <- c("batch_size", "min", "median", "max", "itr/sec", "total_time", "n_itr")
res_bench[, cols]

#   batch_size      min   median      max `itr/sec` total_time n_itr
#        <dbl> <bch:tm> <bch:tm> <bch:tm>     <dbl>   <bch:tm> <int>
# 1         16   23.6ms  54.02ms  93.43ms     18.8        2.6s    49
# 2         32     38ms  84.83ms 151.55ms     11.4       4.29s    49
# 3         64   63.3ms 175.54ms 248.94ms     5.85       8.54s    50
# 4        128   83.2ms 341.52ms 496.24ms     3.00      16.69s    50
# 5        256  232.8ms 653.21ms 847.44ms     1.58      31.66s    50
# 6        512  784.6ms    1.41s    1.98s     0.740       1.1m    49
# 7       1024  681.7ms    2.72s    4.06s     0.377      2.16m    49

ggplot(res_bench, aes(x = factor(batch_size), y = median, group = 1)) +
  geom_point() +
  geom_line() +
  ylab("median time, s") +
  theme_minimal()

DBI::dbDisconnect(con, shutdown = TRUE)

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

2. ΠŸΡ€ΠΈΠ³ΠΎΡ‚Π²ΡΠ½Π΅ Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ

ЦСлият процСс Π½Π° ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°Ρ‚Π° сС ΡΡŠΡΡ‚ΠΎΠΈ ΠΎΡ‚ слСднитС ΡΡ‚ΡŠΠΏΠΊΠΈ:

  1. Π Π°Π·Π±ΠΎΡ€ Π½Π° няколко JSON, ΡΡŠΠ΄ΡŠΡ€ΠΆΠ°Ρ‰ΠΈ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΈ ΠΎΡ‚ Π½ΠΈΠ·ΠΎΠ²Π΅ с ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ΠΈ Π½Π° Ρ‚ΠΎΡ‡ΠΊΠΈ.
  2. РисуванС Π½Π° Ρ†Π²Π΅Ρ‚Π½ΠΈ Π»ΠΈΠ½ΠΈΠΈ въз основа Π½Π° ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ΠΈΡ‚Π΅ Π½Π° Ρ‚ΠΎΡ‡ΠΊΠΈ Π²ΡŠΡ€Ρ…Ρƒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ с нСобходимия Ρ€Π°Π·ΠΌΠ΅Ρ€ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ 256Γ—256 ΠΈΠ»ΠΈ 128Γ—128).
  3. ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π½Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΡ‚Π΅ изобраТСния Π² Ρ‚Π΅Π½Π·ΠΎΡ€.

ΠšΠ°Ρ‚ΠΎ част ΠΎΡ‚ конкурСнцията ΠΌΠ΅ΠΆΠ΄Ρƒ ядрата Π½Π° Python, ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡŠΡ‚ бСшС Ρ€Π΅ΡˆΠ΅Π½ ΠΏΡ€Π΅Π΄ΠΈΠΌΠ½ΠΎ с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° OpenCV. Π•Π΄ΠΈΠ½ ΠΎΡ‚ Π½Π°ΠΉ-проститС ΠΈ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΈ Π°Π½Π°Π»ΠΎΠ·ΠΈ Π² R Π±ΠΈ ΠΈΠ·Π³Π»Π΅ΠΆΠ΄Π°Π» Ρ‚Π°ΠΊΠ°:

ВнСдряванС Π½Π° JSON към Ρ‚Π΅Π½Π·ΠΎΡ€Π½ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π² R

r_process_json_str <- function(json, line.width = 3, 
                               color = TRUE, scale = 1) {
  # ΠŸΠ°Ρ€ΡΠΈΠ½Π³ JSON
  coords <- jsonlite::fromJSON(json, simplifyMatrix = FALSE)
  tmp <- tempfile()
  # УдаляСм Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» ΠΏΠΎ Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½ΠΈΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ
  on.exit(unlink(tmp))
  png(filename = tmp, width = 256 * scale, height = 256 * scale, pointsize = 1)
  # ΠŸΡƒΡΡ‚ΠΎΠΉ Π³Ρ€Π°Ρ„ΠΈΠΊ
  plot.new()
  # Π Π°Π·ΠΌΠ΅Ρ€ ΠΎΠΊΠ½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ°
  plot.window(xlim = c(256 * scale, 0), ylim = c(256 * scale, 0))
  # Π¦Π²Π΅Ρ‚Π° Π»ΠΈΠ½ΠΈΠΉ
  cols <- if (color) rainbow(length(coords)) else "#000000"
  for (i in seq_along(coords)) {
    lines(x = coords[[i]][[1]] * scale, y = coords[[i]][[2]] * scale, 
          col = cols[i], lwd = line.width)
  }
  dev.off()
  # ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ изобраТСния Π² 3-Ρ… ΠΌΠ΅Ρ€Π½Ρ‹ΠΉ массив
  res <- png::readPNG(tmp)
  return(res)
}

r_process_json_vector <- function(x, ...) {
  res <- lapply(x, r_process_json_str, ...)
  # ОбъСдинСниС 3-Ρ… ΠΌΠ΅Ρ€Π½Ρ‹Ρ… массивов ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΎΠΊ Π² 4-Ρ… ΠΌΠ΅Ρ€Π½Ρ‹ΠΉ Π² Ρ‚Π΅Π½Π·ΠΎΡ€
  res <- do.call(abind::abind, c(res, along = 0))
  return(res)
}

Π§Π΅Ρ€Ρ‚Π΅ΠΆΡŠΡ‚ сС ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π° с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° стандартни R инструмСнти ΠΈ сС записва във Π²Ρ€Π΅ΠΌΠ΅Π½Π΅Π½ PNG, ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°Π½ Π² RAM (Π½Π° Linux Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΈΡ‚Π΅ R Π΄ΠΈΡ€Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΈ сС Π½Π°ΠΌΠΈΡ€Π°Ρ‚ Π² дирСкторията /tmp, ΠΌΠΎΠ½Ρ‚ΠΈΡ€Π°Π½ Π² RAM). Π‘Π»Π΅Π΄ Ρ‚ΠΎΠ²Π° Ρ‚ΠΎΠ·ΠΈ Ρ„Π°ΠΉΠ» сС Ρ‡Π΅Ρ‚Π΅ ΠΊΠ°Ρ‚ΠΎ Ρ‚Ρ€ΠΈΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ масив с числа, Π²Π°Ρ€ΠΈΡ€Π°Ρ‰ΠΈ ΠΎΡ‚ 0 Π΄ΠΎ 1. Π’ΠΎΠ²Π° Π΅ Π²Π°ΠΆΠ½ΠΎ, Π·Π°Ρ‰ΠΎΡ‚ΠΎ ΠΏΠΎ-ΠΊΠΎΠ½Π²Π΅Π½Ρ†ΠΈΠΎΠ½Π°Π»Π΅Π½ BMP Π±ΠΈ Π±ΠΈΠ» ΠΏΡ€ΠΎΡ‡Π΅Ρ‚Π΅Π½ Π² Π½Π΅ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π΅Π½ масив с ΡˆΠ΅ΡΡ‚Π½Π°Π΄Π΅ΡΠ΅Ρ‚ΠΈΡ‡Π½ΠΈ Ρ†Π²Π΅Ρ‚ΠΎΠ²ΠΈ ΠΊΠΎΠ΄ΠΎΠ²Π΅.

НСка тСствамС Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π°:

zip_file <- file.path("data", "train_simplified.zip")
csv_file <- "cat.csv"
unzip(zip_file, files = csv_file, exdir = tempdir(), 
      junkpaths = TRUE, unzip = getOption("unzip"))
tmp_data <- data.table::fread(file.path(tempdir(), csv_file), sep = ",", 
                              select = "drawing", nrows = 10000)
arr <- r_process_json_str(tmp_data[4, drawing])
dim(arr)
# [1] 256 256   3
plot(magick::image_read(arr))

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

Π‘Π°ΠΌΠ°Ρ‚Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π° Ρ‰Π΅ бъдС Ρ„ΠΎΡ€ΠΌΠΈΡ€Π°Π½Π° ΠΏΠΎ слСдния Π½Π°Ρ‡ΠΈΠ½:

res <- r_process_json_vector(tmp_data[1:4, drawing], scale = 0.5)
str(res)
 # num [1:4, 1:128, 1:128, 1:3] 1 1 1 1 1 1 1 1 1 1 ...
 # - attr(*, "dimnames")=List of 4
 #  ..$ : NULL
 #  ..$ : NULL
 #  ..$ : NULL
 #  ..$ : NULL

Π’Π°Π·ΠΈ рСализация Π½ΠΈ сС стори Π½Π΅ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»Π½Π°, Ρ‚ΡŠΠΉ ΠΊΠ°Ρ‚ΠΎ Ρ„ΠΎΡ€ΠΌΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ Π½Π° Π³ΠΎΠ»Π΅ΠΌΠΈ ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ ΠΎΡ‚Π½Π΅ΠΌΠ° Π½Π΅ΠΏΡ€ΠΈΠ»ΠΈΡ‡Π½ΠΎ дълго Π²Ρ€Π΅ΠΌΠ΅ ΠΈ Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° сС възползвамС ΠΎΡ‚ ΠΎΠΏΠΈΡ‚Π° Π½Π° Π½Π°ΡˆΠΈΡ‚Π΅ ΠΊΠΎΠ»Π΅Π³ΠΈ, ΠΊΠ°Ρ‚ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ ΠΌΠΎΡ‰Π½Π° Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° OpenCV. По Ρ‚ΠΎΠ²Π° Π²Ρ€Π΅ΠΌΠ΅ нямашС Π³ΠΎΡ‚ΠΎΠ² ΠΏΠ°ΠΊΠ΅Ρ‚ Π·Π° R (няма Ρ‚Π°ΠΊΡŠΠ² сСга), Ρ‚Π°ΠΊΠ° Ρ‡Π΅ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»Π½Π° рСализация Π½Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠ°Ρ‚Π° функционалност бСшС написана Π½Π° C++ с интСграция Π² R ΠΊΠΎΠ΄, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ Rcpp.

Π—Π° Ρ€Π΅ΡˆΠ°Π²Π°Π½Π΅ Π½Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° са ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ΠΈ слСднитС ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ:

  1. OpenCV Π·Π° Ρ€Π°Π±ΠΎΡ‚Π° с изобраТСния ΠΈ Ρ‡Π΅Ρ€Ρ‚Π°Π½Π΅ Π½Π° Π»ΠΈΠ½ΠΈΠΈ. Използвани ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ инсталирани систСмни Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ ΠΈ Π·Π°Π³Π»Π°Π²Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ Π΄ΠΈΠ½Π°ΠΌΠΈΡ‡Π½ΠΎ ΡΠ²ΡŠΡ€Π·Π²Π°Π½Π΅.

  2. xtensor Π·Π° Ρ€Π°Π±ΠΎΡ‚Π° с ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΈ масиви ΠΈ Ρ‚Π΅Π½Π·ΠΎΡ€ΠΈ. Π˜Π·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ Π·Π°Π³Π»Π°Π²Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, Π²ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈ Π² R ΠΏΠ°ΠΊΠ΅Ρ‚Π° със ΡΡŠΡ‰ΠΎΡ‚ΠΎ ΠΈΠΌΠ΅. Π‘ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° Π²ΠΈ позволява Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΡ‚Π΅ с ΠΌΠ½ΠΎΠ³ΠΎΠΈΠ·ΠΌΠ΅Ρ€Π½ΠΈ масиви, ΠΊΠ°ΠΊΡ‚ΠΎ Π² основСн Ρ€Π΅Π΄, Ρ‚Π°ΠΊΠ° ΠΈ Π² основСн Ρ€Π΅Π΄ Π½Π° ΠΊΠΎΠ»ΠΎΠ½ΠΈ.

  3. ndjson Π·Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° JSON. Π’Π°Π·ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° Π² xtensor Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ, Π°ΠΊΠΎ ΠΏΡ€ΠΈΡΡŠΡΡ‚Π²Π° Π² ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°.

  4. RcppThread Π·Π° ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° многонишкова ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π½Π° Π²Π΅ΠΊΡ‚ΠΎΡ€ ΠΎΡ‚ JSON. Използвани са Π·Π°Π³Π»Π°Π²Π½ΠΈΡ‚Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, прСдоставСни ΠΎΡ‚ Ρ‚ΠΎΠ·ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚. ΠžΡ‚ ΠΏΠΎ-популярни RcppΠŸΠ°Ρ€Π°Π»Π΅Π»Π½ΠΎ ΠŸΠ°ΠΊΠ΅Ρ‚ΡŠΡ‚, Π½Π°Ρ€Π΅Π΄ с Π΄Ρ€ΡƒΠ³ΠΈ Π½Π΅Ρ‰Π°, ΠΈΠΌΠ° Π²Π³Ρ€Π°Π΄Π΅Π½ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΡŠΠΌ Π·Π° ΠΏΡ€Π΅ΠΊΡŠΡΠ²Π°Π½Π΅ Π½Π° Ρ†ΠΈΠΊΡŠΠ»Π°.

ЗаслуТава Π΄Π° сС ΠΎΡ‚Π±Π΅Π»Π΅ΠΆΠΈ, Ρ‡Π΅ xtensor сС ΠΎΠΊΠ°Π·Π° Π±ΠΎΠΆΠΈ Π΄Π°Ρ€: Π² допълнСниС към Ρ„Π°ΠΊΡ‚Π°, Ρ‡Π΅ ΠΈΠΌΠ° ΡˆΠΈΡ€ΠΎΠΊΠ° функционалност ΠΈ висока производитСлност, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈΡ‚Π΅ ΠΌΡƒ сС ΠΎΠΊΠ°Π·Π°Ρ…Π° доста ΠΎΡ‚Π·ΠΈΠ²Ρ‡ΠΈΠ²ΠΈ ΠΈ ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€ΠΈΡ…Π° Π½Π° Π²ΡŠΠΏΡ€ΠΎΡΠΈ Π±ΡŠΡ€Π·ΠΎ ΠΈ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ. Π‘ тяхна ΠΏΠΎΠΌΠΎΡ‰ бСшС възмоТно Π΄Π° сС Ρ€Π΅Π°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚ трансформации Π½Π° OpenCV ΠΌΠ°Ρ‚Ρ€ΠΈΡ†ΠΈ Π² xtensor Ρ‚Π΅Π½Π·ΠΎΡ€ΠΈ, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ Π½Π°Ρ‡ΠΈΠ½ Π·Π° ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€Π°Π½Π΅ Π½Π° 3-ΠΈΠ·ΠΌΠ΅Ρ€Π½ΠΈ Ρ‚Π΅Π½Π·ΠΎΡ€ΠΈ Π½Π° изобраТСния Π² 4-ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ Ρ‚Π΅Π½Π·ΠΎΡ€ с ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎΡ‚ΠΎ ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠ΅ (самата ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°).

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΈ Π·Π° ΠΈΠ·ΡƒΡ‡Π°Π²Π°Π½Π΅ Π½Π° Rcpp, xtensor ΠΈ RcppThread

https://thecoatlessprofessor.com/programming/unofficial-rcpp-api-documentation

https://docs.opencv.org/4.0.1/d7/dbd/group__imgproc.html

https://xtensor.readthedocs.io/en/latest/

https://xtensor.readthedocs.io/en/latest/file_loading.html#loading-json-data-into-xtensor

https://cran.r-project.org/web/packages/RcppThread/vignettes/RcppThread-vignette.pdf

Π—Π° ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€Π°Π½Π΅ Π½Π° Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅, ΠΊΠΎΠΈΡ‚ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚ систСмни Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ ΠΈ Π΄ΠΈΠ½Π°ΠΌΠΈΡ‡Π½ΠΎ ΡΠ²ΡŠΡ€Π·Π²Π°Π½Π΅ с Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ, инсталирани Π² систСмата, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ° Π½Π° плъгина, Π²Π½Π΅Π΄Ρ€Π΅Π½ Π² ΠΏΠ°ΠΊΠ΅Ρ‚Π° Rcpp. Π—Π° Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ Π½Π°ΠΌΠΈΡ€Π°Π½Π΅ Π½Π° ΠΏΡŠΡ‚ΠΈΡ‰Π° ΠΈ Ρ„Π»Π°Π³ΠΎΠ²Π΅ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ популярна ΠΏΠΎΠΌΠΎΡ‰Π½Π° ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠ° Π½Π° Linux pkg-config.

ВнСдряванС Π½Π° плъгина Rcpp Π·Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π° Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° OpenCV

Rcpp::registerPlugin("opencv", function() {
  # Π’ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ названия ΠΏΠ°ΠΊΠ΅Ρ‚Π°
  pkg_config_name <- c("opencv", "opencv4")
  # Π‘ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρ‹ pkg-config
  pkg_config_bin <- Sys.which("pkg-config")
  # ΠŸΡ€ΠΎΠ²Ρ€Π΅ΠΊΠ° наличия ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρ‹ Π² систСмС
  checkmate::assert_file_exists(pkg_config_bin, access = "x")
  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° наличия Ρ„Π°ΠΉΠ»Π° настроСк OpenCV для pkg-config
  check <- sapply(pkg_config_name, 
                  function(pkg) system(paste(pkg_config_bin, pkg)))
  if (all(check != 0)) {
    stop("OpenCV config for the pkg-config not found", call. = FALSE)
  }

  pkg_config_name <- pkg_config_name[check == 0]
  list(env = list(
    PKG_CXXFLAGS = system(paste(pkg_config_bin, "--cflags", pkg_config_name), 
                          intern = TRUE),
    PKG_LIBS = system(paste(pkg_config_bin, "--libs", pkg_config_name), 
                      intern = TRUE)
  ))
})

Π’ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Π½Π° Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚Π° Π½Π° плъгина, слСднитС стойности Ρ‰Π΅ Π±ΡŠΠ΄Π°Ρ‚ Π·Π°ΠΌΠ΅Π½Π΅Π½ΠΈ ΠΏΠΎ Π²Ρ€Π΅ΠΌΠ΅ Π½Π° процСса Π½Π° ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€Π°Π½Π΅:

Rcpp:::.plugins$opencv()$env

# $PKG_CXXFLAGS
# [1] "-I/usr/include/opencv"
#
# $PKG_LIBS
# [1] "-lopencv_shape -lopencv_stitching -lopencv_superres -lopencv_videostab -lopencv_aruco -lopencv_bgsegm -lopencv_bioinspired -lopencv_ccalib -lopencv_datasets -lopencv_dpm -lopencv_face -lopencv_freetype -lopencv_fuzzy -lopencv_hdf -lopencv_line_descriptor -lopencv_optflow -lopencv_video -lopencv_plot -lopencv_reg -lopencv_saliency -lopencv_stereo -lopencv_structured_light -lopencv_phase_unwrapping -lopencv_rgbd -lopencv_viz -lopencv_surface_matching -lopencv_text -lopencv_ximgproc -lopencv_calib3d -lopencv_features2d -lopencv_flann -lopencv_xobjdetect -lopencv_objdetect -lopencv_ml -lopencv_xphoto -lopencv_highgui -lopencv_videoio -lopencv_imgcodecs -lopencv_photo -lopencv_imgproc -lopencv_core"

ΠšΠΎΠ΄ΡŠΡ‚ Π·Π° изпълнСниС Π·Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° JSON ΠΈ Π³Π΅Π½Π΅Ρ€ΠΈΡ€Π°Π½Π΅ Π½Π° ΠΏΠ°ΠΊΠ΅Ρ‚ Π·Π° ΠΏΡ€Π΅Π΄Π°Π²Π°Π½Π΅ към ΠΌΠΎΠ΄Π΅Π»Π° Π΅ Π΄Π°Π΄Π΅Π½ ΠΏΠΎΠ΄ спойлСра. ΠŸΡŠΡ€Π²ΠΎ Π΄ΠΎΠ±Π°Π²Π΅Ρ‚Π΅ Π»ΠΎΠΊΠ°Π»Π½Π° дирСктория Π½Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°, Π·Π° Π΄Π° Ρ‚ΡŠΡ€ΡΠΈΡ‚Π΅ Π·Π°Π³Π»Π°Π²Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ (Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈ Π·Π° ndjson):

Sys.setenv("PKG_CXXFLAGS" = paste0("-I", normalizePath(file.path("src"))))

ВнСдряванС Π½Π° JSON към Ρ‚Π΅Π½Π·ΠΎΡ€Π½ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π² C++

// [[Rcpp::plugins(cpp14)]]
// [[Rcpp::plugins(opencv)]]
// [[Rcpp::depends(xtensor)]]
// [[Rcpp::depends(RcppThread)]]

#include <xtensor/xjson.hpp>
#include <xtensor/xadapt.hpp>
#include <xtensor/xview.hpp>
#include <xtensor-r/rtensor.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <Rcpp.h>
#include <RcppThread.h>

// Π‘ΠΈΠ½ΠΎΠ½ΠΈΠΌΡ‹ для Ρ‚ΠΈΠΏΠΎΠ²
using RcppThread::parallelFor;
using json = nlohmann::json;
using points = xt::xtensor<double,2>;     // Π˜Π·Π²Π»Π΅Ρ‡Ρ‘Π½Π½Ρ‹Π΅ ΠΈΠ· JSON ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Ρ‹ Ρ‚ΠΎΡ‡Π΅ΠΊ
using strokes = std::vector<points>;      // Π˜Π·Π²Π»Π΅Ρ‡Ρ‘Π½Π½Ρ‹Π΅ ΠΈΠ· JSON ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Ρ‹ Ρ‚ΠΎΡ‡Π΅ΠΊ
using xtensor3d = xt::xtensor<double, 3>; // Π’Π΅Π½Π·ΠΎΡ€ для хранСния ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ изообраТСния
using xtensor4d = xt::xtensor<double, 4>; // Π’Π΅Π½Π·ΠΎΡ€ для хранСния мноТСства ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ
using rtensor3d = xt::rtensor<double, 3>; // ΠžΠ±Ρ‘Ρ€Ρ‚ΠΊΠ° для экспорта Π² R
using rtensor4d = xt::rtensor<double, 4>; // ΠžΠ±Ρ‘Ρ€Ρ‚ΠΊΠ° для экспорта Π² R

// БтатичСскиС константы
// Π Π°Π·ΠΌΠ΅Ρ€ изобраТСния Π² пиксСлях
const static int SIZE = 256;
// Π’ΠΈΠΏ Π»ΠΈΠ½ΠΈΠΈ
// Π‘ΠΌ. https://en.wikipedia.org/wiki/Pixel_connectivity#2-dimensional
const static int LINE_TYPE = cv::LINE_4;
// Π’ΠΎΠ»Ρ‰ΠΈΠ½Π° Π»ΠΈΠ½ΠΈΠΈ Π² пиксСлях
const static int LINE_WIDTH = 3;
// Алгоритм рСсайза
// https://docs.opencv.org/3.1.0/da/d54/group__imgproc__transform.html#ga5bb5a1fea74ea38e1a5445ca803ff121
const static int RESIZE_TYPE = cv::INTER_LINEAR;

// Π¨Π°Π±Π»ΠΎΠ½ для конвСртирования OpenCV-ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ Π² Ρ‚Π΅Π½Π·ΠΎΡ€
template <typename T, int NCH, typename XT=xt::xtensor<T,3,xt::layout_type::column_major>>
XT to_xt(const cv::Mat_<cv::Vec<T, NCH>>& src) {
  // Π Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Ρ†Π΅Π»Π΅Π²ΠΎΠ³ΠΎ Ρ‚Π΅Π½Π·ΠΎΡ€Π°
  std::vector<int> shape = {src.rows, src.cols, NCH};
  // ΠžΠ±Ρ‰Π΅Π΅ количСство элСмСнтов Π² массивС
  size_t size = src.total() * NCH;
  // ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ cv::Mat Π² xt::xtensor
  XT res = xt::adapt((T*) src.data, size, xt::no_ownership(), shape);
  return res;
}

// ΠŸΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ JSON Π² список ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ Ρ‚ΠΎΡ‡Π΅ΠΊ
strokes parse_json(const std::string& x) {
  auto j = json::parse(x);
  // Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ парсинга Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ массивом
  if (!j.is_array()) {
    throw std::runtime_error("'x' must be JSON array.");
  }
  strokes res;
  res.reserve(j.size());
  for (const auto& a: j) {
    // ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ элСмСнт массива Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ 2-ΠΌΠ΅Ρ€Π½Ρ‹ΠΌ массивом
    if (!a.is_array() || a.size() != 2) {
      throw std::runtime_error("'x' must include only 2d arrays.");
    }
    // Π˜Π·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Ρ‚ΠΎΡ‡Π΅ΠΊ
    auto p = a.get<points>();
    res.push_back(p);
  }
  return res;
}

// ΠžΡ‚Ρ€ΠΈΡΠΎΠ²ΠΊΠ° Π»ΠΈΠ½ΠΈΠΉ
// Π¦Π²Π΅Ρ‚Π° HSV
cv::Mat ocv_draw_lines(const strokes& x, bool color = true) {
  // Π˜ΡΡ…ΠΎΠ΄Π½Ρ‹ΠΉ Ρ‚ΠΈΠΏ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹
  auto stype = color ? CV_8UC3 : CV_8UC1;
  // Π˜Ρ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ Ρ‚ΠΈΠΏ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹
  auto dtype = color ? CV_32FC3 : CV_32FC1;
  auto bg = color ? cv::Scalar(0, 0, 255) : cv::Scalar(255);
  auto col = color ? cv::Scalar(0, 255, 220) : cv::Scalar(0);
  cv::Mat img = cv::Mat(SIZE, SIZE, stype, bg);
  // ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ Π»ΠΈΠ½ΠΈΠΉ
  size_t n = x.size();
  for (const auto& s: x) {
    // ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ Ρ‚ΠΎΡ‡Π΅ΠΊ Π² Π»ΠΈΠ½ΠΈΠΈ
    size_t n_points = s.shape()[1];
    for (size_t i = 0; i < n_points - 1; ++i) {
      // Π’ΠΎΡ‡ΠΊΠ° Π½Π°Ρ‡Π°Π»Π° ΡˆΡ‚Ρ€ΠΈΡ…Π°
      cv::Point from(s(0, i), s(1, i));
      // Π’ΠΎΡ‡ΠΊΠ° окончания ΡˆΡ‚Ρ€ΠΈΡ…Π°
      cv::Point to(s(0, i + 1), s(1, i + 1));
      // ΠžΡ‚Ρ€ΠΈΡΠΎΠ²ΠΊΠ° Π»ΠΈΠ½ΠΈΠΈ
      cv::line(img, from, to, col, LINE_WIDTH, LINE_TYPE);
    }
    if (color) {
      // МСняСм Ρ†Π²Π΅Ρ‚ Π»ΠΈΠ½ΠΈΠΈ
      col[0] += 180 / n;
    }
  }
  if (color) {
    // МСняСм Ρ†Π²Π΅Ρ‚ΠΎΠ²ΠΎΠ΅ прСдставлСниС Π½Π° RGB
    cv::cvtColor(img, img, cv::COLOR_HSV2RGB);
  }
  // МСняСм Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ прСдставлСния Π½Π° float32 с Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ΠΎΠΌ [0, 1]
  img.convertTo(img, dtype, 1 / 255.0);
  return img;
}

// ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° JSON ΠΈ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ Ρ‚Π΅Π½Π·ΠΎΡ€Π° с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ изобраТСния
xtensor3d process(const std::string& x, double scale = 1.0, bool color = true) {
  auto p = parse_json(x);
  auto img = ocv_draw_lines(p, color);
  if (scale != 1) {
    cv::Mat out;
    cv::resize(img, out, cv::Size(), scale, scale, RESIZE_TYPE);
    cv::swap(img, out);
    out.release();
  }
  xtensor3d arr = color ? to_xt<double,3>(img) : to_xt<double,1>(img);
  return arr;
}

// [[Rcpp::export]]
rtensor3d cpp_process_json_str(const std::string& x, 
                               double scale = 1.0, 
                               bool color = true) {
  xtensor3d res = process(x, scale, color);
  return res;
}

// [[Rcpp::export]]
rtensor4d cpp_process_json_vector(const std::vector<std::string>& x, 
                                  double scale = 1.0, 
                                  bool color = false) {
  size_t n = x.size();
  size_t dim = floor(SIZE * scale);
  size_t channels = color ? 3 : 1;
  xtensor4d res({n, dim, dim, channels});
  parallelFor(0, n, [&x, &res, scale, color](int i) {
    xtensor3d tmp = process(x[i], scale, color);
    auto view = xt::view(res, i, xt::all(), xt::all(), xt::all());
    view = tmp;
  });
  return res;
}

Π’ΠΎΠ·ΠΈ ΠΊΠΎΠ΄ трябва Π΄Π° бъдС поставСн във Ρ„Π°ΠΉΠ»Π° src/cv_xt.cpp ΠΈ ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€Π°ΠΉΡ‚Π΅ с ΠΊΠΎΠΌΠ°Π½Π΄Π°Ρ‚Π° Rcpp::sourceCpp(file = "src/cv_xt.cpp", env = .GlobalEnv); ΡΡŠΡ‰ΠΎ сС изисква Π·Π° Ρ€Π°Π±ΠΎΡ‚Π° nlohmann/json.hpp Π½Π° Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅. ΠšΠΎΠ΄ΡŠΡ‚ Π΅ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ Π½Π° няколко Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ:

  • to_xt β€” шаблонна функция Π·Π° трансформиранС Π½Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ (cv::Mat) към Ρ‚Π΅Π½Π·ΠΎΡ€ xt::xtensor;

  • parse_json β€” функцията Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π° JSON Π½ΠΈΠ·, ΠΈΠ·Π²Π»ΠΈΡ‡Π° ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ΠΈΡ‚Π΅ Π½Π° Ρ‚ΠΎΡ‡ΠΊΠΈΡ‚Π΅, ΠΎΠΏΠ°ΠΊΠΎΠ²Π°ΠΉΠΊΠΈ Π³ΠΈ във Π²Π΅ΠΊΡ‚ΠΎΡ€;

  • ocv_draw_lines β€” ΠΎΡ‚ получСния Π²Π΅ΠΊΡ‚ΠΎΡ€ ΠΎΡ‚ Ρ‚ΠΎΡ‡ΠΊΠΈ Ρ‡Π΅Ρ€Ρ‚Π°Π΅ ΠΌΠ½ΠΎΠ³ΠΎΡ†Π²Π΅Ρ‚Π½ΠΈ Π»ΠΈΠ½ΠΈΠΈ;

  • process β€” ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€Π° Π³ΠΎΡ€Π½ΠΈΡ‚Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΈ ΡΡŠΡ‰ΠΎ Ρ‚Π°ΠΊΠ° добавя Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ Π·Π° ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€Π°Π½Π΅ Π½Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΎΡ‚ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅;

  • cpp_process_json_str - ΠΎΠ±Π²ΠΈΠ²ΠΊΠ° Π½Π°Π΄ функцията process, ΠΊΠΎΠΉΡ‚ΠΎ Скспортира Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π° Π² R-ΠΎΠ±Π΅ΠΊΡ‚ (ΠΌΠ½ΠΎΠ³ΠΎΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ масив);

  • cpp_process_json_vector - ΠΎΠ±Π²ΠΈΠ²ΠΊΠ° Π½Π°Π΄ функцията cpp_process_json_str, ΠΊΠΎΠ΅Ρ‚ΠΎ Π²ΠΈ позволява Π΄Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π²Π°Ρ‚Π΅ Π½ΠΈΠ·ΠΎΠ² Π²Π΅ΠΊΡ‚ΠΎΡ€ Π² многонишков Ρ€Π΅ΠΆΠΈΠΌ.

Π—Π° Π½Π°Ρ‡Π΅Ρ€Ρ‚Π°Π²Π°Π½Π΅ Π½Π° ΠΌΠ½ΠΎΠ³ΠΎΡ†Π²Π΅Ρ‚Π½ΠΈ Π»ΠΈΠ½ΠΈΠΈ бСшС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ цвСтовият ΠΌΠΎΠ΄Π΅Π» HSV, послСдван ΠΎΡ‚ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π² RGB. НСка тСствамС Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π°:

arr <- cpp_process_json_str(tmp_data[4, drawing])
dim(arr)
# [1] 256 256   3
plot(magick::image_read(arr))

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ
Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ Π½Π° скоростта Π½Π° ΠΈΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠΈΡ‚Π΅ Π² R ΠΈ C++

res_bench <- bench::mark(
  r_process_json_str(tmp_data[4, drawing], scale = 0.5),
  cpp_process_json_str(tmp_data[4, drawing], scale = 0.5),
  check = FALSE,
  min_iterations = 100
)
# ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°
cols <- c("expression", "min", "median", "max", "itr/sec", "total_time", "n_itr")
res_bench[, cols]

#   expression                min     median       max `itr/sec` total_time  n_itr
#   <chr>                <bch:tm>   <bch:tm>  <bch:tm>     <dbl>   <bch:tm>  <int>
# 1 r_process_json_str     3.49ms     3.55ms    4.47ms      273.      490ms    134
# 2 cpp_process_json_str   1.94ms     2.02ms    5.32ms      489.      497ms    243

library(ggplot2)
# ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π·Π°ΠΌΠ΅Ρ€Π°
res_bench <- bench::press(
  batch_size = 2^(4:10),
  {
    .data <- tmp_data[sample(seq_len(.N), batch_size), drawing]
    bench::mark(
      r_process_json_vector(.data, scale = 0.5),
      cpp_process_json_vector(.data,  scale = 0.5),
      min_iterations = 50,
      check = FALSE
    )
  }
)

res_bench[, cols]

#    expression   batch_size      min   median      max `itr/sec` total_time n_itr
#    <chr>             <dbl> <bch:tm> <bch:tm> <bch:tm>     <dbl>   <bch:tm> <int>
#  1 r                   16   50.61ms  53.34ms  54.82ms    19.1     471.13ms     9
#  2 cpp                 16    4.46ms   5.39ms   7.78ms   192.      474.09ms    91
#  3 r                   32   105.7ms 109.74ms 212.26ms     7.69        6.5s    50
#  4 cpp                 32    7.76ms  10.97ms  15.23ms    95.6     522.78ms    50
#  5 r                   64  211.41ms 226.18ms 332.65ms     3.85      12.99s    50
#  6 cpp                 64   25.09ms  27.34ms  32.04ms    36.0        1.39s    50
#  7 r                  128   534.5ms 627.92ms 659.08ms     1.61      31.03s    50
#  8 cpp                128   56.37ms  58.46ms  66.03ms    16.9        2.95s    50
#  9 r                  256     1.15s    1.18s    1.29s     0.851     58.78s    50
# 10 cpp                256  114.97ms 117.39ms 130.09ms     8.45       5.92s    50
# 11 r                  512     2.09s    2.15s    2.32s     0.463       1.8m    50
# 12 cpp                512  230.81ms  235.6ms 261.99ms     4.18      11.97s    50
# 13 r                 1024        4s    4.22s     4.4s     0.238       3.5m    50
# 14 cpp               1024  410.48ms 431.43ms 462.44ms     2.33      21.45s    50

ggplot(res_bench, aes(x = factor(batch_size), y = median, 
                      group =  expression, color = expression)) +
  geom_point() +
  geom_line() +
  ylab("median time, s") +
  theme_minimal() +
  scale_color_discrete(name = "", labels = c("cpp", "r")) +
  theme(legend.position = "bottom") 

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

ΠšΠ°ΠΊΡ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π²ΠΈΠ΄ΠΈΡ‚Π΅, ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° скоростта сС ΠΎΠΊΠ°Π·Π° ΠΌΠ½ΠΎΠ³ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΈ Π½Π΅ Π΅ възмоТно Π΄Π° сС навакса C++ ΠΊΠΎΠ΄Π° Ρ‡Ρ€Π΅Π· ΠΏΠ°Ρ€Π°Π»Π΅Π»ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° R ΠΊΠΎΠ΄.

3. Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ΠΈ Π·Π° Ρ€Π°Π·Ρ‚ΠΎΠ²Π°Ρ€Π²Π°Π½Π΅ Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ ΠΎΡ‚ Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ

R ΠΈΠΌΠ° заслуТСна рСпутация Π·Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π½Π° Π΄Π°Π½Π½ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ сС ΠΏΠΎΠ±ΠΈΡ€Π°Ρ‚ Π² RAM, Π΄ΠΎΠΊΠ°Ρ‚ΠΎ Python сС Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΈΡ€Π° ΠΏΠΎ-скоро с ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π½Π° Π΄Π°Π½Π½ΠΈ, ΠΊΠΎΠ΅Ρ‚ΠΎ Π²ΠΈ позволява лСсно ΠΈ СстСствСно Π΄Π° ΠΏΡ€ΠΈΠ»Π°Π³Π°Ρ‚Π΅ изчислСния извън ядрото (изчислСния, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‰ΠΈ външна ΠΏΠ°ΠΌΠ΅Ρ‚). ΠšΠ»Π°ΡΠΈΡ‡Π΅ΡΠΊΠΈ ΠΈ умСстСн ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π·Π° нас Π² контСкста Π½Π° описания ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ са дълбоки Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ, ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ ΠΏΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π½Π° Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎ спусканС с апроксимация Π½Π° Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° Π½Π° всяка ΡΡ‚ΡŠΠΏΠΊΠ°, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ ΠΌΠ°Π»ΠΊΠ° част ΠΎΡ‚ наблюдСния ΠΈΠ»ΠΈ ΠΌΠΈΠ½ΠΈ-ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°.

Π Π°ΠΌΠΊΠΈΡ‚Π΅ Π·Π° дълбоко ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, написани Π½Π° Python, ΠΈΠΌΠ°Ρ‚ спСциални класовС, ΠΊΠΎΠΈΡ‚ΠΎ ΠΏΡ€ΠΈΠ»Π°Π³Π°Ρ‚ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ΠΈ въз основа Π½Π° Π΄Π°Π½Π½ΠΈ: Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ, ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΈ Π² ΠΏΠ°ΠΏΠΊΠΈ, Π΄Π²ΠΎΠΈΡ‡Π½ΠΈ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈ ΠΈ Ρ‚.Π½. ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚Π΅ Π³ΠΎΡ‚ΠΎΠ²ΠΈ ΠΎΠΏΡ†ΠΈΠΈ ΠΈΠ»ΠΈ Π΄Π° Π½Π°ΠΏΠΈΡˆΠ΅Ρ‚Π΅ свои собствСни Π·Π° ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΈ Π·Π°Π΄Π°Ρ‡ΠΈ. Π’ R ΠΌΠΎΠΆΠ΅ΠΌ Π΄Π° сС възползвамС ΠΎΡ‚ всички Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π½Π° Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° Python keras с Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈΡ‚Π΅ си Π±Π΅ΠΊΠ΅Π½Π΄ΠΈ, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ СдноимСнния ΠΏΠ°ΠΊΠ΅Ρ‚, ΠΊΠΎΠΉΡ‚ΠΎ ΠΎΡ‚ своя страна Ρ€Π°Π±ΠΎΡ‚ΠΈ Π½Π°Π΄ ΠΏΠ°ΠΊΠ΅Ρ‚Π° мрСТСст. ΠŸΠΎΡΠ»Π΅Π΄Π½ΠΎΡ‚ΠΎ заслуТава ΠΎΡ‚Π΄Π΅Π»Π½Π° дълга статия; Ρ‚ΠΎΠΉ Π½Π΅ само Π²ΠΈ позволява Π΄Π° ΠΈΠ·ΠΏΡŠΠ»Π½ΡΠ²Π°Ρ‚Π΅ Python ΠΊΠΎΠ΄ ΠΎΡ‚ R, Π½ΠΎ ΡΡŠΡ‰ΠΎ Ρ‚Π°ΠΊΠ° Π²ΠΈ позволява Π΄Π° ΠΏΡ€Π΅Ρ…Π²ΡŠΡ€Π»ΡΡ‚Π΅ ΠΎΠ±Π΅ΠΊΡ‚ΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ R ΠΈ Python сСсии, ΠΊΠ°Ρ‚ΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π°Ρ‚Π΅ всички Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈ прСобразувания Π½Π° Ρ‚ΠΈΠΏΠΎΠ²Π΅.

ΠžΡ‚ΡŠΡ€Π²Π°Ρ…ΠΌΠ΅ сС ΠΎΡ‚ нСобходимостта Π΄Π° ΡΡŠΡ…Ρ€Π°Π½ΡΠ²Π°ΠΌΠ΅ всички Π΄Π°Π½Π½ΠΈ Π² RAM с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° MonetDBLite, цялата Ρ€Π°Π±ΠΎΡ‚Π° Π½Π° β€žΠ½Π΅Π²Ρ€ΠΎΠ½Π½Π°Ρ‚Π° ΠΌΡ€Π΅ΠΆΠ°β€œ Ρ‰Π΅ бъдС ΠΈΠ·Π²ΡŠΡ€ΡˆΠ΅Π½Π° ΠΎΡ‚ оригиналния ΠΊΠΎΠ΄ Π² Python, просто трябва Π΄Π° напишСм ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ Π²ΡŠΡ€Ρ…Ρƒ Π΄Π°Π½Π½ΠΈΡ‚Π΅, Ρ‚ΡŠΠΉ ΠΊΠ°Ρ‚ΠΎ няма Π½ΠΈΡ‰ΠΎ Π³ΠΎΡ‚ΠΎΠ²ΠΎ Π·Π° Ρ‚Π°ΠΊΠ°Π²Π° ситуация Π² R ΠΈΠ»ΠΈ Python. По ΡΡŠΡ‰Π΅ΡΡ‚Π²ΠΎ ΠΈΠΌΠ° само Π΄Π²Π΅ изисквания Π·Π° Π½Π΅Π³ΠΎ: Ρ‚ΠΎΠΉ трябва Π΄Π° Π²Ρ€ΡŠΡ‰Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ Π² Π±Π΅Π·ΠΊΡ€Π°Π΅Π½ Ρ†ΠΈΠΊΡŠΠ» ΠΈ Π΄Π° Π·Π°ΠΏΠ°Π·Π²Π° ΡΡŠΡΡ‚ΠΎΡΠ½ΠΈΠ΅Ρ‚ΠΎ си ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈΡ‚Π΅ (послСдното Π² R сС Ρ€Π΅Π°Π»ΠΈΠ·ΠΈΡ€Π° ΠΏΠΎ Π½Π°ΠΉ-простия Π½Π°Ρ‡ΠΈΠ½ с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° затваряния). ΠŸΡ€Π΅Π΄ΠΈ Ρ‚ΠΎΠ²Π° сС изисквашС ΠΈΠ·Ρ€ΠΈΡ‡Π½ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π½Π° R масиви Π² numpy масиви Π²ΡŠΡ‚Ρ€Π΅ Π² ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€Π°, Π½ΠΎ Ρ‚Π΅ΠΊΡƒΡ‰Π°Ρ‚Π° вСрсия Π½Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° keras ΠΏΡ€Π°Π²ΠΈ Π³ΠΎ сама.

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ΡŠΡ‚ Π·Π° Π΄Π°Π½Π½ΠΈ Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈ Π²Π°Π»ΠΈΠ΄ΠΈΡ€Π°Π½Π΅ сС ΠΎΠΊΠ°Π·Π° слСдният:

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ Π·Π° Π΄Π°Π½Π½ΠΈ Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈ Π²Π°Π»ΠΈΠ΄ΠΈΡ€Π°Π½Π΅

train_generator <- function(db_connection = con,
                            samples_index,
                            num_classes = 340,
                            batch_size = 32,
                            scale = 1,
                            color = FALSE,
                            imagenet_preproc = FALSE) {
  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²
  checkmate::assert_class(con, "DBIConnection")
  checkmate::assert_integerish(samples_index)
  checkmate::assert_count(num_classes)
  checkmate::assert_count(batch_size)
  checkmate::assert_number(scale, lower = 0.001, upper = 5)
  checkmate::assert_flag(color)
  checkmate::assert_flag(imagenet_preproc)

  # ΠŸΠ΅Ρ€Π΅ΠΌΠ΅ΡˆΠΈΠ²Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π±Ρ€Π°Ρ‚ΡŒ ΠΈ ΡƒΠ΄Π°Π»ΡΡ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Π΅ индСксы Π±Π°Ρ‚Ρ‡Π΅ΠΉ ΠΏΠΎ порядку
  dt <- data.table::data.table(id = sample(samples_index))
  # ΠŸΡ€ΠΎΡΡ‚Π°Π²Π»ΡΠ΅ΠΌ Π½ΠΎΠΌΠ΅Ρ€Π° Π±Π°Ρ‚Ρ‡Π΅ΠΉ
  dt[, batch := (.I - 1L) %/% batch_size + 1L]
  # ΠžΡΡ‚Π°Π²Π»ΡΠ΅ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ»Π½Ρ‹Π΅ Π±Π°Ρ‚Ρ‡ΠΈ ΠΈ индСксируСм
  dt <- dt[, if (.N == batch_size) .SD, keyby = batch]
  # УстанавливаСм счётчик
  i <- 1
  # ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ Π±Π°Ρ‚Ρ‡Π΅ΠΉ
  max_i <- dt[, max(batch)]

  # ΠŸΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° выраТСния для Π²Ρ‹Π³Ρ€ΡƒΠ·ΠΊΠΈ
  sql <- sprintf(
    "PREPARE SELECT drawing, label_int FROM doodles WHERE id IN (%s)",
    paste(rep("?", batch_size), collapse = ",")
  )
  res <- DBI::dbSendQuery(con, sql)

  # Аналог keras::to_categorical
  to_categorical <- function(x, num) {
    n <- length(x)
    m <- numeric(n * num)
    m[x * n + seq_len(n)] <- 1
    dim(m) <- c(n, num)
    return(m)
  }

  # Π—Π°ΠΌΡ‹ΠΊΠ°Π½ΠΈΠ΅
  function() {
    # НачинаСм Π½ΠΎΠ²ΡƒΡŽ эпоху
    if (i > max_i) {
      dt[, id := sample(id)]
      data.table::setkey(dt, batch)
      # БбрасываСм счётчик
      i <<- 1
      max_i <<- dt[, max(batch)]
    }

    # ID для Π²Ρ‹Π³Ρ€ΡƒΠ·ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…
    batch_ind <- dt[batch == i, id]
    # Π’Ρ‹Π³Ρ€ΡƒΠ·ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…
    batch <- DBI::dbFetch(DBI::dbBind(res, as.list(batch_ind)), n = -1)

    # Π£Π²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅ΠΌ счётчик
    i <<- i + 1

    # ΠŸΠ°Ρ€ΡΠΈΠ½Π³ JSON ΠΈ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° массива
    batch_x <- cpp_process_json_vector(batch$drawing, scale = scale, color = color)
    if (imagenet_preproc) {
      # Π¨ΠΊΠ°Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ c ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° [0, 1] Π½Π° ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» [-1, 1]
      batch_x <- (batch_x - 0.5) * 2
    }

    batch_y <- to_categorical(batch$label_int, num_classes)
    result <- list(batch_x, batch_y)
    return(result)
  }
}

Ѐункцията ΠΏΡ€ΠΈΠ΅ΠΌΠ° ΠΊΠ°Ρ‚ΠΎ Π²Ρ…ΠΎΠ΄ ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π° с Π²Ρ€ΡŠΠ·ΠΊΠ° към Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ, броя Π½Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ΠΈΡ‚Π΅ Ρ€Π΅Π΄ΠΎΠ²Π΅, броя Π½Π° класовСтС, Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°Ρ‚Π°, ΠΌΠ°Ρ‰Π°Π±Π° (scale = 1 ΡΡŠΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²Π° Π½Π° изобразяванС Π½Π° изобраТСния ΠΎΡ‚ 256x256 пиксСла, scale = 0.5 β€” 128x128 пиксСла), Ρ†Π²Π΅Ρ‚Π΅Π½ ΠΈΠ½Π΄ΠΈΠΊΠ°Ρ‚ΠΎΡ€ (color = FALSE ΡƒΠΊΠ°Π·Π²Π° Ρ€Π΅Π½Π΄ΠΈΡ€Π°Π½Π΅ Π² скала Π½Π° сивото, ΠΊΠΎΠ³Π°Ρ‚ΠΎ сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° color = TRUE всСки Ρ‰Ρ€ΠΈΡ… сС ΠΈΠ·Ρ‡Π΅Ρ€Ρ‚Π°Π²Π° Π² Π½ΠΎΠ² цвят) ΠΈ ΠΈΠ½Π΄ΠΈΠΊΠ°Ρ‚ΠΎΡ€ Π·Π° ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½Π° ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π·Π° ΠΌΡ€Π΅ΠΆΠΈ, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ Π½Π° imagenet. ΠŸΠΎΡΠ»Π΅Π΄Π½ΠΎΡ‚ΠΎ Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ, Π·Π° Π΄Π° сС ΠΌΠ°Ρ‰Π°Π±ΠΈΡ€Π°Ρ‚ стойноститС Π½Π° пиксСлитС ΠΎΡ‚ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° [0, 1] Π΄ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° [-1, 1], ΠΊΠΎΠΉΡ‚ΠΎ бСшС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° доставСния keras ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π’ΡŠΠ½ΡˆΠ½Π°Ρ‚Π° функция ΡΡŠΠ΄ΡŠΡ€ΠΆΠ° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π½Π° Ρ‚ΠΈΠΏΠ° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚, Ρ‚Π°Π±Π»ΠΈΡ†Π° data.table с ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»Π½ΠΎ смСсСни Π½ΠΎΠΌΠ΅Ρ€Π° Π½Π° Ρ€Π΅Π΄ΠΎΠ²Π΅ ΠΎΡ‚ samples_index ΠΈ Π½ΠΎΠΌΠ΅Ρ€Π° Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ, брояч ΠΈ максималСн Π±Ρ€ΠΎΠΉ ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ SQL ΠΈΠ·Ρ€Π°Π· Π·Π° Ρ€Π°Π·Ρ‚ΠΎΠ²Π°Ρ€Π²Π°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ ΠΎΡ‚ Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ. ОсвСн Ρ‚ΠΎΠ²Π° Π΄Π΅Ρ„ΠΈΠ½ΠΈΡ€Π°Ρ…ΠΌΠ΅ Π±ΡŠΡ€Π· Π°Π½Π°Π»ΠΎΠ³ Π½Π° функцията Π²ΡŠΡ‚Ρ€Π΅ keras::to_categorical(). Π˜Π·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ ΠΏΠΎΡ‡Ρ‚ΠΈ всички Π΄Π°Π½Π½ΠΈ Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, оставяйки ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Π·Π° Π²Π°Π»ΠΈΠ΄ΠΈΡ€Π°Π½Π΅, Ρ‚Π°ΠΊΠ° Ρ‡Π΅ Ρ€Π°Π·ΠΌΠ΅Ρ€ΡŠΡ‚ Π½Π° Π΅ΠΏΠΎΡ…Π°Ρ‚Π° бСшС ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ ΠΎΡ‚ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚ΡŠΡ€Π° steps_per_epoch ΠΏΡ€ΠΈ ΠΏΠΎΠ²ΠΈΠΊΠ²Π°Π½Π΅ keras::fit_generator(), ΠΈ ΡΡŠΡΡ‚ΠΎΡΠ½ΠΈΠ΅Ρ‚ΠΎ if (i > max_i) Ρ€Π°Π±ΠΎΡ‚ΠΈ само Π·Π° ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€Π° Π·Π° Π²Π°Π»ΠΈΠ΄ΠΈΡ€Π°Π½Π΅.

Π’ΡŠΠ² Π²ΡŠΡ‚Ρ€Π΅ΡˆΠ½Π°Ρ‚Π° функция индСкситС Π½Π° Ρ€Π΅Π΄ΠΎΠ²Π΅Ρ‚Π΅ сС ΠΈΠ·Π²Π»ΠΈΡ‡Π°Ρ‚ Π·Π° слСдващата ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄Π°, записитС сС Ρ€Π°Π·Ρ‚ΠΎΠ²Π°Ρ€Π²Π°Ρ‚ ΠΎΡ‚ Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ с ΡƒΠ²Π΅Π»ΠΈΡ‡Π°Π²Π°Π½Π΅ Π½Π° брояча Π½Π° ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈΡ‚Π΅, JSON Π°Π½Π°Π»ΠΈΠ· (функция cpp_process_json_vector(), написан Π½Π° C++) ΠΈ създаванС Π½Π° масиви, ΡΡŠΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²Π°Ρ‰ΠΈ Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΈ. Π‘Π»Π΅Π΄ Ρ‚ΠΎΠ²Π° сС ΡΡŠΠ·Π΄Π°Π²Π°Ρ‚ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½ΠΈ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΈ с Π΅Ρ‚ΠΈΠΊΠ΅Ρ‚ΠΈ Π½Π° класовС, масиви с пиксСлни стойности ΠΈ Π΅Ρ‚ΠΈΠΊΠ΅Ρ‚ΠΈ сС ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€Π°Ρ‚ Π² списък, ΠΊΠΎΠΉΡ‚ΠΎ Π΅ Π²Ρ€ΡŠΡ‰Π°Π½Π°Ρ‚Π° стойност. Π—Π° Π΄Π° ускорим Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚Π°, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ ΡΡŠΠ·Π΄Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° индСкси Π² Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ data.table ΠΈ модификация Ρ‡Ρ€Π΅Π· Π²Ρ€ΡŠΠ·ΠΊΠ°Ρ‚Π° - Π±Π΅Π· Ρ‚Π΅Π·ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚Π½ΠΈ β€žΡ‡ΠΈΠΏΠΎΠ²Π΅β€œ Ρ‚Π°Π±Π»ΠΈΡ†Π° с Π΄Π°Π½Π½ΠΈ Доста Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ Π΅ Π΄Π° си прСдставим Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΠΌ Π΅Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ с някакво Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»Π½ΠΎ количСство Π΄Π°Π½Π½ΠΈ Π² R.

Π Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΈΡ‚Π΅ ΠΎΡ‚ измСрванията Π½Π° скоростта Π½Π° Π»Π°ΠΏΡ‚ΠΎΠΏ Core i5 са слСднитС:

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ

library(Rcpp)
library(keras)
library(ggplot2)

source("utils/rcpp.R")
source("utils/keras_iterator.R")

con <- DBI::dbConnect(drv = MonetDBLite::MonetDBLite(), Sys.getenv("DBDIR"))

ind <- seq_len(DBI::dbGetQuery(con, "SELECT count(*) FROM doodles")[[1L]])
num_classes <- DBI::dbGetQuery(con, "SELECT max(label_int) + 1 FROM doodles")[[1L]]

# Π˜Π½Π΄Π΅ΠΊΡΡ‹ для ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ
train_ind <- sample(ind, floor(length(ind) * 0.995))
# Π˜Π½Π΄Π΅ΠΊΡΡ‹ для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΎΡ‡Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ
val_ind <- ind[-train_ind]
rm(ind)
# ΠšΠΎΡΡ„Ρ„ΠΈΡ†ΠΈΠ΅Π½Ρ‚ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π°
scale <- 0.5

# ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ Π·Π°ΠΌΠ΅Ρ€Π°
res_bench <- bench::press(
  batch_size = 2^(4:10),
  {
    it1 <- train_generator(
      db_connection = con,
      samples_index = train_ind,
      num_classes = num_classes,
      batch_size = batch_size,
      scale = scale
    )
    bench::mark(
      it1(),
      min_iterations = 50L
    )
  }
)
# ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°
cols <- c("batch_size", "min", "median", "max", "itr/sec", "total_time", "n_itr")
res_bench[, cols]

#   batch_size      min   median      max `itr/sec` total_time n_itr
#        <dbl> <bch:tm> <bch:tm> <bch:tm>     <dbl>   <bch:tm> <int>
# 1         16     25ms  64.36ms   92.2ms     15.9       3.09s    49
# 2         32   48.4ms 118.13ms 197.24ms     8.17       5.88s    48
# 3         64   69.3ms 117.93ms 181.14ms     8.57       5.83s    50
# 4        128  157.2ms 240.74ms 503.87ms     3.85      12.71s    49
# 5        256  359.3ms 613.52ms 988.73ms     1.54       30.5s    47
# 6        512  884.7ms    1.53s    2.07s     0.674      1.11m    45
# 7       1024     2.7s    3.83s    5.47s     0.261      2.81m    44

ggplot(res_bench, aes(x = factor(batch_size), y = median, group = 1)) +
    geom_point() +
    geom_line() +
    ylab("median time, s") +
    theme_minimal()

DBI::dbDisconnect(con, shutdown = TRUE)

Quick Draw Doodle Recognition: ΠΊΠ°ΠΊ Π΄Π° сС сприятСляватС с R, C++ ΠΈ Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ

Ако ΠΈΠΌΠ°Ρ‚Π΅ Π΄ΠΎΡΡ‚Π°Ρ‚ΡŠΡ‡Π½ΠΎ RAM, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ сСриозно Π΄Π° ускоритС Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚Π° Π½Π° Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ, ΠΊΠ°Ρ‚ΠΎ я ΠΏΡ€Π΅Ρ…Π²ΡŠΡ€Π»ΠΈΡ‚Π΅ Π² ΡΡŠΡ‰Π°Ρ‚Π° Ρ‚Π°Π·ΠΈ RAM (32 GB са Π΄ΠΎΡΡ‚Π°Ρ‚ΡŠΡ‡Π½ΠΈ Π·Π° Π½Π°ΡˆΠ°Ρ‚Π° Π·Π°Π΄Π°Ρ‡Π°). Π’ Linux Π΄ΡΠ»ΡŠΡ‚ Π΅ ΠΌΠΎΠ½Ρ‚ΠΈΡ€Π°Π½ ΠΏΠΎ ΠΏΠΎΠ΄Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅ /dev/shm, Π·Π°Π΅ΠΌΠ°ΠΉΠΊΠΈ Π΄ΠΎ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π°Ρ‚Π° ΠΎΡ‚ ΠΊΠ°ΠΏΠ°Ρ†ΠΈΡ‚Π΅Ρ‚Π° Π½Π° RAM. ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΏΠΎΠ΄Ρ‡Π΅Ρ€Ρ‚Π°Π΅Ρ‚Π΅ ΠΏΠΎΠ²Π΅Ρ‡Π΅ Ρ‡Ρ€Π΅Π· Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΈΡ€Π°Π½Π΅ /etc/fstabΠ·Π° Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ запис ΠΊΠ°Ρ‚ΠΎ tmpfs /dev/shm tmpfs defaults,size=25g 0 0. НС забравяйтС Π΄Π° рСстартиратС ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€Π΅Ρ‚Π΅ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π°, ΠΊΠ°Ρ‚ΠΎ ΠΈΠ·ΠΏΡŠΠ»Π½ΠΈΡ‚Π΅ ΠΊΠΎΠΌΠ°Π½Π΄Π°Ρ‚Π° df -h.

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ΡŠΡ‚ Π·Π° тСстови Π΄Π°Π½Π½ΠΈ ΠΈΠ·Π³Π»Π΅ΠΆΠ΄Π° ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠΎ-прост, Ρ‚ΡŠΠΉ ΠΊΠ°Ρ‚ΠΎ тСстовият Π½Π°Π±ΠΎΡ€ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ сС ΠΏΠΎΠ±ΠΈΡ€Π° изцяло Π² RAM:

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΎΡ€ Π·Π° тСстови Π΄Π°Π½Π½ΠΈ

test_generator <- function(dt,
                           batch_size = 32,
                           scale = 1,
                           color = FALSE,
                           imagenet_preproc = FALSE) {

  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²
  checkmate::assert_data_table(dt)
  checkmate::assert_count(batch_size)
  checkmate::assert_number(scale, lower = 0.001, upper = 5)
  checkmate::assert_flag(color)
  checkmate::assert_flag(imagenet_preproc)

  # ΠŸΡ€ΠΎΡΡ‚Π°Π²Π»ΡΠ΅ΠΌ Π½ΠΎΠΌΠ΅Ρ€Π° Π±Π°Ρ‚Ρ‡Π΅ΠΉ
  dt[, batch := (.I - 1L) %/% batch_size + 1L]
  data.table::setkey(dt, batch)
  i <- 1
  max_i <- dt[, max(batch)]

  # Π—Π°ΠΌΡ‹ΠΊΠ°Π½ΠΈΠ΅
  function() {
    batch_x <- cpp_process_json_vector(dt[batch == i, drawing], 
                                       scale = scale, color = color)
    if (imagenet_preproc) {
      # Π¨ΠΊΠ°Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ c ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° [0, 1] Π½Π° ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π» [-1, 1]
      batch_x <- (batch_x - 0.5) * 2
    }
    result <- list(batch_x)
    i <<- i + 1
    return(result)
  }
}

4. Π˜Π·Π±ΠΎΡ€ Π½Π° Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° Π½Π° ΠΌΠΎΠ΄Π΅Π»Π°

ΠŸΡŠΡ€Π²Π°Ρ‚Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π° Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° Π΅ mobilenet v1, Ρ‡ΠΈΠΈΡ‚ΠΎ характСристики са Ρ€Π°Π·Π³Π»Π΅Π΄Π°Π½ΠΈ Π² Ρ‚ΠΎΠ²Π° ΡΡŠΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅. Π’ΠΊΠ»ΡŽΡ‡Π΅Π½ Π΅ ΠΊΠ°Ρ‚ΠΎ стандарт keras ΠΈ ΡΡŠΠΎΡ‚Π²Π΅Ρ‚Π½ΠΎ Π΅ Π½Π°Π»ΠΈΡ‡Π΅Π½ Π² СдноимСнния ΠΏΠ°ΠΊΠ΅Ρ‚ Π·Π° R. Но ΠΊΠΎΠ³Π°Ρ‚ΠΎ сС ΠΎΠΏΠΈΡ‚Π°Ρ… Π΄Π° Π³ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌ с Π΅Π΄Π½ΠΎΠΊΠ°Π½Π°Π»Π½ΠΈ изобраТСния, сС ΠΎΠΊΠ°Π·Π° странно Π½Π΅Ρ‰ΠΎ: входният Ρ‚Π΅Π½Π·ΠΎΡ€ трябва Π²ΠΈΠ½Π°Π³ΠΈ Π΄Π° ΠΈΠΌΠ° ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠ΅Ρ‚ΠΎ (batch, height, width, 3), тоСст броят Π½Π° ΠΊΠ°Π½Π°Π»ΠΈΡ‚Π΅ Π½Π΅ ΠΌΠΎΠΆΠ΅ Π΄Π° сС промСня. Π’ Python няма Ρ‚Π°ΠΊΠΎΠ²Π° ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅, Ρ‚Π°ΠΊΠ° Ρ‡Π΅ ΠΏΠΎΠ±ΡŠΡ€Π·Π°Ρ…ΠΌΠ΅ ΠΈ написахмС наша собствСна рСализация Π½Π° Ρ‚Π°Π·ΠΈ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°, слСдвайки ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π½Π°Ρ‚Π° статия (Π±Π΅Π· ΠΎΡ‚ΠΏΠ°Π΄Π°Π½Π΅Ρ‚ΠΎ, ΠΊΠΎΠ΅Ρ‚ΠΎ Π΅ във вСрсията Π½Π° keras):

Mobilenet v1 Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°

library(keras)

top_3_categorical_accuracy <- custom_metric(
    name = "top_3_categorical_accuracy",
    metric_fn = function(y_true, y_pred) {
         metric_top_k_categorical_accuracy(y_true, y_pred, k = 3)
    }
)

layer_sep_conv_bn <- function(object, 
                              filters,
                              alpha = 1,
                              depth_multiplier = 1,
                              strides = c(2, 2)) {

  # NB! depth_multiplier !=  resolution multiplier
  # https://github.com/keras-team/keras/issues/10349

  layer_depthwise_conv_2d(
    object = object,
    kernel_size = c(3, 3), 
    strides = strides,
    padding = "same",
    depth_multiplier = depth_multiplier
  ) %>%
  layer_batch_normalization() %>% 
  layer_activation_relu() %>%
  layer_conv_2d(
    filters = filters * alpha,
    kernel_size = c(1, 1), 
    strides = c(1, 1)
  ) %>%
  layer_batch_normalization() %>% 
  layer_activation_relu() 
}

get_mobilenet_v1 <- function(input_shape = c(224, 224, 1),
                             num_classes = 340,
                             alpha = 1,
                             depth_multiplier = 1,
                             optimizer = optimizer_adam(lr = 0.002),
                             loss = "categorical_crossentropy",
                             metrics = c("categorical_crossentropy",
                                         top_3_categorical_accuracy)) {

  inputs <- layer_input(shape = input_shape)

  outputs <- inputs %>%
    layer_conv_2d(filters = 32, kernel_size = c(3, 3), strides = c(2, 2), padding = "same") %>%
    layer_batch_normalization() %>% 
    layer_activation_relu() %>%
    layer_sep_conv_bn(filters = 64, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 128, strides = c(2, 2)) %>%
    layer_sep_conv_bn(filters = 128, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 256, strides = c(2, 2)) %>%
    layer_sep_conv_bn(filters = 256, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(2, 2)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 512, strides = c(1, 1)) %>%
    layer_sep_conv_bn(filters = 1024, strides = c(2, 2)) %>%
    layer_sep_conv_bn(filters = 1024, strides = c(1, 1)) %>%
    layer_global_average_pooling_2d() %>%
    layer_dense(units = num_classes) %>%
    layer_activation_softmax()

    model <- keras_model(
      inputs = inputs,
      outputs = outputs
    )

    model %>% compile(
      optimizer = optimizer,
      loss = loss,
      metrics = metrics
    )

    return(model)
}

ΠΠ΅Π΄ΠΎΡΡ‚Π°Ρ‚ΡŠΡ†ΠΈΡ‚Π΅ Π½Π° Ρ‚ΠΎΠ·ΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ са ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΈ. Искам Π΄Π° тСствам ΠΌΠ½ΠΎΠ³ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΎ Π½Π°ΠΏΡ€ΠΎΡ‚ΠΈΠ², Π½Π΅ искам Π΄Π° прСнаписвам всяка Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° Ρ€ΡŠΡ‡Π½ΠΎ. ОсвСн Ρ‚ΠΎΠ²Π° бяхмС лишСни ΠΎΡ‚ Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚Ρ‚Π° Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ Ρ‚Π΅Π³Π»Π°Ρ‚Π° Π½Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ Π² imagenet. ΠšΠ°ΠΊΡ‚ΠΎ ΠΎΠ±ΠΈΠΊΠ½ΠΎΠ²Π΅Π½ΠΎ, ΠΈΠ·ΡƒΡ‡Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° докумСнтацията ΠΏΠΎΠΌΠΎΠ³Π½Π°. функция get_config() Π²ΠΈ позволява Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ описаниС Π½Π° ΠΌΠΎΠ΄Π΅Π»Π° във Ρ„ΠΎΡ€ΠΌΠ°, подходяща Π·Π° Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΈΡ€Π°Π½Π΅ (base_model_conf$layers - ΠΎΠ±ΠΈΠΊΠ½ΠΎΠ²Π΅Π½ R списък) ΠΈ функцията from_config() ΠΈΠ·Π²ΡŠΡ€ΡˆΠ²Π° ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΡ‚ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ²Π°Π½Π΅ Π² ΠΌΠΎΠ΄Π΅Π»Π΅Π½ ΠΎΠ±Π΅ΠΊΡ‚:

base_model_conf <- get_config(base_model)
base_model_conf$layers[[1]]$config$batch_input_shape[[4]] <- 1L
base_model <- from_config(base_model_conf)

Π‘Π΅Π³Π° Π½Π΅ Π΅ Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ Π΄Π° сС напишС унивСрсална функция, Π·Π° Π΄Π° сС ΠΏΠΎΠ»ΡƒΡ‡ΠΈ ΠΊΠΎΠ΅Ρ‚ΠΎ ΠΈ Π΄Π° Π΅ ΠΎΡ‚ доставСнитС keras ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΈΠ»ΠΈ Π±Π΅Π· тСТСсти, Ρ‚Ρ€Π΅Π½ΠΈΡ€Π°Π½ΠΈ Π² imagenet:

Ѐункция Π·Π° Π·Π°Ρ€Π΅ΠΆΠ΄Π°Π½Π΅ Π½Π° Π³ΠΎΡ‚ΠΎΠ²ΠΈ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΈ

get_model <- function(name = "mobilenet_v2",
                      input_shape = NULL,
                      weights = "imagenet",
                      pooling = "avg",
                      num_classes = NULL,
                      optimizer = keras::optimizer_adam(lr = 0.002),
                      loss = "categorical_crossentropy",
                      metrics = NULL,
                      color = TRUE,
                      compile = FALSE) {
  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ²
  checkmate::assert_string(name)
  checkmate::assert_integerish(input_shape, lower = 1, upper = 256, len = 3)
  checkmate::assert_count(num_classes)
  checkmate::assert_flag(color)
  checkmate::assert_flag(compile)

  # ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΈΠ· ΠΏΠ°ΠΊΠ΅Ρ‚Π° keras
  model_fun <- get0(paste0("application_", name), envir = asNamespace("keras"))
  # ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° наличия ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π² ΠΏΠ°ΠΊΠ΅Ρ‚Π΅
  if (is.null(model_fun)) {
    stop("Model ", shQuote(name), " not found.", call. = FALSE)
  }

  base_model <- model_fun(
    input_shape = input_shape,
    include_top = FALSE,
    weights = weights,
    pooling = pooling
  )

  # Если ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Π½Π΅ Ρ†Π²Π΅Ρ‚Π½ΠΎΠ΅, мСняСм Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Π²Ρ…ΠΎΠ΄Π°
  if (!color) {
    base_model_conf <- keras::get_config(base_model)
    base_model_conf$layers[[1]]$config$batch_input_shape[[4]] <- 1L
    base_model <- keras::from_config(base_model_conf)
  }

  predictions <- keras::get_layer(base_model, "global_average_pooling2d_1")$output
  predictions <- keras::layer_dense(predictions, units = num_classes, activation = "softmax")
  model <- keras::keras_model(
    inputs = base_model$input,
    outputs = predictions
  )

  if (compile) {
    keras::compile(
      object = model,
      optimizer = optimizer,
      loss = loss,
      metrics = metrics
    )
  }

  return(model)
}

ΠšΠΎΠ³Π°Ρ‚ΠΎ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚Π΅ Π΅Π΄Π½ΠΎΠΊΠ°Π½Π°Π»Π½ΠΈ изобраТСния, Π½Π΅ сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚ ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ тСТСсти. Π’ΠΎΠ²Π° ΠΌΠΎΠΆΠ΅ Π΄Π° сС ΠΊΠΎΡ€ΠΈΠ³ΠΈΡ€Π°: с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° функцията get_weights() Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ Ρ‚Π΅Π³Π»Π°Ρ‚Π° Π½Π° ΠΌΠΎΠ΄Π΅Π»Π° ΠΏΠΎΠ΄ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π° Π½Π° списък ΠΎΡ‚ R масиви, ΠΏΡ€ΠΎΠΌΠ΅Π½Π΅Ρ‚Π΅ Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΈΡ‚Π΅ Π½Π° ΠΏΡŠΡ€Π²ΠΈΡ Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚ ΠΎΡ‚ Ρ‚ΠΎΠ·ΠΈ списък (ΠΊΠ°Ρ‚ΠΎ Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ Π΅Π΄ΠΈΠ½ Ρ†Π²Π΅Ρ‚Π΅Π½ ΠΊΠ°Π½Π°Π» ΠΈΠ»ΠΈ осрСднитС ΠΈ Ρ‚Ρ€ΠΈΡ‚Π΅) ΠΈ слСд Ρ‚ΠΎΠ²Π° Π·Π°Ρ€Π΅Π΄Π΅Ρ‚Π΅ Ρ‚Π΅Π³Π»Π°Ρ‚Π° ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎ Π² ΠΌΠΎΠ΄Π΅Π»Π° с функцията set_weights(). Π’Π°ΠΊΠ° ΠΈ Π½Π΅ Π΄ΠΎΠ±Π°Π²ΠΈΡ…ΠΌΠ΅ Ρ‚Π°Π·ΠΈ функционалност, Π·Π°Ρ‰ΠΎΡ‚ΠΎ Π½Π° Ρ‚ΠΎΠ·ΠΈ Π΅Ρ‚Π°ΠΏ Π²Π΅Ρ‡Π΅ бСшС ясно, Ρ‡Π΅ Π΅ ΠΏΠΎ-ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΈΠ²Π½ΠΎ Π΄Π° сС Ρ€Π°Π±ΠΎΡ‚ΠΈ с Ρ†Π²Π΅Ρ‚Π½ΠΈ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ.

ΠŸΡ€ΠΎΠ²Π΅Π΄ΠΎΡ…ΠΌΠ΅ ΠΏΠΎΠ²Π΅Ρ‡Π΅Ρ‚ΠΎ ΠΎΡ‚ СкспСримСнтитС, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ mobilenet вСрсии 1 ΠΈ 2, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ resnet34. По-ΠΌΠΎΠ΄Π΅Ρ€Π½ΠΈΡ‚Π΅ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΈ ΠΊΠ°Ρ‚ΠΎ SE-ResNeXt сС прСдставиха Π΄ΠΎΠ±Ρ€Π΅ Π² Ρ‚ΠΎΠ²Π° ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅. Π—Π° съТалСниС нямахмС Π³ΠΎΡ‚ΠΎΠ²ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½Π° нашС Ρ€Π°Π·ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΈ Π½Π΅ написахмС свои (Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΎ Ρ‰Π΅ напишСм).

5. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΠ·ΠΈΡ€Π°Π½Π΅ Π½Π° скриптовС

Π—Π° удобство цСлият ΠΊΠΎΠ΄ Π·Π° стартиранС Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€Π°Π½ ΠΊΠ°Ρ‚ΠΎ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π΅Π½ скрипт, ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΠ·ΠΈΡ€Π°Π½ с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π΄ΠΎΠΊΠΎΠΏΡ‚ ΠΊΠ°ΠΊΡ‚ΠΎ слСдва:

doc <- '
Usage:
  train_nn.R --help
  train_nn.R --list-models
  train_nn.R [options]

Options:
  -h --help                   Show this message.
  -l --list-models            List available models.
  -m --model=<model>          Neural network model name [default: mobilenet_v2].
  -b --batch-size=<size>      Batch size [default: 32].
  -s --scale-factor=<ratio>   Scale factor [default: 0.5].
  -c --color                  Use color lines [default: FALSE].
  -d --db-dir=<path>          Path to database directory [default: Sys.getenv("db_dir")].
  -r --validate-ratio=<ratio> Validate sample ratio [default: 0.995].
  -n --n-gpu=<number>         Number of GPUs [default: 1].
'
args <- docopt::docopt(doc)

ΠΏΠ°ΠΊΠ΅Ρ‚ Π΄ΠΎΠΊΠΎΠΏΡ‚ прСдставлява ΠΈΠ·ΠΏΡŠΠ»Π½Π΅Π½ΠΈΠ΅Ρ‚ΠΎ http://docopt.org/ Π·Π° R. Π‘ Π½Π΅Π³ΠΎΠ²Π° ΠΏΠΎΠΌΠΎΡ‰ сС стартират скриптовС с прости ΠΊΠΎΠΌΠ°Π½Π΄ΠΈ ΠΊΠ°Ρ‚ΠΎ Rscript bin/train_nn.R -m resnet50 -c -d /home/andrey/doodle_db ΠΈΠ»ΠΈ ./bin/train_nn.R -m resnet50 -c -d /home/andrey/doodle_db, Π°ΠΊΠΎ Ρ„Π°ΠΉΠ» train_nn.R Π΅ изпълнима (Ρ‚Π°Π·ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Π° Ρ‰Π΅ Π·Π°ΠΏΠΎΡ‡Π½Π΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Ρ‚ΠΎ Π½Π° ΠΌΠΎΠ΄Π΅Π»Π° resnet50 Π½Π° Ρ‚Ρ€ΠΈΡ†Π²Π΅Ρ‚Π½ΠΈ изобраТСния с Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΈ 128x128 пиксСла Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ трябва Π΄Π° сС Π½Π°ΠΌΠΈΡ€Π° Π² ΠΏΠ°ΠΏΠΊΠ°Ρ‚Π° /home/andrey/doodle_db). ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π΄ΠΎΠ±Π°Π²ΠΈΡ‚Π΅ скорост Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, Ρ‚ΠΈΠΏ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ ΠΈ всякакви Π΄Ρ€ΡƒΠ³ΠΈ пСрсонализирани ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈ към списъка. Π’ процСса Π½Π° ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ° Π½Π° ΠΈΠ·Π΄Π°Π½ΠΈΠ΅Ρ‚ΠΎ сС ΠΎΠΊΠ°Π·Π°, Ρ‡Π΅ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°Ρ‚Π° mobilenet_v2 ΠΎΡ‚ Ρ‚Π΅ΠΊΡƒΡ‰Π°Ρ‚Π° вСрсия keras Π² R ΡƒΠΏΠΎΡ‚Ρ€Π΅Π±Π° Π½Π΅ трябва ΠΏΠΎΡ€Π°Π΄ΠΈ ΠΏΡ€ΠΎΠΌΠ΅Π½ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ Π½Π΅ са Π²Π·Π΅Ρ‚ΠΈ ΠΏΡ€Π΅Π΄Π²ΠΈΠ΄ Π² R ΠΏΠ°ΠΊΠ΅Ρ‚Π°, Ρ‡Π°ΠΊΠ°ΠΌΠ΅ Π΄Π° Π³ΠΎ ΠΊΠΎΡ€ΠΈΠ³ΠΈΡ€Π°Ρ‚.

Π’ΠΎΠ·ΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π½Π°ΠΏΡ€Π°Π²ΠΈ възмоТно Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»Π½ΠΎ ускоряванС Π½Π° СкспСримСнтитС с Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² сравнСниС с ΠΏΠΎ-Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΡ‚ΠΎ стартиранС Π½Π° скриптовС Π² RStudio (отбСлязвамС ΠΏΠ°ΠΊΠ΅Ρ‚Π° ΠΊΠ°Ρ‚ΠΎ възмоТна Π°Π»Ρ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Π° tfruns). Но основното прСдимство Π΅ Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚Ρ‚Π° лСсно Π΄Π° управляватС стартиранСто Π½Π° скриптовС Π² Docker ΠΈΠ»ΠΈ просто Π½Π° ΡΡŠΡ€Π²ΡŠΡ€Π°, Π±Π΅Π· Π΄Π° инсталиратС RStudio Π·Π° Ρ‚ΠΎΠ²Π°.

6. ДокСризация Π½Π° скриптовС

Π˜Π·ΠΏΠΎΠ»Π·Π²Π°Ρ…ΠΌΠ΅ Docker, Π·Π° Π΄Π° осигурим прСносимост Π½Π° срСдата Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‡Π»Π΅Π½ΠΎΠ²Π΅Ρ‚Π΅ Π½Π° Π΅ΠΊΠΈΠΏΠ° ΠΈ Π·Π° Π±ΡŠΡ€Π·ΠΎ внСдряванС Π² ΠΎΠ±Π»Π°ΠΊΠ°. ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Π·Π°ΠΏΠΎΡ‡Π½Π΅Ρ‚Π΅ Π΄Π° сС Π·Π°ΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚Π΅ с Ρ‚ΠΎΠ·ΠΈ инструмСнт, ΠΊΠΎΠΉΡ‚ΠΎ Π΅ сравнитСлно Π½Π΅ΠΎΠ±ΠΈΡ‡Π°Π΅Π½ Π·Π° R програмист, с Ρ‚ΠΎΠ²Π° ΠΏΠΎΡ€Π΅Π΄ΠΈΡ†Π° ΠΎΡ‚ ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΈΠ»ΠΈ Π²ΠΈΠ΄Π΅ΠΎ курс.

Docker Π²ΠΈ позволява ΠΊΠ°ΠΊΡ‚ΠΎ Π΄Π° ΡΡŠΠ·Π΄Π°Π²Π°Ρ‚Π΅ свои собствСни изобраТСния ΠΎΡ‚ Π½ΡƒΠ»Π°Ρ‚Π°, Ρ‚Π°ΠΊΠ° ΠΈ Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Ρ‚Π΅ Π΄Ρ€ΡƒΠ³ΠΈ изобраТСния ΠΊΠ°Ρ‚ΠΎ основа Π·Π° създаванС Π½Π° свои собствСни. ΠšΠΎΠ³Π°Ρ‚ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Ρ…ΠΌΠ΅ Π½Π°Π»ΠΈΡ‡Π½ΠΈΡ‚Π΅ ΠΎΠΏΡ†ΠΈΠΈ, стигнахмС Π΄ΠΎ ΠΈΠ·Π²ΠΎΠ΄Π°, Ρ‡Π΅ инсталиранСто Π½Π° NVIDIA, CUDA+cuDNN Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€ΠΈ ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ Π½Π° Python Π΅ доста ΠΎΠ±Π΅ΠΌΠ½Π° част ΠΎΡ‚ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅Ρ‚ΠΎ ΠΈ Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° Π²Π·Π΅ΠΌΠ΅ΠΌ официалния ΠΎΠ±Ρ€Π°Π· ΠΊΠ°Ρ‚ΠΎ основа tensorflow/tensorflow:1.12.0-gpu, добавяйки Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΈΡ‚Π΅ R ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ Ρ‚Π°ΠΌ.

ΠšΡ€Π°ΠΉΠ½ΠΈΡΡ‚ Π΄ΠΎΠΊΠ΅Ρ€ Ρ„Π°ΠΉΠ» изглСТдашС Ρ‚Π°ΠΊΠ°:

Π”ΠΎΠΊΠ΅Ρ€ Ρ„Π°ΠΉΠ»

FROM tensorflow/tensorflow:1.12.0-gpu

MAINTAINER Artem Klevtsov <[email protected]>

SHELL ["/bin/bash", "-c"]

ARG LOCALE="en_US.UTF-8"
ARG APT_PKG="libopencv-dev r-base r-base-dev littler"
ARG R_BIN_PKG="futile.logger checkmate data.table rcpp rapidjsonr dbi keras jsonlite curl digest remotes"
ARG R_SRC_PKG="xtensor RcppThread docopt MonetDBLite"
ARG PY_PIP_PKG="keras"
ARG DIRS="/db /app /app/data /app/models /app/logs"

RUN source /etc/os-release && 
    echo "deb https://cloud.r-project.org/bin/linux/ubuntu ${UBUNTU_CODENAME}-cran35/" > /etc/apt/sources.list.d/cran35.list && 
    apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9 && 
    add-apt-repository -y ppa:marutter/c2d4u3.5 && 
    add-apt-repository -y ppa:timsc/opencv-3.4 && 
    apt-get update && 
    apt-get install -y locales && 
    locale-gen ${LOCALE} && 
    apt-get install -y --no-install-recommends ${APT_PKG} && 
    ln -s /usr/lib/R/site-library/littler/examples/install.r /usr/local/bin/install.r && 
    ln -s /usr/lib/R/site-library/littler/examples/install2.r /usr/local/bin/install2.r && 
    ln -s /usr/lib/R/site-library/littler/examples/installGithub.r /usr/local/bin/installGithub.r && 
    echo 'options(Ncpus = parallel::detectCores())' >> /etc/R/Rprofile.site && 
    echo 'options(repos = c(CRAN = "https://cloud.r-project.org"))' >> /etc/R/Rprofile.site && 
    apt-get install -y $(printf "r-cran-%s " ${R_BIN_PKG}) && 
    install.r ${R_SRC_PKG} && 
    pip install ${PY_PIP_PKG} && 
    mkdir -p ${DIRS} && 
    chmod 777 ${DIRS} && 
    rm -rf /tmp/downloaded_packages/ /tmp/*.rds && 
    rm -rf /var/lib/apt/lists/*

COPY utils /app/utils
COPY src /app/src
COPY tests /app/tests
COPY bin/*.R /app/

ENV DBDIR="/db"
ENV CUDA_HOME="/usr/local/cuda"
ENV PATH="/app:${PATH}"

WORKDIR /app

VOLUME /db
VOLUME /app

CMD bash

Π—Π° удобство ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ΠΈΡ‚Π΅ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ бяха поставСни Π² ΠΏΡ€ΠΎΠΌΠ΅Π½Π»ΠΈΠ²ΠΈ; ΠΏΠΎ-голямата част ΠΎΡ‚ писмСнитС скриптовС сС ΠΊΠΎΠΏΠΈΡ€Π°Ρ‚ Π²ΡŠΡ‚Ρ€Π΅ Π² ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ΠΈΡ‚Π΅ ΠΏΠΎ Π²Ρ€Π΅ΠΌΠ΅ Π½Π° асСмблиранСто. ΠŸΡ€ΠΎΠΌΠ΅Π½ΠΈΡ…ΠΌΠ΅ ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Π½Π°Ρ‚Π° ΠΎΠ±Π²ΠΈΠ²ΠΊΠ° Π½Π° /bin/bash Π·Π° лСсно ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π° ΡΡŠΠ΄ΡŠΡ€ΠΆΠ°Π½ΠΈΠ΅Ρ‚ΠΎ /etc/os-release. Π’ΠΎΠ²Π° избягва нСобходимостта Π΄Π° сС ΡƒΠΊΠ°Π·Π²Π° вСрсията Π½Π° ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Π°Ρ‚Π° систСма Π² ΠΊΠΎΠ΄Π°.

ОсвСн Ρ‚ΠΎΠ²Π° бСшС написан малък bash скрипт, ΠΊΠΎΠΉΡ‚ΠΎ Π²ΠΈ позволява Π΄Π° стартиратС ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ с Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄ΠΈ. НапримСр, Ρ‚ΠΎΠ²Π° ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° Π±ΡŠΠ΄Π°Ρ‚ скриптовС Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ ΠΏΡ€Π΅Π΄ΠΈ Ρ‚ΠΎΠ²Π° са Π±ΠΈΠ»ΠΈ поставСни Π²ΡŠΡ‚Ρ€Π΅ Π² ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π°, ΠΈΠ»ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Π½Π° ΠΎΠ±Π²ΠΈΠ²ΠΊΠ° Π·Π° отстраняванС Π½Π° Π³Ρ€Π΅ΡˆΠΊΠΈ ΠΈ наблюдСниС Π½Π° Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚Π° Π½Π° ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π°:

Π‘ΠΊΡ€ΠΈΠΏΡ‚ Π·Π° стартиранС Π½Π° ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π°

#!/bin/sh

DBDIR=${PWD}/db
LOGSDIR=${PWD}/logs
MODELDIR=${PWD}/models
DATADIR=${PWD}/data
ARGS="--runtime=nvidia --rm -v ${DBDIR}:/db -v ${LOGSDIR}:/app/logs -v ${MODELDIR}:/app/models -v ${DATADIR}:/app/data"

if [ -z "$1" ]; then
    CMD="Rscript /app/train_nn.R"
elif [ "$1" = "bash" ]; then
    ARGS="${ARGS} -ti"
else
    CMD="Rscript /app/train_nn.R $@"
fi

docker run ${ARGS} doodles-tf ${CMD}

Ако Ρ‚ΠΎΠ·ΠΈ bash скрипт сС изпълнява Π±Π΅Π· ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈ, ΡΠΊΡ€ΠΈΠΏΡ‚ΡŠΡ‚ Ρ‰Π΅ бъдС ΠΈΠ·Π²ΠΈΠΊΠ°Π½ Π²ΡŠΡ‚Ρ€Π΅ Π² ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π° train_nn.R със стойности ΠΏΠΎ ΠΏΠΎΠ΄Ρ€Π°Π·Π±ΠΈΡ€Π°Π½Π΅; Π°ΠΊΠΎ ΠΏΡŠΡ€Π²ΠΈΡΡ‚ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π΅Π½ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ Π΅ "bash", Ρ‚ΠΎΠ³Π°Π²Π° ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ΡŠΡ‚ Ρ‰Π΅ стартира ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ с ΠΊΠΎΠΌΠ°Π½Π΄Π½Π° ΠΎΠ±Π²ΠΈΠ²ΠΊΠ°. Π’ΡŠΠ² всички останали случаи стойноститС Π½Π° ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½ΠΈΡ‚Π΅ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΈ сС замСстват: CMD="Rscript /app/train_nn.R $@".

Π‘Ρ‚Ρ€ΡƒΠ²Π° си Π΄Π° сС ΠΎΡ‚Π±Π΅Π»Π΅ΠΆΠΈ, Ρ‡Π΅ Π΄ΠΈΡ€Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΈΡ‚Π΅ с ΠΈΠ·Ρ…ΠΎΠ΄Π½ΠΈ Π΄Π°Π½Π½ΠΈ ΠΈ Π±Π°Π·Π° Π΄Π°Π½Π½ΠΈ, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ дирСкторията Π·Π° Π·Π°ΠΏΠ°Π·Π²Π°Π½Π΅ Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, са ΠΌΠΎΠ½Ρ‚ΠΈΡ€Π°Π½ΠΈ Π²ΡŠΡ‚Ρ€Π΅ Π² ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€Π° ΠΎΡ‚ хост систСмата, ΠΊΠΎΠ΅Ρ‚ΠΎ Π²ΠΈ позволява Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ Π΄ΠΎΡΡ‚ΡŠΠΏ Π΄ΠΎ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΈΡ‚Π΅ ΠΎΡ‚ скриптовСтС Π±Π΅Π· Π½Π΅Π½ΡƒΠΆΠ½ΠΈ ΠΌΠ°Π½ΠΈΠΏΡƒΠ»Π°Ρ†ΠΈΠΈ.

7. ИзползванС Π½Π° мноТСство GPU Π² Google Cloud

Π•Π΄Π½Π° ΠΎΡ‚ характСристикитС Π½Π° ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅Ρ‚ΠΎ бяха ΠΌΠ½ΠΎΠ³ΠΎ ΡˆΡƒΠΌΠ½ΠΈΡ‚Π΅ Π΄Π°Π½Π½ΠΈ (Π²ΠΈΠΆΡ‚Π΅ Π·Π°Π³Π»Π°Π²Π½Π°Ρ‚Π° снимка, заимствана ΠΎΡ‚ @Leigh.plt ΠΎΡ‚ ODS slack). Π“ΠΎΠ»Π΅ΠΌΠΈΡ‚Π΅ ΠΏΠ°Ρ€Ρ‚ΠΈΠ΄ΠΈ ΠΏΠΎΠΌΠ°Π³Π°Ρ‚ Π² Π±ΠΎΡ€Π±Π°Ρ‚Π° с Ρ‚ΠΎΠ²Π° ΠΈ слСд СкспСримСнти Π½Π° ΠΊΠΎΠΌΠΏΡŽΡ‚ΡŠΡ€ с 1 GPU Ρ€Π΅ΡˆΠΈΡ…ΠΌΠ΅ Π΄Π° ΠΎΠ²Π»Π°Π΄Π΅Π΅ΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΡŠΡ‡Π½ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° няколко GPU Π² ΠΎΠ±Π»Π°ΠΊΠ°. Използван GoogleCloud (Π΄ΠΎΠ±Ρ€ΠΎ Ρ€ΡŠΠΊΠΎΠ²ΠΎΠ΄ΡΡ‚Π²ΠΎ Π·Π° основитС) ΠΏΠΎΡ€Π°Π΄ΠΈ голСмия ΠΈΠ·Π±ΠΎΡ€ ΠΎΡ‚ Π½Π°Π»ΠΈΡ‡Π½ΠΈ ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ, Ρ€Π°Π·ΡƒΠΌΠ½ΠΈ Ρ†Π΅Π½ΠΈ ΠΈ $300 бонус. ΠžΡ‚ алчност ΠΏΠΎΡ€ΡŠΡ‡Π°Ρ… СкзСмпляр 4xV100 със SSD ΠΈ Π΅Π΄ΠΈΠ½ Ρ‚ΠΎΠ½ RAM ΠΈ Ρ‚ΠΎΠ²Π° бСшС голяма Π³Ρ€Π΅ΡˆΠΊΠ°. Π’Π°ΠΊΠ°Π²Π° машина изяТда ΠΏΠ°Ρ€ΠΈ Π±ΡŠΡ€Π·ΠΎ; ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° сС Ρ€Π°Π·ΠΎΡ€ΠΈΡ‚Π΅, СкспСримСнтирайки Π±Π΅Π· Π΄ΠΎΠΊΠ°Π·Π°Π½ Ρ‚Ρ€ΡŠΠ±ΠΎΠΏΡ€ΠΎΠ²ΠΎΠ΄. Π—Π° ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»Π½ΠΈ Ρ†Π΅Π»ΠΈ Π΅ ΠΏΠΎ-Π΄ΠΎΠ±Ρ€Π΅ Π΄Π° Π²Π·Π΅ΠΌΠ΅Ρ‚Π΅ K80. Но голямото количСство RAM бСшС ΠΏΠΎΠ»Π΅Π·Π½ΠΎ - облачният SSD Π½Π΅ Π²ΠΏΠ΅Ρ‡Π°Ρ‚Π»ΠΈ с производитСлността си, Ρ‚Π°ΠΊΠ° Ρ‡Π΅ Π±Π°Π·Π°Ρ‚Π° Π΄Π°Π½Π½ΠΈ бСшС ΠΏΡ€Π΅Ρ…Π²ΡŠΡ€Π»Π΅Π½Π° Π½Π° dev/shm.

Най-голям интСрСс прСдставлява кодовият Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚, ΠΎΡ‚Π³ΠΎΠ²ΠΎΡ€Π΅Π½ Π·Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° мноТСство Π³Ρ€Π°Ρ„ΠΈΡ‡Π½ΠΈ процСсори. ΠŸΡŠΡ€Π²ΠΎ, ΠΌΠΎΠ΄Π΅Π»ΡŠΡ‚ сС създава Π½Π° процСсора с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° контСкстСн ΠΌΠ΅Π½ΠΈΠ΄ΠΆΡŠΡ€, Ρ‚ΠΎΡ‡Π½ΠΎ ΠΊΠ°ΠΊΡ‚ΠΎ Π² Python:

with(tensorflow::tf$device("/cpu:0"), {
  model_cpu <- get_model(
    name = model_name,
    input_shape = input_shape,
    weights = weights,
    metrics =(top_3_categorical_accuracy,
    compile = FALSE
  )
})

Π‘Π»Π΅Π΄ Ρ‚ΠΎΠ²Π° нСкомпилираният (Ρ‚ΠΎΠ²Π° Π΅ Π²Π°ΠΆΠ½ΠΎ) ΠΌΠΎΠ΄Π΅Π» сС ΠΊΠΎΠΏΠΈΡ€Π° Π² Π΄Π°Π΄Π΅Π½ Π±Ρ€ΠΎΠΉ Π½Π°Π»ΠΈΡ‡Π½ΠΈ GPU ΠΈ Π΅Π΄Π²Π° слСд Ρ‚ΠΎΠ²Π° сС ΠΊΠΎΠΌΠΏΠΈΠ»ΠΈΡ€Π°:

model <- keras::multi_gpu_model(model_cpu, gpus = n_gpu)
keras::compile(
  object = model,
  optimizer = keras::optimizer_adam(lr = 0.0004),
  loss = "categorical_crossentropy",
  metrics = c(top_3_categorical_accuracy)
)

ΠšΠ»Π°ΡΠΈΡ‡Π΅ΡΠΊΠ°Ρ‚Π° Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° Π½Π° замразяванС Π½Π° всички слоСвС с ΠΈΠ·ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ Π½Π° послСдния, ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° послСдния слой, размразяванС ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° цСлия ΠΌΠΎΠ΄Π΅Π» Π·Π° няколко GPU Π½Π΅ ΠΌΠΎΠΆΠ° Π΄Π° бъдС ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½Π°.

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Ρ‚ΠΎ бСшС наблюдавано Π±Π΅Π· ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅. Ρ‚Π΅Π½Π·ΠΎΡ€Π½Π° дъска, ΠΊΠ°Ρ‚ΠΎ сС ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π°Π²Π°ΠΌΠ΅ Π΄ΠΎ записванС Π½Π° ΠΆΡƒΡ€Π½Π°Π»ΠΈ ΠΈ Π·Π°ΠΏΠ°Π·Π²Π°Π½Π΅ Π½Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½ΠΈ ΠΈΠΌΠ΅Π½Π° слСд всяка Π΅ΠΏΠΎΡ…Π°:

ΠžΠ±Ρ€Π°Ρ‚Π½ΠΈ повиквания

# Π¨Π°Π±Π»ΠΎΠ½ ΠΈΠΌΠ΅Π½ΠΈ Ρ„Π°ΠΉΠ»Π° Π»ΠΎΠ³Π°
log_file_tmpl <- file.path("logs", sprintf(
  "%s_%d_%dch_%s.csv",
  model_name,
  dim_size,
  channels,
  format(Sys.time(), "%Y%m%d%H%M%OS")
))
# Π¨Π°Π±Π»ΠΎΠ½ ΠΈΠΌΠ΅Π½ΠΈ Ρ„Π°ΠΉΠ»Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ
model_file_tmpl <- file.path("models", sprintf(
  "%s_%d_%dch_{epoch:02d}_{val_loss:.2f}.h5",
  model_name,
  dim_size,
  channels
))

callbacks_list <- list(
  keras::callback_csv_logger(
    filename = log_file_tmpl
  ),
  keras::callback_early_stopping(
    monitor = "val_loss",
    min_delta = 1e-4,
    patience = 8,
    verbose = 1,
    mode = "min"
  ),
  keras::callback_reduce_lr_on_plateau(
    monitor = "val_loss",
    factor = 0.5, # ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅ΠΌ lr Π² 2 Ρ€Π°Π·Π°
    patience = 4,
    verbose = 1,
    min_delta = 1e-4,
    mode = "min"
  ),
  keras::callback_model_checkpoint(
    filepath = model_file_tmpl,
    monitor = "val_loss",
    save_best_only = FALSE,
    save_weights_only = FALSE,
    mode = "min"
  )
)

8. ВмСсто Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π Π΅Π΄ΠΈΡ†Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ, с ΠΊΠΎΠΈΡ‚ΠΎ сС ΡΠ±Π»ΡŠΡΠΊΠ°Ρ…ΠΌΠ΅, всС ΠΎΡ‰Π΅ Π½Π΅ са ΠΏΡ€Π΅ΠΎΠ΄ΠΎΠ»Π΅Π½ΠΈ:

  • Π² keras няма Π³ΠΎΡ‚ΠΎΠ²Π° функция Π·Π° Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ Ρ‚ΡŠΡ€ΡΠ΅Π½Π΅ Π½Π° ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»Π½Π° скорост Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ (Π°Π½Π°Π»ΠΎΠ³ lr_finder Π² Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°Ρ‚Π° Π±ΡŠΡ€Π·ΠΎ.ai); Π‘ извСстни усилия Π΅ възмоТно Π΄Π° сС прСнСсат Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½Π° Ρ‚Ρ€Π΅Ρ‚ΠΈ страни към R, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ‚ΠΎΠ²Π°;
  • ΠΊΠ°Ρ‚ΠΎ слСдствиС ΠΎΡ‚ ΠΏΡ€Π΅Π΄ΠΈΡˆΠ½Π°Ρ‚Π° Ρ‚ΠΎΡ‡ΠΊΠ° Π½Π΅ бСшС възмоТно Π΄Π° сС ΠΈΠ·Π±Π΅Ρ€Π΅ ΠΏΡ€Π°Π²ΠΈΠ»Π½Π°Ρ‚Π° скорост Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π° няколко Π³Ρ€Π°Ρ„ΠΈΡ‡Π½ΠΈ процСсора;
  • липсват ΡΡŠΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΈ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΈ Π½Π° Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ, особСно Ρ‚Π΅Π·ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ са ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈ Π½Π° imagenet;
  • ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠ° Π±Π΅Π· Π΅Π΄ΠΈΠ½ Ρ†ΠΈΠΊΡŠΠ» ΠΈ дискриминативни Π½ΠΈΠ²Π° Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ (косинусното отгряванС бСшС ΠΏΠΎ нашС исканС изпълнСни, Благодаря skeydan).

Какви ΠΏΠΎΠ»Π΅Π·Π½ΠΈ Π½Π΅Ρ‰Π° Π½Π°ΡƒΡ‡ΠΈΡ…Ρ‚Π΅ ΠΎΡ‚ Ρ‚ΠΎΠ²Π° ΡΡŠΡΡ‚Π΅Π·Π°Π½ΠΈΠ΅:

  • На Ρ…Π°Ρ€Π΄ΡƒΠ΅Ρ€ с относитСлно ниска мощност ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΡ‚Π΅ с ΠΏΡ€ΠΈΠ»ΠΈΡ‡Π½ΠΈ (ΠΌΠ½ΠΎΠ³ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎ ΠΏΠΎ-Π³ΠΎΠ»Π΅ΠΌΠΈ ΠΎΡ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π½Π° RAM) ΠΎΠ±Π΅ΠΌΠΈ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ Π±Π΅Π· Π±ΠΎΠ»ΠΊΠ°. Найлонов ΠΏΠ»ΠΈΠΊ Ρ‚Π°Π±Π»ΠΈΡ†Π° с Π΄Π°Π½Π½ΠΈ спСстява ΠΏΠ°ΠΌΠ΅Ρ‚ ΠΏΠΎΡ€Π°Π΄ΠΈ модификация Π½Π° място Π½Π° Ρ‚Π°Π±Π»ΠΈΡ†ΠΈ, ΠΊΠΎΠ΅Ρ‚ΠΎ избягва ΠΊΠΎΠΏΠΈΡ€Π°Π½Π΅Ρ‚ΠΎ ΠΈΠΌ ΠΈ ΠΊΠΎΠ³Π°Ρ‚ΠΎ сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° ΠΏΡ€Π°Π²ΠΈΠ»Π½ΠΎ, Π½Π΅Π³ΠΎΠ²ΠΈΡ‚Π΅ Π²ΡŠΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΠΈ ΠΏΠΎΡ‡Ρ‚ΠΈ Π²ΠΈΠ½Π°Π³ΠΈ дСмонстрират Π½Π°ΠΉ-високата скорост срСд всички ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ Π½ΠΈ инструмСнти Π·Π° скриптови Π΅Π·ΠΈΡ†ΠΈ. Π—Π°ΠΏΠ°Π·Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° Π΄Π°Π½Π½ΠΈ Π² Π±Π°Π·Π° Π΄Π°Π½Π½ΠΈ Π²ΠΈ позволява Π² ΠΌΠ½ΠΎΠ³ΠΎ случаи ΠΈΠ·ΠΎΠ±Ρ‰ΠΎ Π΄Π° Π½Π΅ мислитС Π·Π° нСобходимостта Π΄Π° стиснСтС цСлия Π½Π°Π±ΠΎΡ€ ΠΎΡ‚ Π΄Π°Π½Π½ΠΈ Π² RAM.
  • Π‘Π°Π²Π½ΠΈΡ‚Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π² R ΠΌΠΎΠ³Π°Ρ‚ Π΄Π° Π±ΡŠΠ΄Π°Ρ‚ Π·Π°ΠΌΠ΅Π½Π΅Π½ΠΈ с Π±ΡŠΡ€Π·ΠΈ Π² C++ с ΠΏΠΎΠΌΠΎΡ‰Ρ‚Π° Π½Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° Rcpp. Ако Π² допълнСниС към ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅Ρ‚ΠΎ RcppThread ΠΈΠ»ΠΈ RcppΠŸΠ°Ρ€Π°Π»Π΅Π»Π½ΠΎ, ΠΏΠΎΠ»ΡƒΡ‡Π°Π²Π°ΠΌΠ΅ крос-ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ΅Π½ΠΈ многонишкови Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ, Ρ‚Π°ΠΊΠ° Ρ‡Π΅ няма Π½ΡƒΠΆΠ΄Π° Π΄Π° ΠΏΠ°Ρ€Π°Π»Π΅Π»ΠΈΠ·ΠΈΡ€Π°ΠΌΠ΅ ΠΊΠΎΠ΄Π° Π½Π° Π½ΠΈΠ²ΠΎ R.
  • ΠŸΠ°ΠΊΠ΅Ρ‚ Rcpp ΠΌΠΎΠΆΠ΅ Π΄Π° сС ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° Π±Π΅Π· сСриозни познания ΠΏΠΎ C++, нСобходимият ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ Π΅ ΠΎΡ‡Π΅Ρ€Ρ‚Π°Π½ Ρ‚ΡƒΠΊ. Π—Π°Π³Π»Π°Π²Π½ΠΈ Ρ„Π°ΠΉΠ»ΠΎΠ²Π΅ Π·Π° Ρ€Π΅Π΄ΠΈΡ†Π° страхотни C-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ ΠΊΠ°Ρ‚ΠΎ xtensor Π½Π° Ρ€Π°Π·ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Π½Π° CRAN, Ρ‚.Π΅. създава сС инфраструктура Π·Π° изпълнСниС Π½Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈ, ΠΊΠΎΠΈΡ‚ΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€Π°Ρ‚ Π³ΠΎΡ‚ΠΎΠ² високопроизводитСлСн C++ ΠΊΠΎΠ΄ Π² R. Π”ΠΎΠΏΡŠΠ»Π½ΠΈΡ‚Π΅Π»Π½ΠΎ удобство Π΅ ΠΏΠΎΠ΄Ρ‡Π΅Ρ€Ρ‚Π°Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° синтаксиса ΠΈ Π°Π½Π°Π»ΠΈΠ·Π°Ρ‚ΠΎΡ€ Π½Π° статичСн C++ ΠΊΠΎΠ΄ Π² RStudio.
  • Π΄ΠΎΠΊΠΎΠΏΡ‚ Π²ΠΈ позволява Π΄Π° ΠΈΠ·ΠΏΡŠΠ»Π½ΡΠ²Π°Ρ‚Π΅ самостоятСлни скриптовС с ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈ. Π’ΠΎΠ²Π° Π΅ ΡƒΠ΄ΠΎΠ±Π½ΠΎ Π·Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π΅ Π½Π° ΠΎΡ‚Π΄Π°Π»Π΅Ρ‡Π΅Π½ ΡΡŠΡ€Π²ΡŠΡ€, Π²ΠΊΠ». ΠΏΠΎΠ΄ Π΄ΠΎΠΊΠ΅Ρ€. Π’ RStudio Π΅ Π½Π΅ΡƒΠ΄ΠΎΠ±Π½ΠΎ Π΄Π° сС ΠΏΡ€ΠΎΠ²Π΅ΠΆΠ΄Π°Ρ‚ ΠΌΠ½ΠΎΠ³ΠΎ часовС СкспСримСнти с ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° Π½Π΅Π²Ρ€ΠΎΠ½Π½ΠΈ ΠΌΡ€Π΅ΠΆΠΈ ΠΈ инсталиранСто Π½Π° IDE Π½Π° самия ΡΡŠΡ€Π²ΡŠΡ€ Π½Π΅ Π²ΠΈΠ½Π°Π³ΠΈ Π΅ ΠΎΠΏΡ€Π°Π²Π΄Π°Π½ΠΎ.
  • Docker Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€Π° прСносимост Π½Π° ΠΊΠΎΠ΄Π° ΠΈ Π²ΡŠΠ·ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ Π½Π° Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ΠΈΡ‚Π΅ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΡ†ΠΈ с Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΈ вСрсии Π½Π° ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Π°Ρ‚Π° систСма ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ, ΠΊΠ°ΠΊΡ‚ΠΎ ΠΈ Π»Π΅ΠΊΠΎΡ‚Π° Π½Π° изпълнСниС Π½Π° ΡΡŠΡ€Π²ΡŠΡ€ΠΈ. ΠœΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° стартиратС цСлия ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€ Π·Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ само с Π΅Π΄Π½Π° ΠΊΠΎΠΌΠ°Π½Π΄Π°.
  • Google Cloud Π΅ Π±ΡŽΠ΄ΠΆΠ΅Ρ‚Π΅Π½ Π½Π°Ρ‡ΠΈΠ½ Π·Π° СкспСримСнтиранС със скъп Ρ…Π°Ρ€Π΄ΡƒΠ΅Ρ€, Π½ΠΎ трябва Π²Π½ΠΈΠΌΠ°Ρ‚Π΅Π»Π½ΠΎ Π΄Π° ΠΈΠ·Π±ΠΈΡ€Π°Ρ‚Π΅ ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΈ.
  • Π˜Π·ΠΌΠ΅Ρ€Π²Π°Π½Π΅Ρ‚ΠΎ Π½Π° скоростта Π½Π° ΠΎΡ‚Π΄Π΅Π»Π½ΠΈ ΠΊΠΎΠ΄ΠΎΠ²ΠΈ Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚ΠΈ Π΅ ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, особСно ΠΊΠΎΠ³Π°Ρ‚ΠΎ сС ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€Π°Ρ‚ R ΠΈ C++ ΠΈ с ΠΏΠ°ΠΊΠ΅Ρ‚Π° ΠΏΠ΅ΠΉΠΊΠ° - ΡΡŠΡ‰ΠΎ ΠΌΠ½ΠΎΠ³ΠΎ лСсно.

ΠšΠ°Ρ‚ΠΎ цяло Ρ‚ΠΎΠ²Π° прСТивяванС бСшС ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΈ Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠ΄ΡŠΠ»ΠΆΠ°Π²Π°ΠΌΠ΅ Π΄Π° Ρ€Π°Π±ΠΎΡ‚ΠΈΠΌ Π·Π° Ρ€Π°Π·Ρ€Π΅ΡˆΠ°Π²Π°Π½Π΅ Π½Π° някои ΠΎΡ‚ ΠΏΠΎΠ²Π΄ΠΈΠ³Π½Π°Ρ‚ΠΈΡ‚Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ.

Π˜Π·Ρ‚ΠΎΡ‡Π½ΠΈΠΊ: www.habr.com

ДобавянС Π½Π° Π½ΠΎΠ² ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€