ΠΡΠ΅Π΄ΠΈ Π½Π°ΡΠ°Π»ΠΎΡΠΎ Π½Π° ΠΊΡΡΡΠ°
ΠΠΎΠ΄ΠΈΡΠ°Π½Π΅ΡΠΎ Π½Π° Huffman Π΅ Π°Π»Π³ΠΎΡΠΈΡΡΠΌ Π·Π° ΠΊΠΎΠΌΠΏΡΠ΅ΡΠΈΡΠ°Π½Π΅ Π½Π° Π΄Π°Π½Π½ΠΈ, ΠΊΠΎΠΉΡΠΎ ΡΠΎΡΠΌΡΠ»ΠΈΡΠ° ΠΎΡΠ½ΠΎΠ²Π½Π°ΡΠ° ΠΈΠ΄Π΅Ρ Π·Π° ΠΊΠΎΠΌΠΏΡΠ΅ΡΠΈΡΠ°Π½Π΅ Π½Π° ΡΠ°ΠΉΠ»ΠΎΠ²Π΅. Π ΡΠ°Π·ΠΈ ΡΡΠ°ΡΠΈΡ ΡΠ΅ Π³ΠΎΠ²ΠΎΡΠΈΠΌ Π·Π° ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ Ρ ΡΠΈΠΊΡΠΈΡΠ°Π½Π° ΠΈ ΠΏΡΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π° Π΄ΡΠ»ΠΆΠΈΠ½Π°, ΡΠ½ΠΈΠΊΠ°Π»Π½ΠΎ Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΡΠ΅ΠΌΠΈ ΠΊΠΎΠ΄ΠΎΠ²Π΅, ΠΏΡΠ΅ΡΠΈΠΊΡΠ½ΠΈ ΠΏΡΠ°Π²ΠΈΠ»Π° ΠΈ ΠΈΠ·Π³ΡΠ°ΠΆΠ΄Π°Π½Π΅ Π½Π° Π΄ΡΡΠ²ΠΎ Π½Π° Π₯ΡΡΠΌΠ°Π½.
ΠΠ½Π°Π΅ΠΌ, ΡΠ΅ Π²ΡΠ΅ΠΊΠΈ Π·Π½Π°ΠΊ ΡΠ΅ ΡΡΡ
ΡΠ°Π½ΡΠ²Π° ΠΊΠ°ΡΠΎ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»Π½ΠΎΡΡ ΠΎΡ 0 ΠΈ 1 ΠΈ Π·Π°Π΅ΠΌΠ° 8 Π±ΠΈΡΠ°. Π’ΠΎΠ²Π° ΡΠ΅ Π½Π°ΡΠΈΡΠ° ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ Ρ ΡΠΈΠΊΡΠΈΡΠ°Π½Π° Π΄ΡΠ»ΠΆΠΈΠ½Π°, Π·Π°ΡΠΎΡΠΎ Π²ΡΠ΅ΠΊΠΈ Π·Π½Π°ΠΊ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π° Π΅Π΄ΠΈΠ½ ΠΈ ΡΡΡ ΡΠΈΠΊΡΠΈΡΠ°Π½ Π±ΡΠΎΠΉ Π±ΠΈΡΠΎΠ²Π΅ Π·Π° ΡΡΡ
ΡΠ°Π½Π΅Π½ΠΈΠ΅.
ΠΠ° ΠΊΠ°ΠΆΠ΅ΠΌ, ΡΠ΅ Π½ΠΈ Π΅ Π΄Π°Π΄Π΅Π½ ΡΠ΅ΠΊΡΡ. ΠΠ°ΠΊ ΠΌΠΎΠΆΠ΅ΠΌ Π΄Π° Π½Π°ΠΌΠ°Π»ΠΈΠΌ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎΡΠΎ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²ΠΎ, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ Π·Π° ΡΡΡ ΡΠ°Π½ΡΠ²Π°Π½Π΅ Π½Π° Π΅Π΄ΠΈΠ½ Π·Π½Π°ΠΊ?
ΠΡΠ½ΠΎΠ²Π½Π°ΡΠ° ΠΈΠ΄Π΅Ρ Π΅ ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ Ρ ΠΏΡΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π° Π΄ΡΠ»ΠΆΠΈΠ½Π°. ΠΠΎΠΆΠ΅ΠΌ Π΄Π° ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ ΡΠ°ΠΊΡΠ°, ΡΠ΅ Π½ΡΠΊΠΎΠΈ Π·Π½Π°ΡΠΈ Π² ΡΠ΅ΠΊΡΡΠ° ΡΠ΅ ΡΡΠ΅ΡΠ°Ρ ΠΏΠΎ-ΡΠ΅ΡΡΠΎ ΠΎΡ Π΄ΡΡΠ³ΠΈ (
ΠΠ°ΠΊ, Π·Π½Π°Π΅ΠΉΠΊΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»Π½ΠΎΡΡΡΠ° ΠΎΡ Π±ΠΈΡΠΎΠ²Π΅, Π΄Π° Π³ΠΎ Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌ Π½Π΅Π΄Π²ΡΡΠΌΠΈΡΠ»Π΅Π½ΠΎ?
ΠΠΎΠΌΠΈΡΠ»Π΅ΡΠ΅ Π·Π° Π»ΠΈΠ½ΠΈΡΡΠ° "Π°Π±Π°ΠΊΠ΄Π°Π±". Π’ΠΎΠΉ ΠΈΠΌΠ° 8 Π·Π½Π°ΠΊΠ° ΠΈ ΠΏΡΠΈ ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ Ρ ΡΠΈΠΊΡΠΈΡΠ°Π½Π° Π΄ΡΠ»ΠΆΠΈΠ½Π° ΡΠ΅ ΡΠ° ΠΌΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΈ 64 Π±ΠΈΡΠ°, Π·Π° Π΄Π° Π³ΠΎ ΡΡΡ ΡΠ°Π½ΠΈ. ΠΠΌΠ°ΠΉΡΠ΅ ΠΏΡΠ΅Π΄Π²ΠΈΠ΄, ΡΠ΅ ΡΠ΅ΡΡΠΎΡΠ°ΡΠ° Π½Π° ΡΠΈΠΌΠ²ΠΎΠ»Π° "Π°", "Π±", "Π²" ΠΈ "Π" Π΅ ΡΠ°Π²Π½ΠΎ Π½Π° 4, 2, 1, 1 ΡΡΠΎΡΠ²Π΅ΡΠ½ΠΎ. ΠΠ΅ΠΊΠ° ΡΠ΅ ΠΎΠΏΠΈΡΠ°ΠΌΠ΅ Π΄Π° ΡΠΈ ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΠΌ "Π°Π±Π°ΠΊΠ΄Π°Π±" ΠΏΠΎ-ΠΌΠ°Π»ΠΊΠΎ Π±ΠΈΡΠΎΠ²Π΅, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ ΡΠ°ΠΊΡΠ°, ΡΠ΅ "Π΄Π° ΡΠ΅" ΡΠ΅ ΡΡΠ΅ΡΠ° ΠΏΠΎ-ΡΠ΅ΡΡΠΎ ΠΎΡ "Π"Π "Π" ΡΠ΅ ΡΡΠ΅ΡΠ° ΠΏΠΎ-ΡΠ΅ΡΡΠΎ ΠΎΡ "Β° Π‘" ΠΈ "Π". ΠΠ° Π·Π°ΠΏΠΎΡΠ½Π΅ΠΌ Ρ ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ΡΠΎ "Π΄Π° ΡΠ΅" Ρ Π΅Π΄ΠΈΠ½ Π±ΠΈΡ ΡΠ°Π²Π΅Π½ Π½Π° 0, "Π" ΡΠ΅ Π·Π°Π΄Π°Π΄Π΅ΠΌ Π΄Π²ΡΠ±ΠΈΡΠΎΠ² ΠΊΠΎΠ΄ 11 ΠΈ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ ΡΡΠΈ Π±ΠΈΡΠ° 100 ΠΈ 011 ΡΠ΅ ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌΠ΅ "Β° Π‘" ΠΈ "Π".
Π ΡΠ΅Π·ΡΠ»ΡΠ°Ρ Π½Π° ΡΠΎΠ²Π° ΡΠ΅ ΠΏΠΎΠ»ΡΡΠΈΠΌ:
a
0
b
11
c
100
d
011
Π’Π°ΠΊΠ° ΡΠ΅ Π»ΠΈΠ½ΠΈΡΡΠ° "Π°Π±Π°ΠΊΠ΄Π°Π±" ΡΠ΅ ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌΠ΅ ΠΊΠ°ΡΠΎ 00110100011011 (0|0|11|0|100|011|0|11)ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΉΠΊΠΈ ΠΊΠΎΠ΄ΠΎΠ²Π΅ΡΠ΅ ΠΏΠΎ-Π³ΠΎΡΠ΅. ΠΡΠ½ΠΎΠ²Π½ΠΈΡΡ ΠΏΡΠΎΠ±Π»Π΅ΠΌ ΠΎΠ±Π°ΡΠ΅ ΡΠ΅ Π±ΡΠ΄Π΅ Π² Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ΡΠΎ. ΠΠΎΠ³Π°ΡΠΎ ΡΠ΅ ΠΎΠΏΠΈΡΠ°ΠΌΠ΅ Π΄Π° Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌΠ΅ Π½ΠΈΠ·Π° 00110100011011, ΡΠ΅ ΠΏΠΎΠ»ΡΡΠΈΠΌ Π΄Π²ΡΡΠΌΠΈΡΠ»Π΅Π½ ΡΠ΅Π·ΡΠ»ΡΠ°Ρ, ΡΡΠΉ ΠΊΠ°ΡΠΎ ΠΌΠΎΠΆΠ΅ Π΄Π° Π±ΡΠ΄Π΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π΅Π½ ΠΊΠ°ΡΠΎ:
0|011|0|100|011|0|11 adacdab
0|0|11|0|100|0|11|011 aabacabd
0|011|0|100|0|11|0|11 adacabab
...
ΠΈ Ρ.Π½.
ΠΠ° Π΄Π° ΠΈΠ·Π±Π΅Π³Π½Π΅ΠΌ ΡΠ°Π·ΠΈ Π½Π΅ΡΡΠ½ΠΎΡΠ°, ΡΡΡΠ±Π²Π° Π΄Π° Π³Π°ΡΠ°Π½ΡΠΈΡΠ°ΠΌΠ΅, ΡΠ΅ Π½Π°ΡΠ΅ΡΠΎ ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ ΠΎΡΠ³ΠΎΠ²Π°ΡΡ Π½Π° ΡΠ°ΠΊΠ°Π²Π° ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΡ ΠΊΠ°ΡΠΎ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡ, ΠΊΠΎΠ΅ΡΠΎ Π½Π° ΡΠ²ΠΎΠΉ ΡΠ΅Π΄ ΠΏΡΠ΅Π΄ΠΏΠΎΠ»Π°Π³Π°, ΡΠ΅ ΠΊΠΎΠ΄ΠΎΠ²Π΅ΡΠ΅ ΠΌΠΎΠ³Π°Ρ Π΄Π° Π±ΡΠ΄Π°Ρ Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°Π½ΠΈ ΡΠ°ΠΌΠΎ ΠΏΠΎ Π΅Π΄ΠΈΠ½ ΡΠ½ΠΈΠΊΠ°Π»Π΅Π½ Π½Π°ΡΠΈΠ½. ΠΡΠ°Π²ΠΈΠ»ΠΎΡΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡ Π³Π°ΡΠ°Π½ΡΠΈΡΠ°, ΡΠ΅ Π½ΠΈΠΊΠΎΠΉ ΠΊΠΎΠ΄ Π½Π΅ Π΅ ΠΏΡΠ΅ΡΠΈΠΊΡ Π½Π° Π΄ΡΡΠ³. ΠΠΎΠ΄ ΠΊΠΎΠ΄ ΠΈΠΌΠ°ΠΌΠ΅ ΠΏΡΠ΅Π΄Π²ΠΈΠ΄ Π±ΠΈΡΠΎΠ²Π΅ΡΠ΅, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ΠΈ Π·Π° ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΡΠ½Π΅ Π½Π° ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ ΡΠΈΠΌΠ²ΠΎΠ». Π Π³ΠΎΡΠ½ΠΈΡ ΠΏΡΠΈΠΌΠ΅Ρ 0 Π΅ ΠΏΡΠ΅ΡΠΈΠΊΡ 011, ΠΊΠΎΠ΅ΡΠΎ Π½Π°ΡΡΡΠ°Π²Π° ΠΏΡΠ°Π²ΠΈΠ»ΠΎΡΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡΠ°. Π’Π°ΠΊΠ° ΡΠ΅, Π°ΠΊΠΎ Π½Π°ΡΠΈΡΠ΅ ΠΊΠΎΠ΄ΠΎΠ²Π΅ ΡΠ΄ΠΎΠ²Π»Π΅ΡΠ²ΠΎΡΡΠ²Π°Ρ ΠΏΡΠ°Π²ΠΈΠ»ΠΎΡΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡΠ°, ΡΠΎΠ³Π°Π²Π° ΠΌΠΎΠΆΠ΅ΠΌ ΡΠ½ΠΈΠΊΠ°Π»Π½ΠΎ Π΄Π° Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌΠ΅ (ΠΈ ΠΎΠ±ΡΠ°ΡΠ½ΠΎ).
ΠΠ΅ΠΊΠ° ΠΏΡΠ΅ΡΠ°Π·Π³Π»Π΅Π΄Π°ΠΌΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΠ° ΠΏΠΎ-Π³ΠΎΡΠ΅. Π’ΠΎΠ·ΠΈ ΠΏΡΡ ΡΠ΅ Π·Π°Π΄Π°Π΄Π΅ΠΌ Π·Π° ΡΠΈΠΌΠ²ΠΎΠ»ΠΈ "Π°", "Π±", "Π²" ΠΈ "Π" ΠΊΠΎΠ΄ΠΎΠ²Π΅, ΠΊΠΎΠΈΡΠΎ ΠΎΡΠ³ΠΎΠ²Π°ΡΡΡ Π½Π° ΠΏΡΠ°Π²ΠΈΠ»ΠΎΡΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡΠ°.
a
0
b
10
c
110
d
111
Π‘ ΡΠΎΠ²Π° ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ Π½ΠΈΠ·ΡΡ "Π°Π±Π°ΠΊΠ΄Π°Π±" ΡΠ΅ Π±ΡΠ΄Π΅ ΠΊΠΎΠ΄ΠΈΡΠ°Π½ ΠΊΠ°ΡΠΎ 00100100011010 (0|0|10|0|100|011|0|10). ΠΠΎ 00100100011010 Π²Π΅ΡΠ΅ ΡΠ΅ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π΅Π΄Π²ΡΡΠΌΠΈΡΠ»Π΅Π½ΠΎ Π΄Π° Π΄Π΅ΠΊΠΎΠ΄ΠΈΡΠ°ΠΌΠ΅ ΠΈ Π΄Π° ΡΠ΅ Π²ΡΡΠ½Π΅ΠΌ ΠΊΡΠΌ Π½Π°ΡΠΈΡ ΠΎΡΠΈΠ³ΠΈΠ½Π°Π»Π΅Π½ Π½ΠΈΠ· "Π°Π±Π°ΠΊΠ΄Π°Π±".
ΠΠΎΠ΄ΠΈΡΠ°Π½Π΅ Π½Π° Π₯ΡΡΠΌΠ°Π½
Π‘Π΅Π³Π°, ΡΠ»Π΅Π΄ ΠΊΠ°ΡΠΎ ΡΠ΅ ΡΠΏΡΠ°Π²ΠΈΡ ΠΌΠ΅ Ρ ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ΡΠΎ Ρ ΠΏΡΠΎΠΌΠ΅Π½Π»ΠΈΠ²Π° Π΄ΡΠ»ΠΆΠΈΠ½Π° ΠΈ ΠΏΡΠ°Π²ΠΈΠ»ΠΎΡΠΎ Π·Π° ΠΏΡΠ΅ΡΠΈΠΊΡΠ°, Π½Π΅ΠΊΠ° ΠΏΠΎΠ³ΠΎΠ²ΠΎΡΠΈΠΌ Π·Π° ΠΊΠΎΠ΄ΠΈΡΠ°Π½Π΅ΡΠΎ Π½Π° Huffman.
ΠΠ΅ΡΠΎΠ΄ΡΡ ΡΠ΅ ΠΎΡΠ½ΠΎΠ²Π°Π²Π° Π½Π° ΡΡΠ·Π΄Π°Π²Π°Π½Π΅ΡΠΎ Π½Π° Π΄Π²ΠΎΠΈΡΠ½ΠΈ Π΄ΡΡΠ²Π΅ΡΠ°. Π Π½Π΅Π³ΠΎ Π²ΡΠ·Π΅Π»ΡΡ ΠΌΠΎΠΆΠ΅ Π΄Π° Π±ΡΠ΄Π΅ ΠΊΡΠ°Π΅Π½ ΠΈΠ»ΠΈ Π²ΡΡΡΠ΅ΡΠ΅Π½. ΠΡΡΠ²ΠΎΠ½Π°ΡΠ°Π»Π½ΠΎ Π²ΡΠΈΡΠΊΠΈ Π²ΡΠ·Π»ΠΈ ΡΠ΅ ΡΡΠΈΡΠ°Ρ Π·Π° Π»ΠΈΡΡΠ° (ΡΠ΅ΡΠΌΠΈΠ½Π°Π»ΠΈ), ΠΊΠΎΠΈΡΠΎ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ²Π°Ρ ΡΠ°ΠΌΠΈΡ ΡΠΈΠΌΠ²ΠΎΠ» ΠΈ Π½Π΅Π³ΠΎΠ²ΠΎΡΠΎ ΡΠ΅Π³Π»ΠΎ (Ρ.Π΅. ΡΠ΅ΡΡΠΎΡΠ°ΡΠ° Π½Π° ΠΏΠΎΡΠ²ΡΠ²Π°Π½Π΅). ΠΡΡΡΠ΅ΡΠ½ΠΈΡΠ΅ Π²ΡΠ·Π»ΠΈ ΡΡΠ΄ΡΡΠΆΠ°Ρ ΡΠ΅Π³Π»ΠΎΡΠΎ Π½Π° Π·Π½Π°ΠΊΠ° ΠΈ ΡΠ΅ ΠΎΡΠ½Π°ΡΡΡ Π·Π° Π΄Π²Π° Π½Π°ΡΠ»Π΅Π΄ΡΡΠ²Π΅Π½ΠΈ Π²ΡΠ·Π΅Π»Π°. ΠΠΎ ΠΎΠ±ΡΠΎ ΡΡΠ³Π»Π°ΡΠΈΠ΅ Π±ΠΈΡ Β«0Β» ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ²Π° ΡΠ»Π΅Π΄Π²Π°Π½Π΅ Π½Π° Π»Π΅Π²ΠΈΡ ΠΊΠ»ΠΎΠ½ ΠΈ Β«1Β» - Π²Π΄ΡΡΠ½ΠΎ. Π² ΠΏΡΠ»Π½ΠΎ Π΄ΡΡΠ²ΠΎ N Π»ΠΈΡΡΠ° ΠΈ N-1 Π²ΡΡΡΠ΅ΡΠ½ΠΈ Π²ΡΠ·Π»ΠΈ. ΠΡΠ΅ΠΏΠΎΡΡΡΠ²Π° ΡΠ΅, ΠΊΠΎΠ³Π°ΡΠΎ ΡΠ΅ ΠΊΠΎΠ½ΡΡΡΡΠΈΡΠ° Π΄ΡΡΠ²ΠΎ Π½Π° Huffman, Π½Π΅ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½ΠΈΡΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»ΠΈ Π΄Π° ΡΠ΅ ΠΈΠ·Ρ Π²ΡΡΠ»ΡΡ, Π·Π° Π΄Π° ΡΠ΅ ΠΏΠΎΠ»ΡΡΠ°Ρ ΠΊΠΎΠ΄ΠΎΠ²Π΅ Ρ ΠΎΠΏΡΠΈΠΌΠ°Π»Π½Π° Π΄ΡΠ»ΠΆΠΈΠ½Π°.
Π©Π΅ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ ΠΎΠΏΠ°ΡΠΊΠ° Ρ ΠΏΡΠΈΠΎΡΠΈΡΠ΅Ρ, Π·Π° Π΄Π° ΠΈΠ·Π³ΡΠ°Π΄ΠΈΠΌ Π΄ΡΡΠ²ΠΎ Π½Π° Π₯ΡΡΠΌΠ°Π½, ΠΊΡΠ΄Π΅ΡΠΎ Π²ΡΠ·Π΅Π»ΡΡ Ρ Π½Π°ΠΉ-Π½ΠΈΡΠΊΠ° ΡΠ΅ΡΡΠΎΡΠ° ΡΠ΅ ΠΏΠΎΠ»ΡΡΠΈ Π½Π°ΠΉ-Π²ΠΈΡΠΎΠΊ ΠΏΡΠΈΠΎΡΠΈΡΠ΅Ρ. Π‘ΡΡΠΏΠΊΠΈΡΠ΅ Π½Π° ΠΈΠ·Π³ΡΠ°ΠΆΠ΄Π°Π½Π΅ ΡΠ° ΠΎΠΏΠΈΡΠ°Π½ΠΈ ΠΏΠΎ-Π΄ΠΎΠ»Ρ:
- Π‘ΡΠ·Π΄Π°ΠΉΡΠ΅ Π»ΠΈΡΡΠΎΠ² Π²ΡΠ·Π΅Π» Π·Π° Π²ΡΠ΅ΠΊΠΈ Π·Π½Π°ΠΊ ΠΈ Π³ΠΈ Π΄ΠΎΠ±Π°Π²Π΅ΡΠ΅ ΠΊΡΠΌ ΠΎΠΏΠ°ΡΠΊΠ°ΡΠ° Ρ ΠΏΡΠΈΠΎΡΠΈΡΠ΅ΡΠΈ.
- ΠΠΎΠΊΠ°ΡΠΎ ΠΈΠΌΠ° ΠΏΠΎΠ²Π΅ΡΠ΅ ΠΎΡ Π΅Π΄ΠΈΠ½ Π»ΠΈΡΡ Π² ΠΎΠΏΠ°ΡΠΊΠ°ΡΠ°, Π½Π°ΠΏΡΠ°Π²Π΅ΡΠ΅ ΡΠ»Π΅Π΄Π½ΠΎΡΠΎ:
- ΠΡΠ΅ΠΌΠ°Ρ Π½Π΅ΡΠ΅ Π΄Π²Π°ΡΠ° Π²ΡΠ·Π΅Π»Π° Ρ Π½Π°ΠΉ-Π²ΠΈΡΠΎΠΊ ΠΏΡΠΈΠΎΡΠΈΡΠ΅Ρ (Π½Π°ΠΉ-Π½ΠΈΡΠΊΠ° ΡΠ΅ΡΡΠΎΡΠ°) ΠΎΡ ΠΎΠΏΠ°ΡΠΊΠ°ΡΠ°;
- Π‘ΡΠ·Π΄Π°ΠΉΡΠ΅ Π½ΠΎΠ² Π²ΡΡΡΠ΅ΡΠ΅Π½ Π²ΡΠ·Π΅Π», ΠΊΡΠ΄Π΅ΡΠΎ ΡΠ΅Π·ΠΈ Π΄Π²Π° Π²ΡΠ·Π΅Π»Π° ΡΠ΅ Π±ΡΠ΄Π°Ρ Π΄ΡΡΠ΅ΡΠ½ΠΈ ΠΈ ΡΠ΅ΡΡΠΎΡΠ°ΡΠ° Π½Π° ΠΏΠΎΡΠ²Π° ΡΠ΅ Π±ΡΠ΄Π΅ ΡΠ°Π²Π½Π° Π½Π° ΡΡΠΌΠ°ΡΠ° ΠΎΡ ΡΠ΅ΡΡΠΎΡΠΈΡΠ΅ Π½Π° ΡΠ΅Π·ΠΈ Π΄Π²Π° Π²ΡΠ·Π΅Π»Π°.
- ΠΠΎΠ±Π°Π²Π΅ΡΠ΅ Π½ΠΎΠ² Π²ΡΠ·Π΅Π» ΠΊΡΠΌ ΠΎΠΏΠ°ΡΠΊΠ°ΡΠ° Ρ ΠΏΡΠΈΠΎΡΠΈΡΠ΅ΡΠΈ.
- ΠΠ΄ΠΈΠ½ΡΡΠ²Π΅Π½ΠΈΡΡ ΠΎΡΡΠ°Π½Π°Π» Π²ΡΠ·Π΅Π» ΡΠ΅ Π±ΡΠ΄Π΅ ΠΊΠΎΡΠ΅Π½ΡΡ ΠΈ ΡΠΎΠ²Π° ΡΠ΅ Π·Π°Π²ΡΡΡΠΈ ΠΈΠ·Π³ΡΠ°ΠΆΠ΄Π°Π½Π΅ΡΠΎ Π½Π° Π΄ΡΡΠ²ΠΎΡΠΎ.
ΠΡΠ΅Π΄ΡΡΠ°Π²Π΅ΡΠ΅ ΡΠΈ, ΡΠ΅ ΠΈΠΌΠ°ΠΌΠ΅ Π½ΡΠΊΠ°ΠΊΡΠ² ΡΠ΅ΠΊΡΡ, ΠΊΠΎΠΉΡΠΎ ΡΠ΅ ΡΡΡΡΠΎΠΈ ΡΠ°ΠΌΠΎ ΠΎΡ Π·Π½Π°ΡΠΈ "a", "b", "c", "d" ΠΈ "ΠΈ"ΠΈ ΡΠ΅Ρ Π½ΠΈΡΠ΅ ΡΠ΅ΡΡΠΎΡΠΈ Π½Π° ΠΏΠΎΡΠ²Π° ΡΠ° ΡΡΠΎΡΠ²Π΅ΡΠ½ΠΎ 15, 7, 6, 6 ΠΈ 5. ΠΠΎ-Π΄ΠΎΠ»Ρ ΠΈΠΌΠ° ΠΈΠ»ΡΡΡΡΠ°ΡΠΈΠΈ, ΠΊΠΎΠΈΡΠΎ ΠΎΡΡΠ°Π·ΡΠ²Π°Ρ ΡΡΡΠΏΠΊΠΈΡΠ΅ Π½Π° Π°Π»Π³ΠΎΡΠΈΡΡΠΌΠ°.
ΠΡΡΡΡ ΠΎΡ ΠΊΠΎΡΠ΅Π½Π° Π΄ΠΎ ΠΊΠΎΠΉΡΠΎ ΠΈ Π΄Π° Π΅ ΠΊΡΠ°Π΅Π½ Π²ΡΠ·Π΅Π» ΡΠ΅ ΡΡΡ
ΡΠ°Π½ΡΠ²Π° ΠΎΠΏΡΠΈΠΌΠ°Π»Π½ΠΈΡ ΠΊΠΎΠ΄ Π½Π° ΠΏΡΠ΅ΡΠΈΠΊΡΠ° (ΠΈΠ·Π²Π΅ΡΡΠ΅Π½ ΡΡΡΠΎ ΠΊΠ°ΡΠΎ ΠΊΠΎΠ΄ Π½Π° Π₯ΡΡΠΌΠ°Π½), ΡΡΠΎΡΠ²Π΅ΡΡΡΠ²Π°Ρ Π½Π° Π·Π½Π°ΠΊΠ°, ΡΠ²ΡΡΠ·Π°Π½ Ρ ΡΠΎΠ·ΠΈ ΠΊΡΠ°Π΅Π½ Π²ΡΠ·Π΅Π».
ΠΡΡΠ²ΠΎ Π½Π° Π₯ΡΡΠΌΠ°Π½
ΠΠΎ-Π΄ΠΎΠ»Ρ ΡΠ΅ Π½Π°ΠΌΠ΅ΡΠΈΡΠ΅ ΠΈΠ·ΠΏΡΠ»Π½Π΅Π½ΠΈΠ΅ΡΠΎ Π½Π° Π°Π»Π³ΠΎΡΠΈΡΡΠΌΠ° Π·Π° ΠΊΠΎΠΌΠΏΡΠ΅ΡΠΈΡΠ°Π½Π΅ Π½Π° Huffman Π² C++ ΠΈ Java:
#include <iostream>
#include <string>
#include <queue>
#include <unordered_map>
using namespace std;
// A Tree node
struct Node
{
char ch;
int freq;
Node *left, *right;
};
// Function to allocate a new tree node
Node* getNode(char ch, int freq, Node* left, Node* right)
{
Node* node = new Node();
node->ch = ch;
node->freq = freq;
node->left = left;
node->right = right;
return node;
}
// Comparison object to be used to order the heap
struct comp
{
bool operator()(Node* l, Node* r)
{
// highest priority item has lowest frequency
return l->freq > r->freq;
}
};
// traverse the Huffman Tree and store Huffman Codes
// in a map.
void encode(Node* root, string str,
unordered_map<char, string> &huffmanCode)
{
if (root == nullptr)
return;
// found a leaf node
if (!root->left && !root->right) {
huffmanCode[root->ch] = str;
}
encode(root->left, str + "0", huffmanCode);
encode(root->right, str + "1", huffmanCode);
}
// traverse the Huffman Tree and decode the encoded string
void decode(Node* root, int &index, string str)
{
if (root == nullptr) {
return;
}
// found a leaf node
if (!root->left && !root->right)
{
cout << root->ch;
return;
}
index++;
if (str[index] =='0')
decode(root->left, index, str);
else
decode(root->right, index, str);
}
// Builds Huffman Tree and decode given input text
void buildHuffmanTree(string text)
{
// count frequency of appearance of each character
// and store it in a map
unordered_map<char, int> freq;
for (char ch: text) {
freq[ch]++;
}
// Create a priority queue to store live nodes of
// Huffman tree;
priority_queue<Node*, vector<Node*>, comp> pq;
// Create a leaf node for each character and add it
// to the priority queue.
for (auto pair: freq) {
pq.push(getNode(pair.first, pair.second, nullptr, nullptr));
}
// do till there is more than one node in the queue
while (pq.size() != 1)
{
// Remove the two nodes of highest priority
// (lowest frequency) from the queue
Node *left = pq.top(); pq.pop();
Node *right = pq.top(); pq.pop();
// Create a new internal node with these two nodes
// as children and with frequency equal to the sum
// of the two nodes' frequencies. Add the new node
// to the priority queue.
int sum = left->freq + right->freq;
pq.push(getNode('', sum, left, right));
}
// root stores pointer to root of Huffman Tree
Node* root = pq.top();
// traverse the Huffman Tree and store Huffman Codes
// in a map. Also prints them
unordered_map<char, string> huffmanCode;
encode(root, "", huffmanCode);
cout << "Huffman Codes are :n" << 'n';
for (auto pair: huffmanCode) {
cout << pair.first << " " << pair.second << 'n';
}
cout << "nOriginal string was :n" << text << 'n';
// print encoded string
string str = "";
for (char ch: text) {
str += huffmanCode[ch];
}
cout << "nEncoded string is :n" << str << 'n';
// traverse the Huffman Tree again and this time
// decode the encoded string
int index = -1;
cout << "nDecoded string is: n";
while (index < (int)str.size() - 2) {
decode(root, index, str);
}
}
// Huffman coding algorithm
int main()
{
string text = "Huffman coding is a data compression algorithm.";
buildHuffmanTree(text);
return 0;
}
import java.util.HashMap;
import java.util.Map;
import java.util.PriorityQueue;
// A Tree node
class Node
{
char ch;
int freq;
Node left = null, right = null;
Node(char ch, int freq)
{
this.ch = ch;
this.freq = freq;
}
public Node(char ch, int freq, Node left, Node right) {
this.ch = ch;
this.freq = freq;
this.left = left;
this.right = right;
}
};
class Huffman
{
// traverse the Huffman Tree and store Huffman Codes
// in a map.
public static void encode(Node root, String str,
Map<Character, String> huffmanCode)
{
if (root == null)
return;
// found a leaf node
if (root.left == null && root.right == null) {
huffmanCode.put(root.ch, str);
}
encode(root.left, str + "0", huffmanCode);
encode(root.right, str + "1", huffmanCode);
}
// traverse the Huffman Tree and decode the encoded string
public static int decode(Node root, int index, StringBuilder sb)
{
if (root == null)
return index;
// found a leaf node
if (root.left == null && root.right == null)
{
System.out.print(root.ch);
return index;
}
index++;
if (sb.charAt(index) == '0')
index = decode(root.left, index, sb);
else
index = decode(root.right, index, sb);
return index;
}
// Builds Huffman Tree and huffmanCode and decode given input text
public static void buildHuffmanTree(String text)
{
// count frequency of appearance of each character
// and store it in a map
Map<Character, Integer> freq = new HashMap<>();
for (int i = 0 ; i < text.length(); i++) {
if (!freq.containsKey(text.charAt(i))) {
freq.put(text.charAt(i), 0);
}
freq.put(text.charAt(i), freq.get(text.charAt(i)) + 1);
}
// Create a priority queue to store live nodes of Huffman tree
// Notice that highest priority item has lowest frequency
PriorityQueue<Node> pq = new PriorityQueue<>(
(l, r) -> l.freq - r.freq);
// Create a leaf node for each character and add it
// to the priority queue.
for (Map.Entry<Character, Integer> entry : freq.entrySet()) {
pq.add(new Node(entry.getKey(), entry.getValue()));
}
// do till there is more than one node in the queue
while (pq.size() != 1)
{
// Remove the two nodes of highest priority
// (lowest frequency) from the queue
Node left = pq.poll();
Node right = pq.poll();
// Create a new internal node with these two nodes as children
// and with frequency equal to the sum of the two nodes
// frequencies. Add the new node to the priority queue.
int sum = left.freq + right.freq;
pq.add(new Node('', sum, left, right));
}
// root stores pointer to root of Huffman Tree
Node root = pq.peek();
// traverse the Huffman tree and store the Huffman codes in a map
Map<Character, String> huffmanCode = new HashMap<>();
encode(root, "", huffmanCode);
// print the Huffman codes
System.out.println("Huffman Codes are :n");
for (Map.Entry<Character, String> entry : huffmanCode.entrySet()) {
System.out.println(entry.getKey() + " " + entry.getValue());
}
System.out.println("nOriginal string was :n" + text);
// print encoded string
StringBuilder sb = new StringBuilder();
for (int i = 0 ; i < text.length(); i++) {
sb.append(huffmanCode.get(text.charAt(i)));
}
System.out.println("nEncoded string is :n" + sb);
// traverse the Huffman Tree again and this time
// decode the encoded string
int index = -1;
System.out.println("nDecoded string is: n");
while (index < sb.length() - 2) {
index = decode(root, index, sb);
}
}
public static void main(String[] args)
{
String text = "Huffman coding is a data compression algorithm.";
buildHuffmanTree(text);
}
}
ΠΠ°Π±Π΅Π»Π΅ΠΆΠΊΠ°: ΠΏΠ°ΠΌΠ΅ΡΡΠ°, ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°Π½Π° ΠΎΡ Π²Ρ ΠΎΠ΄Π½ΠΈΡ Π½ΠΈΠ·, Π΅ 47 * 8 = 376 Π±ΠΈΡΠ°, Π° ΠΊΠΎΠ΄ΠΈΡΠ°Π½ΠΈΡΡ Π½ΠΈΠ· Π΅ ΡΠ°ΠΌΠΎ 194 Π±ΠΈΡΠ°, Ρ.Π΅. Π΄Π°Π½Π½ΠΈΡΠ΅ ΡΠ° ΠΊΠΎΠΌΠΏΡΠ΅ΡΠΈΡΠ°Π½ΠΈ Ρ ΠΎΠΊΠΎΠ»ΠΎ 48%. Π C++ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠ°ΡΠ° ΠΏΠΎ-Π³ΠΎΡΠ΅ Π½ΠΈΠ΅ ΠΈΠ·ΠΏΠΎΠ»Π·Π²Π°ΠΌΠ΅ ΠΊΠ»Π°ΡΠ° string, Π·Π° Π΄Π° ΡΡΡ ΡΠ°Π½ΠΈΠΌ ΠΊΠΎΠ΄ΠΈΡΠ°Π½ΠΈΡ Π½ΠΈΠ·, Π·Π° ββΠ΄Π° Π½Π°ΠΏΡΠ°Π²ΠΈΠΌ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠ°ΡΠ° ΡΠ΅ΡΠΈΠΌΠ°.
Π’ΡΠΉ ΠΊΠ°ΡΠΎ Π΅ΡΠ΅ΠΊΡΠΈΠ²Π½ΠΈΡΠ΅ ΠΏΡΠΈΠΎΡΠΈΡΠ΅ΡΠ½ΠΈ ΡΡΡΡΠΊΡΡΡΠΈ ΠΎΡ Π΄Π°Π½Π½ΠΈ Π½Π° ΠΎΠΏΠ°ΡΠΊΠ° ΠΈΠ·ΠΈΡΠΊΠ²Π°Ρ Π²ΡΡΠΊΠΎ Π²ΠΌΡΠΊΠ²Π°Π½Π΅ O(log(N)) Π²ΡΠ΅ΠΌΠ΅, Π½ΠΎ Π² ΠΏΡΠ»Π½ΠΎ Π΄Π²ΠΎΠΈΡΠ½ΠΎ Π΄ΡΡΠ²ΠΎ Ρ N ΠΏΡΠΈΡΡΡΡΠ²Π°Ρ Π»ΠΈΡΡΠ° 2N-1 Π²ΡΠ·Π»ΠΈ ΠΈ Π΄ΡΡΠ²ΠΎΡΠΎ Π½Π° Π₯ΡΡΠΌΠ°Π½ Π΅ ΠΏΡΠ»Π½ΠΎ Π΄Π²ΠΎΠΈΡΠ½ΠΎ Π΄ΡΡΠ²ΠΎ, ΡΠΎΠ³Π°Π²Π° Π°Π»Π³ΠΎΡΠΈΡΡΠΌΡΡ ΡΠ΅ ΠΈΠ·ΠΏΡΠ»Π½ΡΠ²Π° O(Nlog(N)) Π²ΡΠ΅ΠΌΠ΅, ΠΊΡΠ΄Π΅ N - ΠΠ΅ΡΠΎΠΈ.
ΠΠ·ΡΠΎΡΠ½ΠΈΡΠΈ:
ΠΠ·ΡΠΎΡΠ½ΠΈΠΊ: www.habr.com