Google හි නව ස්නායු ජාලය ජනප්‍රිය ප්‍රතිසමයන්ට වඩා සැලකිය යුතු තරම් නිවැරදි සහ වේගවත් වේ

මානව දෘෂ්‍ය බාහිකයේ ජීව විද්‍යාත්මක ක්‍රියාවලීන් මගින් ආභාසය ලබන Convolutional neural networks (CNNs), වස්තුව සහ මුහුණු හඳුනාගැනීම වැනි කාර්යයන් සඳහා හොඳින් ගැලපේ, නමුත් ඒවායේ නිරවද්‍යතාවය වැඩි දියුණු කිරීම සඳහා වෙහෙසකර සහ සියුම් සුසර කිරීම අවශ්‍ය වේ. Google AI පර්යේෂණයේ විද්‍යාඥයන් "වඩා ව්‍යුහගත" ආකාරයෙන් CNN පරිමාණය කරන නව මාදිලි ගවේෂණය කරන්නේ එබැවිනි. ඔවුන්ගේ කාර්යයේ ප්රතිඵල ඔවුන් විසින් ප්රකාශයට පත් කරන ලදී ලිපියයි "EfficientNet: Convolutional Neural Networks සඳහා ආදර්ශ පරිමාණය නැවත සිතා බැලීම", Arxiv.org විද්‍යාත්මක ද්වාරයෙහි මෙන්ම එහි ද පළ කර ඇත. ප්රකාශන ඔබේ බ්ලොග් අඩවියේ. සම-කර්තෘවරුන් කියා සිටින්නේ EfficientNets ලෙස හඳුන්වන කෘතිම බුද්ධි පද්ධති පවුල සම්මත CNN වල නිරවද්‍යතාවය ඉක්මවා යන අතර ස්නායුක ජාලයක කාර්යක්ෂමතාව 10 ගුණයකින් වැඩි කරන බවයි.

Google හි නව ස්නායු ජාලය ජනප්‍රිය ප්‍රතිසමයන්ට වඩා සැලකිය යුතු තරම් නිවැරදි සහ වේගවත් වේ

"පරිමාණ ආකෘතිවල පොදු භාවිතය වන්නේ CNN හි ගැඹුර හෝ පළල අත්තනෝමතික ලෙස වැඩි කිරීම සහ පුහුණුව සහ ඇගයීම සඳහා ආදාන රූපයේ ඉහළ විභේදනය භාවිතා කිරීමයි" යනුවෙන් මාණ්ඩලික මෘදුකාංග ඉංජිනේරු Mingxing Tan සහ Google AI ප්‍රධාන විද්‍යාඥ Quoc V .Le) ලියන්න. "පළල, ගැඹුර සහ ආදාන විභේදනය වැනි ජාල පරාමිතීන් අත්තනෝමතික ලෙස පරිමාණය කරන සාම්ප්‍රදායික ප්‍රවේශයන් මෙන් නොව, අපගේ ක්‍රමය ස්ථාවර පරිමාණ සාධක සමූහයක් සමඟ එක් එක් මානය ඒකාකාරව පරිමාණය කරයි."

කාර්ය සාධනය තවදුරටත් වැඩිදියුණු කිරීම සඳහා, පර්යේෂකයන් නව කොඳු නාරටිය ජාලයක්, ජංගම ප්‍රතිලෝම බෝතල් නෙක් කන්වලූෂන් (MBConv) භාවිතා කිරීමට යෝජනා කරයි, එය EfficientNets පවුලේ ආකෘති සඳහා පදනම ලෙස සේවය කරයි.

පරීක්ෂණ වලදී, EfficientNets දැනට පවතින CNN වලට වඩා ඉහළ නිරවද්‍යතාවයක් සහ වඩා හොඳ කාර්යක්ෂමතාවයක් පෙන්නුම් කර ඇති අතර, පරාමිති ප්‍රමාණය සහ ගණනය කිරීමේ සම්පත් අවශ්‍යතා විශාලත්වයේ අනුපිළිවෙලකින් අඩු කරයි. එක් මාදිලියක් වන EfficientNet-B7, සුප්‍රසිද්ධ CNN Gpipe එකට වඩා 8,4 ගුණයකින් කුඩා ප්‍රමාණය සහ 6,1 ගුණයක හොඳ කාර්ය සාධනයක් පෙන්නුම් කළ අතර, පරීක්‍ෂා කිරීමේදී 84,4% සහ 97,1% නිරවද්‍යතාව (Top-1 සහ Top-5) 50 ප්‍රතිඵලය ලබා ගත්තේය. ImageNet කට්ටලය. ජනප්‍රිය CNN ResNet-4 හා සසඳන විට, තවත් EfficientNet ආකෘතියක් වන EfficientNet-B82,6, සමාන සම්පත් භාවිතා කරමින්, ResNet-76,3 සඳහා 50% හා සාපේක්ෂව XNUMX% ක නිරවද්‍යතාවයක් ලබා ගත්තේය.

CIFAR-100 දත්ත කට්ටලය (91,7% නිරවද්‍යතාවය) සහ ඇතුළුව මිණුම් සලකුණු අටෙන් පහක ඉහළ නිරවද්‍යතාවයක් ලබා ගනිමින් EfficentNets මාදිලි අනෙකුත් දත්ත කට්ටල මත හොඳින් ක්‍රියා කරයි. මල් (98,8%).

Google හි නව ස්නායු ජාලය ජනප්‍රිය ප්‍රතිසමයන්ට වඩා සැලකිය යුතු තරම් නිවැරදි සහ වේගවත් වේ

"ස්නායු ආකෘතිවල කාර්යක්ෂමතාවයේ සැලකිය යුතු දියුණුවක් ලබා දීමෙන්, අනාගත පරිගණක දර්ශන කාර්යයන් සඳහා නව රාමුවක් ලෙස සේවය කිරීමට EfficientNets හැකියාව ඇති බව අපි අපේක්ෂා කරමු", Tan සහ Li ලියනවා.

Google හි Cloud Tensor Processing Units (TPUs) සඳහා මූලාශ්‍ර කේතය සහ පුහුණු ස්ක්‍රිප්ට් නොමිලේ ලබා ගත හැක Github.



මූලාශ්රය: 3dnews.ru

අදහස් එක් කරන්න