በኮምፒተር ራዕይ ውስጥ ካሉት ዋና መተግበሪያዎች አንዱ እንደመሆኑ መጠን ከፍተኛ ምርመራን በሚጠይቁ ሁኔታዎች ውስጥ እንደ ሮቦት እና ሾፌር አልባ መኪኖች ያሉ ውስን የኮምፒዩተር ሀብቶች ባሉባቸው ነገሮች ላይ የነገር ምርመራ በጣም አስፈላጊ እየሆነ መጥቷል ፡፡ እንደ አለመታደል ሆኖ ብዙ ዘመናዊ የከፍተኛ ትክክለኛነት መመርመሪያዎች እነዚህን ገደቦች አያሟሉም ፡፡ ከሁሉም በላይ ደግሞ በእውነተኛ ዓለም ላይ ያሉ ነገሮችን የማወቂያ ትግበራዎች ብዙውን ጊዜ የተለያዩ ሀብቶችን በሚጠይቁ የተለያዩ የመሣሪያ ስርዓቶች ላይ ይሰራሉ።
ታዲያ ተፈጥሮአዊው ጥያቄ ከተለያዩ የሀብት ውስንነት ጋር ሊጣጣም የሚችል ትክክለኛ እና ቀልጣፋ የነገር መመርመሪያዎችን እንዴት ዲዛይን ማድረግ እንደሚቻል ነው?
ቀልጣፋ እና ውጤታማ ብቃት ያለው ምርመራ በ CVPR 2020 ተቀባይነት ያገኘ ፣ ሊለዋወጥ የሚችል እና ቀልጣፋ የነገር መርማሪዎችን አዲስ ቤተሰብ ያስተዋውቃል ፡፡ በነርቭ ኔትወርኮች (EfficientNet) ልኬት ላይ ቀደም ሲል በነበረው ሥራ ላይ መገንባት እና አዲስ ባለ ሁለት አቅጣጫ የአሠራር ኔትወርክ (ቢኤፍፒአን) እና አዲስ የመጠን ህጎችን በማካተት ኢፍፊዴት ዘመናዊ ትክክለኝነትን ያገኛል 9 እጥፍ ያነሰ ሲሆን ከታዋቂው ዘመናዊ መመርመሪያዎች በጣም ያነሰ ስሌት ይጠቀማል ፡ የሚከተለው ሥዕል የሞዴሎቹን አጠቃላይ የአውታረ መረብ ሥነ ሕንፃ ያሳያል ፡፡
የሞዴል አርክቴክቸር ማመቻቸት
ከ “EfficientDet” በስተጀርባ ያለው እሳቤ ቀደም ሲል የነበሩትን የዘመናዊ የመመርመሪያ ሞዴሎችን በዘዴ በመመርመር የሂሳብ ስራ ውጤታማነትን ለማሻሻል መፍትሄዎችን ለማግኘት ከሚደረገው ጥረት የሚመነጭ ነው ፡፡ በአጠቃላይ ፣ የነገር መርማሪዎች ሶስት ዋና ዋና አካላት አሏቸው-ከተሰጠ ምስል ላይ ባህሪያትን የሚያወጣ የጀርባ አጥንት; በርካታ ደረጃዎችን ከጀርባ አጥንት እንደ ግብዓት የሚወስድ የነገሮች መረብ እና የምስሉን የባህርይ መገለጫ ባህሪያትን የሚወክሉ የተቀናጁ ተግባራትን ዝርዝር ያወጣል ፤ እና የእያንዳንዱን ነገር ክፍል እና ቦታ ለመተንበይ የተዋሃዱ ተግባራትን የሚጠቀም የመጨረሻ ክፍል / ሳጥን አውታረ መረብ ፡፡
ለእነዚህ አካላት የንድፍ አማራጮችን ከገመገምን በኋላ አፈፃፀምን እና ቅልጥፍናን ለማሻሻል በርካታ ቁልፍ ማመቻቸቶችን ለይተናል ፡፡ የቀደሙት መመርመሪያዎች በአብዛኛው ResNets ፣ ResNeXt ወይም AmoebaNet ን እንደ የጀርባ አጥንት ይጠቀማሉ ፣ እነሱም አነስተኛ ኃይል ያላቸው ወይም ከ “EfficientNets” ዝቅተኛ ብቃት አላቸው ፡፡ በ EfficientNet የጀርባ አጥንት የመጀመሪያ አተገባበር ብዙ ተጨማሪ ቅልጥፍናን ማግኘት ይቻላል ፡፡ ለምሳሌ ፣ የሬቲኔት -50 የጀርባ አጥንትን ከሚጠቀም የሬቲኔት መረብ መነሻ በመነሳት የእኛን የማስወገጃ ጥናት እንደሚያሳየው ResNet-50 ን በብቃት መረብ-ቢ 3 መተካት በቀላሉ ስሌቱን በ 20% በመቀነስ ትክክለኛነትን በ 3% ሊያሻሽል ይችላል ፡፡ ሌላው ማመቻቸት የተግባራዊ አውታረ መረቦችን ውጤታማነት ማሻሻል ነው ፡፡ ምንም እንኳን የቀደሙት መመርመሪያዎች አብዛኛዎቹ ዳውንሊንክ ፒራሚድ ኔትወርክን (ኤፍ.ፒ.ፒ.) በቀላሉ የሚጠቀሙ ቢሆንም ፣ በታችኛው ተፋሰስ ኤፍፒኤ በተፈጥሮው በአንድ አቅጣጫ የመረጃ ፍሰት ብቻ የተገደበ ሆኖ እናገኘዋለን ፡፡ እንደ PANet ያሉ አማራጭ FPNs ተጨማሪ ስሌት ተጨማሪ ወጪን ይጨምራሉ ፡፡
የቅርብ ጊዜ የኒውራል አርክቴክቸር ፍለጋን (NAS) ለመጠቀም የተደረጉት ሙከራዎች ይበልጥ የተወሳሰበ NAS-FPN ሥነ-ሕንፃ አግኝተዋል ፡፡ ሆኖም ፣ ይህ የአውታረ መረብ አወቃቀር ውጤታማ ቢሆንም ፣ ለተዛባ ተግባር እንዲሁ ያልተለመደ እና በጣም የተመቻቸ በመሆኑ ከሌሎች ተግባራት ጋር ለመላመድ አስቸጋሪ ያደርገዋል ፡፡ እነዚህን ችግሮች ለመፍታት ሁለት አቅጣጫ-ነክ ተግባራትን ቢኤፍፒን አዲስ አውታረ መረብ እናቀርባለን ፣ ይህም ከ FPN / PANet / NAS-FPN የብዙ-ንብርብር ተግባሮችን የማጣመር ሀሳብን ተግባራዊ የሚያደርግ ሲሆን ይህም መረጃ ከላይ እስከ ታች እና በሁለቱም እንዲተላለፍ ያስችለዋል ፡፡ ከታች ወደ ላይ. መደበኛ እና ውጤታማ ግንኙነቶችን በመጠቀም.
ቅልጥፍናን የበለጠ ለማሻሻል አዲስ ፈጣን የተስተካከለ የአሠራር ዘዴን እናቀርባለን ፡፡ ባህላዊ አቀራረቦች ብዙውን ጊዜ ለ FPN ሁሉንም ግብዓቶች በተመሳሳይ ውሳኔ ፣ በተለያዩ የውሳኔ ሃሳቦች እንኳን ያስተናግዳሉ ፡፡ሆኖም ፣ የተለያዩ የውሳኔ ሃሳቦች ያላቸው የግብዓት ባህሪዎች ብዙውን ጊዜ ለውጤት ተግባራት እኩል ባልሆነ መንገድ አስተዋፅዖ እንደሚያደርጉ እናስተውላለን ፡፡ ስለዚህ በእያንዳንዱ የግቤት ተግባር ላይ ተጨማሪ ክብደት እንጨምራለን እናም አውታረ መረቡ የእያንዳንዳቸውን አስፈላጊነት እንዲያውቅ እናደርጋለን ፡፡ እንዲሁም ሁሉንም መደበኛ ኮንቬንሽኖች ውድ ባልሆኑ ፣ ጥልቅ በሆኑ ሊነጣጠሉ በሚችሉ ስብስቦች እንተካለን። በዚህ ማመቻቸት የእኛ ቢኤፍፒፒን የበለጠ ትክክለኛነትን በ 4% ያሻሽላል እና የሂሳብ ወጪዎችን በ 50% ይቀንሳል።
ሦስተኛው ማመቻቸት በተለያዩ የሀብት እጥረቶች መካከል በትክክለኝነት እና በብቃት መካከል የተሻለው ስምምነት መድረስን ያካትታል ፡፡ የቀድሞው ሥራችን እንደሚያሳየው የኔትወርክን ጥልቀት ፣ ስፋት እና ጥራት በአንድ ላይ ማጠንጠን የምስል መታወቂያ አፈፃፀምን በእጅጉ ሊያሻሽል ይችላል ፡፡ በዚህ ሀሳብ በመነሳሳት ጥራት / ጥልቀትን / ስፋትን በጋራ የሚጨምር ለነገር መርማሪዎች አዲስ የተቀናጀ የመለኪያ ዘዴ እናቀርባለን ፡፡ እያንዳንዱ የአውታረ መረብ አካል ማለትም የጀርባ አጥንት ፣ የነገሮች እና የአጥቂ / የክፍል ትንበያ አውታረመረብ የሂዩራዊ ህጎችን በመጠቀም ሁሉንም የመጠን ልኬቶችን የሚቆጣጠር አንድ ውስብስብ የመጠን መለኪያ ይኖረዋል ፡፡ ይህ አካሄድ ለተሰጠው የታለመ ግብዓት እገዳ የመጠን መለኪያን በማስላት ሞዴሉን እንዴት ማሳደግ እንደሚቻል ለመወሰን ቀላል ያደርገዋል ፡፡
አዲሱን የጀርባ አጥንት እና ቢኤፍ.ፒን በማጣመር በመጀመሪያ አነስተኛ የኢፌክት ዲኤት -00 መነሻ መስመርን ዲዛይን እናደርጋለን ከዚያም ውጤታማነትን-ዲ 1 ን ወደ ዲ 7 ለማግኘት የውህድ ልኬትን ተግባራዊ እናደርጋለን ፡፡ እያንዳንዱ ተከታታይ አምሳያ ከ 3 ቢሊዮን FLOPs እስከ 300 ቢሊዮን ፍሎፕስ ያሉ ሰፋ ያሉ የሀብት ገደቦችን የሚሸፍን እና ከፍተኛ ትክክለኝነትን የሚጨምር ከፍተኛ የሂሳብ ወጪ አለው ፡፡
የአፈፃፀም ሞዴል
ለዕቃ ማወቂያ በሰፊው ጥቅም ላይ የዋለ የማጣቀሻ የውሂብ ስብስብ በ ‹COCO› የውሂብ ስብስብ ላይ “EfficientDet” ን መገምገም ፡፡ ቀልጣፋ ዲት -7 ከ 4 እጥፍ ያነሱ ግቤቶችን እና ከ 9.4 እጥፍ ያነሰ ስሌቶችን በመጠቀም ከቀዳሚው ዘመናዊ ሞዴል 1.5 ነጥብ ከፍ ያለ አማካይ አማካይ ትክክለኛነት (mAP) 52.2 ያገኛል ፡፡
እንዲሁም በ EfficientDet እና በቀደሙት ሞዴሎች መካከል የግቤት መለኪያ እና ሲፒዩ / ጂፒዩ መዘግየትን አነፃፅረናል ፡፡ በተመሳሳዩ ትክክለኛነት እገዳዎች ፣ EfficientDet ሞዴሎች በጂፒዩ ላይ ከ2-4 ጊዜ በበለጠ ፍጥነት እና ከሌሎች ጠቋሚዎች በበለጠ በአቀነባባሪው ከ5-11 እጥፍ ይሮጣሉ ፡፡ የ EfficientDet ሞዴሎች በዋነኝነት ለዕቃዎች ምርመራ የታሰቡ ቢሆኑም እኛ እንደ ፍቺ ክፍልፋዮች ባሉ ሌሎች ሥራዎች ውስጥ ውጤታማነታቸውን እንፈትሻለን ፡፡ የመለየት ሥራዎችን ለማከናወን ፣ ተመሳሳይ ሚዛን ያለው የጀርባ አጥንት እና ቢኤፍፒን በመጠበቅ የመመርመሪያውን ጭንቅላት እና የጭንቅላት መጥፋት እና ኪሳራ በመተካት ኢፍፊዲዴት-ዲ 4 ን በጥቂቱ እናሻሽላለን ፡፡ ይህንን ሞዴል ከቀድሞው ዘመናዊ የክፍልፋይ ሞዴሎች ጋር እናነፃፅራለን ለፓስካል VOC 2012 በስፋት ጥቅም ላይ የዋለው የክፍልፋይ ሙከራ የውሂብ ስብስብ ፡፡
ልዩ አፈፃፀማቸውን ከግምት በማስገባት ኢፍፊዴት ለወደፊቱ የነገሮች መመርመሪያ ምርምር አዲስ መሠረት ሆኖ እንዲያገለግል እና እጅግ በጣም ትክክለኛ የሆኑ የእውነተኛ ማወቂያ ሞዴሎችን በብዙ የእውነተኛ ዓለም መተግበሪያዎች ውስጥ ጠቃሚ ያደርገዋል ተብሎ ይጠበቃል ፡፡ ስለዚህ የኮዱን ሁሉንም የመክፈቻ ነጥቦችን እና በ ‹Github.com› ላይ ቅድመ-ቅጥያ ሞዴልን ከፈተ ፡፡