КомпьютерлерАқпараттық технологиялар

Қазіргі заманғы компьютерлік көру. Міндеттері мен компьютерлік көру технологиясы. Python бағдарламалау Компьютерлік Vision

суреттің немесе суреттердің бейнеленген түсіну үшін компьютерді үйрету қалай? Бұл қарапайым, бірақ компьютерге үшін осы сіз маңызды ақпаратты шығарып алу үшін келетін бірлік және нөл тұратын жай матрицасы болып табылады.

компьютерлік көру дегеніміз не? Ол компьютерді «көруге» қабілеті болып табылады

Vision - оны пайдалану адам үшін маңызды ақпарат көзі болып табылады, біз барлық ақпаратты 70-дан 90%, әртүрлі бағалаулар бойынша, алуға. біз ақылды машина жасау қажет болса, әрине, біз сол дағдылары мен компьютерді іске асыру үшін қажет.

компьютерлік пайымын проблемасы өте анық көрсетілген болады. «Бөлімін қараңыз» дегеніміз не? Бұл жай ғана қарап бар жерде деп түсiнiледi. Яғни компьютерлік аян және адами тұрғысынан айырмашылықтарды жасалған. Біз үшін Vision -, қашықтыққа және өлшемдерін түсіну қабілеті болып табылады - бұл әлем туралы білім көзі, сондай-ақ метрикалық ақпарат көзі болып табылады.

Семантикалық ядро сурет

сурет қарап, біз семантикалық ақпаратты алу үшін, былайша айтқанда, атрибуттарды бірқатар оны сипаттауға болады.

Мысалы, осы сурет қарап, біз оны сыртта деп айтуға болады. қала трафик қандай болып табылады. автомобильдер бар екенін. біз осы ғимараттың және Иероглифтер конфигурациясына Оңтүстік-Шығыс Азия екенін сұраса болады. Мао Цзедуна портрет осы Пекин, және кез келген тікелей бейне немесе өзі болған көрген болса, осы атақты Тяньаньмэнь алаңы екенін сұраса еді екенін түсінеміз.

біз оны көріп, сурет туралы қосымша не айта аласыз? Біз адам мұнда жақын бар екенін, айтуға, суретте нысандарды анықтауға болады - қоршау. Мұнда қолшатырлар, бұл ғимаратты плакаттар. Бұл топтарына мысалдар келтірілген сәтке іздеу айналысатын өте маңызды нысандар болып табылады.

Әлі күнге дейін біз объектілерін ерекшеліктері немесе белгілерінің кейбір біле аласыз. Мысалы, бұл жерде біз бұл қарапайым қытай, атап айтқанда, Мао Цзэдун портреті емес екенін анықтауға болады.

көлік құралының айтуынша қозғалыс кезінде деформацияланған емес екенін, ол қозғалатын объект болып табылады, және ол қиын екенін анықтауға болады. тулар туралы үнемі деформацияланған, олар сондай-ақ қозғалады, ол қарсылық айтты, бірақ олар қатты емес, болады. Ал сахна бар жалаулар дамыту арқылы анықталуы мүмкін жел болып табылады, тіпті желдің бағыты анықтауға болады, мысалы, ол солдан оңға соққанын.

компьютерлік аян арақашықтық және ұзындығы

Өте маңызды компьютерлік көру ғылым туралы метрикалық ақпарат болып табылады. Бұл қашықтықта барлық түрлері болып табылады. команда Жерден шамамен 20 минут болып табылады, сондай-ақ көп жауап, өйткені, мысалы, Rover үшін ерекше маңызды болып табылады. Тиісінше, сол жаққа және керi сілтеме - 40 минут. біз Жер қозғалысы пәрмендерге арналған жоспарын жасауға және егер, сіз бұл ескеру қажет.

Сәтті видео ойындар компьютерлік пайымын технологиясын интеграцияланған. бейне айтуынша, сіз, адам нысандардың үш өлшемді үлгілерін құруға болады, және пайдаланушы фотосуреттер қалаларының үш өлшемді үлгілерін қалпына келтіруге болады. Ал содан кейін оларға жүре.

компьютерлік көру - өте кең ауқымды. Ол тығыз түрлі басқа ғылымдармен ұштасып жатыр. компьютерлік пайымын бөлігі Ол тарихи, сурет өңдеу аймағын түсіреді, кейде компьютерлік көру бөледі.

Талдау, тану - жоғары интеллект құру жолы

АҚШ бөлек осы ұғымдар қарастырайық.

Сурет өңдеу - бұл алгоритмдер ауданы, енгізу және шығару болып табылады - сурет, және біз оған бір нәрсе істеу керек.

сурет талдау - екі өлшемді бейнеленген жұмыс және осы жылғы қорытынды жасауға баса назар аударады компьютерлік пайымын, алаңы болып табылады.

Pattern тану - векторлар түрінде деректерді таниды дерексіз математикалық пән. Яғни кіреберісте болып табылады - векторлық және біз онымен істеу нәрсе бар. векторы қайда, біз білу соншалықты маңызды емес.

Компьютерлік көру - бұл бастапқыда екі өлшемді суреттер құрылымын қалпына келтіру болды. Бүгін осы аймақ кеңірек айналды және ол кескіннің негізделген, қабылдау физикалық объектілердің барлық қабылдау ретінде түсіндіруге болады. Яғни, ол міндет болып табылады жасанды интеллект.

мүлдем басқа саласындағы компьютерлік аян қатар, геодезия жылы, фотограмметрия дамыды - екі өлшемді суреттер бойынша объектілерді арасындағы қашықтықтың өлшеу.

Роботтар «көруге» болады

Және, ақырында, - бұл машина көрінісі. машина пайымын астында роботтар аян білдіреді. Яғни кейбір өндірістік есептерді шешу болып табылады. бір үлкен ғылым - Біз компьютерлік көру деп айтуға болады. Ол басқа ғылым бөлігінде кейбір біріктіреді. компьютерлік көру кез келген нақты өтініш алады және қашан, ол машина аян айналады.

Компьютерлік көру облысы практикалық қосымшалар бар массасын. Ол өндірісті автоматтандыру байланысты. кәсіпорындарында машина қолмен еңбегін ауыстыру тиімдірек айналады. машина ұйықтап емес, жалыққан емес, ол жылына 365 күн жұмыс істеуге дайын, бұрыс жұмыс кестесін болды. Сондықтан, машина жұмысын пайдаланып, біз белгілі бір уақытта кепілдік нәтиже алуға болады, және ол өте қызықты болып табылады. Барлық тапсырмалар компьютерлік көру жүйелері үшін нақты пайдалану бар. Ал тек есептеу кезеңіне бірден суретте нәтижелерін көру үшін қарағанда жақсы ештеңе жоқ.

жасанды интеллект әлемнің қарсаңында

Plus ауданы - бұл қиын! аян жауапты ми елеулі бөлігі, және ол сіз «көруге» компьютерді үйрету, егер бұл, толық пайдалану компьютерлік көру болып табылады, ол толық жасанды интеллект міндеттерінің бірі болып табылады деп саналады. біз сол уақытта, ең алдымен, адам деңгейінде мәселені шешу мүмкін болмаса, біз АИ мәселесін шешуге мүмкіндік береді. Бұл өте жақсы! Немесе жоқ өте жақсы, сіз қарап, егер, «Терминатор 2».

Неге Vision - бұл қиын? сол объектінің бейнесі сыртқы факторларға байланысты қатты өзгеруі мүмкін, өйткені. бақылау нүктелерінің объектісі байланысты басқаша көрінуі.

Мысалы, бір және сол қайраткері, әр түрлі бұрыштарға алынған. Және қандай суретте ең қызықты бір көз, екі көз жарым болуы мүмкін. Ал контексте (боялған көзімен көйлек адамның осы бейнесі болса) байланысты көз астам екі болуы мүмкін.

компьютерлік әлі түсіне емес, бірақ ол «көреді»

ол қиындатады Тағы бір фактор - бұл жарықтандыру ғой. түрлі жарықтандыру бірге бір сахнада түрлі көрінеді. нысан мөлшері әр түрлі болуы мүмкін. Сонымен қатар, кез келген сыныпты объектiлерi. Сіз бұл 2 метр, оның биіктігі адам туралы қалай айтуға болады? Ештеңе. Адам өсу және 2,3 м, және 80 см болуы мүмкін. Объектілерін басқа түрлері сияқты, алайда, сол сыныпты объектiлерi болып табылады.

Атап айтқанда, тірі нысандар штаммдарының түрлі өтеді. Шаш адам, спортшылар, жануарлар. жүгіру жылқы суреттер қараңызшы, қандай олардың Мане мен құйрығы бар болып жатқан жай мүмкін емес анықтау. суреттегі А шарасыз объектілер? Егер сіз компьютер кескінінің итерген болса, тіпті ең қуатты машина дұрыс шешім беруге қиындық таба.

Келесі көрініс - бұл маскировка ғой. өте шебер Кейбір нысандар, қоршаған ортаға ретінде таныстыратын жануарлар, және. Ал сол дақтар және бояғыш. Дегенмен, біз әрдайым емес алыстан болса да, оларды көру.

Тағы бір проблема - қозғалыс. невообразимой қозғалыста объектілері деформациясы өтеді.

объектілердің Көптеген өте айнымалы болып табылады. Міне, мысалы, «кафедрасының» объектілеріне төмен екі фотосуреттердің.

Және бұл сіз отыруға болады. өте қиын - Бірақ пішіні, түсі, материал, объектісі болып барлық «кафедрасының» түрлі заттар сияқты, бұл, бір машинаны үйрету. Бұл күрделі міндет болып табылады. компьютерлік пайымын әдістерін біріктіруге - түсіну үшін машинаны үйрету талдау, алыпсатарлық болып табылады.

түрлі платформаларда компьютерлік пайымын интеграциясы

компьютерлік пайымын бұқаралық ол бірінші бет детекторды құрылған 2001, көбірек еніп бастады. Viola, Jones: Біз ол екі авторлар жасады. Ол машина оқыту әдістерін қуатын паш бірінші тез және сенімді жеткілікті алгоритм болды.

Адам тұлға тану - Енді компьютерлік көру жеткілікті жаңа практикалық қосымшалар бар.

Бірақ фильмдер сияқты адам тануға - кездейсоқ бұрыштары, түрлі жарық жағдайында - бұл мүмкін емес. Бірақ мәселені, немесе әр түрлі жарықтандыру немесе түрлі позе түрлі адамдар бір шешу, паспортта фотосурет сияқты ұқсас, ол сенім дәрежесі жоғары болады.

Бетті тану алгоритмдер мүмкіндікке негізінен паспорт фото талаптар.

Егер сіз биометриялық паспорт болса, мысалы, кейбір заманауи әуежайлардың, сіз автоматты түрде паспорттық бақылау жүйесін пайдалануға болады.

компьютерлік пайымын шешілмеген мәселе - кез келген мәтінді тану қабілеті

Бәлкім, біреу OCR жүйесін пайдаланылады. Олардың бірі - Fine Reader, Рунет жүйесінде өте танымал. Сіз деректерді толтыру көптеген формалары бар, олар тамаша шығылады, ақпараттық өте жақсы жүйесін танылды. Бірақ суретте кез келген мәтінмен жағдай әлдеқайда нашар болып табылады. Бұл проблема әлі де шешілмеген күйінде қалып отыр.

компьютерлік көру, Motion Capture қатысуымен ойындары

Бөлек үлкен ауданы - үш өлшемді модельдерді және (өте табысты компьютерлік ойындарға жүзеге асырылады) қозғалыс қармау құру болып табылады. компьютерлік көру пайдаланады бірінші бағдарлама - қимылдары арқылы компьютермен өзара іс-қимыл жүйесі. ол құрылған кезде, ол ашық заттарды көп болды.

алгоритм өте жай жасалған, бірақ ол млн суреттерді алуға адамдардың синтетикалық суреттердің генераторды жасауға алды конфигурациялау үшін. Ол қазір жақсы жұмыс істейді, ол үшін алгоритм, параметрлерін таңдауға олармен суперкомпьютер.

Яғни бір процессор қуаты 12% тұтынады және адам нақты уақыт ұстанымын қабылдауға мүмкіндік береді алгоритм құру миллион суреттер мен ықтимал апта счетности суперкомпьютер уақыты келді. Бұл Microsoft Kinect жүйесі (2010).

мазмұны бойынша суреттер Іздеу жүйесіне фотосуреттерді жүктеуге мүмкіндік береді, және оның нәтижелері бірдей мазмұнмен барлық суреттерді беруге және сол бұрышын жасалған болады.

компьютерлік пайымын мысалдары: үш өлшемді және екі өлшемді карталар қазір онымен жасалған жатыр. шарлау автомобильдер үшін Карталар үнемі сандық видеорегистратором сәйкес жаңартылады.

географиялық белгісі бар фотосуреттерді миллиардтаған бар дерекқор бар. базасында суретті жүктеу, сіз, ол жасалды, онда анықтау, тіпті кейбір перспективаны болады. Әрине, орны бір уақытта туристер жеткілікті танымал шартымен және облыстың фотосуреттер бірқатар болды жасады.

роботтар барлық жерде бар

кез келген жолмен, онсыз барлық жерде қазіргі уақытта Robotics,. Енді (осы компьютерлік бағдарлама көру үшін жолмен, Автомобилист көмектеседі) жүргізушіге пәрмендерді беруге жаяу және жол белгілерін тануға арнайы камера бар көлік құралдары бар. Және онда толық автоматтандырылған робот көлік құралдары болып табылады, бірақ олар қосымша ақпарат көп мөлшерде қолданбай бейне камера жүйесін сенбеу мүмкін емес.

Қазіргі заманғы камера - бұл аналогтық камера Obscura табылады

сандық бейнесі туралы сөйлесейік. Қазіргі заманғы сандық камералар Camera Obscura принципі бойынша ұйымдастырылған. орнына жарық сәулесін кіреді және пәндік тізбектің палатасының артқы қабырғаға проекциясы, ол арқылы тесігі ғана, біз арнайы оптикалық жүйесі Линзаны деп аталатын болады. Оның объектісі үлкен жарық сәулесін жинау және проекция алу және фильмнің немесе матрицада туралы имиджін қалыптастыру мақсатында виртуалды нүктесі арқылы өткен барлық сәулелер етіп, оны түрлендіру болып табылады.

Қазіргі заманғы сандық камералар (матрицалық) жеке элементтерден тұрады - нүкте. Әрбір пиксель пиксель жалпы құлайтын жарық энергиясын өлшеу және бір шығыс нөмірін беруге болады. компьютерлік - Сондықтан, сандық камера, біз бір пикселдің ауланған жарық өлшеу орнату сурет жарықтығы, орнына алуға көру өрісі. Сондықтан, қашан біз көре сурет сызықтар және түсінікті контурын ағып, және әр түрлі түстермен боялған квадраттарының тордағы емес, - нүкте.

Сіз әлемдегі алғашқы сандық кескінді қараңыз төмен.

Бірақ бұл суретте емес пе? Түс. түсі қандай?

түсті Психологиялық қабылдау

Түс - бұл біз көріп қандай болып табылады. бір түсті және адам мен мысықтарды үшін бірдей нәрсе әр түрлі болады. Vision түрлі - біз (адамдар) мен жануарлар оптикалық жүйесі бастап. Сондықтан, түсі - бұл объектілер мен жарық сақталған кезде орын біздің көзқарасымыздың психологиялық сапасы ғой. Емес, объектінің және жарық физикалық меншік. Түс - жеңіл компоненттерінің өзара іс-қимыл нәтижесі болып табылады, және біздің визуалды жүйесін сахна.

көмегімен кітапхана Python бағдарламалау Компьютерлік Vision

Егер компьютер пайымын зерттеуге шындап айналысуға шешім қабылдасаңыз, бірден қиындықтар бірқатар дайындалуға тиіс, бұл ғылым оңай емес және күтпеген кедергілерге бірқатар жасырады. Бірақ «Python бағдарламалау Компьютерлік Vision» Ян Эрик Solema авторлық - барлық ең қарапайым тілін белгіледі кітап. Мұнда Сіз 3D түрлі объектілерді тану әдістерімен танысады, стерео имиджін, виртуалды шындық және компьютерлік аян көптеген басқа бағдарламалармен жұмыс істеуге үйренеді. Кітапта Python жеткілікті мысалдар бар. тым көп зерттеулер мен қатты деректерді шамадан тыс емес, сондай-ақ, сондықтан Бірақ түсініктемелер, ұсынылған былайша айтқанда, жалпылау. студенттер, әуесқой және энтузиастардың үшін қолайлы жұмыс істеу. Осы кітапты жүктеп және компьютерлік аян (PDF-форматында) туралы басқалар желісінде болуы мүмкін.

Қазіргі уақытта, компьютерлік көру алгоритмдерін көзі ашық кітапханасы және суретті өңдеу және сандық алгоритмдері OpenCV бар. Бұл ашық көзі болып табылады, ең заманауи бағдарламалау тілдерінде жүзеге асырылады. біз компьютерлік аян туралы айтатын болсақ, Python программалау тілі ретінде пайдаланады, ол сондай-ақ кітапхана қолдауына ие, сонымен қатар, ол үнемі дамып және үлкен қауымдастық бар.

компаниясы «Microsoft», оның Қызметтер API-қабілетті адамдардың бейнелері бар, оны жұмыс істеуге нейрондық желі үйрету қамтамасыз етеді. компьютерлік көру қолдануға мүмкіндік Python программалау тілі ретінде пайдаланады, сондай-ақ бар.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 kk.delachieve.com. Theme powered by WordPress.