Əks görüntü axtarışı necə işləyir?

Orta görüntünüzün min sözdən daha az dəyəri ola bilər – selfiesdən öyrənə biləcəyiniz çox şey var. Ancaq bəzən neçə sözün dəyərli olmasından asılı olmayaraq bir görüntünün haradan gəldiyini bilmək lazımdır.

Bunun üçün Google, TinEye, Bing, Yandex, Pixsy və daha çox kimi insanlar tərəfindən təmin edilən tərs görüntü axtarış motorları mövcuddur. Müraciətində heç bir söz söyləmədiyi üçün, nə axtarmağı bilirlər? Ən əsası, bunu necə tapdılar? Hər tərs görüntü axtarışı sisteminin necə işləməsi dəyişir və alqoritmlərini gizli saxlayırlar, amma əsas fikir var və anlamaq çətin deyil.

Barmaq izi

Həqiqi şəkillər insan barmaq izlərindən daha unikal ola bilər, çünki tam eyni piksel tənzimləməsini ehtiva edən iki görüntünün şansı çox azdır, barmaq izi ilə toqquşma ehtimalı isə 64 milyard civarındadır nisbətən yaxşı fürsət. Bəs bir görüntünü barmaq izi necə edirsiniz? Alqoritmə görə addımlar dəyişir, lakin əksəriyyəti eyni əsas düsturu izləyir.

Birincisi, rəng, doku, gradient, forma, görüntünün müxtəlif hissələri arasındakı münasibətlər və hətta Furye çevirən şeylər (bir şəklin döş və kosinaya bölünmə üsulu) daxil ola bilən görüntü xüsusiyyətlərini ölçməlisiniz.

Deyək ki, növbəti görüntünü axtarırıq və barmaq izinə ehtiyacımız var.

Nyu York prospekti üçün tərs görüntü axtarışı

Bunun üçün, digər şeylərlə yanaşı, aşağıda görə biləcəyiniz hər birində rəng rəngli histogramları, Furyer çevirmələrini və toxumalı xəritələrdən istifadə edə bilərdik.

Ters Rəng Histogram Şəkil Axtarışı Çevir Fürier görüntü axtarış Tərs Şəkil Axtarış Doku Xəritə

Şəkil ölçüsü, bulanık, dönüşlü və ya manipulyasiya edildiyi təqdirdə yuxarıda göstərilən funksiyalardan və digərlərindən nəticə çıxarmağa çalışan bir sıra alqoritmlər olacaqdır.

Kodlaşdırma, qənaət və axtarış

Bir barmaq izindəki hər bir şəkil funksiyası asanlıqla saxlanan və verilənlər bazasında indekslənən məktublar və nömrələrin simli olaraq kodlana bilər. Çıxarılan və saxlanan xüsusiyyətlərin hər hansı bir birləşməsi həmin görüntü üçün tərs görüntü axtarışı motoru girişi olacaqdır. TinEye verilənlər bazası, məsələn, təxminən 39,6 Bir milyard görüntü, 2020-ci ilin Fevral ayında indeksləndi, yəni alqoritmini bir çox görüntü üzərində işlədərək, axtarılan şəkilləri müqayisə etmək üçün bütün bu barmaq izlərini saxlayır.

Revers Image Axtarış Verilənlər Bazası

Alqoritmin ikinci əsas hissəsi hansı şəkillərin oxşar olduğunu kəşf etməkdir. Bir şəkil yüklədiyiniz zaman tərs görüntü axtarış motorunun barmaq izi alqoritmindən keçəcəkdir. Axtarış motoru girişi "görüntü məsafəsi" olaraq bilinən ən yaxın barmaq izi ilə tapmağa çalışacaq. Hansı amillərin müqayisə ediləcəyini və çəkinin hər bir axtarış motorundan necə asılı olduğunu müəyyənləşdirmək, lakin ilk növbədə görüntünün ümumi məsafəsini mümkün qədər sıfıra yaxın tapmaq məqsədi daşıyır.

Maşın öyrənməsi / AI haqqında?

Yuxarıda təsvir olunan barmaq izi / endeksləmə texnikası sayəsində tərs görüntü axtarışı AI tətbiq etmək üçün praktik olaraq əvvəl də olduqca yaxşıdır. AI, görüntü emalında çox yaxşı olduğuna görə, bir çox böyük axtarış motorları çıxarış və etiket xüsusiyyətlərinə kömək etmək üçün konvulsional sinir şəbəkələrini (CNN) istifadə edir. Google, məsələn, bir müddətdir Google Şəkillərdə etdikləri kimi, potensial görüntü açar sözlərini hazırlamağa və müvafiq veb nəticələrini və şəkillərini çıxarmağa imkan verən əks görünüş axtarışında CNN-dən istifadə edə bilər.

Tərs görüntü axtarışı, konvulsional neyron şəbəkələri

Bunun üçün tərs görüntü axtarışı, sadə xüsusiyyət çıxarılması və görüntü boşluğu üzərində bir addım lazımdır. Konvolyusional neyron şəbəkələri əsasən şəkilləri müxtəlif xüsusiyyətləri əks etdirən müxtəlif filtrlər vasitəsi ilə işlədir, sonra əvvəlki təlimlərə əsasən təsnif etməyə çalışın. Əlbəttə ki, bu çox ölçüləndir, amma CNN görüntü axtarışını daha dəqiq və faydalı etdiyini və ehtimal ki, köhnə kompüter görmə barmaq izi metodları ilə birlikdə tətbiq olunduğunu söyləmək kifayətdir.

Ən yaxşı əks görünüş axtarış motoru nədir?

Google Mestia Şəkil Axtarışı tərsinə

Fərqli bir alqoritm, hamısı nəticədə eyni məqsədə işarə etsə də fərqli şeylər üçün yaxşı bir görüntü axtarış motoru deməkdir: yüklədiyiniz şəkil üçün uyğunluq tapmaq. Google Şəkillərdə, məsələn, olduqca yaxşı bir müvəffəqiyyət nisbəti var, lakin bir çox oxşar, lakin eyni olmayan fotoşəkilləri təqdim edərək "daha yaxşı tahmin" edir. Ümumi əhval-ruhiyyə və ya kateqoriya axtarırsınızsa əladır, amma maşın TinEye-ni daha çox düzəldilmiş olmasına baxmayaraq eyni şəkilləri axtarmağa daha çox bəyənir və fotolardakı şəkilləri biraz daha yaxşı hala gətirə bilir. düzgün matç lazımdırsa.

Mestia Tineyin arxasında şəkil axtarışı

Rus axtarış motoru Yandex, əla görüntü axtarışı vasitəsi ilə də məşhurdur, baxmayaraq ki, rus mövzularında əlindən gələni edəcəyini təxmin etmək olar. Pixsy və ImageRaider kimi vasitələr icazəsiz istifadə hallarının aşkarlanmasına diqqət yetirir, buna görə də xəbərdarlıq kimi daha çox xüsusiyyətləri daxil etməyə və istifadəçinin foto kitabxanasını izləməyə meyllidirlər.

Alqoritm hər zaman dəyişir və ümumiyyətlə kilidlənir, heç bir şey istədiyiniz nəticəni qaytarmadığı təqdirdə bir neçə fərqli maşın yoxlamaq yaxşı bir fikirdir.

Şəkil krediti: New York City, DB Database Icon küçələrindən buxar

Bu məqalə faydalı oldu? Olmasa