Bu səbəbdən AI şirkətləri səs yazılarını dinləməlidirlər

Avqustun sonlarında, Motherboard, Microsoftun AI əsaslı səs köməkçisinin işini yaxşılaşdırmaq üçün Xbox istifadəçilərindən səs yazılarını podratçılarla paylaşdığını elan etdi. Bu ayın əvvəlindəki başqa bir hesabat, Microsoftun işə salındığını ortaya qoydu Skype Çat platformasının xidmətlərini yaxşılaşdırmaq üçün podratçılarla birlikdə Cortana yazıları və səs əmrləri. Bəzi yazılarda intim məzmun var idi.

Microsoft, istifadəçi tərəfindən yaradılan məlumatları kəsmək və qeyd etmək üçün insanları işə salan bir neçə şirkətdən biridir. Son bir neçə ayda Google-da oxşar proqramlar, Amazon, Facebooke Appleözünü istifadəçi məxfiliyinin müdafiəçisi kimi təyin edən şəxs aşkarlandı.

Səslə idarə olunan köməkçilər və söhbət panelləri getdikcə populyarlaşdıqca, texnologiya şirkətləri çətin bir problemlə üzləşirlər: AI alqoritmləri insan dilinin mürəkkəbliyi üçün tərtib edilməmişdir və ümumiyyətlə əmr və ifadələrin mənasını başa düşə bilmir. istifadəçilərinizin.

Hazırda yeganə həll yolu bu AI alqoritmlərini düzgün istiqamətə yönəltmək üçün insanları işə götürməkdir. Və adətən bu işçilərin yazılarını yazmaq və yazmaq üçün istifadəçilərin ailə söhbətlərini dinləmələrini tələb edir.

Dil anlamaqda çətinlik çəkir

Alexa, Siri və Cortana kimi dil köməkçiləri, son illərdə çox populyarlaşan bir süni intellekt sahəsidir. Dərin öyrənmə alqoritmləri nümunələri tapmaq və məlumatları təsnif etmək üçün xüsusilə faydalıdır.

Milyonlarla səs yazısı və əlaqəli mətnlərlə dərin bir öyrənmə alqoritmini təmin etsəniz, çox yüksək dəqiqliklə yeni audio kliplər yaza biləcəksiniz. Dərin öyrənmə də yaxşı bir proqnozlaşdırıcıdır: böyük bir mətn orqanı olan AI alqoritmini hazırlayırsınızsa, müxtəlif söz sətirlərinin mürəkkəb riyazi təsvirlərini inkişaf etdirir və cümlələrin avtomatik tamamlanması kimi tapşırıqları yerinə yetirə bilir.

Bu səbəbdən AI şirkətləri səs yazılarını dinləməlidirlər 1

Bağlı sosial media

Ancaq dərin öyrənmə sözlərin və ifadələrin mənasını, təmiz riyaziyyat və statistika ilə həll edilə bilməyən bir məsələni başa düşmək üçün mübarizə aparır.

"Nitqin tanınması və təbii nitq anlayışı oxşar problemlər kimi səslənir, lakin bunlar tamamilə fərqlidir" dedi Gary Marcus, idrakçı alim, Robust.AI şirkətinin qurucusu və baş direktoru. "Nitqi tanımaqla, dilinizdə məhdud sayda heca və fonem var və bir səs axını çox kiçik bir qrup qrupuna aid bir şeyə çevirməyə çalışırsınız."

İngilis dilində on minlərlə ümumi istifadə olunan sözlər var və böyük məlumatlar əsrində, dərin öyrənmə modelləri hazırlamaq üçün istifadə edilə bilən milyonlarla nümunəni asanlıqla tapa bilərsiniz. Ancaq cümlələrin təhlili və mənalarının şərh edilməsi tamamilə fərqli bir səydir. Çox sayda mümkün ifadələr var, hər biri dəqiq bir məna daşıyır. Sözlərin mənası, bir cümlədə olduqları yerdən və onlardan əvvəl və ya nəyin ardından asılı olaraq dəyişir.

"Bir neçə qısa ifadələr istisna olmaqla, eşitdiyiniz ifadələrin demək olar ki hamısı orijinaldır. Sizdə birbaşa məlumat yoxdur və bu da düşüncə və anlaşma probleminiz deməkdir" dedi. "Hər şeyi kateqoriyalaşdırmaqda, tanış mövzulara qoymaqda yaxşı olan texnikalar bunun üçün sadəcə uyğun deyildir. Anlamaq dili dünya haqqında bildiklərinizi buna bağlayır. Başqalarının çalışdıqlarını gətirin. dediyin sözlərlə et ”.

AI Restart (New York Universitetinin professoru Ernest Devis ilə birlikdə) adlı yeni kitabında, Marcus, müasir AI-nin insan dilinin mənasını tapmaqda qarşılaşdığı bəzi çətinlikləri izah edir. Təqdim etdiyimiz şeylərdən biri, dünyamızın hər birimizin sahib olduğu ümumi məlumat və danışıqdan və yazılı dilin qeyri-müəyyənliklərini açmaq üçün bu bilikdən necə istifadə etməyimizdir.

Gündəlik söhbətlər bu qeyri-müəyyənliklərlə doludur. Məsələn, Markus və Devisin kitablarında araşdırdıqları bu ifadəni nəzərdən keçirin: "Elsi xalası ilə telefonla danışmağa çalışdı, amma cavab vermədi." Bu sadə bir ifadədir. Bununla yanaşı, bir insan olaraq asanlıqla həll edə biləcəyiniz bəzi qeyri-müəyyən məqamlar da mövcuddur. Bu ifadəni eşitdikdən sonra dərhal biləcəksiniz ki, "çatmaq" "ünsiyyət qurmaq" və "fiziki cəhətdən çatmaq" deyil, "zəng" "zəng" deməkdir və "fiziki olaraq zəng etmək" deyil və "o" "Elsinin xala aiddir və deyil. Elsie-də bir telefonun nə olduğunu, nədən istifadə edildiyini və necə zəng etmək lazım olduğunu bildiyiniz üçün asanlıqla əldə edə biləcəyiniz bütün nəticələr.

Sonsuz məşq dövrü

Dünyada ümumi düşüncə və bilik olmadığına görə, texnologiya şirkətlərinin AI modellərini daha çox nümunə ilə öyrətməkdən başqa çarəsi yoxdur, ümid etdikləri bir anda Aİ-nin nə etdiyini deməyin bütün yollarını tapacaqlar. – köməkçilər etməlidir. Bu səbəbdən AI alqoritmlərinin işini qiymətləndirmək və ya AI alqoritmlərinin deşifrə edə bilmədiyi istifadəçi qeydlərinə şərh və şərh vermək üçün çox vaxt uzaq və az işləyən işçilərin köməyinə ehtiyac duyurlar.

İnsanların hər şeyi ifadə edə bilməsi üçün sonsuz yolları nəzərə alaraq, daha çox təlim bir qrup həll yolu olacaq. Hər zaman uyğunsuzluqlar, AI-nin öyrədilmədiyi ssenarilər olacaqdır; və insan dili dinamik və daim inkişaf edir. Bütün bunlar daha çox təlim tələb edir, yəni şəxsi söhbətlərinizi izləyən uzaq işçilərdən daha çox hekayələr eşitdiyiniz deməkdir.

Süni intellekt nədir?

"Mövcud texnologiyanın zəif tərəfi, xüsusilə təbii dil anlamaq kimi açıq suallar üzərində inanılmaz dərəcədə məlumat çox olmasıdır. Buna görə şirkətlər bu məlumatları almağa ümidsizdirlər" deyir. "Düşünmürəm ki, həqiqətən probleminizi həll edəcək. Bir az kömək edəcək, amma alınmayacaq."

Dərin öyrənmə alqoritmlərinə ümumi mənada və əsas biliklərin daxil olma ehtimalı olmadan, problem qısa müddət ərzində həll edilə bilməz. Texnologiya şirkətləri AI alqoritmlərini öyrətmək üçün istifadəçi məlumatlarını toplamağa və izahat verməyə davam etdikləri üçün, məlumatları qoruma orqanları tərəfindən onlara təsir edən gizlilik vəkilləri və mümkün qanuni hərəkətlər. Nəticədə, bu şirkətlər məlumat toplamaq və yayım proqramlarını ara vermədən zəiflətdilər və yenidən qurdular.

avqustun sonu Apple Siri səs əmrlərini podratçılara təqdim etdiyi üçün veb saytında imzalanmadan üzr istədi. Şirkət, kadr sənədlərinin yalnız qiymətləndirmə proqramını seçdikləri təqdirdə təlim məqsədləri üçün istifadə ediləcəyini vəd etdi. Google məlumat müdafiəsi qaydalarının daha sərt olduğu Avropadakı sınaq proqramını dayandırdı, lakin proqram digər sahələrdə sarsılmaz olaraq qalır. Microsoft, hansı insan xidmət təminatçısının səsini eşidə biləcəyini aydınlaşdırmaq üçün məxfilik siyasətini yeniləmişdir. Amazon istifadəçilərə reytinq proqramını deaktiv etmək seçimini vermək üçün proqramını dəyişdirdi – bir çox istifadəçinin gözü götürməyən və ya başa düşmədiyi bir şey.

Uzunmüddətli perspektivdə, Marcus, AI üçün yeni perspektivlərə ehtiyac duyduğumuzu söylədi: "AI mövzusunda daha çox araşdırma aparmalıyıq. Bu, ilk növbədə məlumat və riyaziyyatdan ibarət bir mədəniyyətin başqalarının psixologiya kimi digər sahələrdən olan fikirləri də daxil etdiyi bir mədəniyyətə köçürməyimiz deməkdir. , insan ağlının fəaliyyətindən çox narahat olan və bu günümüzə nisbətən daha geniş bir süni intellekt qurma texnikası ilə nəticələnə biləcək fəlsəfə və dilçilik. "