Umelá inteligencia sa učí jazyk ako dieťa, ktoré pozoruje okolie
Vedci z MIT predstavili nové riešenie pre učenie umelej inteligencie, ktorá je určená pre spracovanie a chápanie ľudskej reči. Oproti jednoduchším strojovým prístupom sa ale inšpirovali u človeka a používajú tak "biologický" prístup, ktorý je viac zameraný na pozorovanie okolia.
Než sa človek naučí jazyk, čo zahŕňa ako jednotlivé slová, tak aj vetnú skladbu a kontext, trvá to niekoľko rokov. Aspoň pokiaľ sa začína z ničoho (narodené dieťa). Tento prístup bol zvolený aj u nového sémantického parsera, ktorý sa učí všetko od začiatku a musí sám zistiť, čo aké slová vlastne znamenajú a v akom kontexte.
Vytrvalé pozorovanie
Podobne ako deti, ktoré počas rokov postupne vidia obrovské množstvo obrazu spojeného so zvukom, sa aj testovaná umelá inteligencia musí popasovať s tým, že vidí len video, ktoré je navyše doplnené o titulky.
Akonáhle tak rôzne osoby na videu niečo hovoria, robia alebo vnímajú (vyše 400 testovacích videí), umelá inteligencia túto kombináciu spracuje a zároveň tak uloží aj kontext so slovami v titulkoch. Programátori nič ďalšie dopredu umelú inteligenciu nenaučili.
Oproti iným systémom učenia tak dochádza k absolútne minimálnemu zásahu do učenia a korekcii, čo je porovnateľné práve s dieťaťom, ktoré väčšinu času len pozoruje a počúva bez toho, aby ho okolití ľudia nejako špeciálne učili. Výsledkom bolo, že "sentence tracker" potom dokázal na videu rozpoznať napríklad udalosť "žena, ktorá zdvíha jablko" a ďalšie podobné akcie.
Vďaka tomu sa umelá inteligencia dokáže podobne ako dieťa naučiť rôzne nuansy jazyka daného okolia, takže podľa dostupných materiálov v podobe videa sa môže meniť aj reč a štýl hovoru.
Čau kámo
Systém je veľmi dobrou ukážkou nielen na učenie jazyka od úplného začiatku, ale aj prispôsobenie v inom okolí. Ako typický príklad sa dá predstaviť to, že budúce roboty a umelé inteligencie sa budú vyskytovať na rôznych miestach, v rôznych rodinách a podobne.
Aby ich pozícia na danom mieste alebo v rodine bola čo najprirodzenejšia, musia sa naučiť trochu iný štýl jazyka, jeho použitie a vnímanie kontextu podľa nových pravidiel. S tým súvisí aj nový systém obvyklého vyjadrovania pri pozdrave a ďalších činnostiach, v pokročilejších štádiách napríklad aj vtipoch a interakcii s jednotlivými ľuďmi zvlášť. Práve prispôsobiteľnosť podľa pozorovania videa (obrazu) je kľúčovou technológiou nového systému učenia jazyka.
Porozumenie učenia jazyka
Nový systém tiež poodkrýva rúško toho, ako v ľudskom mozgu prebieha učenie jazyka už v ranom veku. V prípade človeka ale pochopiteľne nejde len o pasívne video s titulkami, ale o neustály interaktívny prísun informácií ako z očí, tak z uší, ktorý je doplnený aj množstvom komplexného dodatočného vnímania napríklad emócie a ďalšie jemné variácie, ktoré sú pre kontext tiež dôležité.
Je jasné, že budúce systémy budú s týmito dodatočnými informáciami počítať a budú sa tak učiť aj tieto jemné informácie, ktoré sú dôležité pri komunikácii medzi ľuďmi. V ďalšej fáze chcú vedci systém posunúť smerom k väčšej interaktivite a zase tak o niečo priblížiť systém k tomu, ako funguje detský mozog v reálnom svete.
Nový systém umelej inteligencie sa zvládne naučiť šoférovať auto za 20 minút
Umelá inteligencia v autách sa nemusí spoliehať len na predtrénované dáta. Nový systém umožní naučiť sa všetko potrebné rýchlo a jednoducho. Stačí niekoľko opakovaní a ľudského učenia.