X
 09.07.2019 Живот

Вештачката интелигенција ќе може да преведува одамна загубени јазици

Британскиот археолог Артур Еванс во 1886 година нашол древен камен со необични знаци на непознат јазик. Каменот бил од Крит, а Еванс веднаш се фрлил во потрага по информации што би му помогнале во дешифрирањето.

Набрзо нашол камења и плочки со слични записи, кои датирале од 1400 година пред новата ера. Според тоа, тие записи би биле меѓу најстарите дотогаш откриени. Еванс бил убеден дека линеарниот облик на тоа писмо е развиен од слики што ѝ припаѓаат на раната доба од уметноста.

Подоцна било утврдено дека станува збор за две различни писма. Едното од нив (линеар А) потекнувало од периодот меѓу 1800 и 1400 година пр.н.е., а другото (линеар Б) е помладо и се јавува дури по 1400 година пр.н.е.

Еванс и други истражувачи со години безуспешно се обидувале да ги дешифрираат древните записи. Проблемот е делумно решен дури во 1953 година, кога Мајкл Вентрис, лингвист-аматер, го дешифрирал линеарот Б. Тоа го направил врз основа на две клучни постигнувања. Прво, Вентрис претпоставил дека голем број зборови во линеарот Б кои се повторуваат претставуваат имиња на локации на Крит, што се покажало како точно. Потоа тој претпоставил дека јазикот кој се обидува да го дешифрира е ран облик на древен грчки јазик.

Тоа било огромен напредок, но едниот линеар останал загатка до ден-денес. Сега со него би можела да се позанимава вештачката интелигенција, потпирајќи се на напредоците во подрачјето на машинското учење.

Тоа подрачје веќе донесе голем напредок во лингвистиката бидејќи овозможи машинско читање и усвојување на огромни бази податоци. Благодарение на тоа, меѓу другото, денес имаме автоматски машински превод од еден јазик на друг. Не е сосема совршен, но отвора врата кон сосема нов поглед на јазикот.

Џијаминг Луо и Регина Барзилеј од МИТ и Јуан Као од лабораторијата за вештачка интелигенција од „Гугл“ развиле систем на машинско учење кој може да дешифрира одамна изгубени јазици и тие тоа го демонстрирале така што направиле машината да го дешифрира линеарот Б, што првпат е направено автоматски.

Притоа бил користен значително поразличен пристап од досегашниот. Имено, машинскиот превод се заснова на идејата дека зборовите се во меѓусебно сличен однос, без оглед за кој јазик станува збор. Така, процесот почнува со мапирање на тие односи специфични за одреден јазик, што бара огромни бази на податоци на текст.

Потоа машината пребарува текстови за да уочи колку често некој збор се појавува покрај друг друг. Тој образец на единствен начин го поставува зборот во просторот на повеќедимензионални параметри, со чија помош машината може да научи каде спаѓа зборот во преводот.

Притоа, за него важат едноставни правила, а реченицата може да ја разгледува како сет обрасци кои се следат во своевидно патување низ просторот. Клучниот увид кој овозможил машински превод било тоа што зборовите во разни јазици заземаат исти точки во нивните посебни простори, што овозможило мапирање на целиот јазик на друг.

За да биде возможен овој пристап, потребно е да се има огромни количини податоци. Но, пред неколку години  германски научници покажаа дека е можно да се остварат слични резултати со драстично помали бази на податоци. Трикот бил во различниот начин на ограничување на машините, така што да не се потпира на базата на податоци.

Луо и неговата екипа отишле чекор понатаму потпирајќи се на познатите начини на развој на јазик со текот на времето и претпоставката дека кој било јазик може да се менува само на одредени начини. Тој пристап го олеснува дешифрирањето на јазикот доколку изворниот јазик од кој е развиен е познат.

Тие пристапот го примениле на линеарот Б и на угаритски, ран облик на хебрејски јазик откриен во 1929 година. Машината успеала точно да преведе 67,3 отсто од линеарот.

Дали ќе успее да ја разреши и тајната на другиот линеар? Пред лингвистите има уште многу препреки пред тоа да стане можно. Новиот метод не може да биде употреблив додека не биде пронајден јазикот од кој настанал линеарот.

Но, голема предност на машинскиот превод е што може брзо да тестира јазици, а притоа да не се измори
Подготвил: Билјана Арсовска

Издвојуваме

Слични вести од Fakulteti.mk

Живот