X
 17.11.2025 Наша тема

„Не треба да водиме битка со вештачката интелигенција, туку треба да ја сметаме за сојузник затоа што е алатка“, вели Андријана Павлова од Институтот за македонски јазик

Имајќи предвид дека во светот се зборуваат околу 7.000 јазици, да се биде дел од овие модели е еден вид привилегија - ни сподели Андријана 

Во време кога технологијата сè повеќе го диктира ритамот на секојдневието, а вештачката интелигенција стана дел од нашите навики, се отвора прашањето како таа влијае врз македонскиот јазик? Сè повеќе луѓе се потпираат на Чет-ГПТ за пишување текстови, преводи, па и за толкување на литературни дела. Но, проблемите се јавуваат кога се прифаќаат неговите одговори без проверка, честопати полни со граматички грешки, несоодветен речник и неправилна употреба на македонскиот јазик.

Андријана Павлова, истражувачка од Институтот за македонски јазик, има работено на неколку труда поврзани со македонскиот јазик и вештачката интелигенција. Според неа, грешките се нормална и очекувана појава во секој развоен процес.

- Првите модели на Чет-ГПТ биле обучувани со многу помали количини на текстуални податоци, кои генерално биле на англиски јазик. Поради малиот број податоци и параметри (поставки што го контролираат и го оптимизираат јазичното однесување на моделот), овие модели имале ограничен капацитет за расудување и за следење на текот на информациите. Генерирале бесмислени содржини, кои се повторувале или, пак, се одликувале со пристрасност. За разлика од нив, првиот јавнодостапен модел на Чет-ГПТ, кој беше пуштен во употреба во ноември 2022 година, го привлече вниманието на светската јавност поради повеќејазичноста и способноста да следи инструкции и да дава одговори кои се поусогласени со нашите очекувања. Моделот опфаќа околу 100 јазици, вклучувајќи го и македонскиот. Имајќи предвид дека во светот се зборуваат околу 7.000 јазици, да се биде дел од овие модели е, сепак, еден вид привилегија - ни сподели Андријана.

Машинското учење потсетува на начинот на кој ние го усвојуваме мајчиниот јазик

- Кога моделот се соочува со недостиг на ресурси од одреден јазик, применува механизми за пренос на знаење од еден во друг јазик. Од тие причини во генерираните одговори се забележува пренос на структури од други јазици. Во суштина, овие невронски мрежи функционираат на сличен начин како што функционира и нашиот мозок, додека пак, процесот на машинско учење потсетува на начинот на кој ние го усвојуваме мајчиниот јазик и на начинот на кој учиме друг (странски) јазик - детално ни објаснува нашата соговорничка.


Андријана Павлова/ фото: приватна архива

Клучна улога во развојот и во напредокот на големите јазични модели одиграле процесот на фино нагодување и засиленото учење преку повратни информации добиени од човек, т. е. преку фидбекот на евалуаторите на моделот.

- Во однос на македонскиот јазик, во одговорите на првиот голем повеќејазичен модел (GPT-3.5) забележувавме голем број грешки и појава на туѓа лексика или на структури преземени од други јазици. Исто така, се случуваше моделот да генерира одговори на англиски, на руски или на бугарски јазик наместо на македонски јазик. Причина за ова се ограничените ресурси за македонски јазик. Сепак, кај секој нареден сериски модел на Чет-ГПТ забележувавме подобрување и намалување на грешките од ваков вид. Тоа се должи и на поврзувањата на моделите со интернет-базата во реално време, како и на зголемувањето на ресурсите на македонски јазик во дигиталниот простор. Најновата верзија на Чет-ГПТ, но и Грок, Џемини и др. модели покажуваат импресивни резултати и во однос на генерирањето содржини на македонски јазик. Исто така, со создавањето специјализирани ГПТ-модели и со нивното дополнително обучување со податоци на македонски јазик можеме да постигнеме подобри и попрецизни резултати. Овој процес е едноставен и не бара инженерски познавања. Лично, за целите на своите истражувања, имам направено неколку вакви модели: Граматика на македонскиот јазик, Правопис, Вицко итн., кои при тестирањата покажаа многу подобри резултати од основниот модел - ни споделува Андријана Павлова.

Јазичните модели и машинските преведувачи можат да ни бидат корисна алатка за зачувување и за промоција на јазикот

- Немањето преводи и титли поттикна процес на директно заемање или на калкирање зборови и фрази од англискиот јазик. Како резултат на тоа забележуваме прекумерна употреба, па дури и замена на постојните зборови со англизми. Големите јазични модели и машинските преведувачи, во суштина, можат да ни бидат корисна алатка за зачувување и за промоција на јазикот. За разлика од порано, со напредокот во областа на вештачката интелигенција значително се забрза, но и се подобри процесот на преведување и на локализирање на содржините. Алатките базирани на вештачка интелигенција овозможуваат приспособување и дотерување на преводот. Тие можат да направат локализација, односно приспособување на текстот во согласност со културните и со јазичните специфики. На овој начин се овозможува содржината да звучи поприродно, како да е создадена на целниот јазик. Се разбира, овие технологии сè уште се во развојна фаза и можат да прават грешки и/или да генерираат бесмислици и неточни податоци, па неопходно е генерираните содржини и автоматските преводи да се земаат со резерва, односно да бидат проверувани - посочува Андријана.

Според неа, ако сакаме да го зачуваме јазикот, неопходно е да читаме и да слушаме содржини на македонски јазик.

- Доколку сакаме да го зачуваме нашиот јазик и нашиот идентитет, неопходно е да твориме и да читаме на македонски јазик што е можно почесто. Машините можат да станат супериорни во обработката на податоци и во генерирањето содржини, но никогаш нема да можат да го заменат човекот. Човекот е словесно битие, со развиена свест и совест, за кого јазикот има смисла и цел. Машините се само статистички и веројатносни модели, кои се создадени да го имитираат човековото однесување. Останува отворено прашањето дали човештвото е спремно да ги користи овие алатки паметно, без да ги злоупотребува. Тоа зависи од сите нас и од нашите морални и духовни вредности - подвлекува Андријана.

Треба да се бориме против мрзливоста

Симон Саздов, професор на Филолошки факултет „Блаже Конески“, исто така, смета дека не треба да водиме битка со вештачката интелигенција. Напротив, треба да ја сметаме за сојузник затоа што е алатка, а она што нам ни останува е да научиме соодветно да ја користиме.


Проф. Симон Саздов/фото: Филолошки факултет

- Дури во однос на прашањето во контекст на зачувувањето на македонскиот јазик во време на вештачка интелигенција сметам дека е доволно со програмирачка постапка само да се ограничи употребата на зборовите од туѓо потекло, односно да им се дава предност на нивните соодветници од домашно потекло, па да забележиме дека вештачката интелигенција може и да го афирмира македонскиот јазик, односно да го издигне рамништето на неговата употреба. Дека виртуелните соговорници не се безгрешни, не би требало да има дилема. Тоа, впрочем, со мали букви го пишува кај нив. Во врска со тоа, може да се заклучи дека не треба беспоговорно да се зема сето она што ќе ни го каже виртуелниот соговорник. Еве едно недамнешно искуство. Некој ми обрна внимание дека еден од виртуелните соговорници напишал дека Европска унија на стандарден македонски јазик се пишува со мало почетно у, што не е точно. Имајќи го бесплатно достапен македонскиот Правопис во електронска форма, ние таму треба да го провериме точното пишување, а не да ги прашуваме виртуелните соговорници, кои, гледаме, можат и да згрешат. Она против што, веројатно, треба да се бориме е мрзливоста, површноста на многумина во денешно време - изјави професорот Симон Саздов. 

Оваа содржина е заштитена со авторски права. Фотографиите се од сопствени извори или од платени сервиси. Секоја употреба, копирање, преземање, репродукција или дистрибуција, целосна или делумна, без претходна писмена дозвола од редакцијата, е строго забранета и подлежи на законска одговорност. Бесплатно преземање е можно само на првата третина од текстот, со јасно наведен извор и линк до изворниот текст во првата реченица. Факултети.мк ги почитува професионалните/етичките стандарди, Кодексот на новинарите и Принципите на Меѓународната федерација на новинарите.
Подготвил: Сања Јачевска

Издвојуваме

Слични вести од Fakulteti.mk

Наша тема