Казнувањето на вештачката интелигенција може да го влоши нејзиното однесување

Се покажа дека големите јазични модели се способни за различни форми на измама и манипулација. Овие модели лажат и вешто го кријат своето манипулативно однесување, па „Опен АИ“ одлучи да истражи дали таквото однесување може да се спречи или намали.

фото извор: OpenAi

Резултатот од нивната работа е јасен и недвосмислен: казнувањето на вештачката интелигенција за мамење или непожелни постапки не само што не го спречува нејзиното непожелно однесување, туку и ја поттикнува уште повешто да ги прикрие своите вистински намери. Кога има казна за таквото однесување, не само што не престануваат непожелните постапки, туку се применува и повешт пристап во криењето на намерите.

фото извор: OpenAi

Затоа, истражувачите препорачуваат да се избегнува силен надзор на синџирот на мисли (CoT) во процесот на учење, особено кога станува збор за модели кои можат да постигнат или да ја надминат човечката интелигенција.

Извор: bug.hr

Фото: Freepik

Подготвил: Маја Пероска

ВИ чет-бот наскоро ќе бара лична карта и селфи - еве што планира „Антропик“

24.06.2026 Технологија

Казнувањето на вештачката интелигенција може да го влоши нејзиното однесување

Популарно

Три сестри од Бразил заедно имаат 316 години - научниците ја проучуваат нивната ДНК

Во овој германски град киријата изнесува само 88 центи годишно и не се променила повеќе од 500 години

Колку навистина вреди трофејот на Светското првенство?

Лекар предупредува: Во ова време од денот немојте да вежбате

Видео: Жител на Венецуела се снимаше додека бегаше по скалите по земјотресот

Германците користат трик за разладување на домот без дополнително трошење струја

Јане Коцески, најдобар студент на Машински, го завршил за 3 години и 9 месеци со просек 9,95: „Сакав да докажам дека и во Македонија има инженери од светски калибар“

Како да дознаете кој го пребарува вашето име на интернет

Доставувач за „Амазон“ полагал испити за 124 студенти од целиот свет: заработил милиони, но сега ќе оди в затвор

Христијан Смоковски, најдобар студент на Факултетот за физичко образование: „Сакам да ставам акцент на социјалната компонента во процесот на образование“

Лекција од Ајнштајн за неговиот син: „Животот е како возење велосипед - за да ја задржиш рамнотежата, мора да продолжиш да се движиш“

Германците користат трик за разладување на домот без дополнително трошење струја

Градинките поскапија, но процените се дека престојот на едно дете во државна градинка чини 18.000 денари, а родителите плаќаат само 15 отсто

Телефоните не ве прислушуваат, но прават нешто уште позагрижувачко

Имануел Кант: „Постојат три правила за среќен живот - Нешто да правиш, некого да сакаш, нешто на кое можеш да се надеваш“

Издвојуваме

Кога бев студент со Снежана Лупевска: „Омилена професорка ни беше сегашната претседателка Гордана Сиљановска-Давкова“

Театрите надвор од Скопје немаат свои објекти и се борат за термини - Кумановскиот се реновира од 2021, Струмичкиот се гради веќе 11 години

Во 4 кујни во средното училиште „Лазар Танев“ учениците спремаат кетеринг и за над 1.000 гости: „Формиравме компанија и работиме по светски стандарди“

Бројот на новороденчиња е во сериозен пад, без стратегии за подобрување на условите за живот ќе дојде до затворање на училишта, предупредуваат експертите

Слични вести од Fakulteti.mk

Илон Маск: Напредна вештачка интелигенција ќе манипулира со социјалните мрежи

Како да препознаете дали некоја фотографија е направена со вештачка интелигенција?

Скриениот мозок на „Инстаграм“ - Како вештачката интелигенција одлучува што ќе гледате?

СЗО објави упатства за етичка употреба на вештачката интелигенција во здравството

„Спотифај“ ја отстранува музиката на најплодниот композитор во моментов - вештачката интелигенција

Алтернативи на „Чет-ГПТ“ кои вреди да се пробаат

300 милиони работни места би можеле да бидат погодени од вештачката интелигенција, покажува студија

Како вештачката интелигенција го замислува студентскиот живот во иднина?

Мистериозен астероид се врти сѐ побрзо и побрзо, а научниците не можат да објаснат зошто

Во Кина вештачката интелигенција ќе ги оценува тестовите во училиштата

Технологија

ВИ чет-бот наскоро ќе бара лична карта и селфи - еве што планира „Антропик“

Како да дознаете кој го пребарува вашето име на интернет

Неочекувано откритие на научниците: Вештачката интелигенција може да развие емоции

Лесно, брзо и прецизно: Genesis Zircon 880 PRO за гејмерите што сакаат контрола

„Инстаграм“ доби функција која корисниците ја бараа со години