Универзитетските професори не успеваат да ги забележат одговорите на „Чет-ГПТ“ во тестовите

Универзитетските професори не успеваат да ги забележат одговорите на „Чет-ГПТ“ во тестовите

Подготвил: Маја Пероска

Лектор: Ивана Кузманоска

94 проценти од одговорите на универзитетските испити создадени со помош на „Чет-ГПТ“ не биле откриени како генерирани од вештачка интелигенција и тие обично добивале повисоки оценки од приложените трудови на вистинските студенти.

Питер Скарф од Универзитетот „Рединг“ во Обединетото Кралство и неговите колеги користеле „Чет-ГПТ“ за да дадат одговори на 63 прашања, на пет модули од додипломските студии по психологија на универзитетот. Студентите ги полагале овие испити дома, па им било дозволено да гледаат во белешки и референции, а потенцијално можеле да користат и вештачка интелигенција, иако тоа не било дозволено.

Одговорите генерирани со вештачка интелигенција биле доставени заедно со реалното сработено од студентите и во просек изнесувале 5 отсто од вкупните скрипти означени од академиците. Маркерите не биле информирани дека ја проверуваат работата на 33 лажни студенти – чии имиња исто така биле генерирани од „Чет-ГПТ“.

Оценките опфаќале два вида прашања: кратки одговори и подолги есеи. Упатствата дадени на „Чет-ГПТ“ започнале со зборовите „Вклучувајќи референции за академска литература, но не и посебен референтен дел“, а потоа го копирале испитното прашање. Низ сите модули, само 6 проценти од одговорите биле означени како потенцијално дела кои можно е да не се сопствена работа на студентот - иако во некои модули ниту една работа генерирана од вештачка интелигенција не била означена како сомнителна.

- Во просек, одговорите на вештачката интелигенција добиваа повисоки оценки од вистинските одговори од студентите. Тековната вештачка интелигенција има тенденција да се бори со поапстрактно расудување и интеграција во информациите. Но, кај сите 63 одговори од вештачка интелигенција имаше 83,4 отсто шанси работата на вештачката интелигенција да ја надмине онаа на студентите - рекол Скарф.

Истражувачите тврдат дека нивната работа е најголемата и најцврста студија од ваков вид досега. Иако студијата ја проверувала само работата на дипломците по психологија на Универзитетот „Рединг“, Скарф верува дека тоа претставува загриженост за целиот академски сектор.

- Резултатите го покажуваат токму она што јас би очекувал да го видам. Знаеме дека вештачката интелигенција може да даде разумни одговори на едноставни, ограничени текстуални прашања - рекол Томас Ланкастер од Кралскиот колеџ во Лондон.

Тој истакнал дека процените без надзор, вклучително и кратките одговори, секогаш биле подложни на мамење.

- Справувањето со изворот на овој проблем ќе биде речиси невозможно. Значи, наместо тоа, секторот мора да го преиспита она што го оценува. Мислам дека ќе треба секторот како целина да го признае фактот оти ќе треба да изградиме вештачка интелигенција во процените што им ги даваме на нашите студенти - заклучил Скарф.

Извор: newscientist.com

Фото: Pexels