„Чет-ГПТ“ измислува: 79 отсто од податоците неточни на тест за општо знаење

18.05.2025 Технологија

„Чет-ГПТ“ измислува: 79 отсто од податоците неточни на тест за општо знаење

Низ историјата секогаш постоеле брилијантни, но несигурни луѓе. Сега истата аналогија сè почесто се користи за вештачката интелигенција. Според истражување на компанијата „Опен АИ“, најновите модели на „Чет-ГПТ“ и понатаму „халуцинираат“, односно измислуваат факти и тоа во загрижувачки обем.

Новите модели создаваат нови проблеми

Моделите „ГПТ-о3“ и „ГПТ-о4-мини“ беа замислени како напредни алатки што ќе ја имитираат човечката логика. За разлика од претходните генерации кои се фокусираа на течно генерирање текст, овие модели треба да „размислуваат чекор по чекор“. „Опен АИ“ дури тврдеше дека „ГПТ-о3“ може да се натпреварува со докторанди по хемија, биологија и математика.

Но, извештајот на компанијата открива сериозен проблем: „ГПТ-о3“ измислувал информации во дури една третина од задачите поврзани со јавни личности, двојно повеќе од претходниот модел, „ГПТ-о1“. Уште полош е „ГПТ-о4-мини“, кој измислувал во 48 отсто од истите задачи.

На тест за општо знаење (SimpleQA), „ГПТ-о3“ измислил 51 отсто од информациите, а „ГПТ-о4-мини“ дури 79 отсто. Тоа не се мали грешки, туку сериозна криза на доверба. Ако модел кој тврди дека е „разумен“ не проверува што кажува, туку слободно фантазира, тогаш станува опасен, а не корисен.

Повеќе размислување не значи поголема точност

Во заедницата што се занимава со вештачка интелигенција се појави теорија дека колку повеќе еден модел „размислува“, толку повеќе можности има да згреши. За разлика од поедноставните верзии што се држат до проверени факти, новите модели се впуштаат во поврзување далечни идеи, што често значи и измислување.

Од „Опен АИ“ за „Тајмс“ изјавиле дека зголемениот број измислици не мора да значи дека моделот е лош, туку дека едноставно „одговара подетално и послободно“.

Бидејќи новите модели се охрабруваат да шпекулираат, границата меѓу претпоставка и фактичка точност станува сè помаглива. Некои од „можните“ сценарија што ги нуди Чет-ГПТ немаат никаква врска со реалноста, но сепак звучат уверливо.

Ова е спротивно на целите на „Опен АИ“, како и на конкурентите како „Гугл“ и „Антропик“. Кога ќе се нарече некој модел на вештачката интелигенција „помошник“ или „копилот“, се претпоставува дека е безбеден и корисен. Но, веќе имаше случаи каде што адвокати користеле „Чет-ГПТ“ и во поднесоците приложиле целосно измислени судски случаи.

Колку е покорисен, толку има помалку простор за грешки

Со проширувањето на употребата на вештачката интелигенција во училници, канцеларии, болници и администрација, штетата од измислени информации може да биде огромна. „Чет-ГПТ“ навистина може да помогне при пишување барања за работа или анализа на податоци, но колку е поупотреблив, толку е поважно да не греши.

Не можете да му заштедите време на некој ако тој потоа мора да проверува сè до последен збор. Проблемот не е што моделот не е импресивен, „ГПТ-о3“ покажал одлични способности за кодирање и логика, туку тоа што понекогаш решава да ви каже дека вода врие на 27 °C или дека Абрахам Линколн водел поткаст.

Додека не се решат овие проблеми, секој одговор од моделите на вештачката интелигенција, па и од „Чет-ГПТ“, треба да се прима со голема доза на резерва. Како што заклучува извештајот: понекогаш „Чет-ГПТ“ е како личност со преголема самодоверба што зборува глупости.

Извор: Index.hr
Фото: Freepik

Подготвил: Тамара Гроздановски

Тагови:

„Чет-ГПТ“ измислува: 79 отсто од податоците неточни на тест за општо знаење

Популарно

Научниците откриле трик што ги отклучува изгубените спомени

Истражувачи тврдат дека ова е најштетната социјална мрежа

Михаил Стојковски има 14 години и е прв Македонец со шампионска титула на „Алпе Адриа мотокрос шампионатот“: „Мој идол е татко ми“

Во свет оптоварен со технологија, науката покажува дека на мозокот му треба работа со раце

Зборувањето повеќе јазици може да го забави стареењето на мозокот

Луѓето родени во овој месец живеат значително подолго, потврдува науката

Легендата за хемотерапијата: Не, на тетката не ѝ е подобро од гоџи-бобинките

Кина го преплавува светот со автомобили на бензин што не може да ги продаде дома

Си-ен-ен: Македонија - земјата на југот од Европа со вкусна храна и убаво вино која не е преплавена од туристи

Новиот тест на крвта што открива рак крие загрижувачки проблем

Еден од најстарите лекови за крвен притисок може да го запре и агресивниот раст на тумор на мозокот

Утринска навика што предизвикува најмногу срцеви удари во првите 10 минути по будењето

2.200 евра плата, бесплатна храна и сместување, но никој не се пријавува: Австрија се соочува со недостиг на работници

Луѓето родени во овој месец живеат значително подолго, потврдува науката

Техниката на д-р Веил со која ќе заспиете за само 60 секунди

Издвојуваме

Кога бев студент со Снежана Лупевска: „Омилена професорка ни беше сегашната претседателка Гордана Сиљановска-Давкова“

Театрите надвор од Скопје немаат свои објекти и се борат за термини - Кумановскиот се реновира од 2021, Струмичкиот се гради веќе 11 години

Во 4 кујни во средното училиште „Лазар Танев“ учениците спремаат кетеринг и за над 1.000 гости: „Формиравме компанија и работиме по светски стандарди“

Бројот на новороденчиња е во сериозен пад, без стратегии за подобрување на условите за живот ќе дојде до затворање на училишта, предупредуваат експертите

Слични вести од Fakulteti.mk

Како да слушате видеа на Youtube во позадина на Аndroid платформа?

Внимавајте: Хакерите ги користат торентите од серијата „Игра на троновите“ за да ви ги нападнат компјутерите

Првиот модуларен робот кој можете да го направите сами

Научници ќе спојуваат мозочни клетки со вештачка интелигенција

Иднината на земјоделието и технологијата според Бил Гејтс

Научниците објаснуваат зошто интернетот не` прави поглупави

Милениумците може да се изнервираат за само една минута ако интернетот им е бавен

Фејсбук најавува нови промени со кои ќе го подобри човештвото

Краток тест за креативност осмислен од психолог од „Харвард“

Заборавена опција на „Фејсбук“, претставена уште во 2004 година, повторно станува популарна

Технологија

Истражувачи тврдат дека ова е најштетната социјална мрежа

Кој телефон има најбрз безжичен пренос на податоци

Дали може вештачката интелигенција да биде харизматична?

Како недовршените игри ја променија гејмерската индустрија

Дали е сеедно кој ХДМИ влез на вашиот телевизор го користите