Naravno da ako Google i počne kažnjavati rangiranjem stranice generirane AI alatima da će uvijek postojat cake da se to zaobiđe kao i uvijek. Ljudi smo, prilagodit ćemo se
Samo kažem što je u najavi i da postoji mogućnost da će mnoge stranice tako rangirane biti kažnjene. Zato bi bilo dobro prepraviti te AI textove da probamo proći neokrznuto.
Danas sam vidio i to je sigurno točno, da npr. ChatGPT sam namjerno ostavlja tragove kako bi kasnije prepoznao svoj tekst, pa čak i ako ga se izmijeni, da opet može prepoznati da je izmijenjen. Naravno, razlog nije detekcija od strane Google-a već ovo:
Kada AI shvati da čita nekakav AI tekst, znači da iz tog teksta nema ništa novo za naučiti
Kada shvati da čita članak napisan od strane čovjeka, znat će da iz njega može nešto naučiti…
Meni ovo totalno drži vodu, i vjerujem da je tako.
Al ne igra mu to ulogu jer svakako ne cita taj sadrzaj ako je na netu, a u porukama na chatu pamti sadrzaj samo do odredjenog broja rijeci (zbog ustede zbog manjka infrastrukture)
Nema sta ChatGPT da ostavlja u svom tekstu da bi sam sebe prepoznao, niti daje uvijek unikatne odgovore (cesto se ponavlja), moze zapamtiti tekst koji je dao (ako bi kasnije trebalo) ali tu je puko gubljenje resursa, jer mu je (pricam o openAI modelu, chatgpt je samo chatbot) sigurno lakse procitat clanak, nego procitat dio i onda uporedjivait nesto i racunati da li da ga cita do kraja.
Eto vi tvrdite da ostavlja tragove da sam sebe prepozna u buducnosti. Sta su ti tragovi u ovim tekstovima?
Jedno je sposobnost s visokom tacnosti odrediti da li je tekst AI (i da li ce ga citati, to bi vec sad lagano mogao uraditi, a mozda vec to i rade) a posve drugo da namjerno nesto ostavlja a i ovako cesto ne moze povatati svi i dati dobre odgovore
To nebi radilo …jer bi male izmjene u tekstu uništile takav trag. Osim toga, sa strane resursa bi to bio loš pristup.
Kakav trag moze ostaviti?
Pa semantički trag. U semantici postoji sigurno jako puno načina da se kaže ista stvar … a te semantičke varijacije su za njega broj. Tako da on odabirom kombinacija stila pisanja može ugraditi nevidljivi password u tekst…i to na više mjesta u tekst. Slično kao što QR code pohranjuje informaciju na više mjesta i tako je robusan na uništenje.
Takav tekst i ako se dosta izmjeni, AI opet može prepoznati da je njegov.
Bez problema se može ostaviti trag u tekstu. Tekst se može skroz promiješati, zamijeniti riječi sinonimima, ubaciti hrpa dodatnog teksta itd., ali ako se ne pogodi i promijeni jedan nano dio teksta, trag ostaje. Ja to u nekim slučajevima prakticiram već godinama, a niti sam programer niti neki stručnjak iz tog područja, jednostavno mi je pao napamet način. Mogu mislit što onda tek mogu isprogramirati ovi iz OpenAI, Googlea itd. Onaj tko ima “ključ” bez problema kasnije uz sve navedene promjene teksta utvrdi da je tekst recimo od AI. Ako će OpenAI surađivati sa Googleom, onda će Google imati ključ, tj. Googleov algoritam će moći prepoznati sajtove sa AI tekstom.
O penalima je rano pričati. Za sada nisu penalizirani niti svi oni spam sajtovi koji daju loše prevedeni sadržaj.
…osim kad se izmjeni taj dio gdje kombinacija, i onda se opet vratis na isto. On trenutno ne moze napraviti u bulku velik broj tekstove gdje vise od 10% nece biti relativno lako prepoznano kao AI, koliko bi mu tek onda bilo komplikovano da jos dodaje takve kombinacije.
Na kraju krajeva, postavlja se logicno pitanje- zasto bi radio ista od toga, kad on sam vjerovatno moze vrlo dobor prepoznati AI tekst. Imali smo gore primjer onog alata sto je pravljen za gpt2, a fino tera i ovdje, i sa nekih 90%+ se moze vidjeti da je AI (rekao bih i vise, ali nisam siguran zbog strucnih tekstova). Znaci daleko jednostavnije, bez ikakvog komplikovanja
Ima primjera gdje su se zauzele top pozicije sa jakom konkurencijom samo sa AI contentom, a i sam google je rekao da AI content nece biti ni u kojem smislu sankcionisan ako je taj clanak koristan za krajnjeg korisnika.
Kombinacija nije nešto lokalizirano na nekom dijelu teksta. Nego nešto što prožima posebno cijeli tekst, posebno rečenice , posebno paragraphe. Ako sve to izmeniš, onda niti nemaš više isti tekst.
Na kraju krajeva …to njemu nije nikakav kritični problem ako mu se desi da ne prepozna svoj tekst. Nema tu nekakav red-flag da on to mora sa 100% točnosti znati. Ali za svaki koji prepozna, štedi mu vrijeme ako zna da je on sam autor tog teksta.
Ne vidim zašto bi to bila neka extra komplikacija.
A po čemu ga prepoznaje, nego upravo po tim nekim značajkama koje AI stil pisanja ostavlja unutra?
Mi sada samo gruntamo hoće li taj stil pisanja biti samo naknadno prepoznat od trećih alata (i njega samoga) ili će biti svjesno ugrađen i jasno determiniran i poznat njemu koji piše tekst i koji bira taj određeni “stil” pisanja.
No ako se taj stil može naknadno prepoznavati od strane trećih alata, onda bi nekako trebalo biti logično da on sam sebi može olakšati prepoznavanje svog teksta … unaprijed poznavanjem pravila koje koristi i koje kasnije odgonetava/prepoznaje u analiziranom tekstu.
gledo sam i sa jednim i sa drugim, i cudno bi bas da ovaj tekst sto gledam nema nigdje… mada ako je tako, onda odlicno
Bukvalno sam o ovome pisao gore. Ogromna je razlika ako AI radi na odredjen nacin koji dovodi do toga da ga je relativno lagano prepoznati, a posve druga stvar da AI ostavlja sam sebi neke tragove kao sto ste pricali gore. I od toga, ti citiras nesto posve drugo i opet pricas isto
Znaci opet mjenjas teze, nije tvrdjeno da se ne moze tekst prepoznati (bukvalno cijeli topic pricam o tome kako se moze prepoznati), nego si tvrdio da se namjerno ostavljaju stvari za prepoznavanje sto je suludo