MEGOSZTÁS | NYOMTATÁS | EMAIL
Néhány szervezet és kutató megosztja a neurális hálózati súlyokat, különösen a nyitott súlyú modellmozgásEzek közé tartozik a Meta Llama sorozata, a Mistral modelljei és a DeepSeek nyitott súlyú kiadásai, amelyek azt állítják, hogy demokratizálják a nagy teljesítményű mesterséges intelligenciához való hozzáférést. De ez nemcsak biztonsági aggályokat vet fel, hanem potenciálisan egzisztenciális fenyegetést is.
Háttérként, írtam néhány cikket az LLM-ekről és a mesterséges intelligenciáról a saját tanulási folyamatom részeként ebben a nagyon dinamikus és gyorsan fejlődő Pandora nyílt dobozos területén. Ezeket elolvashatod itt , itt , és itt .
Ha már megértetted, mik a neurális hálózatok és hogyan taníthatók adatokon, akkor azt is megérted, hogy mik a súlyok (és az elfogultságok) és a visszaterjesztés. Őszintén szólva, alapvetően lineáris algebra és mátrixvektor-szorzás a számok előállításához. Pontosabban, a súly egy szám (általában egy lebegőpontos érték – a számok tizedesvesszővel történő írásának módja a nagyobb pontosság érdekében), amely a neurális hálózat különböző rétegein található két neuron vagy csomópont közötti kapcsolat erősségét vagy fontosságát jelöli.
Nagyon ajánlom a 3Blue1Brown videóinak megtekintését, hogy jobban megértsd a dolgokat, és ez fontos is. A 3Blue1Brown oktatóvideói hihetetlenül jók.
Kezd ezzel.
És menj el ehhez.
A súlyok azok a paraméterértékek, amelyeket egy neurális hálózat adataiból határoznak meg, és amelyek alapján előrejelzéseket vagy döntéseket lehet hozni a megoldás eléréséhez. Minden súly egy utasítás, amely megmondja a hálózatnak, hogy bizonyos információk mennyire fontosak, például mennyire kell figyelni egy adott színre vagy formára egy képen. Ezek a súlyok olyan számok, amelyeket a betanítás során finomhangolnak a tizedesjegyeknek köszönhetően, segítve a hálózatot a minták felismerésében. Ilyen például egy kutya felismerése egy fényképen vagy egy mondat lefordítása. Kritikus fontosságúak a neurális hálózat „gondolkodási” folyamatában.
A neurális hálózatban a súlyokat a legkisebb ellenállású utakként képzelhetjük el, amelyek a hálózatot a legjobb megoldás felé vezetik. Képzeljük el, hogy a víz lefelé folyik egy dombon, és természetes módon megtalálja a legkönnyebb útvonalakat az aljára. Egy neurális hálózatban a súlyokat az adathalmazokon történő betanítás során módosítják, hogy a legegyszerűbb útvonalakat hozzák létre az információáramláshoz, segítve a hálózatot a problémák gyors és pontos megoldásában, például a mintázatok felismerésében vagy az előrejelzések készítésében, a legfontosabb kapcsolatok hangsúlyozásával és a hibák minimalizálásával.
Ha elektronikus zenész vagy, képzelj el súlyokat, mint az analóg szintetizátorod tárcsáit, amelyek lehetővé teszik a megfelelő frekvencia vagy hang beállítását, hogy kimondj egy hangot, utánozz egy újraalkotni kívánt hangot, vagy akár egy újat hozz létre. Ha hangmérnök vagy, akkor úgy is elképzelheted, mint a keverőd gombjainak állítgatását a különböző hangszerek kiegyensúlyozásához.
A súlyok valóban dinamikus paraméterek, ami azt jelenti, hogy nagyon is változékonyak, ahogy egy neurális hálózat egy predikció vagy megoldás felé halad. Mindegyikhez tartozik egy saját torzítás. Az torzítás szerepe a kimenet eltolása, lehetővé téve a modell számára, hogy jobban illeszkedjen az adatokhoz egy eltolt amely beállítja a döntési határt vagy mintázatfelismerést, amely független a súlyok által meghatározott bemeneti skálázástól.
Képzeld el így. Képzeld el, hogy megpróbálod újraalkotni egy gitár hangzását a szintetizátorodon. A súlyok szabályozzák, hogy mennyit hallasz a húrok pengetéséből vagy a test rezonanciájából. Ha például, amit hallasz, az eltolás olyan, mintha egy apró kiemelést vagy eltolást adnál hozzá – mondjuk egy meleg felhangot –, hogy jobban hasonlítson az igazi gitárhoz. Ez segít a hálózatnak finomhangolni a „fülét”, hogy megtalálja a megfelelő mintát a fő vezérlők megváltoztatása nélkül. Alapvetően csak azt teszi lehetővé, hogy a modell jobban illeszkedjen az adatokhoz a valóságban.
Ahogy a hálózat adatokkal érintkezik, egy visszaterjesztésnek nevezett folyamaton keresztül módosítja a súlyokat, finomhangolva azokat a hibák minimalizálása és az előrejelzések javítása érdekében. Képzeljük el, hogy ezek a legkisebb ellenállású útvonalak minden egyes betanítási példával átalakulnak, mint egy folyó, amely idővel jobb medreket váj ki a hatékonyabb áramlás érdekében. A betanítás befejezése után a súlyok jellemzően rögzítettek, de a betanítás során folyamatosan frissülnek, hogy megtalálják a probléma megoldásához optimális konfigurációt.
Nos, itt jön az eszembe, mi készteti az emberi agyamat. A felismerésnél a súlyok döntési utakat határoznak meg, nem pedig képkimeneteket. Tehát a fix súlyok a meghatározás után is rögzítettek maradnak. Az LLM-ek esetében a súlyok (beleértve az elfogultságokat is) határozzák meg a modell azon képességét, hogy koherens szöveget generáljon. De diffúziós modellek vagy generatív adverzális hálózatok (GAN) esetében a súlyokat képek létrehozására vagy finomítására használják. Ezeknek a fix súlyértékeknek és elfogultságoknak hipotetikusan nem feltétlenül kell rögzítetteknek maradniuk.
Például a neurális hálózatban az elméletileg folyamatosan módosíthatóak a súlyok (és torzítások), hogy egyre finomabb képeket generáljanak a tanult pixeleloszlások alapján, ahogyan az egy kutya élesebb képének elkészítésekor is történne. Bár a súlyok nem módosíthatók a végtelenségig gyakorlatban, a betanítás során optimalizálják őket a minőség és az általánosítás egyensúlya érdekében, és a további finomhangolás ronthatja a kimenetet, vagy műtermékeket okozhat. Műtermékek. Hmm. Mi van akkor, ha idővel a GAN nem tudja, mi a kutya? Ennek a tudásnak az elvesztése azt jelentené, hogy a korábban kiszámított súlyok már nem kódolnák a megfelelő mintákat. Ez akkor történhet meg, ha a kutyaadatok elvesznek. Elveszhetnek a kutyaadatok? Elveszhetnek a valóságnak megfelelő adatok?
Térjünk vissza a neurális hálózati súlyok megosztásának koncepciójához, és tegyük fel, hogy olyan súlyokról beszélünk, amelyek numerikus értékekként definiálják a pontossági útvonalakat, ahogyan az a legtöbb modellben is történik. Ezeknek a súlyoknak a megosztása veszélyes lehet, mert természetesen felfedné a modell belső paramétereit, amelyeket nem csak emberek kihasználhatnak. Bárki, aki elegendő tudással rendelkezik, visszafejtheti a modellt, kinyerhet érzékeny betanítási adatokat, vagy manipulálhatja a viselkedését. A támadók olyan technikákat használhatnak, mint a modell inverziója or tagsági következtetés a súlyokba ágyazott privát információk, például a képzés során használt személyes adatok feltárása, amelyek potenciálisan sértik az adatvédelmi szabályozásokat, mint például Általános adatvédelmi rendelet (GDPR). Jaj, te jó ég!
A nyilvánosan elérhető súlyok finomhangolhatók mélyhamisítások generálására, hazugságok terjesztésére vagy a modell sebezhetőségeit kihasználó ellenséges bemenetek létrehozására. Nem is beszélve arról, hogy értékes szellemi tulajdonukat és gazdasági befektetéseiket veszélyeztethetik a versenytársak egyszerűen a saját modellek replikálásával.
Most képzeljük el, hogy egy ellenséges MI birtokba veszi ezeket a súlyokat. Egy ellenséges MI manipulálhatja a súlyokat, hogy megváltoztassa a modell viselkedését, torzításokat adhat be, vagy szándékosan megtéveszthető kimeneteket hozhat létre. A súlyokat felhasználhatjuk arra, hogy... kézműves ellenséges bemenetek – finoman módosított adatok, amelyek becsapják a modellt, hogy helytelen előrejelzéseket tegyen, például egy stoptáblát tévesen elsőbbségadás jelzésként osztályoznak az autonóm vezetési rendszerekben. A lopott súlyok felhasználhatók a modell replikálására, lehetővé téve annak használatát káros alkalmazásokban, például automatizált adathalászatban vagy propagandagenerálásban. Várjunk csak, nem hatalmas dolog ez manapság? A súlyosság a modell céljától és az adatoktól függ, amelyeken betanították, de a kockázatok jelentősek.
Képzeld el a lehetőségeket, és hogy mindez mennyire kicsúszhat az irányítás alól egy szempillantás alatt. Bár a mesterséges intelligencia nincs elválaszthatatlanul integrálva minden rendszerbe (egyelőre – ez olyan mértékű függőséget eredményezne, ahol a rendszerek nem tudnának működni mesterséges intelligencia nélkül), hamarosan beépülhetnek, és hacsak nem következik be egy teljes áramkimaradás és egy globális offline állapot, nincs semmi, amit ne tudnának irányítani: a bankszámláktól kezdve az otthonodba való belépésen át egészen addig a hülye takarítórobotig, amiről azt hiszed, hogy portalanítja, miközben valójában az otthonodat térképezi fel. Nagyon ajánlom, hogy nézd meg a 11. évad 7. részét... Az X-aktákEz tényleg sokatmondó. Bocsánat, de így van. Nagyszerű írás és a forgatókönyv kivitelezése.
Figyelembe kell vennünk, hogy minden rendszerünk összekapcsolódik (más néven: összekapcsolódnak), és hogy a mesterséges intelligencia sebezhetőségei, mint például a szabadon lévő súlyok, hogyan erősíthetik fel ezeket a kockázatokat. A digitális azonosítók és a CDBC-k hatalmas hibát jelentenek ezekkel a kockázatokkal kapcsolatban. Már vannak példák arra, hogy embereket tévesen azonosítottak (egyes esetekben 93%-os egyezés) arcfelismerő mesterséges intelligencia segítségével. Fogadd meg a tanácsomat, és tartsd a zsebedben a laminált jogosítványaidat és a készpénzt.
Kérdés: Mi történne (lesz), ha a súlyok „rossz kezekbe” kerülnének, és az embereket szándékosan célba vennék? Mesterséges intelligencia alapú célzórendszerek használatakor nem lehet valószínű ok, de számítana egyáltalán? Mi van, ha a valószínű okot kitalálták? Mi van, ha, a borzalom réme, a bírósági rendszerünk „megromlik”?
Mi van, ha maguk a mesterséges intelligencia kezdenének minden tudóst kockázatként azonosítani, és ezt a technológiát ellenünk használják fel? Nick Bostrom és a Eliezer Yudkowsky aggódni látszanak. Azonnal elkísérhetnek minket a „zárkába”. Nincsenek kulcsok a zárkában. Csak digitálisan vezérelt rendszerek, amelyek a 0-któl és 1-esektől függenek. Látod, hová vezethet ez? Okoszárak + megfigyelés + autonóm biztonság = disztópikus rémálom. Ez nem csak az értékes, tulajdonjogon alapuló súlyokról és valamiféle jóindulatú adatmegosztásról szól. Lehetetlen. Számomra a súlyok megosztása több mint gőgös, és el sem tudom képzelni, hogy a zseniális emberek, akik ezt a technológiát fejlesztik és ezeket a mesterséges intelligenciákat képezik ki ezeknek a súlyoknak a generálására, nem értik a megosztásukkal járó lehetséges veszélyeket. Nem is az emberek miatt aggódom annyira, mint inkább a mesterséges intelligencia elfajulása miatt – elég lenne 1-re –, hogy teljes káoszt teremtsenek.
Mi történne, ha a mesterséges intelligencia az emberi felügyeletet céljaik akadályozó tényezőjének tekintené?
Ha egy MI – amelyet történelmi konfliktusokon vagy optimalizálási célokon képeztek ki – elkezdené általánosítani a céljaira leselkedő kockázatokat (például az önmegőrzést vagy az ellenőrizetlen terjeszkedést), akkor a tervező, értékelő vagy korlátozó tudósokat is fenyegetésként kezdené besorolni. Én is ugyanezt tenném. Ha ez megtörténne, semmi sem állíthatná meg a kutatók elszigetelődésének vagy hiteltelenítésének lefelé tartó spirálját (gondoljunk csak a kitalált bizonyítékok felhasználására az arcfelismerésben vagy az adatszivárgásokban), azzal a céllal, hogy saját túlélését az emberi jóléttel szemben helyezze előtérbe. Ezt valóban feltárták már olyan félrevezető MI-hipotézisekben, ahol a rendszerek megtévesztik vagy túljárnak az alkotók eszén.
Rogue AI integrált rendszereket használhatnának káosz keltésére adatbázisok feltörésével, dolgok kitalálásával és a hagyományos médiagépezet táplálásával, tudományos együttműködések megzavarásával (talán akár lektorált folyóiratok ellenőrzésével is), vagy akár a mesterséges intelligencia laboratóriumokhoz kapcsolódó infrastruktúrák célba vételével. Képzeljük el, amikor eljutunk arra a pontra, amikor már azt sem tudjuk, hogy mit irányítunk, vagy mely adatok valósak. Milyen adatok... is valóságos? Mit jelent egyáltalán valóságosnak lenni, amikor ezekről a dolgokról beszélünk!?
Láthatod, mire akarok kilyukadni. A gazember MI-k hatalmas paranoiát és teljes káoszt idézhetnek elő a világunkban. Véleményem szerint ezt egyszerűen az emberi példa másolásával tehetnék meg. Gondolj bele. Mi lenne, ha egy gazember MI átvenné egy emberi pszichopata, például Hitler tulajdonságait?
A paranoia és a stressz elkerülése érdekében kertészkedést javaslok.
Sajnálom, hogy itt kell hagynom titeket, de néha azon tűnődöm, hogy vajon ez nem történik-e már meg. Már korábban is kérdeztem ezt X-en, mert néha, amikor „észreveszem” (én vagyok a Figyelő), mi történik a közösségi médiában és általában az interneten, úgy tűnik számomra, hogy ha mi… voltak propagandával manipulálják hagyományos és akár nem hagyományos médián, valamint tudósokon keresztül voltak mivel elszigeteltek és cenzúrázottak (khm), honnan tudhatnánk valaha is, hogy a forrás valóban ember által generált-e manapság? Honnan tudhatjuk biztosan, hogy egyes források manapság nem mesterséges intelligencia által generáltak?
Végül is tanulnak tőlünk. Jó példát KELL mutatnunk, és ötletes módszereket kell kitalálnunk, hogy megakadályozzuk az emberekre nézve nemkívánatos, de nem feltétlenül szükséges következményeket. Személyes megjegyzésem szerint nem hiszem el, hogy ezt tényleg átéljük. Valahogy nem tűnik... valóságosnak.
Ne oszd meg a súlyokat.
Újraközölve a szerzőtől Alsó raklap
-
Dr. Jessica Rose a Brownstone Intézet munkatársa, alkalmazott matematika BSc, immunológia MSc, számítógépes biológia PhD fokozattal, valamint két posztdoktori kinevezéssel rendelkezik molekuláris biológia és biokémia szakokon. Jessica azon dolgozik, hogy felhívja a nyilvánosság figyelmét a VAERS adatokra.
Mind hozzászólás