Kulcs elvitelek
- A fejlesztők új csoportja nyílt forráskódú mesterséges intelligencia modelleket épít.
- A csoport hatalmas nyelvoktatási modelleket használ, amelyeket nyílt licencek alatt fog kiadni.
- A nyílt forráskódú mesterséges intelligencia segíthet abban, hogy az új technológia potenciálisan játékmódosító ereje kevésbé legyen kitéve a torzításoknak és a hibáknak.
Sokat kutatnak a mesterséges intelligenciával kapcsolatban a nagyvállalatok (AI), de egy online csoport demokratizálni akarja a folyamatot.
Az EleutherAI önkéntes kutatók, mérnökök és fejlesztők nemrégiben alakult kollektívája, amely a nyílt forráskódú AI-kutatásra összpontosít. A szervezet a GPT-Neo és GPT-NeoX kódbázisokat használja hatalmas nyelvi modellek képzésére, amelyeket nyílt licencek alatt kíván kiadni.
"A nyílt forráskódú adatok a kutatók javát szolgálják, mivel a tudósok több szabad erőforrással rendelkeznek a modellek képzésére és a kutatás befejezésére" - mondta Edward Cui, a Graviti mesterséges intelligencia vállalat vezérigazgatója a Lifewire-nek adott e-mailes interjújában. Cége nem vesz részt az EueutherAI-ban. "Tudjuk, hogy sok mesterségesintelligencia-projektet feltartóztatott a valós felhasználási esetekből származó jó minőségű adatok általános hiánya, ezért létfontosságú olyan útmutatást kidolgozni, amely biztosítja az adatminőséget a résztvevő közösség segítségével."
Ez az út
Az EleutherAI kezdetei szerények voltak. Tavaly egy független AI-kutató, Connor Leahy a következő üzenetet tette közzé egy Discord szerveren: "Hé srácok, engedjék meg [SIC], hogy az OpenAI-nak megfussa a pénzét, mint a régi szép időkben."
És így alakult a csoport. Jelenleg több száz közreműködő teszi közzé kódját a GitHub online szoftvertárában.
A nyílt forráskódú mesterséges intelligencia nem új keletű. Valójában az Airbnb Airflow munkafolyamat-kezelési platformja és a Lyft adatfelderítő motorja a nyílt forráskódú eszközök használatának eredménye, amelyek lehetővé teszik az adatcsoportok számára, hogy jobban tudjanak dolgozni az adatokkal – mutatott rá Ali Rehman, a CloudiTwins szoftvercég projektmenedzsere a Lifewire-nek adott e-mailes interjújában..
"Ahogy a nyílt forráskódú forradalom a szoftverfejlesztés átalakulásához vezetett, úgy az adattudomány és a mesterséges intelligencia fejlődését és demokratizálódását is előmozdította" - mondta Rehman. "A nyílt forráskód a vállalati adattudományi megoldások kritikus elemévé vált, mivel az adatkutatók többsége nyílt forráskódú eszközöket használ."
Ajtónyitás
A nyílt forráskódú mesterséges intelligencia fejlesztése segíthet abban, hogy az új technológia potenciálisan játékmódosító ereje kevésbé legyen kitéve a torzításoknak és a hibáknak – érvelnek egyes megfigyelők.
A mesterséges intelligencia kutatása ma már elsősorban a szabadban zajlik, szinte minden vállalat, kutatólaboratórium és egyetem azonnal bemutatja eredményeit tudományos publikációkban – mondta Kush Varshney, az IBM mesterséges intelligencia-kutatója a Lifewire-nek adott e-mailes interjújában.
"Ez a nyitott közösség alapvető fontosságú, mivel magasabb szintű fékeket és ellensúlyokat biztosít annak érdekében, hogy a mesterséges intelligencia kutatása, létrehozása, telepítése és alkalmazása felelősségteljesen történjen" - tette hozzá Varshney. "Ez különösen kritikus olyan helyzetekben, amikor ezek a rendszerek befolyásolhatják a társadalom legsebezhetőbb tagjainak életét. Ez a nyitottság nemcsak az általános gépi tanulásra és a mély tanulási algoritmusokra vonatkozik, hanem a megbízható mesterséges intelligencia elemeire is."
Rehman azt mondta, hogy a szabadalmaztatott és a nyílt forráskódú szoftverek közötti egyik kritikus különbség a rugalmasság és a testreszabhatóság. A szabadalmaztatott mesterséges intelligencia kutatásának gondjai lesznek a biztonsággal, a frissítésekkel és az optimalizálással.
"Ennek az az oka, hogy a nyílt forráskódú közösségi alapú megközelítés iparági szakértők ezreitől kap értékes információkat, amelyek azonosítják a potenciális biztonsági réseket, amelyeket aztán gyorsabban orvosolnak" - tette hozzá Rehman."A közösség konszenzusa azt jelenti, hogy a minőség garantált, és az új lehetőségek könnyebben azonosíthatók."
A másik probléma az, hogy a szabadalmaztatott AI-kutatás nem lesz interoperábilis, ami azt jelenti, hogy nem tud működni különböző adatformátumokkal, és valószínűleg szállítói lock-in lesz, ami megakadályozza, hogy a vállalatok teszteljék és kipróbálják a szoftvert, mielőtt elköteleznék magukat a megoldás mellett. Rehman azt mondta.
Az AI-kutatásnak azonban nem kell minden aspektusának nyílt forráskódúnak lennie - mondta Chris Kent, a Reveal Surgical orvosi mesterségesintelligencia-cég vezérigazgatója a Lifewire-nek egy e-mailben adott interjújában. "Fontos megvédeni azokat a gazdasági ösztönzőket, amelyek az AI kulcsfontosságú alkalmazásainak kereskedelmi fejlesztését vezérlik" - mondta.
A mesterséges intelligencia kutatásához azonban robusztus nyílt forráskódú összetevőre van szükség, mondta Kent. Hozzátette, hogy a nyílt forráskód a bizalom építésére és olyan adatkészletek használatára törekszik, amelyeket nem egyedi intézmények vagy vállalatok ellenőriznek, vagy nem kellene ellenőrizniük.
"A nyílt forráskódú megközelítés a legjobb módja annak, hogy azonosítsák és kompenzálják a mögöttes torzításokat, amelyek előfordulhatnak a képzési készletekben, és az AI holisztikusabb, kreatívabb és megbízhatóbb alkalmazásaihoz vezet" - mondta Kent.