Hogyan segíthetnek a hallucinációk a mesterséges intelligencia jobb megértésében

Tartalomjegyzék:

Hogyan segíthetnek a hallucinációk a mesterséges intelligencia jobb megértésében
Hogyan segíthetnek a hallucinációk a mesterséges intelligencia jobb megértésében
Anonim

A legfontosabb elvitelek

  • Egy új gépi tanulási modell hallucinálja a mondat megjelenésének képét egy nyelven, hogy segítse a fordítást.
  • A VALHALLA nevű mesterséges intelligencia rendszert úgy tervezték, hogy utánozza azt, ahogyan az emberek felfogják a nyelvet.
  • Az új rendszer egy növekvő mozgalom része, amely a mesterséges intelligencia használatát célozza a nyelv megértésére.
Image
Image

A szavak fordítása közbeni képek megjelenítésének emberi módszere segíthet a mesterséges intelligenciának (AI) jobban megérteni Önt.

Egy új gépi tanulási modell azt a képet hallucinálja, hogyan néz ki egy mondat egy nyelven. Egy friss kutatás szerint a technika ezután vizualizációt és egyéb nyomokat használ a fordítás segítésére. Ez egy egyre növekvő mozgalom része, hogy mesterséges intelligenciát használjunk a nyelv megértésére.

"Az, ahogy az emberek beszélnek és írnak, egyedülálló, mert mindannyiunknak némileg eltérő a hangja és stílusa" - mondta Beth Cudney, a Maryville Egyetem adatelemző professzora, aki nem vett részt a kutatásban a Lifewire-nek adott e-mailes interjújában.. "A kontextus megértése nehéz, mert olyan, mint a strukturálatlan adatok kezelése. Itt hasznos a természetes nyelvi feldolgozás (NLP). Az NLP a mesterséges intelligencia egyik ága, amely a gépi olvasás-megértés segítségével kezeli a kommunikációnk különbségeit. A legfontosabb különbség az NLP-ben, mint a mesterséges intelligencia egyik ága, nem csupán az általunk kimondott vagy írt szavak szó szerinti jelentésére összpontosít, hanem a jelentésére összpontosít."

Kérdezze meg Alice-t

Az MIT, az IBM és a San Diego-i Kaliforniai Egyetem kutatói által megalkotott új MI-rendszert, a VALHALLA-t úgy tervezték, hogy utánozza azt, ahogyan az emberek felfogják a nyelvet. A tudósok szerint az érzékszervi információk, például a multimédia, új és ismeretlen szavakkal, például a képekkel ellátott kártyákkal párosított használata javítja a nyelvelsajátítást és -megtartást.

Ezek a rendszerek növelik a chatbotok erejét, amelyek jelenleg csak képzettek és képesek konkrét beszélgetésekre…

A csapat azt állítja, hogy módszerük javítja a gépi fordítás pontosságát a csak szöveges fordításhoz képest. A tudósok két transzformátorral rendelkező kódoló-dekódoló architektúrát használtak, egyfajta neurális hálózati modellt, amely alkalmas a szekvenciafüggő adatokhoz, például a nyelvhez, amely képes figyelni a kulcsszavakra és a mondat szemantikájára. Az egyik transzformátor vizuális hallucinációt generál, a másik pedig multimodális transzformációt hajt végre az első transzformátor kimenetei segítségével.

"Valós forgatókönyvek esetén előfordulhat, hogy nincs képed a forrásmondatról" - mondta Rameswar Panda, a kutatócsoport egyik tagja egy sajtóközleményben. "Tehát a motivációnk alapvetően a következő volt: Ahelyett, hogy külső képet használnánk a következtetés során bemenetként, használhatunk-e vizuális hallucinációt – a vizuális jelenetek elképzelésének képességét - a gépi fordítási rendszerek javítására?"

AI Megértés

Jelentős kutatások összpontosulnak az NLP fejlesztésére, mutatott rá Cudney. Például Elon Musk társalapítója volt az Open AI-nak, amely a GPT-3-on dolgozik, egy olyan modellen, amely képes az emberrel társalogni, és elég hozzáértő ahhoz, hogy Pythonban és Java nyelven szoftverkódokat generáljon.

A Google és a Meta a LAMDA nevű rendszerükkel társalgási mesterséges intelligencia fejlesztésén is dolgozik. "Ezek a rendszerek növelik a chatbotok erejét, amelyek jelenleg csak képzettek és képesek konkrét beszélgetésekre, ami valószínűleg megváltoztatja az ügyfélszolgálat és az ügyfélszolgálat arculatát" - mondta Cudney.

Aaron Sloman, a CLIPr, egy mesterséges intelligencia-technológiai vállalat társalapítója egy e-mailben azt mondta, hogy az olyan nagy nyelvi modellek, mint a GPT-3, nagyon kevés gyakorlati példából tanulhatnak, és javíthatják az emberi visszajelzéseken alapuló szövegösszegzéseket. Például azt mondta, hogy egy nagy nyelvi modellnek megadhat egy matematikai feladatot, és megkérheti az AI-t, hogy gondolkodjon lépésről lépésre.

"Arra számíthatunk, hogy a nagy nyelvi modellekből nagyobb betekintést és érvelést nyerünk, ahogy többet megtudunk képességeikről és korlátairól" - tette hozzá Sloman. "Arra is számítok, hogy ezek a nyelvi modellek több emberszerű folyamatot hoznak létre, miközben a modellezők jobb módszereket dolgoznak ki a modellek finomhangolására az érdeklődésre számot tartó feladatokhoz."

A Georgia Tech számítástechnika professzora, Diyi Yang egy e-mailes interjúban azt jósolta, hogy a természetes nyelvi feldolgozó (NLP) rendszereket mindennapi életünkben egyre többen fogják használni, kezdve az NLP-alapú személyre szabott asszisztensektől az e-mailekben és telefonhívásokban. hozzáértő párbeszédrendszerekhez az utazás vagy az egészségügy területén történő információkereséshez."Valamint tisztességes mesterséges intelligencia-rendszerek, amelyek felelősségteljesen és torzításmentesen képesek feladatokat végrehajtani és segíteni az embereket" - tette hozzá Yang.

Az óriási mesterséges intelligencia-modellek, amelyek több billió paramétert használnak, mint például a GPT-3 és a DeepText, továbbra is azon dolgoznak, hogy egyetlen modell legyen minden nyelvi alkalmazáshoz – jósolta Stephen Hage, a Dialexa gépi tanulási mérnöke egy e-mailes interjúban. Elmondta, hogy lesznek új típusú modellek is, amelyeket meghatározott felhasználási célokra, például hangutasításos online vásárlásra hoztak létre.

"Példa lehet egy vásárló, aki azt mondja: "Mutasd ezt a szemhéjfestéket éjkékben, több fényudvarral", hogy megmutassa ezt az árnyalatot a személy szemén, némileg szabályozva az alkalmazás módját" - tette hozzá Hage.

Ajánlott: