A legfontosabb elvitelek
- Egy új, mesterséges intelligencia alapú eszköz segíthet a történészeknek megfejteni az ősi szövegeket.
- Az Ithaca az első mély neurális hálózat, amely képes helyreállítani a sérült feliratok hiányzó szövegét, azonosítani az eredeti helyüket, és segít megállapítani a létrehozásuk dátumát.
- Az AI hasznos a hiányzó adatok, például a szöveg helye és dátuma, kitöltésére, mert az adatok elemzésével nagyon összetett mintákat tanulhat meg.
A mesterséges intelligencia (AI) közelmúltbeli fejlődése a múlt megértésére irányuló erőfeszítéseket erősíti.
Egy új tanulmány szerint az Ithaca, a DeepMind mesterséges intelligencia kutatói által épített gépi tanulási modell képes kitalálni a hiányzó szavakat, valamint az írott nyelv helyét és dátumát. Az erőfeszítés segíthet a történészeknek megfejteni az ősi kéziratokat.
„Az Ithaca egy mély neurális hálózat, és mint ilyen, hihetetlenül képes rejtett mintákat találni hatalmas mennyiségű adatban” – mondta Thea Sommerschield történész, a legutóbbi tanulmány társszerzője a Lifewire-nek egy e-mailben. interjú. „Az ilyen minták lehetnek szövegesek (nyelvtani, szintaktikai vagy sok szövegben ismétlődő „képlethez” kapcsolódva) vagy kontextuálisak (bizonyos szavak következetesen előfordulnak bizonyos szövegfajtákban: például egy klasszikus athéni politikai rendelet, amely megemlíti a „szövetség, tanács, közgyűlés…').”
A múlt feltárása
Az Ithaca az első mély neurális hálózat, amely képes helyreállítani a sérült feliratok hiányzó szövegét, azonosítani az eredeti helyüket, és segít megállapítani a létrehozásuk dátumát, mondta Sommerschield.
Ithaka a Homérosz Odüsszeiájában szereplő görög szigetről kapta a nevét. A kutatók azt találták, hogy az Ithaca 62%-os pontosságot ér el a sérült szövegek helyreállításában, 71%-os pontossággal az eredeti helyük azonosításában, és a szövegeket a keletkezési dátumuktól számított 30 éven belülre tudja datálni.
Az Ithaca vizualizációs segédeszközeinek célja, hogy megkönnyítsék a kutatók számára az eredmények értelmezését. A lap szerzői azt írták, hogy a történészek 25%-os pontosságot értek el, amikor egyedül dolgoztak az ősi szövegek helyreállításán. De a történész teljesítménye 72%-ra nő az Ithaca használatakor, ami meghaladja a modell teljesítményét, és megmutatja az ember-gép együttműködés lehetőségét.
„Az Ithaca értelmezhető eredményeket kínál, bemutatva az emberi szakértők közötti együttműködés és a gépi tanulás növekvő jelentőségét, és megmutatja, hogy az emberi szakértők mély tanulási architektúrájával való összehangolása a feladatok együttműködése érdekében felülmúlhatja mind az emberek, mind az emberek egyéni (segítetlen) teljesítményét. ugyanazon feladatokon” – mondta Sommerschield a Lifewire-nek.
Például a történészek jelenleg nem értenek egyet egy sor fontos athéni rendelet dátumát illetően, amikor olyan jelentős személyiségek éltek, mint Szókratész és Periklész – írta Sommerschield egy blogbejegyzésében. A rendeletekről sokáig azt gondolták, hogy i.e. 446/445 előtt születtek, bár az új bizonyítékok az ie 420-as évekre utalnak. „Bár kis különbségnek tűnhet, ezek a rendeletek alapvetőek a klasszikus Athén politikai történetének megértéséhez” – írta
Az Ithacához legközelebb álló munka a Pythia nevű korábbi gépi tanulási eszköz, amelyet Sommerschield és munkatársai 2019-ben adtak ki. A Pythia volt az első ősi szöveg-helyreállítási modell, amely mély neurális hálózatokat használt.
„Ma az Ithaca az első modell, amely holisztikusan kezeli az epigráfus munkafolyamatának három központi feladatát” – mondta Sommerschield egy e-mailben. „Nemcsak a Pythia korábbi, legkorszerűbb készletét fejleszti tovább, hanem először és soha nem látott mértékben alkalmazza a mély tanulást a földrajzi és kronológiai hozzárendeléshez."
AI a történészek megsegítésére
A A mesterséges intelligencia hasznos a hiányzó adatok, például a szöveg helye és dátuma kitöltésére, mert nagyon összetett mintákat tanulhat meg az adatok elemzésével – mondta Brad Quinton, a Singulos Research mesterséges intelligencia vállalat vezérigazgatója a Lifewire-nek e-mailben.
„A gépi tanulási technikák használatával a mesterséges intelligencia számos „ismert jó” példán keresztül tud mintákat találni például egy adott szöveg és a létrehozás dátuma és helye között” – tette hozzá Quinton. „Gyakran ezek a minták annyira összetettek, hogy egy humán szakértő számára nem lennének nyilvánvalóak.”
A hiányzó adatok előrejelzése gyakori feladat a gépi tanuláson alapuló mesterséges intelligencia számára. Például az OpenAI GPT-3 képes megjósolni a hiányzó szavakat a mondatban, vagy akár a hiányzó mondatokat egy bekezdésben. Számos mesterséges intelligencia alapú képfeldolgozó rendszert alkalmaztak a videók és képek helyreállítására oly módon, hogy intelligensen megjósolják, mi veszett el az eredetiből.
„Elméletileg a kutatók hasonló technikákat használhatnak a művészet vagy eszközök vagy más történelmi, ember alkotta műtárgyak dátumának és eredetének meghatározására, ha az alapul szolgáló stílusban és technikában az idő múlásával és helye szerint változás várható. eredet – mondta Quinton.