Az Ngram Viewer eszköz használata a Google Könyvekben

Tartalomjegyzék:

Az Ngram Viewer eszköz használata a Google Könyvekben
Az Ngram Viewer eszköz használata a Google Könyvekben
Anonim

Amit tudni kell

  • A Google Books Ngram Viewerben írjon be egy kifejezést, válasszon dátumtartományt és korpuszt, állítsa be a simítási szintet, majd kattintson a Keresés sok könyv között.
  • Megfúrhatja az adatokat. Például a hal igealak kereséséhez a fish főnév helyett használjon egy címkét: search for fish_VERB.
  • Az Ngram Viewer egy grafikont ad ki, amely a kifejezés időbeli használatát ábrázolja. Több kifejezés esetén mindegyiket egy színkódolt vonal jelöli.

Ez a cikk elmagyarázza, hogyan használhatja az Ngram Viewer eszközt a Google Könyvekben kutatásra és hatékony keresésre.

Image
Image

Hogyan működik az Ngram Viewer

Az Ngram, más néven N-gram, a szöveg vagy beszédtartalom statisztikai elemzése annak érdekében, hogy megtaláljuk a szövegben valamilyen elem n-jét (számát).

A keresési elem mindenféle lehet, beleértve a fonémákat, előtagokat, kifejezéseket és betűket. Bár az Ngram a kutatói közösségen kívül homályos, számos területen használják, és számos hatással van a fejlesztőkre, akik olyan számítógépes programokat kódolnak, amelyek megértik és reagálnak a természetes beszélt nyelvre.

A Google Books Ngram Viewer esetében az elemezni kívánt szöveg abból a nagyszámú, köztulajdonban lévő könyvből származik, amelyeket a Google beszkennelt, hogy feltöltse Google Könyvek keresőmotorját. A Google Books Ngram Viewer esetében a Google a keresni kívánt szövegtörzsre korpuszként hivatkozik. Az Ngram Viewer nyelv szerint összesíti, bár külön elemezheti a brit és az amerikai angolt, vagy egyesítheti őket.

  1. Ugrás a Google Könyvek Ngram Viewer oldalára a books.google.com/ngrams. címen
  2. Írja be az elemezni kívánt kifejezést vagy kifejezéseket. Az egyes kifejezéseket vesszővel válassza el. A Google az "Albert Einstein, Sherlock Holmes, Frankenstein" kifejezést javasolja a kezdéshez.

    Az NGram Viewer kereséseiben az elemek megkülönböztetik a kis- és nagybetűket, ellentétben a Google internetes kereséseivel.

  3. Válasszon dátumtartományt. Az alapértelmezett érték 1800 és 2000 között van.
  4. Válasszon korpuszt. Kereshet idegen nyelvű szövegek vagy angol szövegek között, és a szokásos lehetőségek mellett a lista alján olyan bejegyzések is megjelenhetnek, mint az "angol (2009)" vagy az "amerikai angol (2009)". Ezek régebbi korpuszok, amelyeket a Google azóta frissített, de lehet, hogy van valami oka, hogy összehasonlítsa a régi adatkészletekkel. A legtöbb felhasználó figyelmen kívül hagyhatja őket, és a legújabb korpuszokra összpontosíthat.
  5. Állítsa be a simítási szintet. A simítás azt jelenti, hogy mennyire sima a grafikon a végén. A legpontosabb ábrázolás a 0 simítási szintet tükrözi, de ez a beállítás nehezen olvasható. Az alapértelmezett érték 3. A legtöbb esetben nem kell módosítania.

  6. Nyomja meg a Keressen sok könyvet.

A Google Ngram Viewer segítségével elmélyülhet az adatokban. Ha a hal igére szeretne keresni a fish főnév helyett, ezt megteheti címkék használatával. Ebben az esetben a fish_VERB. kifejezésre kell keresnie

A Google az Ngram Viewer programhoz használható egyéb speciális dokumentációk teljes listáját tartalmazza a webhelyén.

Bottom Line

A Google Books Ngram Viewer egy grafikont ad ki, amely egy adott kifejezés használatát mutatja be a könyvekben az idők során. Ha egynél több szót vagy kifejezést írt be, mindegyiket egy színkódolt vonal jelöli a többi keresési kifejezéssel ellentétben. Ez hasonló a Google Trendshez, csak a keresés hosszabb időszakot fed le.

Esettanulmány

Vegyük fontolóra az ecetes piték esettanulmányát. Laura Ingalls Wilder Little House on the Prairie című sorozatában szerepelnek. Ha a Google internetes keresőjével többet tudhat meg az ecetes pitékről, kiderül, hogy az amerikai déli konyha részének tekintik, és valóban ecettel készülnek. Visszaemlékeznek azokra az időkre, amikor nem mindenki jutott hozzá a friss termékekhez az év minden szakában, de ez az egész történet?

Keressen a Google Ngram Viewerben az ecetes pite kifejezésre, és találkozni fog néhány említéssel a piteről az 1800-as évek elején és végén, sok említéssel az 1940-es években, és egyre több említéssel az utóbbi időben. A 3-as simítási szintnél azonban egy fennsíkot lát az 1800-as évek említései felett. Mivel ez idő alatt nem sok könyv jelent meg, és az adatok simára vannak állítva, a kép torz. Valószínűleg csak egy könyv említette az ecetes pitét, és ezt átlagolták a tüske elkerülése érdekében. A simítást 0-ra állítva láthatja, hogy pontosan ez a helyzet. A tüske középpontjában 1869 áll, és van még egy tüske 1897-ben és 1900-ban.

Nem valószínű, hogy a többi időben senki sem beszélt az ecetes pitékről: Valószínűleg mindenhol lebegtek receptek, de az emberek nem írtak róluk a könyvekben, és ez az Ngram-keresések fontos korlátja.

Ajánlott: