Amit tudni kell
- A Google Books Ngram Viewerben írjon be egy kifejezést, válasszon dátumtartományt és korpuszt, állítsa be a simítási szintet, majd kattintson a Keresés sok könyv között.
- Megfúrhatja az adatokat. Például a hal igealak kereséséhez a fish főnév helyett használjon egy címkét: search for fish_VERB.
- Az Ngram Viewer egy grafikont ad ki, amely a kifejezés időbeli használatát ábrázolja. Több kifejezés esetén mindegyiket egy színkódolt vonal jelöli.
Ez a cikk elmagyarázza, hogyan használhatja az Ngram Viewer eszközt a Google Könyvekben kutatásra és hatékony keresésre.
Hogyan működik az Ngram Viewer
Az Ngram, más néven N-gram, a szöveg vagy beszédtartalom statisztikai elemzése annak érdekében, hogy megtaláljuk a szövegben valamilyen elem n-jét (számát).
A keresési elem mindenféle lehet, beleértve a fonémákat, előtagokat, kifejezéseket és betűket. Bár az Ngram a kutatói közösségen kívül homályos, számos területen használják, és számos hatással van a fejlesztőkre, akik olyan számítógépes programokat kódolnak, amelyek megértik és reagálnak a természetes beszélt nyelvre.
A Google Books Ngram Viewer esetében az elemezni kívánt szöveg abból a nagyszámú, köztulajdonban lévő könyvből származik, amelyeket a Google beszkennelt, hogy feltöltse Google Könyvek keresőmotorját. A Google Books Ngram Viewer esetében a Google a keresni kívánt szövegtörzsre korpuszként hivatkozik. Az Ngram Viewer nyelv szerint összesíti, bár külön elemezheti a brit és az amerikai angolt, vagy egyesítheti őket.
- Ugrás a Google Könyvek Ngram Viewer oldalára a books.google.com/ngrams. címen
-
Írja be az elemezni kívánt kifejezést vagy kifejezéseket. Az egyes kifejezéseket vesszővel válassza el. A Google az "Albert Einstein, Sherlock Holmes, Frankenstein" kifejezést javasolja a kezdéshez.
Az NGram Viewer kereséseiben az elemek megkülönböztetik a kis- és nagybetűket, ellentétben a Google internetes kereséseivel.
- Válasszon dátumtartományt. Az alapértelmezett érték 1800 és 2000 között van.
- Válasszon korpuszt. Kereshet idegen nyelvű szövegek vagy angol szövegek között, és a szokásos lehetőségek mellett a lista alján olyan bejegyzések is megjelenhetnek, mint az "angol (2009)" vagy az "amerikai angol (2009)". Ezek régebbi korpuszok, amelyeket a Google azóta frissített, de lehet, hogy van valami oka, hogy összehasonlítsa a régi adatkészletekkel. A legtöbb felhasználó figyelmen kívül hagyhatja őket, és a legújabb korpuszokra összpontosíthat.
-
Állítsa be a simítási szintet. A simítás azt jelenti, hogy mennyire sima a grafikon a végén. A legpontosabb ábrázolás a 0 simítási szintet tükrözi, de ez a beállítás nehezen olvasható. Az alapértelmezett érték 3. A legtöbb esetben nem kell módosítania.
- Nyomja meg a Keressen sok könyvet.
A Google Ngram Viewer segítségével elmélyülhet az adatokban. Ha a hal igére szeretne keresni a fish főnév helyett, ezt megteheti címkék használatával. Ebben az esetben a fish_VERB. kifejezésre kell keresnie
A Google az Ngram Viewer programhoz használható egyéb speciális dokumentációk teljes listáját tartalmazza a webhelyén.
Bottom Line
A Google Books Ngram Viewer egy grafikont ad ki, amely egy adott kifejezés használatát mutatja be a könyvekben az idők során. Ha egynél több szót vagy kifejezést írt be, mindegyiket egy színkódolt vonal jelöli a többi keresési kifejezéssel ellentétben. Ez hasonló a Google Trendshez, csak a keresés hosszabb időszakot fed le.
Esettanulmány
Vegyük fontolóra az ecetes piték esettanulmányát. Laura Ingalls Wilder Little House on the Prairie című sorozatában szerepelnek. Ha a Google internetes keresőjével többet tudhat meg az ecetes pitékről, kiderül, hogy az amerikai déli konyha részének tekintik, és valóban ecettel készülnek. Visszaemlékeznek azokra az időkre, amikor nem mindenki jutott hozzá a friss termékekhez az év minden szakában, de ez az egész történet?
Keressen a Google Ngram Viewerben az ecetes pite kifejezésre, és találkozni fog néhány említéssel a piteről az 1800-as évek elején és végén, sok említéssel az 1940-es években, és egyre több említéssel az utóbbi időben. A 3-as simítási szintnél azonban egy fennsíkot lát az 1800-as évek említései felett. Mivel ez idő alatt nem sok könyv jelent meg, és az adatok simára vannak állítva, a kép torz. Valószínűleg csak egy könyv említette az ecetes pitét, és ezt átlagolták a tüske elkerülése érdekében. A simítást 0-ra állítva láthatja, hogy pontosan ez a helyzet. A tüske középpontjában 1869 áll, és van még egy tüske 1897-ben és 1900-ban.
Nem valószínű, hogy a többi időben senki sem beszélt az ecetes pitékről: Valószínűleg mindenhol lebegtek receptek, de az emberek nem írtak róluk a könyvekben, és ez az Ngram-keresések fontos korlátja.