Mi az az optikai karakterfelismerés (OCR)?

Tartalomjegyzék:

Mi az az optikai karakterfelismerés (OCR)?
Mi az az optikai karakterfelismerés (OCR)?
Anonim

Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely egy nyomtatott, gépelt vagy kézzel írt dokumentum digitális változatát hozza létre, amelyet a számítógépek anélkül tudnak elolvasni, hogy manuálisan be kellene gépelni vagy be kellene írni a szöveget. Az OCR-t általában PDF formátumban beolvasott dokumentumokon használják, de a képfájlon belül a szöveg számítógéppel olvasható változatát is létrehozhatja.

Mi az OCR?

A OCR, amelyet szövegfelismerésnek is neveznek, egy olyan szoftvertechnológia, amely a karaktereket, például számokat, betűket és írásjeleket (más néven karakterjeleket) nyomtatott vagy írott dokumentumokból elektronikus formába alakítja át, amelyek könnyebben felismerhetők és olvashatók a számítógépek és egyéb szoftverek. Egyes OCR-programok ezt úgy teszik meg, hogy egy dokumentumot beolvasnak vagy lefényképeznek digitális fényképezőgéppel, mások pedig alkalmazhatják ezt a folyamatot olyan dokumentumokra, amelyeket korábban OCR nélkül szkennettek vagy fényképeztek. Az OCR lehetővé teszi a felhasználók számára a PDF-dokumentumok közötti keresést, a szöveg szerkesztését és a dokumentumok újraformázását.

Image
Image
Történelmi újság szkennelése OCR szoftverrel.

Getty Images

Mire használható az OCR?

Gyors, mindennapi szkennelési igényekhez az OCR nem feltétlenül jelent nagy problémát. Ha nagy mennyiségű szkennelést végez, a PDF-fájlokban való keresés, hogy megtalálja a pontosan azt, amelyre szüksége van, sok időt takaríthat meg, és még fontosabbá teszi a szkennerprogram OCR funkcióit. Íme néhány egyéb dolog, amiben az OCR segít:

  • Automatizált adatfeldolgozás és adatbevitel (Példa: Az önéletrajzok álláskereső-követő rendszerei).
  • A beszkennelt könyvek kereshetővé tétele.
  • Kézzel írt beolvasások konvertálása számítógéppel olvasható szöveggé.
  • A dokumentumok használhatóbbá tétele a látássérült felhasználókat segítő olvasóprogramokkal.
  • Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele.
  • Adatok kinyerése és átvitele könyvelő programokba (Példa: Nyugták és számlák).
  • Dokumentumok indexelése keresőmotorok általi használatra.
  • A járművezetői rendszámok felismerése sebességmérő kamerával és piros lámpás kameraszoftverrel.
  • Beszédszintetizátorok beszélni nem tudók számára – Stephen Hawking elméleti fizikus a beszédszintetizátor programok talán legismertebb felhasználója.

Bottom Line

Miért nem csinálsz egyszerűen egy képet, igaz? Mert nem tudna semmit szerkeszteni vagy keresni a szövegben, mert az csak egy kép lenne. A dokumentum beolvasása és az OCR-szoftver futtatása szerkeszthetővé alakíthatja a fájlt, és kereshet is.

OCR előzményei

Míg a szövegfelismerés legkorábbi használata 1914-re datálható, az OCR-hez kapcsolódó technológiák széles körben elterjedt fejlesztése és használata az 1950-es években kezdődött, különösen a nagyon leegyszerűsített betűtípusok létrehozásával, amelyeket könnyebb volt digitálisan konvertálni. olvasható szöveg. Az első ilyen egyszerűsített betűtípust David Shepard hozta létre, és OCR-7B néven ismerték. Az OCR-7B-t ma is használják a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípusokhoz. Az 1960-as években a postai szolgáltatások számos országban elkezdték OCR technológiát használni a levélválogatás jelentős felgyorsítására, ideértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot is. Az OCR továbbra is az alapvető technológia, amelyet a postai szolgáltatások számára világszerte használnak a levelek rendezésére. 2000-ben az OCR-technológia korlátaival és képességeivel kapcsolatos kulcsfontosságú ismereteket használták fel a botok és spammerek megállítására használt CAPTCHA programok fejlesztésére.

Az évtizedek során az OCR pontosabbá és kifinomultabbá vált a kapcsolódó technológiai területek, például a mesterséges intelligencia, a gépi tanulás és a számítógépes látás fejlődésének köszönhetően. Manapság az OCR-szoftver mintafelismerést, funkcióérzékelést és szövegbányászatot használ a dokumentumok gyorsabb és pontosabb átalakítására, mint valaha.

GYIK

    Hogyan szkennelhetek be dokumentumokat a telefonommal vagy táblagépemmel?

    IOS rendszeren nyissa meg a Notes alkalmazást, és hozzon létre egy új jegyzetet. Nyissa meg a kamerát, majd érintse meg a Dokumentumok szkennelése gombot. Androidon nyissa meg a Google Drive-ot, és válassza ki a Plus (+), majd érintse meg a Scan elemet a dokumentumot a telefonjával.

    Hogyan használhatom az OCR-t az Adobe Acrobatban?

    Nyissa meg a beolvasott képet tartalmazó PDF-fájlt, majd válassza a Tools > PDF szerkesztése lehetőséget. Az Acrobat automatikusan alkalmazza az OCR-t, így Ön szerkesztheti a szöveget. Csak válassza ki, hol szeretné szerkeszteni, és kezdjen el gépelni.

    Mi a különbség az OCR és az OMR között?

    Az optikai jelfelismerés (OMR) olyan szoftver, amely észleli a nyomokat a papíron, jellemzően egy buboréklapon. Az OMR-t vizsgák, felmérések, kérdőívek, sőt választások eredményeinek feldolgozására használják. Az OCR-től eltérően az OMR nem tudja megfejteni az oldalon lévő jelöléseket, csak azt ellenőrzi, hogy ott vannak-e a jelölések.

Ajánlott: