Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely egy nyomtatott, gépelt vagy kézzel írt dokumentum digitális változatát hozza létre, amelyet a számítógépek anélkül tudnak elolvasni, hogy manuálisan be kellene gépelni vagy be kellene írni a szöveget. Az OCR-t általában PDF formátumban beolvasott dokumentumokon használják, de a képfájlon belül a szöveg számítógéppel olvasható változatát is létrehozhatja.
Mi az OCR?
A OCR, amelyet szövegfelismerésnek is neveznek, egy olyan szoftvertechnológia, amely a karaktereket, például számokat, betűket és írásjeleket (más néven karakterjeleket) nyomtatott vagy írott dokumentumokból elektronikus formába alakítja át, amelyek könnyebben felismerhetők és olvashatók a számítógépek és egyéb szoftverek. Egyes OCR-programok ezt úgy teszik meg, hogy egy dokumentumot beolvasnak vagy lefényképeznek digitális fényképezőgéppel, mások pedig alkalmazhatják ezt a folyamatot olyan dokumentumokra, amelyeket korábban OCR nélkül szkennettek vagy fényképeztek. Az OCR lehetővé teszi a felhasználók számára a PDF-dokumentumok közötti keresést, a szöveg szerkesztését és a dokumentumok újraformázását.
Getty Images
Mire használható az OCR?
Gyors, mindennapi szkennelési igényekhez az OCR nem feltétlenül jelent nagy problémát. Ha nagy mennyiségű szkennelést végez, a PDF-fájlokban való keresés, hogy megtalálja a pontosan azt, amelyre szüksége van, sok időt takaríthat meg, és még fontosabbá teszi a szkennerprogram OCR funkcióit. Íme néhány egyéb dolog, amiben az OCR segít:
- Automatizált adatfeldolgozás és adatbevitel (Példa: Az önéletrajzok álláskereső-követő rendszerei).
- A beszkennelt könyvek kereshetővé tétele.
- Kézzel írt beolvasások konvertálása számítógéppel olvasható szöveggé.
- A dokumentumok használhatóbbá tétele a látássérült felhasználókat segítő olvasóprogramokkal.
- Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele.
- Adatok kinyerése és átvitele könyvelő programokba (Példa: Nyugták és számlák).
- Dokumentumok indexelése keresőmotorok általi használatra.
- A járművezetői rendszámok felismerése sebességmérő kamerával és piros lámpás kameraszoftverrel.
- Beszédszintetizátorok beszélni nem tudók számára – Stephen Hawking elméleti fizikus a beszédszintetizátor programok talán legismertebb felhasználója.
Bottom Line
Miért nem csinálsz egyszerűen egy képet, igaz? Mert nem tudna semmit szerkeszteni vagy keresni a szövegben, mert az csak egy kép lenne. A dokumentum beolvasása és az OCR-szoftver futtatása szerkeszthetővé alakíthatja a fájlt, és kereshet is.
OCR előzményei
Míg a szövegfelismerés legkorábbi használata 1914-re datálható, az OCR-hez kapcsolódó technológiák széles körben elterjedt fejlesztése és használata az 1950-es években kezdődött, különösen a nagyon leegyszerűsített betűtípusok létrehozásával, amelyeket könnyebb volt digitálisan konvertálni. olvasható szöveg. Az első ilyen egyszerűsített betűtípust David Shepard hozta létre, és OCR-7B néven ismerték. Az OCR-7B-t ma is használják a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípusokhoz. Az 1960-as években a postai szolgáltatások számos országban elkezdték OCR technológiát használni a levélválogatás jelentős felgyorsítására, ideértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot is. Az OCR továbbra is az alapvető technológia, amelyet a postai szolgáltatások számára világszerte használnak a levelek rendezésére. 2000-ben az OCR-technológia korlátaival és képességeivel kapcsolatos kulcsfontosságú ismereteket használták fel a botok és spammerek megállítására használt CAPTCHA programok fejlesztésére.
Az évtizedek során az OCR pontosabbá és kifinomultabbá vált a kapcsolódó technológiai területek, például a mesterséges intelligencia, a gépi tanulás és a számítógépes látás fejlődésének köszönhetően. Manapság az OCR-szoftver mintafelismerést, funkcióérzékelést és szövegbányászatot használ a dokumentumok gyorsabb és pontosabb átalakítására, mint valaha.
GYIK
Hogyan szkennelhetek be dokumentumokat a telefonommal vagy táblagépemmel?
IOS rendszeren nyissa meg a Notes alkalmazást, és hozzon létre egy új jegyzetet. Nyissa meg a kamerát, majd érintse meg a Dokumentumok szkennelése gombot. Androidon nyissa meg a Google Drive-ot, és válassza ki a Plus (+), majd érintse meg a Scan elemet a dokumentumot a telefonjával.
Hogyan használhatom az OCR-t az Adobe Acrobatban?
Nyissa meg a beolvasott képet tartalmazó PDF-fájlt, majd válassza a Tools > PDF szerkesztése lehetőséget. Az Acrobat automatikusan alkalmazza az OCR-t, így Ön szerkesztheti a szöveget. Csak válassza ki, hol szeretné szerkeszteni, és kezdjen el gépelni.
Mi a különbség az OCR és az OMR között?
Az optikai jelfelismerés (OMR) olyan szoftver, amely észleli a nyomokat a papíron, jellemzően egy buboréklapon. Az OMR-t vizsgák, felmérések, kérdőívek, sőt választások eredményeinek feldolgozására használják. Az OCR-től eltérően az OMR nem tudja megfejteni az oldalon lévő jelöléseket, csak azt ellenőrzi, hogy ott vannak-e a jelölések.