Mi az az optikai karakterfelismerés (OCR)?

👤 Szerző Abigail Brown 📧 [email protected].
⏱ Public 2023-12-17 06:50.
🖍 Utoljára módosítva 2025-06-01 07:16.

Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely egy nyomtatott, gépelt vagy kézzel írt dokumentum digitális változatát hozza létre, amelyet a számítógépek anélkül tudnak elolvasni, hogy manuálisan be kellene gépelni vagy be kellene írni a szöveget. Az OCR-t általában PDF formátumban beolvasott dokumentumokon használják, de a képfájlon belül a szöveg számítógéppel olvasható változatát is létrehozhatja.

Mi az OCR?

A OCR, amelyet szövegfelismerésnek is neveznek, egy olyan szoftvertechnológia, amely a karaktereket, például számokat, betűket és írásjeleket (más néven karakterjeleket) nyomtatott vagy írott dokumentumokból elektronikus formába alakítja át, amelyek könnyebben felismerhetők és olvashatók a számítógépek és egyéb szoftverek. Egyes OCR-programok ezt úgy teszik meg, hogy egy dokumentumot beolvasnak vagy lefényképeznek digitális fényképezőgéppel, mások pedig alkalmazhatják ezt a folyamatot olyan dokumentumokra, amelyeket korábban OCR nélkül szkennettek vagy fényképeztek. Az OCR lehetővé teszi a felhasználók számára a PDF-dokumentumok közötti keresést, a szöveg szerkesztését és a dokumentumok újraformázását.

Történelmi újság szkennelése OCR szoftverrel.

Getty Images

Mire használható az OCR?

Gyors, mindennapi szkennelési igényekhez az OCR nem feltétlenül jelent nagy problémát. Ha nagy mennyiségű szkennelést végez, a PDF-fájlokban való keresés, hogy megtalálja a pontosan azt, amelyre szüksége van, sok időt takaríthat meg, és még fontosabbá teszi a szkennerprogram OCR funkcióit. Íme néhány egyéb dolog, amiben az OCR segít:

Automatizált adatfeldolgozás és adatbevitel (Példa: Az önéletrajzok álláskereső-követő rendszerei).
A beszkennelt könyvek kereshetővé tétele.
Kézzel írt beolvasások konvertálása számítógéppel olvasható szöveggé.
A dokumentumok használhatóbbá tétele a látássérült felhasználókat segítő olvasóprogramokkal.
Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele.
Adatok kinyerése és átvitele könyvelő programokba (Példa: Nyugták és számlák).
Dokumentumok indexelése keresőmotorok általi használatra.
A járművezetői rendszámok felismerése sebességmérő kamerával és piros lámpás kameraszoftverrel.
Beszédszintetizátorok beszélni nem tudók számára - Stephen Hawking elméleti fizikus a beszédszintetizátor programok talán legismertebb felhasználója.

Bottom Line

Miért nem csinálsz egyszerűen egy képet, igaz? Mert nem tudna semmit szerkeszteni vagy keresni a szövegben, mert az csak egy kép lenne. A dokumentum beolvasása és az OCR-szoftver futtatása szerkeszthetővé alakíthatja a fájlt, és kereshet is.

OCR előzményei

Míg a szövegfelismerés legkorábbi használata 1914-re datálható, az OCR-hez kapcsolódó technológiák széles körben elterjedt fejlesztése és használata az 1950-es években kezdődött, különösen a nagyon leegyszerűsített betűtípusok létrehozásával, amelyeket könnyebb volt digitálisan konvertálni. olvasható szöveg. Az első ilyen egyszerűsített betűtípust David Shepard hozta létre, és OCR-7B néven ismerték. Az OCR-7B-t ma is használják a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípusokhoz. Az 1960-as években a postai szolgáltatások számos országban elkezdték OCR technológiát használni a levélválogatás jelentős felgyorsítására, ideértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot is. Az OCR továbbra is az alapvető technológia, amelyet a postai szolgáltatások számára világszerte használnak a levelek rendezésére. 2000-ben az OCR-technológia korlátaival és képességeivel kapcsolatos kulcsfontosságú ismereteket használták fel a botok és spammerek megállítására használt CAPTCHA programok fejlesztésére.

Az évtizedek során az OCR pontosabbá és kifinomultabbá vált a kapcsolódó technológiai területek, például a mesterséges intelligencia, a gépi tanulás és a számítógépes látás fejlődésének köszönhetően. Manapság az OCR-szoftver mintafelismerést, funkcióérzékelést és szövegbányászatot használ a dokumentumok gyorsabb és pontosabb átalakítására, mint valaha.

GYIK

Hogyan szkennelhetek be dokumentumokat a telefonommal vagy táblagépemmel?

IOS rendszeren nyissa meg a Notes alkalmazást, és hozzon létre egy új jegyzetet. Nyissa meg a kamerát, majd érintse meg a Dokumentumok szkennelése gombot. Androidon nyissa meg a Google Drive-ot, és válassza ki a Plus (+), majd érintse meg a Scan elemet a dokumentumot a telefonjával.

Hogyan használhatom az OCR-t az Adobe Acrobatban?

Nyissa meg a beolvasott képet tartalmazó PDF-fájlt, majd válassza a Tools > PDF szerkesztése lehetőséget. Az Acrobat automatikusan alkalmazza az OCR-t, így Ön szerkesztheti a szöveget. Csak válassza ki, hol szeretné szerkeszteni, és kezdjen el gépelni.

Mi a különbség az OCR és az OMR között?

Az optikai jelfelismerés (OMR) olyan szoftver, amely észleli a nyomokat a papíron, jellemzően egy buboréklapon. Az OMR-t vizsgák, felmérések, kérdőívek, sőt választások eredményeinek feldolgozására használják. Az OCR-től eltérően az OMR nem tudja megfejteni az oldalon lévő jelöléseket, csak azt ellenőrzi, hogy ott vannak-e a jelölések.

Ajánlott:

Mi az az optikai karakterfelismerés (OCR)?

Tartalomjegyzék:

Mi az OCR?

Mire használható az OCR?

Bottom Line

OCR előzményei

GYIK

Hogyan szkennelhetek be dokumentumokat a telefonommal vagy táblagépemmel?

Hogyan használhatom az OCR-t az Adobe Acrobatban?

Mi a különbség az OCR és az OMR között?

Ajánlott:

Mi az az optikai meghajtó?

Mi az a digitális optikai kapcsolat?

Szakértő által tesztelt: Az 5 legjobb optikai zoomos fényképezőgép 2022-ben

A 6 legjobb külső optikai meghajtó 2022-ben

Útmutató az optikai és digitális képstabilizáláshoz

A Google otthoni rutinjainak beállítása

Hogyan párosítsd az Apple Watch-ot iPhone-oddal

Hogyan lehet megakadályozni, hogy a Spotify megnyíljon indításkor Mac számítógépen

Alkalmazások átvitele Androidról Androidra

Le kell állítania Netflix jelszavának megosztását

Kiégett autós audioerősítő biztosíték diagnosztizálása

Második autóakkumulátor hozzáadása a csúcsminőségű hangzáshoz

7 pénzkeresési mód videojátékok streamelésével a Twitchen

Excel hiperhivatkozások, könyvjelzők és Mailto hivatkozások

Mac-problémák: Elakadt a kék vagy fekete képernyőn

Az automatikus megújítás kikapcsolása iPhone-on

A CMOS törlése (a BIOS-beállítások visszaállítása)

Hogyan készített az Amazon egy vezérlőt a felhőhöz

Hogyan ellenőrizheti megfelelően számítógépét rosszindulatú programok szempontjából

Mi az a táblagép?