Optika signorekono (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo OCR laŭ Optical Character Recognition) estas nocio el la IT-areo, kiu priskribas la aŭtomatan tekstorekonon de (plej ofte presita) dokumento.
Originale ĝi estis evoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin – sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo OCR-A estas uzata por tre diversaj signoj, OCR-B por pli similaj signotipoj, kaj OCR-H por manskriboj.
La kreskantaj povumoj de la moderna komputilo kaj la pliboniĝantaj algoritmoj ebligas ankaŭ la rekonon de "normalaj" presitaj signoj ĝis la manskriboj (tiu lasta gravas ekz. ĉe leterodistribuo en la poŝto).
La moderna tekstorekono entenas la rekonon de la diversaj litertipoj kaj -grandoj kaj tiel certigas la preskaŭ plej originalfidelan reaperigon.
La elirpunkto estas bildo (rastruma bildo), kiu estas farita el dokumento per skanilo, cifereca fotilo aŭ videokamerao. La signorekono okazas en tri ŝtupoj:
Finfine okazas kodado de la eldona aranĝo (ekz. ASCII) kiel tekstodateno, kaj aspekta aranĝo (ekz. kiel HTML aŭ PDF).
La kvalito de la signorekono dependas de multaj faktoroj kiaj:
Dum la pura modelrekono estas atingita 80 % (ĉiu kvina signo estas fuŝe rekonita), la bonaj programoj celas danke al povumaj algoritmoj ĝis 99 % de senerareco. (ekz. OmniPage Pro 12 Office rekonas eĉ la Esperantajn literojn hu[rompita ligilo] kaj en[rompita ligilo])
Legu: lingvorekono, irisrekono, ECM-komponentoj