21-11-2024
Σημειώστε αυτή τη σελίδα σελιδοδείκτη.
ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर)
मशीन-एन्कोडेड टेक्स्ट में टाइप, हस्तलिखित, या मुद्रित टेक्स्ट की छवियों का इलेक्ट्रॉनिक या यांत्रिक रूपांतरण है, चाहे स्कैन किए गए दस्तावेज़ से, दस्तावेज़ की एक तस्वीर, एक दृश्य फोटो (उदाहरण के लिए, एक परिदृश्य में संकेतों और बिलबोर्ड पर टेक्स्ट फोटोग्राफ), या उपशीर्षक पाठ से छवि पर आरोपित (उदाहरण के लिए: एक टेलीविजन प्रसारण से)।
मुद्रित पेपर रिकॉर्ड से डेटा दर्ज करने के लिए व्यापक रूप से उपयोग किया जाता है - चाहे पासपोर्ट, चालान, बैंक विवरण, कम्प्यूटरीकृत रसीदें, व्यवसाय कार्ड, मेल, स्थिर डेटा के प्रिंटआउट, या कोई अन्य उपयुक्त दस्तावेज - यह मुद्रित ग्रंथों को डिजिटाइज़ करने का एक सामान्य तरीका है ताकि वे कर सकें इलेक्ट्रॉनिक रूप से संपादित, खोजा, अधिक कॉम्पैक्ट रूप से संग्रहीत, ऑनलाइन प्रदर्शित किया जाता है, और मशीन प्रक्रियाओं जैसे संज्ञानात्मक कंप्यूटिंग, मशीन अनुवाद, और (निकाले गए) टेक्स्ट-टू-एसपी में उपयोग किया जाता है ओसीआर पैटर्न मान्यता अध्ययन का एक उपक्षेत्र है जिसमें कृत्रिम बुद्धि शामिल है और कंप्यूटर दृष्टि।
पहले के संस्करणों में अलग-अलग पात्रों की तस्वीरों के साथ प्रशिक्षण की आवश्यकता होती थी और एक समय में एक ही टाइपफेस पर काम किया जाता था। अधिकांश टाइपफेस के लिए उच्च स्तर की पहचान सटीकता प्रदान करने में सक्षम उन्नत सिस्टम अब व्यापक रूप से उपलब्ध हैं, जैसे सिस्टम हैं जो इनपुट के रूप में कई डिजिटल चित्र फ़ाइल स्वरूपों को स्वीकार करते हैं। कुछ प्रणालियाँ स्वरूपित आउटपुट की नकल करने में सक्षम हैं जो जितना संभव हो सके मूल पृष्ठ के समान है, जिसमें ग्राफिक्स, कॉलम और अन्य गैर-पाठ्य घटक शामिल हैं।