বর্তমান তারিখ:22 August, 2019

ওসিআর কি? | কম্পিউটার কীভাবে আপনার হাতের লেখা চিনতে পারে?

ওসিআর

বন্ধুর হাতের লেখা পড়তে গিয়ে কি দাঁত মুখ ভেঙ্গে যায় আপনার? তারপরেও আপনার নিজেকে ভাগ্যবান মনে করা উচিৎ, কেনোনা আপনি কোন পোস্ট অফিসে চাকরী করেন না—যেখানে প্রতিদিন হাজার হাজার হাতের লেখা চিঠি আদান প্রদান করা হয়। আমাদের আজকের জীবন ধীরেধীরে সম্পূর্ণরূপে কম্পিউটার নির্ভর হয়ে পড়ছে, তাই সত্যিই মানুষ আর কম্পিউটারের মধ্যে ভালো বোঝাবুঝি জ্ঞান থাকা প্রয়োজন। প্রায় প্রত্যেক প্রকারের কম্পিউটারের সাথে কথা বলার জন্য আমরা “কীবোর্ড” বা “মাউস” ব্যবহার করে থাকি, যাতে তারা সহজেই বুঝতে পারে যে আমরা তাদের দ্বারা কি করাতে চাচ্ছি। কিন্তু কোন কম্পিউটারকে যখন সরাসরি কোন বই পড়তে বলবো বা হাতের লেখা কোন চিঠি পড়তে বলবো, তখন তা সম্পূর্ণ করতে কম্পিউটারকে আরো বেশি খাটনি করতে হবে। আর এখানেই অপটিক্যাল ক্যারেক্টার রেকগনেশন বা ওসিআর কাজ করতে চলে আসে। এটি একধরণের কম্পিউটার প্রোগ্রাম বা সফটওয়্যার, যা স্বয়ংক্রিয়ভাবে কোন প্রিন্ট করা টেক্সট বা হ্যান্ড রাইটিং বিশ্লেষণ করতে পারে এবং এটিকে এমন একটি রূপে নিয়ে যায়, যাতে কম্পিউটার তা সহজেই বুঝতে পারে। আপনার সেলফোনে যে হ্যান্ড রাইটিং কীবোর্ড রয়েছে, সেটিও ওসিআর ব্যবহার করেই কাজ করে। কিন্তু কীভাবে এটি কাজ করে? চলুন বিস্তারিত জেনে নেওয়া যাক।

ওসিআর কি?

ওসিআর কি

এই লেখাগুলো যখন আপনি কম্পিউটার স্ক্রীনে বা মোবাইল স্ক্রীনে পড়ছেন, তখন আপনার চোখ এবং আপনার মস্তিষ্ক অবিরত অপটিক্যাল ক্যারেক্টার রেকগনেশন পদ্ধতি ব্যবহার করছে, এমনকি আপনাকে বিন্দুমাত্র না টের পাইয়েই। আপনার চোখ এই স্ক্রীনের সাদাকালো প্যাটার্নকে কাজে লাগিয়ে বিভিন্ন ক্যারেক্টার যেমন অক্ষর, সংখ্যা, এবং বিভিন্ন বিরাম চিহ্ন চেনার চেষ্টা করছে এবং আপনার মস্তিষ্ক সেই অক্ষর, সংখ্যা, এবং বিভিন্ন বিরাম চিহ্ন গুলোকে একত্র করে লেখা গুলো পড়ার চেষ্টা করছে।

কম্পিউটারও এই কাজটি করতে পারে, কিন্তু মানুষের মতো এতো সহজে করতে পারেনা। প্রথম সমস্যাটি হলো মানুষের মতো কম্পিউটারের কোন চক্ষু থাকেনা, সুতরাং আপনি যদি কম্পিউটার দিয়ে কোন পুরাতন বই বা আপনার হাতের লেখা পড়াতে চান, তবে সেটি অপটিক্যাল স্ক্যানার বা ডিজিটাল ক্যামেরা দিয়ে স্ক্যান করে সেটিকে ইমেজ রূপে প্রদর্শন করাতে হবে। এই পদ্ধতিতে আপনি যে পেজটি তৈরি করবেন, তা একটি গ্রাফিক ফাইল হিসেবে তৈরি হবে (সাধারনত জেপ্যাগ ফাইল হয়ে থাকে)। কিন্তু কম্পিউটারের কাছে আপনার ছবি বা সুন্দরবনের ছবির মধ্যে কোন পার্থক্য নেই, অর্থাৎ কম্পিউটার কোন গ্রাফিক বা ফটোগ্রাফের পিক্সেল প্যাটার্ন থেকে কোন অর্থ বের করতে পারেনা। কম্পিউটারের কাছে কোন টেক্সট ভর্তি পেজ থাকার কোন মূল্যই নেই, কেনোনা আপনি যেভাবে কোন পেজ পড়তে পারেন, কম্পিউটার কখনোই তা সেভাবে পড়তে পারেনা। ওসিআর প্রোগ্রাম কোন ইমেজ থেকে তার টেক্সট সরাসরি টেক্সট হিসেবে পরিণত করে—অথবা বলতে পারেন এটি কোন ইমেজ বা হাতের লেখা থেকে টেক্সট গুলোকে TXT বা DOC ফাইল হিসেবে সংরক্ষন করে।

ওসিআর কীভাবে কাজ করে?

letters-66951_1280

মনেকরুন আমাদের জীবন অনেক সহজ এবং আমাদের বর্ণমালাতে শুধু একটি মাত্র অক্ষর রয়েছে “A”। এখন যদি আপনি চিন্তা করে দেখেন, তবে দেখতে পাবেন, মাত্র একটি অক্ষর থাকার পরেও ওসিআর কে অনেক সমস্যা পোহাতে হবে—কেনোনা প্রত্যেকটি ব্যক্তি এই “A” কে সম্পূর্ণ আলাদা আলাদাভাবে লিখবে। এমনকি যদি আপনি কম্পিউটার প্রিন্টেড টেক্সটের কথা বলেন, তো সেখানেও সমস্যা রয়েছে—কেনোনা আলাদা আলাদা বই এবং ডকুমেন্ট আলাদা আলাদা মুদ্রাক্ষর (ফন্ট) ব্যবহার করে লেখা হয়, সুতরাং এই অক্ষর “A” কে সম্পূর্ণ আলাদা আলাদা ভাবে লেখ হবে।

তাহলে ওসিআর কীভাবে লেখা গুলোকে চিনতে পারবে? বিস্তৃতভাবে বলতে গেলে, আসলে দুইটি পদ্ধতি রয়েছে কাজ করার জন্য। এক হলো, প্রত্যেকটি অক্ষরকে এদের সম্ভাব্য সকল প্যাটার্নে (প্যাটার্ন রেকগনেশন) চিনে রাখা এবং আরেকটি হলো প্রত্যেকটি অক্ষরের প্রত্যেকটি লাইন, প্রত্যেকটি সূক্ষ্ম রেখা (ফিচার ডিটেকশন) মনে রেখে ঐ অক্ষরকে চিনতে পারা।

প্যাটার্ন রেকগনেশন

যদি প্রত্যেকে কোন অক্ষর যেমন “A” কে একদম একইভাবে লেখে, তবে কম্পিউটারের তা চিনতে অনেক সহজ হয়ে যাবে। তাহলে শুধুমাত্র কম্পিউটার তার জমা থাকা “A” এর সাথে স্ক্যান করা “A” মিল করবে, যদি দুইটিই মিলে যায়, তো হয়ে গেলো কাজ।

কিন্তু এখন প্রশ্ন হলো, আপনি কীভাবে সকলকে একই হাতের লেখা শেখাবেন? ১৯৬০ সালের দিকে ব্ল্যাঙ্ক চেক লেখার জন্য এক স্পেশাল ফোন উন্নতিকরণ করা হয়েছিলো, যার নাম “OCR-A”। তখন প্রত্যেকটি চেকে একই ফন্ট ব্যবহার করা হতো, ফলে অপটিক্যাল ক্যারেক্টার রেকগনেশন বা ওসিআর সহজেই সেই ফন্ট বুঝতে পারতো। কিন্তু বর্তমানে পৃথিবী জুড়ে বিভিন্ন বই বা ডকুমেন্ট প্রিন্ট করতে একই ফন্ট ব্যবহার করা হয়না, এবং কখনোই কারো হাতের লেখা কারো সাথে মিল হয়না। এই সমস্যা থেকে নিস্তার পাওয়ার উপায় হলো প্রত্যেকটি অক্ষরকে চেনার জন্য ওসিআর প্রোগ্রামকে বিশেষভাবে প্রশিক্ষণ দেওয়া, যাতে কোন অক্ষর চিনতে প্রোগ্রাম নাম্বার ব্যবহার করে। জনপ্রিয় ফন্ট গুলোর বিপরিতে প্রোগ্রাম একটি নাম্বারের সারী মনে রাখে এবং স্ক্যান করার সময় সেই নাম্বার গুলো ডিকোড করে অক্ষরগুলো চেনার চেষ্টা করে। এই পদ্ধতিতে আপনার লেখা অক্ষর যে শতভাগ চিনতে পারা যাবে, এতে কোন নিশ্চয়তা নেই।

ফিচার ডিটেকশন

ফিচার ডিটেকশনকে ইনটেলিজেন্ট ক্যারেক্টার রেকগনেশন বা আইসিআর ও বলা হয়ে থাকে। এটি কোন ক্যারেক্টারকে চেনার জন্য সবচাইতে ব্যস্তব বুদ্ধি সম্পন্ন পদ্ধতি। এখন মনেকরুন, আপনি নিজেই ওসিআর কম্পিউটার প্রোগ্রাম, আপনার সামনে একসাথে অনেক গুলো অক্ষর রেখে দেওয়া হলো, যেখানে বিভিন্ন অক্ষর বিভিন্ন ফন্ট ব্যবহার করে লেখা। তাহলে আপনি এই অক্ষর গুলোকে কীভাবে চিনতে পারবেন? এরা সবাইতো আলাদা ধরনে লেখা!

আপনার কাজকে সহজ করার জন্য আপনি একটি চমৎকার নিয়ম বের করতে পারেন। যখন আপনি দুইটি বাঁকানো লাইন দেখতে পাবেন এবং দেখবেন যে আরেকটি লাইন উপরের দিকে সেই দুইটি লাইনের সাথে সংযুক্ত হয়েছে, এবং বাঁকানো লাইন দুটি হেলিয়ে খাঁড়াভাবে রয়েছে এবং আরেকটি লাইন সমতলভাবে উপরের দিকে বা মাঝখানে এসে একত্রিত হয়েছে, তখন আপনি সহজেই বুঝে যাবেন যে এই অক্ষরটি হলো “A”। আর এই পদ্ধতি ব্যবহার করে আপনি বেশিরভাগই বড় হাতের অক্ষর চিনতে পারবেন, এতে কোন যায় আসেনা যে অক্ষরটি কোন ফন্ট ব্যবহার করে লেখা রয়েছে। সরাসরি কোন অক্ষরের সম্পূর্ণ প্যাটার্ন মনে না রেখে সেই অক্ষটির প্রত্যেকটি লাইন প্রত্যেকটি সূক্ষ্ম রেখা এবং তাদের অবস্থানের ধারণা রাখলেই খুব সহজে কোন অক্ষর চিনতে পারা সম্ভব। বেশিরভাগ আধুনিক ওসিআর প্রোগ্রাম প্যাটার্ন রেকগনেশন পদ্ধতির চাইতে ফিচার ডিটেকশন পদ্ধতিই বেশি ব্যবহার করে। কিছু প্রোগ্রাম নিউরাল নেটওয়ার্ক (এটি এমন পদ্ধতি, যেখানে কম্পিউটার প্রোগ্রাম স্বয়ংক্রিয়ভাবে মানুষের মস্তিকের মতো কাজ করতে পারে) ব্যবহার করে কাজ করে। নিউরাল নেটওয়ার্ক নিয়ে খুব শীঘ্রই নতুন একটি পোস্ট লিখে ফেলবো।

হ্যান্ড রাইটিং রেকগনেশন কীভাবে কাজ করে?

হ্যান্ড রাইটিং রেকগনেশন

লেজার প্রিন্টার দিয়ে কম্পিউটার টেক্সট প্রিন্ট করে তা রেকগনেশন করা কম্পিউটারের কাছে তুলনামূলকভাবে অনেক সহজ। কিন্তু কম্পিউটার যখন মানুষের হাতের টেরামেরা লেখা পড়তে চায়, তখন কম্পিউটারের ১২টা বেজে যায়। মানুষের ব্রেইন এক্ষেত্রে যেকোনো কম্পিউটার থেকে অনেক আগে কাজ করে, আমরা দুনিয়ার সবচাইতে খারাপ হাতের লেখাটি সম্পূর্ণ বুঝতে না পারলেও অনুমান করতে পারি, আমরা যেকোনো অক্ষরকে ফিচার ডিটেকশন পদ্ধতি ব্যবহার করে চেনার চেষ্টা করি, আমাদের মস্তিষ্কে লেখক এবং কি লেখা থাকতে পারে সে বিষয়ের উপর ধারণা থাকে। কিন্তু কম্পিউটারটার এতোটা বুদ্ধিমত্তার সাথে কখনোই কাজ করতে পারেনা।

আপনি যখন ট্যাবলেট কম্পিউটার বা স্মার্টফোনের হ্যান্ড রাইটিং কীবোর্ড দিয়ে কিছু লেখেন, সেটা কম্পিউটারের কাছে সনাক্ত করা অনেক সহজ হয়ে থাকে। যদি আপনি “A” লেখার চেষ্টা করেন, তখন টাচস্ক্রীন আপনার টানা রেখা অনুভব করে, প্রথমে আপনি একটি লম্বা বাঁকা রেখা আঁকেন তারপরে আরেকটি লম্বা বাঁকা রেখা এবং শেষে আরেকটি সমতল রেখা এনে মিলিয়ে দেন। এখানে কম্পিউটার সমজেই বুঝতে পারে কোন রেখা কীভাবে আঁকা হয়েছিলো এবং আঁকার পরে এটিকে “A” অক্ষরে প্রকাশিত করে। কম্পিউটার এক্ষেত্রে ফিচার ডিটেকশন পদ্ধতি ব্যবহার করে। কিন্তু কোন কাগজের উপরে কোন এব্রোথেব্রো হাতের লেখা চিনতে পারা এতো সহজ কাজ হয়ে ওঠেনা। কোন হাতের লেখা কম্পিউটারকে চিনতে পাড়ার জন্য এক নির্দিষ্ট নিয়ম মেনে তবেই লিখতে হয়, আর এই লেখার নিয়মকে কম্ব ফিল্ডস বলা হয়।

ওসিআর এর সুবিধা সমূহ

কোন প্রিন্ট করা পেজকে যদি মেশিন রীডআবোল করা সম্ভব হয়, তবে এথেকে আপনি সেই সমস্থ জিনিষ করতে পারবেন যা আগে কখনোই করতে পারতেন না। আপনি কীওয়ার্ড ব্যবহার করে কোন টেক্সট বা অক্ষর অনুসন্ধান করতে পারবেন। প্রিন্ট করা পেজ থেকে টেক্সট গুলোকে ওয়ার্ড প্রসেসিং সফটওয়্যার দ্বারা এডিট করতে পারবেন, টেক্সট গুলোকে ওয়েবপেজে পরিণত করতে পারবেন। সম্পূর্ণ পেজের টেক্সট গুলোকে কম্প্রেস করে সেভ করার জায়গা বাঁচাতে পারবেন। তাছাড়া প্রিন্ট পেজ থেকে টেক্সট গুলো ব্যবহার করে মেইল পাঠাতে পারবেন। মেশিন রীডআবোল টেক্সট গুলো যেকোনো স্ক্রীন রিডার সহজেই পড়তে এবং বুঝতে পারবে।

শেষ কথা


WiREBD এখন ইউটিউবে, নিয়মিত টেক/বিজ্ঞান/লাইফ স্টাইল বিষয়ক ভিডিও গুলো পেতে WiREBD ইউটিউব চ্যানেলটি সাবস্ক্রাইব করুণ! জাস্ট, youtube.com/wirebd — এই লিংকে চলে যান এবং সাবস্ক্রাইব বাটনটি হিট করুণ!

আপনি হয়তো ভাবছেন যে, ওসিআর আজকের আবিষ্কার হওয়া কোন প্রযুক্তি! আসলে এই প্রযুক্তি এবং এর কাজ করার পদ্ধতি নতুন নয় ১৯২৮ সাল থেকে এই প্রযুক্তি চলে আসছে। তবে সামনে হয়তো এতে আরো উন্নতি আনা সম্ভব হতে পারে। আপনি যদি মেশিন লার্নিং নিয়ে এবং আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে আমার লেখা পোস্ট গুলো না পড়ে থাকেন, তবে পড়ে আসতে পারেন, সেখানে অনেক মজার তথ্য খুঁজে পাবেন। আশা করছি আজকের পোস্ট আপনাদের কাছে চরম লেগেছে, তাই যেকোনো প্রশ্নে এবং মতামত জানাতে নিচে আমাকে কমেন্ট করুন। পোস্টটি শেয়ার করার মাধ্যমে আপনার বন্ধুদেরও প্রযুক্তির আলোয় আলোকিত করতে সাহায্য করুন। ধন্যবাদ 🙂

প্রযুক্তির জটিল টার্মগুলো কি আপনাকে বিভ্রান্ত করছে? কিছুতেই কি আপনার মস্তিষ্কে পাল্লা পড়ছে না? তাহলে বন্ধু, আপনি এবার সঠিক জায়গায় এসেছেন—কেনোনা এখানে আমি প্রযুক্তির সকল জটিল বিষয় গুলো ভাঙ্গিয়ে সহজ পানির মতো উপস্থাপন করার চেষ্টা করি, যাতে সকলে সহজেই সকল টেক টার্ম গুলো বুঝতে পারে।

15 Comments

  1. তরিকুল ইসলাম Reply

    ভালো হয়েছে তাহমিদ ভাই, এলসিডি এবং এলইডি ডিসপ্লে র মধ্যে পার্থক্য উল্লেক করে একটি পোস্ট চাই।

    1. তাহমিদ বোরহান Post author Reply

      কমেন্টের জন্য ধন্যবাদ 🙂
      ডিসপ্লে নিয়ে কিন্তু আগে থেকেই একটি পোস্ট রয়েছে http://wirebd.com/ডিসপ্লে-প্রযুক্তি/
      আগে পোস্টটি চেক করুন, তারপরে আরো কোন প্রশ্ন থাকলে আমাকে জানাতে পারেন।

    1. তাহমিদ বোরহান Post author Reply

      ধন্যবাদ 🙂 আগে বলুন উইন্ডোজ ট্যাব কিনবেন না অ্যান্ড্রয়েড ট্যাব?
      আপনার বাজেট কি রকম? কি কাজে বেশিরভাগ সময় ডিভাইজটি ব্যবহার করবেন? এই উত্তর গুলো যোগ করে প্রশ্ন করলে আপনাকে সঠিক মতামত জানাতে পারবো বলে আশা করি।
      ধন্যবাদ 🙂

  2. অর্নব Reply

    এক কথাই অতুলনিয় পোস্ট! এই না হলো পোস্ট! ধন্যবাদ ভাই 😀

  3. প্রদিপ মন্ডল Reply

    ফাটিয়ে দিয়েছেন ভাই
    মানুষ যেকোন কম্পিউটার থেকে অনেক বেশি এগিয়ে। কিন্তু যখন কম্পিউটার মানুসের আগে চলে যাবে তখন হয়ত মানুসকে রোবটের দাসত্ত করতে হবে।

  4. Anirban Dutta Reply

    Khub bhao hoeche bhai. OCR niye eto details jantam na, apnar lekha pore janlam. Mail id peye gechi ebar majhe majhe mail korbo bhai, reply deben. Community site ki tahole hobena??

    1. তাহমিদ বোরহান Post author Reply

      ভাই আসলে ফোরাম সাইটের সিকিউরিটি নিয়ে অনেক ঝামেলায় আছি, এমনিতেই টেকহাবসে অনেক অ্যাটাক পেয়েছি। তবে এতোটুকু আশ্বস্ত করছি ইউটিউব চ্যানেল খুব শীঘ্রই শুরু করছি।

  5. মামুন সিদ্দিকী Reply

    আমি আপনার সব লেখা পরি। হাতের লেখা থেকে কম্পিটার ফন্টে আনতে হলে কি সফটওয়ার ও হার্ডওয়ার দরকার? জানালে উপক্রিত হই। আপনার ইউটিউব চেনেলের অপেক্ষায় রইলাম।

Leave a Reply

Your email address will not be published. Required fields are marked *