شرکت نرم افزار برنامه نویسان دانش برتر سهند

تبدیل عکس به متن فارسی OCR

تبدیل عکس به متن فارسی OCR
مبدل او سی آر OCR فارسی | تبدیل عکس به متن فارسی

او سی آر OCR چیست

به ساده ترین حالت ممکن اگر بخواهیم اوسی آر OCR  (Optical Character Recognition ) را توضیح دهیم می توان به نرم افزار یا سخت افزاری گفت که پس از پردازش تصاویر متون داخل آن را استخراج می کند. حال اینکه چرا کلا به اوسی آر نیاز است می تواند هزاران دلیل داشته باشد ولی اصلی ترین آن جلوگیری از هدررفت زمان برای تایپ مجدد صفحه ای است که از قبل توسط دست یا کامپیوتر نوشته ( یا تایپ) شده است.

تبدیل عکس به متن
سامانه اوسی آر فارسی دقیقا چه کاری انجام می دهد؟ به طور خلاصه تصاویر اسکن (ایجاد) شده توسط دوربین های دیجیتال یا اسکنرها که حاوی متن هستند در نرم افزار یا سخت افزار مورد پردازش قرار می گیرند، نرم افزار او سی آر این وظیفه را بر عهده می گیرد که بیت به بیت (جز به جز) تصویر ورودی را مورد بررسی و آنالیز قرار بدهد سپس با استفاده از الگوریتم و هوش مصنوعی که توسط طراح نرم افزار او سی آر طراحی شده متون درون تصویر را استخراج کند. بعضی از نرم افزارها علاوه بر متن با قدرت آنالیز خود می توانند سایر موارد همچون تصاویر، جداول، فرمول ها، صفحه آرایی، نوع و سایز فونت و … را تشخیص و در فایل خروجی که می تواند از نوع نوشته (txt) یا ورد(doc , docx , dot) یا پی دی اف قابل جستجو (Searchable Pdf, PDF) یا … باشد، اعمال کنند.

سختی های و پیچیدگی های تبدیل ماشینی اسناد فارسی یا همان او سی آر فارسی
اگر به زبان های دیگر مانند انگلیسی دقت کنید متوجه خواهید شد که در الفبای آن حروف یا اعداد از نظر نوشتاری با هم تفاوت های زیادی دارد همچنین مانند زبان فارسی حروف کمتر چندین شکل دارد ولی این در زبان فارسی این مورد صدق نمی کند به طور مثال به (ز ژ ر یا ب پ ت ث) دقت کنید فقط حذف یک نقطه می تواند “ث” را به “ت” یا “ز” را به “ر” تبدیل کند این مورد در اعداد نیز صدق می کند (“۲” “۳” ) فقط با یک دندانه از هم متمایز می شوند،

غیر از شبیه بودن حروف مسئله دیگری که می توان دلیل بر سختی اوسی آر فارسی باشد چسبیده شدن کلمات است به طور مثال (“ب” “به” “بی” “با”) ؛ مورد دیگه ای که وجود دارد کشیده شدن حروف است به این مثال توجه کنید (“سی” “سـی” “ســی) هر سه مورد نوشته شده از نظر ما “سی” هستند ولی این برای نرم افزار او سی آر فارسی یک “س” چسبان و یک یا چند “ـ”  است یکم که دقیق تر بشویم این کاراکتر شبیه خط فاصله “-” است ولی باید گفت که این دو باهم متفاوت است.  
البته موارد دیگری نیز هستند که باعث سخت شدن تبدیل ماشینی یا OCR فارسی می شوند. مواردی که در بالا گفته شد جزو اصلی ترین آن ها است. همین موارد آنالیز زبان فارسی یا به گفتاری دیگر OCR فارسی را سخت کرده است. البته با گذشت زمان و روی کار آمدن مواردی  مانند اسکنرهای با کیفیت تر، هوش مصنوعی دقیق تر، و الگوریتم های قوی تر این موارد نیز کم کم در حال رفع و تصحیح است و راه برای تبدیل عکس فارسی به متن قابل ویرایش ( OCR) روان و روان تر می شود.

ویژگی ها و مشخصات

ویژگی های اصلی
  • پشتیبانی از انواع فونت‌های رایج و اندازه‌های مختلف
  • تبدیل عکس حاوی متن فارسی و انگلیسی به متن معادل
  • تولید فایل متنی در فرمت (RTF،Word ،TXT)
  • دریافت ورودی در فرمت‌های مختلف (BMP ،JPG ،PNG و PDF)
  • دقت بالای تبدیل عکس‌نوشته به متن ( در کیفیت تصویر مطلوب بالای 98% )
گارانتی
قیمت پایه

40,000,000 تومان

قیمت پایه براساس توسعه و سفارش سازی شما ممکن می باشد کاهش یا افزایش پیدا کند
سفارش   درخواست دمو
گفتگو در مورد طراحی اپلیکیشن