Скенирање и претварање слика у текст помоћу ОЦР, оптичко препознавање знакова

2016-09-02 11:42:19
Главни·Софтвер·Скенирање и претварање слика у текст помоћу ОЦР, оптичко препознавање знакова

Није нечувено да документ можете примити е-поштом који вам је послан у облику слике или можда у облику ПДФ датотеке и морате да будете у могућности да измените или имате текст у облику за уређивање. Понекад ћете можда морати да скенирате неке документе преко скенера и да бисте морали да их уређујете из свог програма за обраду текста.

Уређивање слике или директно скенирано у датотеци није могуће само по себи, и уколико немате времена за резерву, нећете желети да куцате све у себи. Оно што вам је потребно је нешто што се већ неко вријеме назива оптичким препознавањем знакова (ОЦР) што преводи текст у сликама у текст који можете уређивати. Неки од најбољих софтверских пакета ОЦР су Омнипаге и ФинеРеадер, али коштају великог новца. Ево избора углавном бесплатних начина да се ваш текст претвори у обрадив облик. 1. ФрееОЦР

ФрееОЦР је ОЦР програм заснован на Тессерацт мотору отвореног кода који Гоогле одржава и сматра се веома тачним. Може да прихвати унос директно из скенера, ПДФ датотеке и неколико различитих врста формата слике, укључујући ТИФФ датотеке са више страница, истовремено подржавајући конверзију помоћу 11 различитих језика. Такође можете да изаберете одређене делове улазног документа за конверзију који су корисни за више блокова или ступаца текста, а излаз се може извозити директно у Ворд или као обогаћени текст.

Обратите пажњу током инсталације јер програм користи Инсталл Манагер да вам понуди неколико бита адваре-а. ФрееОЦР ради на Виндовс КСП у Виндовс 8, инсталација .НЕТ Фрамеворк в2 потребна је за КСП кориснике. ФрееОЦР се такође може користити у комерцијалне и личне сврхе.

Преузмите ФрееОЦР


2. СимплеОЦР

Софтвер СимплеОЦР бесплатан је за личну, едукативну и комерцијалну употребу и прихвата улаз са скенера, ЈПГ, БМП и ТИФФ слика са више страница. Резултирајући текст се може сачувати као стандардни текстуални фајл или Ворд документ. Након инсталације, када први пут покренете СимплеОЦР, изаберите најбољу опцију „Мацхине Принт“ (Штампање машина) која је бесплатна, доња опција је 14-дневни демо напреднијег софтвера. Затим изаберите 1 од 4 језика за свој профил и кликните на Селецт.

Кликом на дугме Додај страницу може се додати неколико страница и претворити помоћу Претвори у текст. Након што се препознавање знака заврши, резултирајући текст ће се приказати у доњем прозору обојеним речима како би вас обавестио о потенцијалним проблемима са правописом. Плава је сумњива реч, црвена је реч која се не налази у речнику програма итд., А свака од ових речи може се проверити с падајуће листе понуђених алтернатива.

Преузмите СимплеОЦР


3. и2ОЦР

и2ОЦР је бесплатна и неограничена услуга на мрежи за конверзију ОЦР-а од Сцивеаверс.орг која прихвата уносе са слика формата ТИФ, ЈПГ, ПНГ, БМП, ГИФ, ПБМ, ПГМ и ППМ. Постоји подршка за огромна 33 језика и иако је максимална величина датотеке ограничена на 10 МБ, то би требало бити довољно за већину општих употреба.

Употреба је прилично једноставна, само одаберите дугме да бисте претражили датотеку на рачунару или УРЛ опција може зграбити датотеку директно са интернетске локације, као што је Дропбок итд. Изаберите језик са падајућег пада и кликните велико дугме за конверзију датотеке, време конверзије је било само неколико секунди када је тестирано. Чини се да је тачност конверзије одлична иако је то само обичан текст, а појавит ће се упоредо са оригиналном сликом ниже у прозору на коју затим можете кликнути да бисте истакли и копирали у документ или директно снимили као Ворд .ДОЦ датотеку . Сцивеаверс такође има неколико других корисних алата за конверзију формата, укључујући претварање датотека у ПДФ.

Посетите и2ОЦР


4. ОЦР на мрежи

Бесплатни Интернет ОЦР има бесплатну и плаћену услугу, а бесплатна вам омогућава претварање до 15 страница на сат. Ово укључује учитавање ЈПГ, БМП, ТИФ, ПНГ, ПЦКС, ГИФ и вишестранских ПДФ докумената за обраду у 1 од 32 препозната језика са величином до 4МБ сваки. Излаз може бити или Ворд документ (ДОЦ), прорачунска таблица Екцел (КСЛС) или обична текстуална датотека (ТКСТ).

Изаберите локалну датотеку за уплоад, кликните дугме Уплоад, унесите нумерирану цаптцха и подесите жељени језик и формат исписа. Затим кликните Препознај и причекајте неколико секунди док се претвара. Добивени текст ће се појавити испод, уз дугме да бисте га преузели као одабрани формат датотеке.

Посетите Интернет ОЦР


5. Бесплатно онлине ОЦР

Ова интернетска услуга има подршку за учитавање најпопуларнијих формата слика ЈПГ, ГИФ, БМП, ПНГ, ТИФФ, као и подршку за ОЦР конверзију ПДФ докумената. Након конверзије резултирајући текст се такође може извести у неколико различитих формата Ворд ДОЦ, Рицхтект РТФ, обичног ТКСТ-а и такође слојевитог ПДФ документа. Програм се такође труди да распоред текста и форматирање буде што ближе оригиналној копији.

Да бисте користили услугу, једноставно одаберите датотеку за пренос и одаберите формат који желите да буде сачуван, а затим кликните на дугме. Добивате лијеп мјерач напретка који требате погледати током конверзије, а дугме за преузимање појавиће се након што буде довршено. Чини се да је бесплатни Интернет ОЦР прилично добро функционирао и задржао је величину и обликовање фонта у већини случајева. Услуга је бесплатна за употребу, али се не спомиње величина датотеке или ограничења употребе што је помало збуњујуће јер не знамо да ли је заиста неограничено или једноставно нису споменули која су ограничења ...

Посетите бесплатни онлајн ОЦР


6. НевОЦР

Ова бесплатна ОЦР услуга на мрежи сигурно има пуно подршке за формат уноса. Постоји 9 уобичајених формата слика, подршка за слике унутар Зип архива, документи с више страница попут ПДФ-а, ТИФФ-а и ДјВу-а, као и ДОЦКС и ОДТ датотеке. Листа излаза је мања, али и даље корисна ако имате на располагању ТКСТ, ДОЦ и ПДФ датотеку. Препознавањем управљају Тессерацт и Цунеиформ мотори и могу препознати укупно 58 језика, као и текст са више колона, као и слике слабијег квалитета.

Да бисте користили НевОЦР, једноставно одаберите локалну датотеку или једну директну из УРЛ-а, одаберите језик препознавања и притисните дугме Превиев. Ово ће учитати страницу за преглед, а испод ње ће се приказати претворени ОЦР текст. Ако не можете видети текст, притисните плави тастер ОЦР. Текст се може извести на различите начине, укључујући стандардно преузимање у један од три формата датотека, копирање у међуспремник, стављање путем Гоогле или Бинг преводилаца, лепљење на мрежи у Пастебин или Пастие, па чак и слање директно у Гоогле документе. НевОЦР има неограничено учитавање и не захтева никакву регистрацију.

Посетите НевОЦР


7. Мицрософт Оффице Доцумент Имагинг

Као што знамо, Мицрософт Оффице није бесплатан производ, али велики број корисника вероватно ће имати инсталирану неку врсту верзије. Алат за Оффице Доцумент Имагинг може да изврши ОЦР на документу и резултати су веома добри, али нажалост није лако доступан у свим верзијама система Оффице. Оффице 2003 би га требало да подразумевано укључи у вашу инсталацију, корисници система Оффице 2007 мораће да га ручно додају из опције додавање компоненти, а по подразумеваном положају није ни у Оффицеу 2010. Упутства о томе како додати МОДИ у Оффице 2010 можете пронаћи на Мицрософт.цом.

Опција Мицрософт Оффице Доцумент Имагинг можете да пронађете у менију Старт -> Програми -> Мицрософт Оффице -> Мицрософт Оффице Тоолс. Препознаје само ТИФФ слике као улазни извор, тако да ћете вероватно претходно морати да конвертујете своје документе. Отворите датотеку и кликните на икону ока на алатној траци под називом „Препознај текст помоћу ОЦР-а“. Затим кликните на дугме са десне стране да бисте текст директно послали у Ворд.

Напомена уредника: ОЦРОнлине је још једна тестирана бесплатна услуга, али имате само 5 бесплатних конверзија на 1 страницу недељно, што је мало превише рестриктивно и такође морате да отворите налог. Квалитет конверзије је врло добар, иако вам је сада и поново потребна само непарна страница.

Гоогле документи такође имају могућност претварања ПДФ датотека и слика у документе путем ОЦР-а. Идите на Гоогле диск и кликните на Опције -> Поставке за уплоад -> Претворите текст из пренесених ПДФ и сликовних датотека, а затим изаберите опцију потврде. Тада ћете питати да ли желите да ОЦР слику или ПДФ желите да пренесете на Гоогле диск.

Избор Уредника