ABBYY FineReader Express, formatiranje teksta
(1 korsinik/a gleda/ju temu) (1) Gost

ABBYY FineReader Express, formatiranje teksta


21.01.2011 | 14:07
Kada skenirani tekst obradim u ABBYY FineReader Expres, koristeći opciju Convert to Text Document, pa taj tekst prebacim u word, ne mogu da zadržim formatiranje teksta. Naime, uvučeni redovi više nisu uvučeni, nego poravnati s lijeve strane. Postoji li mogućnost da zadržim formatiranje teksta kakav je u originalu, ili ga moram ponovo formatirati i svaku uvlaku ponovo postaviti?

U jednoj ranijoj verzijiABBYY-a sam išao na Convert to Searchable PDF i dobijao sam bolji rezultat. sada u ovoj verziji ne.

Kako postići najbolje rezultate kod ovog programa?
21.01.2011 | 17:58
A da li tekst spremaš kao Plain ili Rich Text? Spremaš li ga u .rtf formatu? Kako je kad ga otvoriš u TextEditu?
sad sam provjerio. Mora biti spremljen kao .rtf.

Javi rezultat.
21.01.2011 | 19:26
U .rtf, ali kada ga prebacim u word i formatiram, ne mogu dobiti uvlake kod pasusa, dijaloga i sl. Sve moram ponovo ručno dotjerati. Opet, velika pomoć. Ne mogu više ni zamisliti taj mukotrpni posao prekucavanja dugih (književnih) tekstova.
  • Sank
  • Moderator
  • 221
23.01.2011 | 10:58
Ja sam prebacivanje knjiga do sada radio na PC-u sa ABBYY 10-kom ravno u MS Word i osim manjeg broja ispravaka pogrešno prepoznatih slova i ponekad prevelikih razmaka između pasusa sve drugo je već ok. Do sada me najviše namučilo par stranica u jednoj knjizi gdje je tekst bio formatiran u dva stupca i to su još morali biti fino poravnati zbog veze teksta izmedju stupaca. Pokušao sam i direktno u PDF, međutim iz nekog razloga na pojedinim stranicama mi je jedan red u tekstu prelazio izvan desne margine, a nije se dalo u Acrobatu sredit, pa i dalje radim preko MS Worda.

Skinuo sam zadnju verziju za Maca pa kad probam napisat ću dojmove.
23.01.2011 | 11:04
ABBYY 10 nije za Mac, pa je možda u tome razlika.
  • Sank
  • Moderator
  • 221
23.01.2011 | 11:28
Pa vjerojatno postoji razlika između PC i Mac verzije. Daj mi malo vremena da se poigram sa Mac verzijom pa napišem osvrt.
  • Sank
  • Moderator
  • 221
24.01.2011 | 14:17
Eto isprobao sam ABBYY za Maca i prvi su dojmovi pozitivni iako se razlikuje od verzije Pro za Windoze u nekoliko bitnih točaka.

Prva je razlika, a ujedno i najveća, što Mac verzija pored slike skenirane stranice na kojoj se mogu postavljati okviri oko teksta koji će pročitati ne nudi odmah i sam tekst sa strane i to sa istaknutim eventualnim pogreškama kod prepoznavanja gdje se te greške mogu ispraviti. Zapravo, odmah po skeniranju se nudi spremanje prepoznatog teksta u prethodno izabrani RTF format, a koji se nakon toga u mojem slučaju odmah otvara u instaliranom MS Wordu. Mislim da je to nepotrebno i da bi prvo trebalo korisniku ponuditi da ispravi okvire za tekst, izmjeni ili izbriše eventualne fusnote, zatim ispravi pogreške kod prepoznavanja i tek onda napravi izvoz u željeni dokument baš kako omogućuje windows Pro verzija.

Druga je bitna razlika što Mac verzija skenirane dvije stranice knjige odjednom ne odvaja kao dvije stranice, nego ih prepoznaje kao jednu sa tekstom u dvije kolone. To jako komplicira kasnije formatiranje stranica jer se prvo treba riješiti stupaca teksta te izmjeniti orijentaciju stranice i njezin format što može dovesti do gubitka izvornog formata teksta. Ne mogu vjerovati da u Mac verziju nisu implementirali tu osnovnu opciju koju posjeduje windows verzija.

Ima još jedna stvar koja mi nije jasna. Imam kupljenu licencu za ABBYY FineReader Express Edition for MAC i nakon aktivacije i regidtracije još uvijek mi je opcija "Preferences..." na izbornku zasivljena i onemogućena? Je li to normalno ili što? Ipak sam očekivao da će imati mogućnost nekih osnovnih postavki poput inicijalnog formata stranica, isključivanje prepoznavanja fusnota itd. da sad ne nabrajam sve.

Mislim da Mac verzija po svojim mogućnostima još uvijek daleko zaostaje od svoje verzije za windowse, vjerojatno zato i onaj Express u nazivu. Mislim da je dobra za prepoznavanje kakvih dokumenata, možda ugovora i slično, ali definitivno još nije dovoljno zrela za obimniji posao kao što je prebacivanje štampanih knjiga pa čak ni njihovih manjih dijelova.

Ipak, jedna me je stvar oduševila. Naime, ja imam mrežni mutifunkcijski printer/skener i ABBYY mi ga uredno prepozna i podigne njegov ScanGear baš kao i na PCju i čak mi omogućuje slijedno skeniranje bez prekidanja

Pa Laki, da se sada još malo osvrnem na tvoj problem. Dakle, ja imam ABBYY FF Express Build 8.0.0.3891 i MS Word:mac 2011 verzija 14.0.0 (100825).

Prvo sam skenirao desetak stranica jedne knjige, onda sam još jednom provjerio okvire oko tekstova na stranicama i morao neke nepotrebne izbrisati. Još sam jednom pokrenuo prepoznavanje i tekst mi se otvorio automatski u Wordu.

Veličina stranice u wordu je bila A4, landscape orjentirana sa tekstom u dva stupca. Prvo sam selektirao cijeli tekst i "Split text into colimns" stavio na 1.

Zatim sam preko izbornika "File" -> "Page Setup..." promijenio orjentaciju u portrait, te odabrao veličinu A5 koja odgovara veličini skenirane knjige. Pokušaj da to napravim preko "Layout" kartice sa "Orientation" i "Size" rezultiralo je totalnim gubitkom formata teksta.

Dobio sam tekst koji je između nekih pasusa imao preveliki razmak koji sam eliminirao tipkom "delete", a vjerojatno zbog toga što je ABBY umetnuo page break pa se nakon ovih promjena nalaze na pogrešnom mjestu. Možda postoji i bolji način za maknuti PB, ali ja imam vremena pa to deletam

Meni su margine bile već ok, ali ako nisu sad je vrijeme da se prvo isprave margine i onda na kraju selekcijom cijelog teksta može se malo povećati ili smanjiti indent (uvlačenje) pasusa koje ovim postupkom nisam izgubio. I kad sam sve to napravio dobio sam slijedeće:

ABBYYfornat1.jpg


Oprosti, nisam neki stručnjak za word, pa vjerojatno neke stvari radim pješke, a može se vjerojatno i jednostavnije, ali meni je dovoljno da mogu prebaciti štampanu knjigu od kojih par stotinjak stranica u EPUB format i čitati na iPadu. Nekim pasusima na kraju to uvlačenje može biti veće ili manje nego drugima, pa ja to obično namjestim tako da stavim kursor na taj red i onda na horizontalnom ruleru namjestim "First line indent" oznaku da se poravna s ostalima. Vjerojatno se to može i preko trake izbornika "Format" -> "Paragraph" -> "Indents and Spacing", ali ne volim kad mi word nešto radi s tekstom automatski, a da ja to ne vidim jer često jednu stvar napravi kako treba, ali zezne neku drugu
24.01.2011 | 15:08
Teško formatira tekst. Jednostavne stvari idu. Kao gornji primjer, ali probajte neki složeniji tekst s tabelama, više kolona, slikom i razlićitim fontovima. Nije svemoguć. OCR je više zamišljen kao pomoć pri skeniranju teksta da se ne mora prekucavati. Ipak se daktilografija uči neko vrijeme, a OCR ide u par sati. Uvijek postoje iznimke koje OCR program teže savladava.
Za MAC je ABBYY FineReader Express Edition for Mac i mislim da ono express nije kao puna verzija, već ekspres. Možda griješim.
  • Sank
  • Moderator
  • 221
24.01.2011 | 16:19
@zabac OCR jest zamišljen da prvenstveno zamjeni ukucavanje, ali ABBYY se također reklamira i da može zadržati format teksta, vidi ovdje, a to prilično i dobro radi, barem kad su tekstovi u pitanju, pa čak i oni sa slikama, različitim fontovima i stupcima (osim u izuzetnim slučajevima). Isprobano i radi na Windows verziji ok. Ja sam do sada skenirao desetak knjiga od kojih je jedna imala čak 380 stranica. Za tu knjigu od 380 stranica trebalo mi je manje od 5 sati od prvog skena do gotove knjige u EPUB formatu.

Veći problem prestavlja Word koji bez obzira na svoje već dugačko postojanje i razvoj, još uvijek ima svoje mušice, pa zna izgubiti format teksta samo zbog jednog krivog klika na krivu funkciju na krivom mjestu i u krivo vrijeme Sva sreća što postoji Undo, premda sam doživio da u nekim specifičnim slučajevima čak ni Undo više ne zna vratiti prethodno stanje pa nastane sranje.

I da, dobro si to zamjetio, a ja već prethodno napisao da je ova verzija ABBYY-ja Express baš zato što joj očito nedostaju one funkcije koje ima Pro verzija na Windowsima. Na žalost za Maca za sada je izgleda dostupna samo Express verzija.
25.01.2011 | 14:29
Moje malo iskustvo sa ABBYY za Maca.
Skeniram dvije stranice knjige, odaberem Convert Text Document, tekst mi se pojavi na desktopu kao .rtf. Pojave se obje stranice jedna ispod druge, odnosno tekst kao cjelina dviju stranica. Tekst u .rtf je formatiran sa uvlakama.
Prebacim taj tekst u word (ne otvara mi se automatski u Wordu 2011) i on je takođe i tu formatiran kako treba, ali je povučen udesno. Ne vidim desnu marginu. Označim tekst u wordu, pa kliknem na Normal. E, sada su problemi - nema više formatiranog teksta, nego ga ručno moram postaviti tako da bude poravnat s obje strane i svakom pasusu dati ručno uvlaku.

Kako natjerati word da mi da i desnu marginu? Kako sačuvati uvlake?
word.jpg
26.01.2011 | 11:47
Sank je napisao:
Dakle, ja imam ABBYY FF Express Build 8.0.0.3891 i MS Word:mac 2011 verzija 14.0.0 (100825)


Da se osvrnem na ovo - Sank, updejtaj si Office, mislim da su već dva-tri updejta izašla koja poboljšavaju stabilnost i brzinu, tako nešto...
26.01.2011 | 11:52
Sank je napisao:
Za tu knjigu od 380 stranica trebalo mi je manje od 5 sati od prvog skena do gotove knjige u EPUB formatu.


Smije li se znati koje to knjige skeniraš? Samo neke znanstvene ili ima i bestsellera?

S obzirom da ovi bedaci od izdavača u nas još ništa ne rade oko digitalnih knjiga - spreman sam ti platiti za kopije tvojih skenova (imam u obitelji ljude koji jako vole čitati, no s vidom im se toliko zakompliciralo da više ne vide dovoljno dobro ovu veličinu fonta u knjigama). A onda ebookove na iPad i vozi miško.
  • Sank
  • Moderator
  • 221
26.01.2011 | 18:51
@Vanjuška

Hvala za info za office update. Zar se ne bi trebao MS office updejtat automatski kao na win? Budem provjerio.

Za knjige što pitaš do sada sam prebacio nekoliko bestselera, a i neke edukativne knjige. Možda to nije uredu, ali opet s druge strane papirnato izdanje sam platio, a čitam kad prebacim u elektronsko. Recimo da radim sigurnosnu kopiju.

Iz tog razloga rado ću ti posuditi moje sigurnosne kopije knjiga, ali nikako naplatiti da ne kršim zakon o intelektualnom vlasništvu To bi bilo isto kao da sam ti posudio papirnato izdanje. Budem ti se javio na PM sutra sa popisom.

@Laki

Nisam baš najbolje razumio kako ti se pojavi RTF tekst na desktopu, ali definitivno ti nije ok označiti tekst i kliknuti na normal, osim ako ga možda nisi nekako prekonfigurirao jer ti inače Normal style definitivno pregazi prethodni format. Koliko vidim tebi desna margina bježi izvan papira pa da li si probao preko Page Setupa provjeriti veličinu papira i postavke margina i od tamo pokušati ispraviti?
27.01.2011 | 12:12
Ne znam kako mi se pojavi okvir rtf tekst. Jednostavno iskoči prozor na desktopu satekstom. Evo slike. E, a kako sačuvati ovo formatiranje kada sve prebacim u word? To istražujem.

Uvijek mi javlja da je slika koju ovdje hoću da prikopčam prevelika.
Prilozi:
27.01.2011 | 12:17
Slika
Sim.jpg
28.01.2011 | 12:58
Skenirati se mogu po dvije stranice, a onda u Photoshopu izrezati svaku posebno, pa ubaciti u ABBY. Problem i dalje ostaje formatiranje. Istražujem dalje.
Moderatori: Bertone
  • Stranica:
  • 1

Vikalica™

Zadnja poruka: pred 1 dan, 9 sati
  • Yonkis: Hoćemo li sljedeći iParty organizirati putem Invites app-a? ;)
  • Yonkis: Apple will bring its next-generation M5 chip to the MacBook Pro in the fall, followed by the iPad Pro in the first half of 2026, according to Bloomberg’s Mark Gurman. - Wow, M5 na iPadu. M4 je već overkill ali ok. :D
  • miomika: @Zdravac...vjeruj mi, nebi ga prepoznao razliku, ni da te za guzicu ugrize. Nije to google translate.
  • miomika: Naravno Zdravac, pišeš na pamet i provjerio si, jelda?
  • Zdravac: Možda malo "old fashion", ali eto! :)
  • Zdravac: Vjeruj mi, skuži se odmah AI, ali kod ovih mlađih to prolazi jer je to, kao "kul"
  • Zdravac: Poslovna komunikacija zahtijeva poslovno znanje. Dakle, ili znaš što trebaš pisati, ili ne znaš. Ako ne znaš, zaposliti ću onoga tko zna - sigurno ne AI!
  • Zdravac: Ma kakav crni AI za poslovne mailove!! Kod mene ti to sigurno nebi prošlo!
  • drlovric: Mi saljemo stotine mailova na engleskom i da to ista valja, vec bi bilo u nasem workflow :) Ali eto, uzivaj ako te veseli. Ja it tvrdim da je beskorisno, sporo, trapavo, nedovrseno...
  • miomika: pa dok vidim full feature, nemogu sve reč. Upravo gledam na vijestima, završila je konferencija koja nama brani korištenje AI-a na uređajima. Što je zaključak, naravno, 10 mb texta ničega. Kako vidim u OS:_u, izgleda da će potiho ući na mala vrata. @dlovric možda je do ljudi koji je neznaju koristiti. Ipak je u pozadini chatGPT. Meni se ova opcija u mailu jako sviđa, da napravi poslovni
  • Soffoklo: @drlovric ne dozivljava nas Apple kao neko africko pleme vec mi sami sebe tako dozivljavamo i predstavljamo, a onda tvrtke poput Apple sukladno tome djeluju. Zato i Slovenija ima titlove, kao sto je imala i Apple Music davno prije nas i to uz potpunu uslugu, a ne djelomicnu, pa se premijer javno hvali kako eto imamo Apple Music. Do nas je.
  • drlovric: Apple AI je potpuno beskoristan. Dugo nisu vecu blamazu napravili. Svaki dan radim sa Amerima i niti jedan covjek mi nije rekao da ima jedan koristan feature. Svi cekaju bolju Siri koje nema pa nema. A ljudi kupovali iPhone 16 Pro radi "inteligencije" :D
  • miomika: ...i proofreading i onaj AI radi u mailu. Doduše, samo na engleskom, ali radi. Točno se kuži da lagano ovo preregulirano govno iz EU nema proslka i da AI lagano kuca na vrata.
  • miomika: ajde neke dobre vijesti. AKo je laptop/comp settiran na eng. radit će vam image playground s najnovijim update-om 15.3.1
  • drlovric: Apple nas dozivljava kao neko africko pleme i nema tu razumnog objasnjenja ni opravdanja.
  • drlovric: Da jadni, kako bi to mogli priustiti. Bitno bi im utjecalo na poslovanje a pokrili bi desetke miluja ljudi (HR, BIH, SRB, CG). Sve isti jezik :) Iz istog razloga nemamo titlove na Apple TV. A Slovenija ima. Valjda su veci od ostatka ex. YU :)
  • dpasaric: Nema Hrvatske jer bi to značilo da moraju zaposliti osobu koja čita komentare na našem jeziku, a za to smo premaleno tržište. Ostavi komentar na ENG na US/UK zemlji i ciao.
  • dpasaric: MacBook Pro M4 16" prikaz je na naslovnici! :)
  • Yonkis: Zašto nema Hrvatske kada se želi dati feedback na nešto Appleovo? [link]
  • Yonkis: iCloud (plus). Ne prikazuje znak “plus”. Hellou, 21st ovdje :))))
  • Yonkis: Ako imate iCloud onda možete koristiti [link] čak i sa Android korisnicima.
  • m@xym: @Zdravac, naravno da hoće.
  • Zdravac: Hoće li nam to Apple proizvodi drastično poskupiti?
  • jura22: Na danasnji da Steve Jobs je predstavio prvi komercijalni Macintosh.
  • Riba: Ja sam davno narucio sa UK Amazona ali vidim da tamo vise nije available.
  • Riba: Haha, je, evo nasao ga u order history, trebao bih nabaviti novi.
  • Yonkis: A kako to nabaviti jer vidim da je made in Scotland? Toga nema u RH ili..?
  • Vanjuška: Našao... Deo-go.com To buraz!
  • Vanjuška: Riba, nemrem naći tvoj post na forumu o onom čudesnom pripravku s Amazona koji je rješavao skorene mrlje od znoja na majicama... Sjećaš se toga? Imaš link? B>io sam kupio onomad i super je poslužilo, sad mi opet treba, a nemrem iskopati jer ne znam koji skup riječi bih koristio.
  • smayoo: Poslao sam ti nešto, ne znam je li to - to što trebaš?
  • Riba: Pogledat cu jos ali ne mogu reproducirati, posalji mi na mail developer console output u browseru, pretpostavljem da ne ucitava javascript ali ne znam zasto kod mene onda radi.
  • smayoo: Nije pomoglo
  • Riba: stefanjos i smayoo - kod mene je sve u redu na oba browsera, pokusajte ocistiti browser cache
  • jura22: Mozda postoji neka intimna povezanost. Tada se isplati.
  • kupus: Ne isplati se. Ispravan vrijedi par sto eura max, i to si sretan ako ga prodaš.
  • Damirst: Vidio sam da su nove po cca 100€. Isplati li se to s obzirom na starost uređaja?
  • Damirst: Koje grafičke mogu u taj model?
  • pbreaker: *5670 sam ja kupovao s 512mb za 2010...
  • pbreaker: Kupovao sam ja radeon 6770 za imac2010 preko aliexpressa i radi sve vec nekih godinu dana. 6970 je u 2011 modelima koliko znam, grafa s 2gb ne crkava ona je na aliju oko 80Eura. tako da bolje staviti nju nego od 1gb koja je nešto jeftinija.
  • drlovric: Imamo li nekog kolegu Jabucara iz Benkovca ili Zadra? :)
  • dpasaric: Teško ćeš to naći, to je jedino što može krepati u tim strojevima.
  • Damirst: Ekipa, ima li netko za prodati grafičku Radeon HD 6970M za iMac 27 mid 2010?
  • smayoo: I na ffox isto
  • stefanjos: oglasnik opet u banani, bar na chromeu
  • ZeljkoB: Ako netko trazi iPad Pro 11" ili iPhone 12 Pro Max, u oglasniku su, slike detaljne na zahtjev, sve kao novo
  • Lihto: Može :)
  • dpasaric: Ili ga stavi negdje sa strane. pa da ga baš ne frkneš donesi u muzej kada budeš prolazio nekom prilikom, baš ću ovih tjedana slagati novi Apple postav, pa ću vidjeti treba li mi još koji, znam da 2-3 imam sigurno u skladištu...
  • Lihto: Hvala Davore, znači ide u reciklažu..
  • dpasaric: Više ne vrijedi, njegovo vrijeme je davno prošlo, to je muzejska stvar, a i muzeju ih imamo hrpu...
  • Lihto: Jel vrijedi šta orginal Apple dock sa 30pin kablom za iPhone 4/4s? Ako netko želi kupiti može na pm..

Za vikanje moraš biti prijavljen.

Prijava

Prisutni jabučari

EJc, Ender, robee, rusty, temeljnik, tino1, vjeshalica, Anonimci (692)

Novo na Jabučnjaku

Teme

Poruke

Oglasi

Komentari

Anketa

Koji Mac koristite?

Page Speed 1.05 Seconds

Provided by iJoomla SEO