Don't try full ocr, it's useless.
authorDaniel Axtens <dja@ucc.gu.uwa.edu.au>
Wed, 17 Aug 2011 04:18:23 +0000 (12:18 +0800)
committerDaniel Axtens <dja@ucc.gu.uwa.edu.au>
Wed, 17 Aug 2011 04:18:23 +0000 (12:18 +0800)
scan2pages.sh

index e878bfe..5fbdab5 100755 (executable)
@@ -233,13 +233,13 @@ for scanpgnum in  `$my_seq 1 $pages`; do
 
 done
 
-#try full ocr
-rm -rf $outdir/logpgs
-ocropus book2pages $outdir/logpgs $outdir/logpg-*.png
-ocropus pages2lines $outdir/logpgs
-ocropus lines2fsts $outdir/logpgs
-ocropus fsts2bestpaths $outdir/logpgs
-ocropus buildhtml $outdir/logpgs > $outdir/out.html
+#don't try full ocr, it's a waste of time.
+#rm -rf $outdir/logpgs
+#ocropus book2pages $outdir/logpgs $outdir/logpg-*.png
+#ocropus pages2lines $outdir/logpgs
+#ocropus lines2fsts $outdir/logpgs
+#ocropus fsts2bestpaths $outdir/logpgs
+#ocropus buildhtml $outdir/logpgs > $outdir/out.html
 
 mkdir -p $outdir/pages
 mv $outdir/final-*.${extension} $outdir/pages

UCC git Repository :: git.ucc.asn.au