Установка программ добавления OCR слоя в Djvu, в Линуксе дистрибутив Gentoo.

Данное руководство не претендует на полноту, и на опытный «бойцов», но позволяет составить план действий для установки пакетов для OcrDjvu, что в последствии поможет в написании скрипта установки «ebuild» для установки в Gentoo.

Устанавливаем пакет dev-python/lxml:
emerge dev-python/lxml

Этот пакет необходим для встраивания текста в djvu.

Теперь установим пакет python-djvulibre.

Скачиваем http://jwilk.net/software/python-djvulibre .

Теперь разархивируем, заходим в папку с исходником, и выполняем команду, для сборки библиотеки:
python setup.py build_ext —inplace

После сборки, заходим в папку ./djvu/ и копируем следующие файлы:
__init__.py
const.py
decode.so
sexpr.so

в директорию /usr/lib/python2.6/djvu .

Это папка питона, правим под установленный в системе, у меня 2.6 по умолчанию.

На этом установка пакета python-djvulibre можно считать законченной.

А теперь самый интересный пакет, ради которого написана статья ocrodjvu — Скрипт связки с системой распознавания и встраивания текстового слоя в DJVU.

Устанавливается ещё проще.

Скачиваем - http://jwilk.net/software/ocrodjvu , распаковываем, переходим в исходники.

Создаём папку /usr/share/djvu и копируем в неё папку ./lib и djvu2hocr, hocr2djvused, ocrodjvu и ocrodjvu.py .

И создаём символические ссылки djvu2hocr, hocr2djvused, ocrodjvu в /usr/bin На этом, установка закончена.

Сыллки:

  1. http://jwilk.net/software/ocrodjvu
  2. http://jwilk.net/software/python-djvulibre

Hosted by uCoz