Com fer un audiollibre en català, amb Ubuntu

Resum: Indiquem com fer, a partir d'un arxiu de text, un audiollibre en català, amb Ubuntu, Festival i les veus catalanes del Festcat. Això amb una senzilla ordre (bash audiollibre.sh arxiu.txt [autor]) i que genera un arxiu mp3 (o bé ogg) per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3.

Índex

Contents

Com fer un audiollibre en català, amb Ubuntu

Instal·lació

Si feu servir Ubuntu Hardy 8.04, o posterior, veieu això.

Primer cal instal·lar les veus catalanes del Festcat com s'indica aquí.

Baixem aquests tres scripts i els desem en una carpeta:

audiollibre.sh Que converteix un arxiu de text a mp3, separant els capítols i llegint-los amb Festival

divcapitols.sh Que separa un arxiu.txt en els seu capítols

text2mp3.sh Que converteix un arxiu de text a mp3 llegint-lo amb Festival (veieu a les notes com fer-ho en ogg).

I els hi donem permisos d'execució fent, en un terminal:

$ chmod 755 audiollibre.sh 
$ chmod 755 divcapitols.sh 
$ chmod 755 text2mp3.sh

Notes:

Els dos primers scripts només són necessaris per a dividir un llibre en capítols i transformar aquests capítols amb un arxiu (pista) d'àudio per a cada capítols. Si només volem fer un arxiu d'àudio, només cal el tercer script.
Si volem fer l'audiollibre en el format lliure ogg, enlloc del mp3, podem fer servir aquest altre script: text2ogg.sh i n'hi haurà prou amb uns canvis a audiollibre.sh, per tal que cridi a text2ogg.sh en lloc de text2mp3.sh

Ús

Suposant que els capítols del llibre comencin amb una línia del tipus "XX" (en números romans, com els llibres del Projecte Gutemberg), farem:

$ bash audiollibre.sh arxiu.txt [autor]

Si conté espais, el nom de l'autor ha d'anar entre cometes.

Convé que el nom de l'arxiu.txt coincideixi amb el títol del llibre, amb caràcters de subratllat ("_") per al espais, ja que s'utilitzarà com a etiqueta del títol de tots els arxius (eliminant la extensió). Ha d'estar codificat amb latin-1.

I si tot es correcte, es crearan dos arxius per a cada capítol XX del llibre, que es diran:

Titol_del_llibre_-_Capitol_XX.txt
Titol_del_llibre_-_Capitol_XX.mp3

Exemple

Volem fer un audiollibre.sh amb l'obra Arran del Cingle de Josep Morató i Grau, del Projecte Gutemberg:

Anem a Manybooks aquí, i ho baixem en format RTF. L'obrim i copiem tot el contingut (Ctrl-C) a l'editor de text (gedit) i ho desem amb el nom Arran_del_Cingle.txt en format txt, (veieu més endavant Problemes coneguts)

Un cop seguides les instruccions anteriors (Instal·lació), fem:

bash audiollibre.sh Arran_del_Cingle.txt "Josep Morató i Grau"

esperem una bona estona i obtindrem 23 arxius de text i 23 arxius mp3, un per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3. Al terminal anirem rebent informació del progrés i dels eventuals problemes.

Nota: Al Projecte Gutemberg hi ha una còpia del mateix llibre en format txt, i ens podriem estalviar un pas, però per alguna raó, els capítols llavors no es separen bé. Si ho descobriu, digueu-nos'ho.

Sobre els noms del capítols

Si els noms del capítols no venen en números romans, caldrà adaptar l'script divcapitols.sh. Per exemple si són del tipus "Capítol 99", caldrà posar un caràcter "#" a línia que conté la ordre csplit (amb la qual cosa la convertim en un comentari):

# csplit -s -f "${1%.txt}_-_Capítol_" $1 "/^[IVX]*[IVX]*[IVX]$/" "{*}"

I treurem el primer caràcter ("#") de la línia següent, que quedarà així:

csplit -s -f "${1%.txt}_-_Capítol_" $1 "/Capítol /" "{*}"

que era un comentari i ara sí que s'executarà.

Les opcions i paràmetres signifiquen:

"-f ${1%.txt}_-_Capítol_" que els noms del capítols començaran per arxiu sense extensió (1%.txt) seguit de _-_Capítol_ i el número del capítol.

$1 El nom de l'arxiu que volem dividir

"/^[IVX]*[IVX]*[IVX]$/" L'expressió regular que es cerca per separar els capítols

"{*}" Indica que es separin tots els capítols que es trobin.

Espero que aquests dos exemples ens permetin adaptar-lo a les nostres necessitats. (Veieu les referències sobre expressions regulars).

On trobar llibres de text en català

Hi ha molts llocs, com ara:

Biblioteques

Universitats

La Universitat Oberta de Catalunya (Molts textos són en format pdf)
Selecció de Poesia Catalana
Grup de Coneixement lliure de la UB
UPC Commons
Llibres de lliure accés d'interès politècnic
UB Servei de tractament informatitzat de textos catalans
RIALC Repertorio infomatizzato dell'antica letteratura catalana

Internacionals

El Projecte Gutemberg (conté obres en format txt)
Manybooks Els mateixos llibres del Projecte Gutemberg, disponibles en molts formats
Viquillibres
Google Llibres

Si en trobeu més, afegiu-los aquí.

Problemes coneguts

Degut a un problema de la versió actual de les veus Festcat (veu la pàgina corresponent) els caràcters "¡" i "¿" que per altra banda no són necessaris en el català actual, però que es troben en llibres antics com el proposat a l'exemple, fan que el motor de veu doni errors. La solució es eliminar-los del llibre abans de la seva conversió, la qual cosa es por fer en dos simples substitucions amb Reemplaça (Control+H).

Veieu també l'apartat "Problemes coneguts del scripts

Veieu també

Com instal·lar instal·lar les veus catalanes del Festcat a Ubuntu
Scripts per a les veus catalanes del Festcat a Ubuntu
Conversió de fitxers pdf a txt (en anglès)

 $ sudo apt-get install pdftotext
 $ pdftotext -enc Latin1 arxiu.pdf arxiu.txt

Registre de canvis

2008-6-9 A la primera versió l'etiqueta del número de la pista no sempre es desava bé. Solucionat en aquesta versió.

2008-6-10 Ara tots els arxius es desen en una carpeta.

Referències

Sobre l'ús d'expressions regulars:

http://www.ncsa.uiuc.edu/UserInfo/Resources/Hardware/IBMp690/IBM/usr/share/man/info/en_US/a_doc_lib/cmds/aixcmds1/csplit.htm (en anglès)

http://www.opengroup.org/onlinepubs/000095399/utilities/csplit.html (en anglès)

http://gnosis.cx/publish/programming/text_utils.html (en anglès)

Crèdits: PacoRivière http://pacoriviere.cat/ http://galindaines.blogspot.com/

CategoryTutorialsEnCatala

CatalanTeam/Tutorials/SíntesiDeVeu/Audiollibre (last edited 2010-02-21 14:21:48 by 73)

Ubuntu Wiki

Audiollibre