Audiollibre

Differences between revisions 40 and 41
Revision 40 as of 2008-06-23 17:30:57
Size: 8605
Editor: 25
Comment:
Revision 41 as of 2008-08-06 16:23:09
Size: 8671
Editor: localhost
Comment: converted to 1.6 markup
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
[[Include(CatalanTeam/Capçalera)]] <<Include(CatalanTeam/Capçalera)>>
Line 5: Line 5:
'''Resum:''' Indiquem com fer, a partir d'un arxiu de text, un [http://ca.wikipedia.org/wiki/Audiollibre audiollibre] en català, amb Ubuntu, Festival i les [https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/ veus catalanes] del Festcat. Això amb una senzilla ordre (''bash audiollibre.sh arxiu.txt [autor]'') i que genera un arxiu mp3 (o bé ogg) per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3. '''Resum:''' Indiquem com fer, a partir d'un arxiu de text, un [[http://ca.wikipedia.org/wiki/Audiollibre|audiollibre]] en català, amb Ubuntu, Festival i les [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/|veus catalanes]] del Festcat. Això amb una senzilla ordre (''bash audiollibre.sh arxiu.txt [autor]'') i que genera un arxiu mp3 (o bé ogg) per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3.
Line 7: Line 7:
||<tablestyle="float:center; font-size: 0.9em; width:95%; background:#F1F1ED; margin: 0 0 1em 1em;" style="padding:0.5em; ">'''Índex'''[[BR]][[TableOfContents]]|| ||<tablestyle="float:center; font-size: 0.9em; width:95%; background:#F1F1ED; margin: 0 0 1em 1em;" style="padding:0.5em; ">'''Índex'''<<BR>><<TableOfContents>>||
Line 10: Line 10:
Primer cal instal·lar les [https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/ veus catalanes del Festcat com s'indica aquí]. Primer cal instal·lar les [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/|veus catalanes del Festcat com s'indica aquí]].
Line 14: Line 14:
attachment:audiollibre.sh Que converteix un arxiu de text a mp3, separant els capítols i llegint-los amb Festival [[attachment:audiollibre.sh]] Que converteix un arxiu de text a mp3, separant els capítols i llegint-los amb Festival
Line 16: Line 16:
attachment:divcapitols.sh Que separa un arxiu.txt en els seu capítols [[attachment:divcapitols.sh]] Que separa un arxiu.txt en els seu capítols
Line 18: Line 18:
[https://wiki.ubuntu.com/CatalanTeam/Tutorials/S%c3%adntesiDeVeu/Scripts?action=AttachFile&do=get&target=text2mp3.sh text2mp3.sh] Que converteix un arxiu de text a mp3 llegint-lo amb Festival (veieu a les notes com fer-ho en ogg). [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/S%c3%adntesiDeVeu/Scripts?action=AttachFile&do=get&target=text2mp3.sh|text2mp3.sh]] Que converteix un arxiu de text a mp3 llegint-lo amb Festival (veieu a les notes com fer-ho en ogg).
Line 31: Line 31:
 * Si volem fer l'audiollibre en el format lliure ogg, enlloc del mp3, podem fer servir aquest altre script: [https://wiki.ubuntu.com/CatalanTeam/Tutorials/S%c3%adntesiDeVeu/Scripts?action=AttachFile&do=get&target=text2ogg.sh text2ogg.sh] i n'hi haurà prou amb uns canvis a audiollibre.sh, per tal que cridi a ''text2ogg.sh'' en lloc de ''text2mp3.sh''  * Si volem fer l'audiollibre en el format lliure ogg, enlloc del mp3, podem fer servir aquest altre script: [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/S%c3%adntesiDeVeu/Scripts?action=AttachFile&do=get&target=text2ogg.sh|text2ogg.sh]] i n'hi haurà prou amb uns canvis a audiollibre.sh, per tal que cridi a ''text2ogg.sh'' en lloc de ''text2mp3.sh''
Line 50: Line 50:
Volem fer un audiollibre.sh amb l'obra Arran del Cingle de Josep Morató i Grau, del [http://www.gutenberg.org/browse/languages/ca Projecte Gutemberg]: Volem fer un audiollibre.sh amb l'obra Arran del Cingle de Josep Morató i Grau, del [[http://www.gutenberg.org/browse/languages/ca|Projecte Gutemberg]]:
Line 52: Line 52:
Anem a [http://manybooks.net/titles/grauj2544325443-8.html Manybooks aquí], i ho baixem en format RTF. L'obrim i copiem tot el contingut (Ctrl-C) a l'editor de text (gedit) i ho desem amb el nom Arran_del_Cingle.txt en format txt, (veieu més endavant ''Problemes coneguts'') Anem a [[http://manybooks.net/titles/grauj2544325443-8.html|Manybooks aquí]], i ho baixem en format RTF. L'obrim i copiem tot el contingut (Ctrl-C) a l'editor de text (gedit) i ho desem amb el nom Arran_del_Cingle.txt en format txt, (veieu més endavant ''Problemes coneguts'')
Line 92: Line 92:
 * [http://www.bnc.cat/fons/coldigital.php Biblioteca de Catalunya]  * [[http://www.bnc.cat/fons/coldigital.php|Biblioteca de Catalunya]]
Line 94: Line 94:
 * [http://www.cbuc.es/cbuc/programes_i_serveis/bdc/ Biblioteca Digital de Catalunya]  * [[http://www.cbuc.es/cbuc/programes_i_serveis/bdc/|Biblioteca Digital de Catalunya]]
Line 96: Line 96:
 * [http://bv2.gva.es/default.php Biblioteca Valenciana Digital]  * [[http://bv2.gva.es/default.php|Biblioteca Valenciana Digital]]
Line 98: Line 98:
 * [http://www.lluisvives.com/index.jsp Biblioteca Virtual Joan Lluís Vives]  * [[http://www.lluisvives.com/index.jsp|Biblioteca Virtual Joan Lluís Vives]]
Line 100: Line 100:
 * [http://www.culturalliure.org/ Cultura Lliure]  * [[http://www.culturalliure.org/|Cultura Lliure]]
Line 102: Line 102:
 * [http://www.cervantesvirtual.com/Buscar.html?titulo=&opTitulo=and&autor=&opAutor=and&materia=&opMateria=and&otrosCampos=catalan&opOtrosCampos=and&periodo=&enviar=Buscar Biblioteca Miguel de Carvantes]  * [[http://www.cervantesvirtual.com/Buscar.html?titulo=&opTitulo=and&autor=&opAutor=and&materia=&opMateria=and&otrosCampos=catalan&opOtrosCampos=and&periodo=&enviar=Buscar|Biblioteca Miguel de Carvantes]]
Line 106: Line 106:
 * [http://www.uoc.edu/masters/cat/web/materials_lliures.html La Universitat Oberta de Catalunya] (Molts textos són en format pdf)  * [[http://www.uoc.edu/masters/cat/web/materials_lliures.html|La Universitat Oberta de Catalunya]] (Molts textos són en format pdf)
Line 108: Line 108:
 * [http://www.uoc.edu/lletra/especials/folch/ Selecció de Poesia Catalana]  * [[http://www.uoc.edu/lletra/especials/folch/|Selecció de Poesia Catalana]]
Line 110: Line 110:
 * [http://gclub.ourproject.org/tiki-list_file_gallery.php?galleryId=6 Grup de Coneixement lliure de la UB]  * [[http://gclub.ourproject.org/tiki-list_file_gallery.php?galleryId=6|Grup de Coneixement lliure de la UB]]
Line 112: Line 112:
 * [http://upcommons.upc.edu/ UPC Commons]  * [[http://upcommons.upc.edu/|UPC Commons]]
Line 114: Line 114:
 * [http://bibliotecnica.upc.es/gratuits/inici.asp?lletra=I Llibres de lliure accés d'interès politècnic]  * [[http://bibliotecnica.upc.es/gratuits/inici.asp?lletra=I|Llibres de lliure accés d'interès politècnic]]
Line 116: Line 116:
 * [http://www.ub.edu/stitc/ UB Servei de tractament informatitzat de textos catalans]  * [[http://www.ub.edu/stitc/|UB Servei de tractament informatitzat de textos catalans]]
Line 118: Line 118:
 * [http://www.rialc.unina.it/ RIALC] Repertorio infomatizzato dell'antica letteratura catalana  * [[http://www.rialc.unina.it/|RIALC]] Repertorio infomatizzato dell'antica letteratura catalana
Line 122: Line 122:
 * [http://www.gutenberg.org/browse/languages/ca El Projecte Gutemberg] (conté obres en format txt)  * [[http://www.gutenberg.org/browse/languages/ca|El Projecte Gutemberg]] (conté obres en format txt)
Line 124: Line 124:
 * [http://manybooks.net/language.php?code=ca Manybooks] Els mateixos llibres del Projecte Gutemberg, disponibles en molts formats  * [[http://manybooks.net/language.php?code=ca|Manybooks]] Els mateixos llibres del Projecte Gutemberg, disponibles en molts formats
Line 126: Line 126:
 * [http://ca.wikibooks.org/wiki/Portada Viquillibres]  * [[http://ca.wikibooks.org/wiki/Portada|Viquillibres]]
Line 128: Line 128:
 * [http://books.google.es/books?hl=ca Google Llibres]  * [[http://books.google.es/books?hl=ca|Google Llibres]]
Line 135: Line 135:
 * Veieu també l'apartat "Problemes coneguts del [https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/Scripts scripts]  * Veieu també l'apartat "Problemes coneguts del [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/Scripts|scripts]]
Line 139: Line 139:
 * Com instal·lar instal·lar les [https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/ veus catalanes del Festcat a Ubuntu]  * Com instal·lar instal·lar les [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/|veus catalanes del Festcat a Ubuntu]]
Line 141: Line 141:
 * Scripts per a les [https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/Scripts veus catalanes del Festcat a Ubuntu]  * Scripts per a les [[https://wiki.ubuntu.com/CatalanTeam/Tutorials/SíntesiDeVeu/Scripts|veus catalanes del Festcat a Ubuntu]]
Line 143: Line 143:
 * [http://en.wikipedia.org/wiki/Pdftotext Conversió de fitxers pdf a txt] (en anglés)  * [[http://en.wikipedia.org/wiki/Pdftotext|Conversió de fitxers pdf a txt]] (en anglés)
Line 148: Line 148:
2008-6-9 A la [attachment:SintesiDeVeuV0.1.tar.gz primera versió] l'etiqueta del número de la pista no sempre es desava bé. Solucionat en aquesta versió. 2008-6-9 A la [[attachment:SintesiDeVeuV0.1.tar.gz|primera versió]] l'etiqueta del número de la pista no sempre es desava bé. Solucionat en aquesta versió.

Com fer un audiollibre en català, amb Ubuntu

Resum: Indiquem com fer, a partir d'un arxiu de text, un audiollibre en català, amb Ubuntu, Festival i les veus catalanes del Festcat. Això amb una senzilla ordre (bash audiollibre.sh arxiu.txt [autor]) i que genera un arxiu mp3 (o bé ogg) per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3.

Instal·lació

Primer cal instal·lar les veus catalanes del Festcat com s'indica aquí.

Baixem aquests tres scripts i els desem en una carpeta:

audiollibre.sh Que converteix un arxiu de text a mp3, separant els capítols i llegint-los amb Festival

divcapitols.sh Que separa un arxiu.txt en els seu capítols

text2mp3.sh Que converteix un arxiu de text a mp3 llegint-lo amb Festival (veieu a les notes com fer-ho en ogg).

I els hi donem permisos d'execució fent, en un terminal:

{{{$ chmod 755 audiollibre.sh $ chmod 755 divcapitols.sh $ chmod 755 text2mp3.sh }}}

Notes:

  • Els dos primers scripts només són necessaris per a dividir un llibre en capítols i transformar aquests capítols amb un arxiu (pista) d'àudio per a cada capítols. Si només volem fer un arxiu d'àudio, només cal el tercer script.
  • Si volem fer l'audiollibre en el format lliure ogg, enlloc del mp3, podem fer servir aquest altre script: text2ogg.sh i n'hi haurà prou amb uns canvis a audiollibre.sh, per tal que cridi a text2ogg.sh en lloc de text2mp3.sh

Ús

Suposant que els capítols del llibre comencin amb una línia del tipus "XX" (en números romans, com els llibres del Projecte Gutemberg), farem:

{{{$ bash audiollibre.sh arxiu.txt [autor] }}}

Si conté espais, el nom de l'autor ha d'anar entre cometes.

Convé que el nom de l'arxiu.txt coincideixi amb el títol del llibre, amb caràcters de subratllat ("_") per al espais, ja que s'utilitzarà com a etiqueta del títol de tots els arxius (eliminant la extensió). Ha d'estar codificat amb latin-1.

I si tot es correcte, es crearan dos arxius per a cada capítol XX del llibre, que es diran:

{{{Titol_del_llibre_-_Capitol_XX.txt Titol_del_llibre_-_Capitol_XX.mp3 }}}

Exemple

Volem fer un audiollibre.sh amb l'obra Arran del Cingle de Josep Morató i Grau, del Projecte Gutemberg:

Anem a Manybooks aquí, i ho baixem en format RTF. L'obrim i copiem tot el contingut (Ctrl-C) a l'editor de text (gedit) i ho desem amb el nom Arran_del_Cingle.txt en format txt, (veieu més endavant Problemes coneguts)

Un cop seguides les instruccions anteriors (Instal·lació), fem:

{{{bash audiollibre.sh Arran_del_Cingle.txt "Josep Morató i Grau" }}}

esperem una bona estona i obtindrem 23 arxius de text i 23 arxius mp3, un per cada capítol, amb les etiquetes ID3 del títol, autor, àlbum, any, pista i gènere ben posades per al nostre reproductor de mp3. Al terminal anirem rebent informació del progrés i dels eventuals problemes.

Nota: Al Projecte Gutemberg hi ha una còpia del mateix llibre en format txt, i ens podriem estalviar un pas, però per alguna raó, els capítols llavors no es separen bé. Si ho descobriu, digueu-nos'ho.

Sobre els noms del capítols

Si els noms del capítols no venen en números romans, caldrà adaptar l'script divcapitols.sh. Per exemple si són del tipus "Capítol 99", caldrà posar un caràcter "#" a línia que conté la ordre csplit (amb la qual cosa la convertim en un comentari):

{{{# csplit -s -f "${1%.txt}_-_Capítol_" $1 "/^[IVX]*[IVX]*[IVX]$/" "{*}" }}} I treurem el primer caràcter ("#") de la línia següent, que quedarà així:

{{{csplit -s -f "${1%.txt}_-_Capítol_" $1 "/Capítol /" "{*}" }}} que era un comentari i ara sí que s'executarà.

Les opcions i paràmetres signifiquen:

"-f ${1%.txt}_-_Capítol_" que els noms del capítols començaran per arxiu sense extensió (1%.txt) seguit de _-_Capítol_ i el número del capítol.

$1 El nom de l'arxiu que volem dividir

"/^[IVX]*[IVX]*[IVX]$/" L'expressió regular que es cerca per separar els capítols

"{*}" Indica que es separin tots els capítols que es trobin.

Espero que aquests dos exemples ens permetin adaptar-lo a les nostres necessitats. (Veieu les referències sobre expressions regulars).

On trobar llibres de text en català

Hi ha molts llocs, com ara:

Biblioteques

Universitats

Internacionals

Si en trobeu més, afegiu-los aquí.

Problemes coneguts

Degut a un problema de la versió actual de les veus Festcat (veu la pàgina corresponent) els caràcters "¡" i "¿" que per altra banda no són necessaris en el català actual, però que es troben en llibres antics com el proposat a l'exemple, fan que el motor de veu doni errors. La solució es eliminar-los del llibre abans de la seva conversió, la qual cosa es por fer en dos simples substitucions amb Reemplaça (Control+H).

  • Veieu també l'apartat "Problemes coneguts del scripts

Veieu també

{{{ $ sudo apt-get install pdftotext

  • $ pdftotext -enc Latin1 arxiu.pdf arxiu.txt

}}}

Registre de canvis

2008-6-9 A la primera versió l'etiqueta del número de la pista no sempre es desava bé. Solucionat en aquesta versió.

2008-6-10 Ara tots els arxius es desen en una carpeta.

Referències

Sobre l'ús d'expressions regulars:

http://www.ncsa.uiuc.edu/UserInfo/Resources/Hardware/IBMp690/IBM/usr/share/man/info/en_US/a_doc_lib/cmds/aixcmds1/csplit.htm

http://www.opengroup.org/onlinepubs/000095399/utilities/csplit.html

http://gnosis.cx/publish/programming/text_utils.html

Crèdits: PacoRivière http://pacoriviere.cat/ http://galindaines.blogspot.com/

CatalanTeam/Tutorials/SíntesiDeVeu/Audiollibre (last edited 2010-02-21 14:21:48 by 73)