Pegandome con MAVEN

04/04/2010 en 14:04 | Publicado en Uncategorized | Deja un comentario

Para este proyecto estoy usando una gran cantidad de librerías, que postearé en una entrada del blog. En este caso os voy a hablar del api de apache TIKA. Sirve para extraer el contenido de ficheros como pdf, doc, html… y un largo etcétera.

El mayor problema residía en que en la página de la api solo estaban los códigos fuente de la API, y había que compilarlos usando Maven.

Los pasos para instalar Maven no son nada complicados. En linux bastará con lo siguiente:

$ cd /usr/local
$ tar -xzf maven-2.2.1.tar.gz
$ ln -s maven-2.2.1 maven
$export PATH=/usr/local/maven/bin:${PATH}

En Windows tenemos que primero añadir como variables de entorno:

M2_HOME = C:\maven-2.2.1

Y después añadir al path del sistema:

%M2_HOME%\bin

Podremos comprobar si funciona poniendo en la linea de comandos:

mvn -version

Pues bueno, una vez que lo tenemos instalado procederemos a compilar las fuentes de Tika. En mi caso cuando intentaba compilar Tika, me fallaban varias de las pruebas que hacia. Lei en un post Ruben Laguna para solucionar el problema que tiene Tika 0.6 con el idioma que no sea el “en_US” lo único que tenemos que hacer es:

export LC_ALL=en_US.UTF-8

Una vez que he cambiado esto, todos los test los ha pasado a la perfección, así que Ruben muchas gracias por haber escrito una entrada en tu blog con la solución.

Anuncios

Dejar un comentario »

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Blog de WordPress.com.
Entries y comentarios feeds.

A %d blogueros les gusta esto: