Software Libre

Configurar Yacy para un buen desempeño

Cosas que vale la pena saber al comenzar a usar Yacy

No soy un experto en Yacy. Este texto contiene algunos consejos para que Yacy no consuma tantos recursos en nuestro sistema que he aprendido en la práctica. A continuación explico algunas cosas que tuve que aprender al usar Yacy, el buscador p2p. Por ejemplo, cómo configurar Yacy para que no consuma tantos recursos de RAM y procesador y podamos realizar otras actividades sin apagar el buscador. También explicaré como configurar el proxy con Yacy e indexar páginas mientras navegamos, además de algunos consejos sobre cómo crawling (recolectar?) urls sin “atascar nuestro pc”.

1. Configurar el uso de RAM en Yacy

En los menus de la izquierda debemos hace clic en “Admin Console”, luego en el menú de arriba en “Performance”.La primera casilla dice “Memory Setting” por defecto viene 600 mbs de memoria. Esto es demasiado para PCs con 1GB o menos de RAM. Es recomendable introducir un valor menor (yo probé con 200 mbs), lo cual reducirá el rendimiento de Yacy pero dejará más espacio libre para otros procesos. Luego haces clic en “set” para aplicar el cambio.

2. Configurar el porcentaje que se utiliza para crawling (recolectar?)de la performance definida

En la misma sección de “Perfomance”, más abajo dice “Use Default Profile”. Recomiendo para PCs de escritorio o notebooks seleccionar valores como 25% o 10%. Esto mejora el rendimiento de tu computador mientras usas Yacy. Clic en “Save” para aplicar la configuración (se debe reiniciar Yacy).

3. Configurar las cantidad de páginas que se procesan por minuto

El proceso de crawling (que yo traduciría por recolección) de urls consume muchos recursos del procesador. Para reducir la cantidad de páginas por minuto hacemos clic en “Crawler Monitor” ubicado en el menú izquierdo de Yacy. Uno de los cuadros desplegados dice “Speed”, en aquella sección haz clic en el botón “minimun” para ordenar a Yacy que recolecte solo 10 páginas por minuto. Esto dará un respiro a tu Pc. Puedes aumentar el valor según la potencia de tu Pc o si te dedicas exclusivamente a Yacy.

4. Crawling (recolectar?) urls en forma manual

Para crawling/recolectar urls e indexarlos local y remotamente (hacia otros peers de Yacy) en forma manual conviene hacerlo desde “Crawl Start Expert”. Para ellos hacemos clic en “Index Creation” ubicado en el menú izquierdo, luego en el menú superior buscamos “Crawl Start Expert”. En “Starting Point” se introduce el url inicial, desde donde comenzará nuestra recolección. En Crawling Depth (profundidad) se debe introducir un valor. El valor 0 significa que se recolectará sólo el url de partida. Entre más profundo (más alto el número) más urls del sitio recolectará, lo cual toma más tiempo y más recursos. Elige el valor que más te convenga y según la importancia que le concedes al sitio y a sus páginas interiores. Luego puedes ver otras opciones como “Maximun Pages per Domain”, opción que permite limitar el número de páginas que se recolectan por sitio, y otras opciones que no explicaré aquí. La opción importante de marcar es “Do remote indexing”, la cual permite que lo que recolectas sea indexado en otros peer también. Para iniciar la recolección, haces clic en “Star New Crawl” y comenzará el proceso.

5. Crawling (recolectar?) urls mientras navegas

Para recolectar e indexar urls mientras navegas Yacy ofrece un proxy. Para emplearlo debes configurar tu navegador. Si usas Firefox esto se hace en “Editar” luego en “Preferencias” luego en “Avanzado” luego en la pestaña “Red” luego en “Configuración” y se abrirá la ventana “Configuración de conexión”. En la ventana seleccionas “Configuración manual de proxy”. En la caja que dice “Proxy HTTP” introduces “localhost” y donde dice “Puerto” introduces “8080”. Seleccionas la casilla usar mismo proxy para todo. Para no tener problemas al ingresar a algunas páginas, más abajo donde dice “No usar proxy para” introduces las excepciones separadas por coma. Por ejemplo: gmail.com,gnewbook.org De esta forma no se usará el proxy al ingresar a esas páginas que requieren autenticar. Una ves hecho esto, y si Yacy está encendido, recolectará en indexara las páginas que abras en tu navegador. El proxy funciona por defecto en profundidad 0 por lo que no atascará tu computador. Importante: si Yacy está apagado, no podrás navegar con este proxy.

Espero que estos consejos te hayan servido para usar Yacy sin consumir todos los recursos de tu computador. Saludos.

7 comentarios sobre “Configurar Yacy para un buen desempeño

  1. Pingback: Corazón en llamas
  2. Saludos, soy un nuevo enganchado a Ubuntu y YaCy. Creo haber instalado todo correctamente, me sale la página que mencionas.

    Según entiendo http://localhost:8090/index.html es el ejecutable de YaCy y desde ahí busco sin problemas, pero hace falta ir a administration y allí configurar lo que vamos a compartir, indexados de páginas web, etc.

    En Windows se instala en el escritorio y al ejecutarlo se abre la web http://localhost:8090/index.html, sin problemas de contraseña se puede configurar la aplicación son problema. Tampoco se si realmente se están indexando las páginas que visito.

    Aquí es cuando surge el problema, cuando accedo a administration sale un mensaje de Firefox “Inicio de sesión requerido http://localhost:8090 está solicitando un nombre de usuario y contraseña. El sitio dice “admin log-in””. Desconozco que contraseña hay que incluir y por qué en Ubuntu me la pide y en Windows no. Para otros menús de YaCy no me lo pide.
    He probado a cambiar la configuración del proxy, IPs del router, configuración de Firefox, un montón de cosas que he rastreado por la web sin darle solución.
    Haber si me podían ayudar, gracias

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s