User Tools

Site Tools


zz_deprecated:infojobs_spider

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Last revisionBoth sides next revision
infojobs_spider [2012/02/23 14:48] – created dodgerzz_deprecated:infojobs_spider [2019/07/18 07:17] – external edit 127.0.0.1
Line 1: Line 1:
 +====== Infojobs Spyder ======
  
 +
 +====== Descripcion ======
 +Este script accede a infojobs basándose en una URL predefinida y recorre los identificadores, enviando únicamente los que no ha sido publicados previamente.
 +
 +
 +====== Instrucciones ======
 +Para que el script funcione, hay que crear el fichero de configuración, el script buscará en su propio directorio los ficheros *.conf para ejecutarlos todos (multiples búsquedas/usuarios).
 +Para obtener la URL de búsqueda, hay que usar alguna extensión que capture los headers que lanza infojobs cuando se ejecuta la misma y luego cambiar la variable o bien, mirar la página de búsqueda y ver que categorías/subcategorías queremos y añadirlas a la URL.
 +Como variables a tener en cuenta de la URL:
 +^ Variable ^ Descripcion ^
 +| <code>inicio=1</code> | No tocarla, es la primera página :P |
 +| <code>resultados=1000</code> | Número de resultados que nos muestra la primera página |
 +| <code>subcategoria</code> | Las subcategorías, si se usa un conversor html a ascii se verán los caracteres "normales" |
 +
 +===== Dependencias =====
 +  * sqlite3
 +  * bash >= 3.0
 +  * wget
 +
 +===== Config File =====
 +<file config krruke.conf>
 +SEARCHURL='https://www.infojobs.net/jobsearch/search-results/list.xhtml?palabra=&of_area=150&of_pais=17&of_provincia=9&tipo_contrato=0&remuneracion_minima=0&remuneracion_maxima=0&remuneracion_formato=0&antiguedad=2&experiencia=0&ett=true&seleccion=true&inicio=1&inicio=1&&orden=10&poblacion=&nivel_estudios=0&jornada_laboral=0&subcategoria=3114%2C3113%2C3106%2C3107%2C3105%2C3110%2C3111%2C3108%2C3124%2C3109&origen_busqueda=8&origen_accion=4&canal=0&query_id=12573539010&poblacionIdGEO=0&poblacionGEO=&radioGEO=0&upsellings=false'
 +DBFILE="/home/user/jobs_mailer/user.db"
 +MAIL="user@monguimail.com"
 +</file>
 +
 +===== Script =====
  
 <file bash jobs_mailer.sh> <file bash jobs_mailer.sh>
Line 76: Line 104:
 done done
 </file> </file>
 +
 +
 +===== Programación =====
 +Mediante cron se pueden lanzar el script:
 +<code>
 +0,30    09-20               1-5             /home/root/jobs_mailer/mail_jobs-02.sh
 +</code>
 +