Cómo Extraer Todos Los Enlaces

Tabla de contenido:

Cómo Extraer Todos Los Enlaces
Cómo Extraer Todos Los Enlaces

Video: Cómo Extraer Todos Los Enlaces

Video: Cómo Extraer Todos Los Enlaces
Video: Cómo extraer todas las URLs de una página web en menos de 1 minuto 2024, Mayo
Anonim

Internet vive de enlaces. Al hacer clic en los enlaces, los usuarios se mueven entre las páginas de los sitios. Al publicar enlaces, se llama la atención sobre recursos interesantes. Los motores de búsqueda utilizan enlaces para reponer la base de búsqueda y calcular los parámetros utilizados en la clasificación. Los enlaces son la columna vertebral de la web. Es por eso que el enlace correcto y la estructura de enlace correcta son tan importantes para cada recurso. Y es por eso que todo webmaster debe conocer la respuesta a la pregunta de cómo extraer todos los enlaces de un sitio, una página individual o un grupo de páginas.

Cómo extraer todos los enlaces
Cómo extraer todos los enlaces

Es necesario

  • - el programa gratuito Xenu's Link Sleuth, disponible para descargar en
  • - Conexión a Internet.

Instrucciones

Paso 1

Cree un nuevo proyecto en Link Sleuth de Xenu. En el menú principal de la aplicación, seleccione el elemento "Archivo" y luego "Verificar URL …", o presione el atajo de teclado Ctrl + N. En el cuadro de diálogo "Punto de partida de Xenu" que aparece, en el campo superior, ingrese la URL de la página desde la que desea comenzar a extraer enlaces. Si es necesario, complete los campos en el grupo de controles "Incluir / Excluir" para agregar direcciones externas y grupos de direcciones adicionales a una posible lista de verificación y bloquear forzosamente algunas direcciones o grupos de direcciones para que no sean indexados por la aplicación.

Paso 2

Configure los parámetros del programa. En el cuadro de diálogo "Punto de partida de Xenu", haga clic en el botón "Más opciones …". Se mostrará el cuadro de diálogo "Opciones". Cambie a la pestaña "Básico" del cuadro de diálogo. Establezca el número de subprocesos paralelos que descargan datos de Internet moviendo el control deslizante "Subprocesos paralelos". En el campo "Profundidad máxima", ingrese un valor para la profundidad máxima para que la aplicación vea los enlaces. En el grupo de elementos "Informe", active o desactive las opciones para generar el informe. Cambie a la pestaña "Avanzado". Activar o desactivar opciones adicionales. En el cuadro Reintentos, ingrese un valor para el número máximo de reintentos de URL en caso de error. Haga clic en el botón "Aceptar".

Paso 3

Obtenga una lista de páginas y enlaces del sitio. En el cuadro de diálogo "Punto de partida de Xenu", haga clic en el botón "Aceptar". La aplicación comenzará a funcionar. La barra de estado mostrará información sobre el progreso del proceso de adquisición de datos. Espere a que se complete el proceso. En la ventana con una solicitud para crear un informe (ventana con el texto "Link detective terminado. ¿Quiere un informe?") Haga clic en el botón "No".

Paso 4

Extrae todos los enlaces de una sola página. En la lista de páginas que ha creado la aplicación, busque la página cuyos enlaces desea extraer. Haga clic derecho en la línea correspondiente. En el menú contextual, seleccione el elemento "Propiedades de URL". El campo "… enlaces en esta página" del cuadro de diálogo que se muestra contendrá una lista de todos los enlaces presentes en la página. El campo "… enlazando a este" contendrá las direcciones de las páginas enlazadas a este.

Paso 5

Extraiga todos los enlaces del sitio. Desde el menú principal, seleccione "Archivo" y luego "Exportar mapa de página a archivo separado por TAB …". En el cuadro de diálogo que aparece, especifique el nombre y la ruta para guardar el archivo. El archivo resultante contiene todas las direcciones de las páginas de referencia y de destino en los campos OriginPage y LinkToPage. El campo LinkToPageStatus contiene los valores para el éxito de la operación de recuperación de datos del servidor. Importe el archivo a una base de datos (como MS Access) para extraer enlaces según sus criterios.

Recomendado: