Un crawler è un connettore di dati che aiuta a estrapolare i contenuti HTML delle pagine web. Una volta che una scansione viene eseguita correttamente su un insieme di pagine web, il flusso Aggiungi dati facilita la conversione dei contenuti HTML grezzi in entità della piattaforma Yext Content. In questo articolo viene mostrato come creare un crawler.
Prima di configurare un crawler per il tuo sito, devi assicurarti che il crawler di Yext sia autorizzato ad accedere alle tue pagine web. A tale scopo, dovrai inserire nel tuo elenco di whitelisting sia l'agente utente che gli indirizzi IP del nostro crawler.
Agente utente
Il crawler di Yext utilizza il seguente agente utente:
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, come Gecko) HeadlessChrome/87.0.4280.88 YextBot/Java Safari/537.36
Indirizzi IP
Il crawler di Yext utilizza i seguenti indirizzi IP:
- 54.204.19.87
- 50.19.160.200
- 34.198.218.97
- 54.221.171.225
Per creare un Crawler:
- Fai clic su Content nella barra di navigazione e seleziona Configurazione.
- Fai clic su Crawler.
- Fai clic sul pulsante + Nuovo Crawler.
- Inserisci un nome per il Crawler.
- Fai clic su Settimanalmente e seleziona la frequenza con cui desideri eseguire il crawler: Una volta, Giornalmente o Settimanalmente.
-
Fai clic su Pagine secondarie e seleziona la strategia di scansione.
- La strategia di scansione serve a indicare se si vogliono scansionare tutte le pagine, le pagine secondarie o pagine specifiche.
- Selezionare i tipi di file di cui il crawler deve eseguire la scansione.
-
Inserisci le pagine o i domini che desideri scansionare. Per aggiungere altre pagine o domini, fai clic sul link + Aggiungi altro.
- Nota: la scansione verrà effettuata nelle pagine e nei domini specificati che possono essere indicizzati
- (Facoltativo) Aggiungi i domini che vuoi escludere dalla scansione.
- (Facoltativo) Specificare il limite di velocità o la profondità massima per il crawler.
-
Una volta salvato il crawler, tornerai alla pagina Crawler. Per visualizzare i dettagli del Crawl appena creato, fai clic sul pulsante Visualizza dettagli .
Commenti
0 commenti
Accedi per aggiungere un commento.