Come raschiare le e-mail da LinkedIn

Come fare, Scraping, Jul-26-20215 minuti di lettura

LinkedIn è la piattaforma di social networking perfetta per i professionisti, con 660 milioni di utenti su 303 milioni di utenti attivi mensili. Se non avete ancora creato un account LinkedIn, fatelo oggi stesso. Potrete così entrare in contatto con i giganti del settore. In questo articolo, parleremo di come raschiare le e-mail dagli account LinkedIn. Spesso si può

LinkedIn è la piattaforma di social networking perfetta per i professionisti, con 660 milioni di utenti su 303 milioni di utenti attivi mensili. Se non avete ancora creato un account LinkedIn, fatelo oggi stesso. Potrete confrontarvi con i giganti del settore.

In questo articolo parleremo di come raschiare le e-mail dagli account LinkedIn. Spesso si ha bisogno di indirizzi e-mail per i processi di reclutamento che la vostra azienda utilizza spesso o per campagne pubblicitarie non invasive.

Tuttavia, la maggior parte degli utenti nasconde i propri indirizzi e-mail per motivi di privacy. LinkedIn fornisce anche meccanismi per mascherare tali indirizzi e-mail dalla vista pubblica. In queste circostanze, l'unico modo per accedere agli indirizzi e-mail è lo scraping. 

Quindi, senza ulteriori indugi, scopriamo come effettuare lo scraping di e-mail con LinkedIn, ma prima scopriamo anche perché è necessario effettuare lo scraping da LinkedIn.

Perché raschiare le email da LinkedIn?

Come accennato nel paragrafo introduttivo, potrebbe servirvi per scopi di reclutamento o di marketing. Per approfondire ulteriormente la questione, il profilo di un utente in LinkedIn contiene nomi, indirizzi e-mail, competenze, esperienze professionali, qualifiche, ecc. D'altro canto, i profili aziendali contengono annunci di lavoro, numero di dipendenti, dipendenti attuali e vari altri dati vitali.

Quindi LinkedIn ha una ricchezza di informazioni che sarà immensamente utile per le persone.

Alcuni utenti possono utilizzare bot e crawler per raschiare le e-mail e creare un elenco di e-mail. Poi vendono questi elenchi di e-mail a marketer e altri gruppi che sono fortemente interessati a questi dati.

Detto questo, è necessario considerare anche gli aspetti etici dello scraping di e-mail. Di solito viene considerato non etico anche se le intenzioni non sono malevole. Tuttavia, l'efficacia dello scraping di e-mail su LinkedIn per costruire relazioni professionali non può essere trascurata.

La prossima sezione si concentrerà quindi sulla legalità dell'email scraping dal punto di vista di LinkedIn con un esempio.

LinkedIn consente qualsiasi forma di scraping?

La risposta è un secco no, affinché il messaggio sia chiaro. La documentazione di LinkedIn su "Software ed estensioni proibite" vieta severamente l'uso di crawler, bot, robot, script e qualsiasi altro componente aggiuntivo o plugin per effettuare lo scraping del sito web di LinkedIn. Per saperne di più sull'uso degli scrape su LinkedIn, potete consultare il link qui sopra.

LinkedIn ha applicato la maggior parte di queste regole per proteggere la privacy dei suoi membri. Tuttavia, ci sono zone d'ombra in alcune di queste leggi anti-scraping. Dico questo perché qualche tempo fa LinkedIn ha citato in giudizio 100 scrapers anonimi per aver effettuato lo scraping di dati da LinkedIn, ma ancora non è stato emesso alcun verdetto sul caso. Questo anche perché LinkedIn non è riuscito a distinguere lo scraping corretto da quello distruttivo.

Il caso di cui sopra ha portato a sollevare questioni critiche nello scraping. Tuttavia, esse esulano dallo scopo di questo articolo. Quindi, quello che sto cercando di spiegare è che se avete intenzione di raccogliere dati da LinkedIn, dovete essere consapevoli del fatto che a loro non piace. Pertanto, dovete farlo nel modo giusto, come scoprirete nelle prossime sezioni.

Come raccogliere le email da LinkedIn?

Per scansionare le e-mail nel modo giusto, è necessario prendere in considerazione diversi fattori. Alcuni di questi fattori critici sono:

  • Avete bisogno di metodi manuali o automatizzati per lo scraping delle e-mail?
  • Se si utilizzano metodi automatizzati, quali sono i parametri dell'applicazione da impostare?
  • Quali sono i tipi di profili e le pagine da scrapare da LinkedIn (profili pubblici e privati, di cui parleremo più avanti)? 
  • Utilizzerete dei proxy e, in caso affermativo, quali e quanti sono i tipi di proxy?

Nella prossima sezione, quindi, analizzeremo il metodo più sicuro e più legittimo per raccogliere gli indirizzi e-mail da LinkedIn.

Esportare manualmente i contatti di LinkedIn.

Questo è il modo più sicuro e legittimo per raccogliere le e-mail da LinkedIn. 

Prima di illustrarvi i passi da seguire per l'esportazione manuale, vi invito a prestare attenzione a questo metodo: in LinkedIn è presente una nuova impostazione della privacy che consente solo l'accesso privilegiato agli ID e-mail degli utenti. Tuttavia, è possibile cambiare questa impostazione con l'opzione "più debole". In questo modo sarete alla mercé degli hacker che potrebbero utilizzare il vostro indirizzo e-mail per azioni dannose.

Con questo metodo, quindi, sarete in grado di scaricare solo gli indirizzi e-mail dei vostri contatti diretti. Anche in questo caso, il download è limitato ai messaggi di posta elettronica che hanno modificato l'impostazione predefinita della privacy in "debole".

In ogni caso, ecco i passaggi da seguire per scaricare le e-mail manualmente:

  1. Accedete al vostro profilo LinkedIn con il vostro ID e-mail e la vostra password.
  2. Navigare fino alla homepage.
  3. Individuare quindi l'icona Me nella barra di navigazione superiore.
  4. Fare clic sull'icona a discesa nell'icona Me.
  5. Selezionare Impostazioni e privacy dal menu a discesa
  6. Quindi selezionare la scheda Privacy nella barra laterale sinistra.
  7. Cliccate sulla prima opzione, che dice "Come LinkedIn utilizza i vostri dati".
  8. Accedere se viene richiesto.
  9. Verrete quindi reindirizzati a una pagina di dati contrassegnata dall'opzione Scarica i tuoi dati che si trova sotto di essa.
  10. In questa pagina, è necessario selezionare le connessioni target di cui si desidera indirizzare l'e-mail.
  11. Quindi, per concludere, seguite le istruzioni sullo schermo.

Riceverete quindi un'e-mail contenente un link per l'estrazione dei dati richiesti.

Utilizzo di strumenti automatizzati

Come avete visto sopra, utilizzando il metodo manuale otterrete solo una manciata di risultati. È quindi necessario utilizzare un metodo alternativo sotto forma di strumenti di automazione. Questi strumenti di automazione sono applicazioni di crawling destinate esclusivamente a LinkedIn. Scopriamone alcuni.

PhantomBuster - chiamato anche scraper di profili LinkedIn - è un'applicazione basata su cloud. I responsabili delle risorse umane e i reclutatori la utilizzano spesso per estrarre dati preziosi come gli indirizzi e-mail di potenziali candidati o dipendenti. Se i profili di destinazione sono "connessioni dirette", è possibile estrarre facilmente i dettagli. Tuttavia, per le "connessioni indirette", l'estrazione delle e-mail diventa complicata. Ulteriori informazioni su questo strumento sono disponibili qui.

Octoparse -Si tratta di uno strumento di scraping web molto intelligente che utilizza solo tre fasi per raccogliere i dati. Prima trova i dati, li seleziona e poi li esporta. Offre diverse opzioni per il salvataggio dei dati, in CSV, XLSX o in diverse piattaforme utilizzando la chiave API. È possibile utilizzare server proxy per mascherare gli indirizzi IP o utilizzare una rotazione automatica degli IP per evitare il divieto di accesso a LinkedIn. Per saperne di più su Octoparse.

SalesQL- Questo strumento è gratuito ed è un'estensione del browser Google Chrome. Potete quindi aggiungerlo facilmente al vostro browser Chrome. I rappresentanti di vendita e i reclutatori utilizzano spesso questo strumento per raschiare le e-mail da LinkedIn. Indipendentemente dal fatto che la connessione sia di primo livello o meno, è possibile estrarla. È possibile esportare i contatti in file CSV/Excel, ATS (software HR) o CRM. Non esitate a ottenere maggiori informazioni su SalesQL qui.

Quali sono i parametri di applicazione dei metodi automatizzati?

Per poter raccogliere i dati da alcuni degli strumenti di scraper sopra citati, sarebbe utile sapere come impostare questi parametri:

Fili

I thread sono il numero di connessioni attualmente aperte che si utilizzano per raschiare i dati da LinkedIn o da qualsiasi altro sito web. Maggiore è il numero di thread, più veloce è il processo di scraping. Tuttavia, LinkedIn vi segnalerà rapidamente.  

Pertanto, sebbene molti scrapers impostino 10 proxy per thread, l'opzione migliore sarebbe quella di utilizzare un thread per proxy. Se si utilizza qualcosa di più, LinkedIn sospetterebbe che si possa finire in tribunale, anche se ciò potrebbe rallentare il processo di scraping.

Timeout

I timeout sono il tempo necessario al server per rispondere a un proxy prima che quest'ultimo inizi una nuova richiesta. Molti scrapers impostano i timeout a 1 o 2 secondi. In questo modo i risultati vengono sovraccaricati. Tuttavia, non lo raccomandiamo e, coerentemente, è necessario impostare i timeout a un livello più alto, ad esempio 20-30 secondi. In questo modo il server ha una pausa solida prima di accettare una nuova richiesta.

Scraping di profili privati su LinkedIn

In quest'ultima sezione scoprirete come effettuare lo scraping di un profilo privato. Tuttavia, lo scraping di profili privati alla ricerca di e-mail e altri dettagli solleverà problemi legali per LinkedIn, perché quando si crea un account LinkedIn, LinkedIn promette di proteggere i vostri dati e di non rivelarli a terzi.

È possibile effettuare lo scraping dei dati di qualcuno, compresi gli indirizzi e-mail, per scopi non distruttivi. Ad esempio, si è a caccia di lavoro e si cercano redattori tecnici freelance in una determinata città. D'altro canto, potreste effettuare lo scraping a scopo di ricerca. Quindi, tenendo presente questo aspetto, scopriamo come effettuare lo scraping di profili privati.

Creare account

Il modo ideale per effettuare lo scraping da profili privati è creare un account utente. In questo modo sarete in grado di connettervi con il maggior numero possibile di contatti. Tuttavia, sarebbe utile tenere a mente che questo account non serve per connettersi con le persone. È meglio utilizzarlo come punto di accesso a LinkedIn per lo scraping.

A questo scopo consiglio di utilizzare Octoparse. Questo perché consente di accedere a LinkedIn con il proprio account e di applicare le ricerche appropriate. Quindi è possibile effettuare lo scraping con la funzione di trascinamento, mostrando la pagina LinkedIn in cui ci si trova.

Ricerca e raccolta

Dopo aver creato l'account e quando si è pronti a cercare con Octoparse, è necessario capire cosa cercare. Poi Octoparse esplorerà con precisione ciò che si richiede. Tuttavia, è possibile raccogliere solo le informazioni disponibili come non-connessione, compresi gli indirizzi e-mail dei contatti.

Utilizzo di proxy dedicati

LinkedIn molto probabilmente vi bloccherà con il metodo sopra descritto se non rispettate le regole dei timeout e dei thread.

Inoltre, quando create un account, assicuratevi di utilizzare un server proxy e di usare lo stesso indirizzo IP quando fate lo scraping attraverso Octoparse. Questo perché apparite come un essere umano a LinkedIn, dato che la maggior parte degli esseri umani non accede a LinkedIn da indirizzi IP diversi in una frazione di secondo. Quindi, se utilizzate un proxy per creare un account, utilizzate lo stesso proxy quando fate lo scraping di LinkedIn.

Ora si tratta di decidere quali e quanti proxy utilizzare.

Quali proxy utilizzare per lo scraping di LinkedIn?

I proxy ideali per lo scraping di LinkedIn sono i proxy elitari. Questo perché i proxy d'élite offrono un maggiore anonimato e impostazioni di intestazione sicure rispetto agli altri tipi di proxy.

Prima di effettuare lo scraping, è necessario essere ben consapevoli del fatto che LinkedIn non gradisce lo scraping e tratta seriamente i colpevoli. Ciò implica che dovete utilizzare i proxy Elite dedicati e i proxy privati Elite. I proxy condivisi o gratuiti sono semplicemente fuori dall'equazione per questo scopo.

Numero di deleghe

Il numero di proxy dipende in larga misura dalle dimensioni che si intende raschiare. Come già detto, quando si utilizza un singolo proxy per account, si consiglia di utilizzare 50 account e 50 proxy.

Se volete avere più proxy per account, cosa che non raccomandiamo, usate un numero di proxy compreso tra 100 e 150. Poi ruotateli spesso in modo che LinkedIn non li catturi e li banni. Quindi ruotateli spesso in modo che LinkedIn non li catturi e li banni.

D'altra parte, se avete meno deleghe, LinkedIn probabilmente le vieterà. Quindi, per determinare la cifra migliore, dovete sperimentare il più possibile con LinkedIn. Questo vi aiuterà anche a identificare se qualcuno dei vostri proxy è nella lista nera di LinkedIn.

Conclusione

Dopo aver letto questo articolo, ci auguriamo che abbiate un'idea completa di come sia possibile effettuare lo scraping di e-mail attraverso LinkedIn. Il metodo più semplice e ovvio è quello manuale. Tuttavia, questo non restituirà una manciata di risultati. La scelta più ovvia è quindi quella di utilizzare uno strumento automatico insieme a proxy d'élite.

Vi auguriamo buona fortuna nell'estrarre le e-mail da LinkedIn utilizzando i metodi qui menzionati.