Sergio Sarnari Filòsofia informatica
e sue applicazioni... di Sergio Sarnari
Blog



programmazione

Trovare indirizzi email su Internet

Scritto da Sergio Sarnari il 28/02/07 alle 19.54 nella categoria Programmazione

Questo articolo tratta principalmente di insicurezza informatica e spiega come sia facile reperire dai personali di aziene presenti su internet senza il loro consenso.
Ovviamente è creato solo a scopo dimostrativo e per far capire che spesso i database aziendali che vengono.
Un database richiamato da pagine internet contiene solitamente nel suo URL alcune informazioni utili sul contenuto della pagina.
Analizziamo ad esempio la pagina: http://www.dominio.it/modules.php?name=contact&idcompany=454&file=categories&op=newindex

E' un modulo molto probabilmente creato da qualche CMS, che richiama alcune variabili:

variabile name con valore "contact"
variabile idcompany con valore "454"
variabile file con valore "categories"
variabile op con valore "newindex"

Diciamo che cliccando sul link otteniamo una pagina contenente le informazioni di un'azienda tra cui telefono, fax ed email.
La variabile idcompany è abbastanza sospetta, sicuramente se porvassimo a cambiare il valore da 454 a 123 otterremmo i dati di un'altra agenzia.
A questo punto rubare (perchè di furto si tratta) i dati delle varie aziende (diciamo che sia un sito di agenzie assicurative) presenti nel sito internet è un gioco da ragazzi.

Ovviamente non sto dicendo di scorrere manualmente ogni singola pagina e di copiare ed incollare i dati che ci interessano, ma parlo di una vera e propria procedura automatizzata che possa generarci un singolo file importabile all'interno di un DB o un foglio di calcolo.

Diciamo che la pagina contenga questo testo:

Nome agenzia: Cavaliere Assicurazioni
Indirizzo: Via dello Stagno, 1
60019 Senigallia (AN)
Telefono: +39 1234 56789  Fax +39 1234 456787
E-mail: infohotel@hotelmaxi.it
Link: www.hotelmaxi.it/hotel/index.htm

Che in codice HTML si traduce in:

<font size="2"><b>Nome agenzia: Cavaliere Assicurazioni<br>
Indirizzo: Via dello Stagno, 1<br>
60019 Senigallia (AN)<br>
Telefono: +39 1234 56789  Fax +39 1234 456787<br>
E-mail: info@cavaliereassicurazioni.it<br>
Link: http://www.cavaliereassicurazioni.it<br>
</font>
<br>

La prima cosa che dobbiamo fare è capire poter inserire il codice HTML della pagina in una variabile per poi poter dividere ciò che ci serve dal resto.

Niente di più semplice, basta utilizzare la funzione file_get_contents (PHP 4 o superiore).

    $pagina = "http://www.dominio.it/modules.php?name=contact&idcompany=454&file=categories&op=newindex;
    $contenuto=@file_get_contents($pagina);

A questo punto la variabile $contenuto conterrà il codice HTML della pagina che gli abbiamo indicato.

Per procedere con la divisione del codice utile da quello inutile utilizziamo questo comando:

    list ($testo1, $testo2) = split ("Nome agenzia:", $contenuto);
 
In pratica divido in due parti la variabile $contenuto appena trovo la stringa "Nome agenzia" (ovvero quando inizia la parte che mi interessa).

    list ($testo1, $testo2) = split ("</font>", $testo2);
       
Stessa cosa ma così arrivo ad avere nella variabile $testo1 solo la parte che mi interessa, ora pensiamo a ripulire un po' il restante.

    $testo1=str_replace("Indirizzo: ","",$testo1);
    $testo1=str_replace("Telefono: ","",$testo1);
    $testo1=str_replace("Email: ","",$testo1);
    $testo1=str_replace("Link: ","",$testo1);

In pratica così sono rimasti solo i dati utili; e per finire...

    $testo1=str_replace("<br>","#",$testo1);
    $testo1=str_replace("Fax: ","#",$testo1);
   
Così nella variabile $testo1 avrò qalcosa come:

    Cavaliere Assicurazioni#Indirizzo: Via dello Stagno, 1#60019 Senigallia (AN)#+39 1234 56789  #+39 1234 456787#info@cavaliereassicurazioni.it#http://www.cavaliereassicurazioni.it#

Ovvero una riga con tutti i dati dell'agenzia separati dal carattere "#".
Sarà sufficiente scrivere questi dati su un file di testo...

    $fp = fopen("agenzie.txt","a");
    $riga = $testo1."\r\n";
    fputs ($fp,$riga);

...e con un semplice gioco di refresh, ricaricherete questa pagina cambiando il valore della variabile idcompany richiamata nell'URL (variabile $pagina).

    $pagina = "http://www.dominio.it/modules.php?name=contact&idcompany=454&file=categories&op=newindex;
    $pagina = "http://www.dominio.it/modules.php?name=contact&idcompany=455&file=categories&op=newindex;
    $pagina = "http://www.dominio.it/modules.php?name=contact&idcompany=456&file=categories&op=newindex;
    $pagina = "http://www.dominio.it/modules.php?name=contact&idcompany=457&file=categories&op=newindex;

Non mi dilungo nei dettagli, non sarebbe politically correct. };)
Purtroppo le aziende che permettono di visualizzare i loro archivi con dei semplici elenchi numerati (a volte per poca professionalità del webmaster, più raramente per esigenze di programmazione) possono subire quest'attacco.
Ovviamente i dati così "prelevati" non possono essere utilizzati per inviare fax o intasare email con pubblicità, ma chi ricorre a questi trucchi spesso non si fa scrupoli.
La cosa curiosa è che anche le grandi aziende che vendono gli indirizzi in loro possesso non hanno preso provvedimenti, permettono a qualunque malintenzionato con un po' di conoscenze di programmazione di fargliela sotto il naso.

DISCLAMER:
Non ho fatto nulla di quanto c'è scritto, ma semplicemente è fattibile, ciò si evince dall'architettura dei vari siti che non ho citato appositamente.


tratteggio
Commenti (0) | Permalink| 4146 letture

Lascia un commento
Nome (obbligatorio)
Sito web (con "http://" davanti)
Codice di verifica: che giorno è oggi? (obbligatorio)




¢ 2006-2009 Sergio Sarnari - Tutti i testi contenuti su questo sito sono rilasciati sotto licenza Creative Commons. Per informazioni: clicca qui
Se la piattaforma di questo blog ti sembra Wordpress... ripensaci
per iniziare:
Qualcosa su di me Contattami
Le mie foto I miei cinguettii
Facebook I feed al mio sito

categorie:
Attualità (5)
Cinema (1)
Cucina e ricette (3)
Filosofia (2)
Internet (20)
Lavori e progetti (3)
Letteratura (2)
Linux (1)
Marketing (7)
Personale (20)
Programmazione (9)
SEO (12)
Sicurezza (4)
Società (24)
Svago (8)
Tango argentino (1)
Tecnologia (2)

qualche foto :
www.flickr.com

progetti:
ancestrale.it
rievocazioni.net
anconalavoro.it
maceratalavoro.it
pavialavoro.it
cesenalavoro.net
vivaeltango.net

mi piace leggere:
Andrea Cappello
Fabio dell'Orto
John Battelle
Nicola Mattina
Pandemia

amici:
5 minuti di relax
Adriano
Alessandro
Alessio
Angelo
CarpeDiem13
Dentro al replay
Gaspatcho
Giovy's Blog
Gioxx
Ilaria
kOoLiNuS
Lara
Luca Conti
Luca Lorenzetti
Marco
Maxime
Michele L.
Michele P.
Motor-Bike
Professione turismo
Tommaso
Visitancona

archivi:
Gennaio 2009 (2)
Dicembre 2008 (4)
Novembre 2008 (2)
Ottobre 2008 (6)
Settembre 2008 (4)
Agosto 2008 (6)
Luglio 2008 (11)
Giugno 2008 (7)
Maggio 2008 (4)
Marzo 2008 (5)
Febbraio 2008 (1)
Gennaio 2008 (2)
Dicembre 2007 (5)
Novembre 2007 (5)
Ottobre 2007 (2)
Settembre 2007 (2)
Agosto 2007 (2)
Luglio 2007 (3)
Giugno 2007 (7)
Maggio 2007 (2)
Aprile 2007 (10)
Marzo 2007 (7)
Febbraio 2007 (6)
Gennaio 2007 (11)
Dicembre 2006 (8)

citazioni:
CitLa fantasia è una naturale attività umana, la quale certamente non distrugge e neppure reca offesa alla Ragione, né smussa l'appetito per la verità scientifica, di cui non ottunde la percezione. Al contrario: più acuta e chiara è la ragione, e migliori fantasie produrrà.Cit
J.R.R. Tolkien

post più letti:
(degli ultimi due mesi)

Smettitela di parlare o sei un giornale
Scenari possibili per uscire dalla crisi
Facebook: You have exceeded the limit for posting on walls!
Canto di Natale
Bypass z-index -1000 on Considero Alive MP3 Player - DNN
Auguri di buon anno!
Manuale del perfetto signore del male

ultimi commenti:
Caro Sergio, ti segnalo/consig...
Scritto da Endymion il 05/01/09
Caro Assenzio, non sono molto...
Scritto da Sergio il 04/01/09
Violet, tra i Matter L. il Bre...
Scritto da Endymion il 03/01/09
SI DIREBBERO MAGIE... E inv...
Scritto da Assenzio il 03/01/09
ciao direi che è proprio la s...
Scritto da marina il 03/01/09
Geniale!!!!!!!!!!!!!!!!!!...
Scritto da marco il 30/12/08
Tanti Auguri di Buon Natale, S...
Scritto da 4 EveR YounG il 23/12/08
Dopo aver finito un buon Breva...
Scritto da Violet il 16/12/08
Ottimo! Proprio quello che cer...
Scritto da Downloadsoftwarefree il 15/12/08
Anche "E hanno un piano!" è un...
Scritto da Gabriele il 14/12/08

sto leggendo:



questo blog...
Non utilizza CMS di terze parti; è stato realizzato dalla A alla Z dal sottoscritto e si attiene agli standard del World Wide Web Consortium
Valid XHTML 1.0 Transitional  Valid XHTML 1.0 Transitional


disclaimer:
1.questo blog non rappresenta una testata giornalistica in quanto viene aggiornato senza alcuna periodicità
2.non fate i prepotenti, non lo sopporto
3.non ho ovviamente responsabilità per commenti di terze persone 4.se su questo blog trovate qualcosa che non vi piace, parlatene con me
5.a volte inserisco del materiale preso da internet, se è vostro e non vi sta bene fatemi sapere