Aller au contenu


Visiteurs Escamotés

robots visiteurs sites google bing yahoo spies scrapers hackers

  • Vous ne pouvez pas répondre à ce sujet
8 replies to this topic

#1 Txon

Txon

    AïoligaToR

  • Administrateur
  • PipPipPipPipPipPipPipPipPip
  • 10 854 Messages :
  • Gender:Male

Posté 20 mars 2012 - 08:47

Salut !

Selon Incapsula, 49 % seulement des visites de sites seraient d'origine humaine. Les ''robots'' s'en donneraient à cœur joie.

« Les propriétaires de sites qui pensent qu'ils savent qui les visite devraient regarder de plus près.
31% des visiteurs sont susceptibles d'être de ''dommageables intrus''.
Google Analytics ne montre pas 51% du trafic de site Web, y compris les pirates, les spammeurs et autres harceleurs non-humains ! »

Image IPB
Fouillant les sites Web sans méfiance, il y a des pirates, des robots spammeurs, des espions ''grattoirs'' de toutes sortes qui recueillent des renseignements commerciaux de nature exclusive et les données des usagers.
  • ''Spies of Sorts'' (19%) se réfère au vol de données marketing afin de fournir un avantage compétitif à la concurrence.
  • "Hackers" (5 %) dont les ''Scouters'' qui analysent les sites à la recherche de vulnérabilités, les ''Snipers'' qui suivent pour exploiter ces vulnérabilités et les attaques par DDoS.
  • "Scrapers" (5 %), des robots qui copient le contenu d'autres sites pour l'afficher sur le leur afin d'obtenir du trafic par les moteurs de recherche. La cible est surtout constituée des sites industriels, de voyages et des ''news'' en général.
  • ''Spammers'', connus sur bien des sites et blogs. Ils peuvent poster des messages qui n'ont rein à voir avec la nature du site, y insérer des maliciels ou provoquer leur mise dans les listes noires.
Au total, la robotique potentiellement dangereuse constitue 31 % de tout le trafic Web tandis que 20 % sont liés aux moteurs de recherche eux-mêmes, ceux de Google et de Bing en tête.

@+
Report: 51% of web site traffic is 'non-human' and mostly malicious

"They who can give up essential liberty to obtain a little temporary safety, deserve neither liberty nor safety."(Benjamin Franklin)


#2 noisette

noisette

    Webmarster

  • Admin
  • PipPipPipPipPipPipPipPipPip
  • 21 131 Messages :
  • Gender:Male

Posté 20 mars 2012 - 13:10

C'est tout à fait le cas sur infomars, une proportion non-négligeable de nos visiteurs est constituée de robots, en grande partie des moteurs de recherche.

#3 Th-Crown

Th-Crown

    Martien

  • Eminence Verte
  • PipPipPipPipPipPipPipPip
  • 1 319 Messages :
  • Gender:Male
  • Location:Quelque part entre l'enfer et la Terre

Posté 20 mars 2012 - 13:25

C'est tout à fait le cas sur infomars, une proportion non-négligeable de nos visiteurs est constituée de robots, en grande partie des moteurs de recherche.


Bonjour Noisette. Quels sont les outils qui te permettent de savoir cela ?

#4 noisette

noisette

    Webmarster

  • Admin
  • PipPipPipPipPipPipPipPipPip
  • 21 131 Messages :
  • Gender:Male

Posté 20 mars 2012 - 13:39

En bas de page du forum, tu as les visiteurs connectés, et parmi eux, souvent des robots; ils sont facilement reconnaissables, le robot de google s'appelle google, etc
Ils ne sont pas considérés comme "membres".

Sans titre.png


Sinon, il faut regarder dans les pages de stats, ou les logs, il n'y a pas grand chose qui me rebute autant (c'est pas hyper glamour).

#5 Txon

Txon

    AïoligaToR

  • Administrateur
  • PipPipPipPipPipPipPipPipPip
  • 10 854 Messages :
  • Gender:Male

Posté 20 mars 2012 - 17:11

Et pour les 31% de "robotique potentiellement dangereuse" ? Quelles sont les parades ?

@+

"They who can give up essential liberty to obtain a little temporary safety, deserve neither liberty nor safety."(Benjamin Franklin)


#6 noisette

noisette

    Webmarster

  • Admin
  • PipPipPipPipPipPipPipPipPip
  • 21 131 Messages :
  • Gender:Male

Posté 20 mars 2012 - 17:34

IPB n'est sans doute pas imparable, mais au niveau sécurité, c'est sans doute un forum parmi les plus fiable.

#7 Thelwin Argon

Thelwin Argon

    Thelwinneur

  • Administrateur
  • PipPipPipPipPipPipPipPipPip
  • 3 256 Messages :
  • Gender:Male
  • Location:Suisse

Posté 20 mars 2012 - 22:34

En effet... et il faut dire deux trois choses... Id Est :

Notre forum fonctionne à l'aide d'un CMS (gestionnaire de contenu) du nom d'IPB, qui, s'il contient certainement des vulnérabilités n'en reste pas moins régulièrement mis à jour. Ensuite il est hébergé par OVH qui de leur côté s'occupent de garder leur serveur Apache à jour (version de PHP, de Apache, de MySQL, de PhpMyAdmin, de leur propre CMS de gestion d'hébergement, type Plesk ou Cpanel, etc.)


Et si l'on se penche sur les 31% de robot potentiellement dangereux, qu'y voit-on ?
--> 2% de Spams : de ce point de vue, c'est IPB qui va nous protéger via les CAPTCHA et autres questions de sécurité nécessaires à la création d'un compte.
Et oui, on a des spammeurs, mais ils nécessitent une intervention humaine, a priori, pour s'inscrire et on les élimine en quelques heures en général après qu'ils aient commencés à sévir...
Faut dire qu'on en a pas tant que ça, le pire étant la partie désinfection avec cette faiblesse que nous avons nous même implémentée en autorisant des posts sans création de compte... (Mais avec CAPTCHA quand même !)

-->5% de Scrapers : bon là, j'avoue je ne suis pas trop sûr qu'on soit touché ^^' Après tout le scraping nous ferait plus de pub qu'autre chose vu qu'on mentionne Infomars un peu partout ;)

-->5% de Hackers : là on est touché c'est sûr, mais là encore, c'est OVH et IPB qui vont nous protéger : OVH en gardant à jour ses serveurs Apache et surtout en faisant attention à ne pas y introduire de vulnérabilité et IPB en faisant de même avec leur CMS.
Typiquement ces outils vont chercher des failles courantes et grossières telles que l'utilisation du mot de passe par défaut dans l'admin d'un CMS ou sur un serveur ou alors des possibilités d'injection SQL ou des faiblesses au niveau des FTP, cela arrive trop souvent que l'authentification en anonyme soit possible sur un FTP géré par un utilisateur trop Lambda ;)
Nous n'avons été qu'une seule fois clairement victime d'un "hack" et cela était vraisemblablement dû à une erreur humaine au niveau de notre hébergeur.

Il faut savoir que ces robots cherchent généralement plus du côté des CMS gratuit et plus répandu que IPB, tel que WordPress...
En effet ils vont chercher par exemple la présence de fichiers clefs et possiblement non protégés, l'exemple parfait étant "/wp-config.php" dans le cas de wordpress : dans ce fichier sont stockées en clair les informations de connexion à la base de donnée SQL et donc indirectement la possibilité de changer par exemple le password de l'utilisateur numéro 0, l'Admin par construction... Et via un simple CHMOD mal effectué, un site complet peut être "hacké" en quelques minutes...
Ensuite viennent les bruteforces... En effet pour se logguer sur WP par exemple, il suffirait d'accéder à "infomars.fr/wp-login.php" si nous l'utilisions, et ensuite de bruteforcer la connection, ce qui ne générera aucune alerte d'aucune sorte, tout au plus des logs avec un gros volumes d'appel POST sur wp-login.php !
Et il faut dire que de nombreuses personnes utilisent des mots de passe trop faible et une simple attaque par dictionnaire peut déjà faire des ravages parmi les blogueurs non avertis ! (Txon ne me contredira pas sur ce point, je crois me souvenir de quelque billet à ce sujet là de sa part)

De même que certains scripts largement utilisés dans les thèmes de nombreux CMS peuvent contenir des faiblesses, typiquement en août 2011 quand une vulnérabilité 0day fut trouvée dans le fameux "timthumb.php" utilisé par beaucoup de site WordPress pour générer des miniatures, ainsi que son nom pourrait le suggérer. Cette faille permettait le dépôt d'un fichier sur le serveur... On devine facilement à quel point cela peut être compromettant... Voici un lien détaillé pour les intéressés.

Bref, là encore on voit que l'on n'est pas très intéressant : on a un CMS payant, ce qui fait de nous une minorité par rapport aux autres, donc peu de risque.

Ensuite au niveau serveur, c'est vrai qu'on est a priori vulnérable puisque Infomars tourne sur un serveur Apache et qu'en août dernier un outil permettant d'exploiter une faille de déni de service a été publié qui s'en prenait à toutes les versions du serveur web en question !!! Heureusement ce fut corrigé dès la version 2.2.20
Mais l’exploitation de cette faille est très très dangereuse pour les sites web, en effet cela rend possible la saturation des ressources serveur (CPU et mémoire) en quelques dizaines de requêtes tout sauf bienveillantes !!! Pour les intéressés, encore un lien...
Mais là on n'y peut rien, on compte sur notre hébergeur pour gérer ce genre de soucis ^^

Bon je vais passer à la suite...

19% de Spies of Sort ... Bin là encore une fois, on est pas trop concerné :francais:


Voilà pour ceux qui étaient curieux de savoir ce qu'il en est pour un petit forum comme nous. :yes:

Au final on voit que ces robots ne sont pas si dangereux que ça...
Si ça se trouve au final ils vont se faire plus de mal entre eux qu'aux petits sites comme nous : un phisher aura tendance à accumuler les sites tournant sous WordPress et a faire du déploiement en masse et ensuite à ne plus les mettre à jour... -.-' Comportement à risque, punissable par robot. Idem pour le scraping ou autre pratique, IMHO. :siffle:

PS : désolé pour la tartine, mais bon j'avais pas envie de raccourcir après l'avoir écrit :thelwin:
Sauf pathologie mentale profonde, tout le monde est bon en maths. | Albert Jacquard
——————————————————
Deux excès : exclure la raison, n'admettre que la raison. | Blaise Pascal

#8 noisette

noisette

    Webmarster

  • Admin
  • PipPipPipPipPipPipPipPipPip
  • 21 131 Messages :
  • Gender:Male

Posté 21 mars 2012 - 07:39

Merci !

#9 Thelwin Argon

Thelwin Argon

    Thelwinneur

  • Administrateur
  • PipPipPipPipPipPipPipPipPip
  • 3 256 Messages :
  • Gender:Male
  • Location:Suisse

Posté 21 mars 2012 - 16:09

De rien ^^''
Sauf pathologie mentale profonde, tout le monde est bon en maths. | Albert Jacquard
——————————————————
Deux excès : exclure la raison, n'admettre que la raison. | Blaise Pascal



0 utilisateur(s) en train de lire ce sujet

0 membre(s), 0 invité(s), 0 utilisateur(s) anonyme(s)