ForumNeuro


Geri Git   ForumNeuro > Bilgisayar Dünyası > Webmaster
Kayıt S.S.S Üye Listesi Ajanda Konuları Okundu İşaretle

Webmaster Web Dizayn ve Webmasterlarla ilgili herşey burada...


Yanıtla
 
Forum Araçları Görüntüleme Biçimleri
Eski 08-10-2005, 21:37   #1 (permalink)
Dj Murat
Etkili Üye
 
Giriş Tarihi: 02-10-2005
Konum: Dağılın uleenn
Mesajlar: 250
Rep Gücü: 15
Rep Puanı : 2750
Dj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya benDj Murat Ben var ya ben
Varsayılan Web Sayfalarını Tarayan Spam ve Casus Robotları Engelleme

Mart 2004
İlker Fıçıcılar


Web sayfalarımı her gün pek çok robot gezip bandwidth'den giderek daha fazla çalmaya başlayınca bir çözüm aramak gerekti. Web sunucularımın önünde squid bir httpd hızlandırıcı olarak çalışıyor. Uygun refresh_pattern ayarlarıyla squid'in sunucuyu oldukça rahatlattığını söyleyebilirim. Squid'le mutluyuz ve mutluluk gölgeleyici bu kötü robotlardan kurtulmak istiyoruz.

Squid ile Apache bir denge içinde çalışmalı, aksi halde kullanıcılar, sayfayı gezenler istenmeyen sonuçlarla karşılaşıyorlar. Performans için gerek squid'de gerekse apache'de pek çok ayarı sınırlarında kullanmak gerekiyor. Örneğin apache'de mod_gzip açtıysanız, apache'nin önündeki squid'in sayfaların farklı biçimlerini de önbellekte tutmasını sağlamalısınız, yoksa gzip ile sıkıştırılmış sayfaları gösteremeyen bir tarayıcı sayfalarınızı okuyamayacaktır.

Benzer şekilde kötü robotları apache içinden engellerseniz ve uygun Vary başlıkları eklemezseniz, ya robotlar squid'de daha önce normal kullanıcılarca önbelleklenmiş bilgiye ulaşacaklar ve engellenmemiş olacaklar, ya da ilk davranan kötü bir robotsa ve bu istek önbelleğe girdiyse normal kullanıcılar da Erişim Yasak sayfası ile karşılaşacaklardır. Bunu önlemek için apache'ye Header append "Vary:" "User-Agent" şeklinde bir ekleme yapabilirsiniz, ama bu da squid'in her sayfanın her tarayıcı için ayrı bir kopyasını önbellekte tutmasına yol açar. Bu ise, ziyaret eden farklı user-agent sayısına göre, performansını on kattan daha fazla düşürüyor.

Bu durumda, apache'de vary başlığı ayarı olarak sadece Header append "Vary:" "Accept-Encoding" kullanmak, apache'de RewriteEngine ile RewriteCond %{HTTP_USER_AGENT} EmailSiphon ve RewriteRule .* - [F,L] biçimindeki yasaklamaları kullanmamak gerekiyor. Yapmak istediğimizi squid acl'leri ile halledeceğiz.

Önce, apache veya squid http_accelerator kayıtlarınızı inceleyerek sizi rahatsız eden robotları tesbit etmelisiniz. Aşağıdaki liste veya internetteki başka listeler yerine kendi istenmeyen robotlar listenizi oluşturmanız verimlilik açısından yararlı olacaktır. Yine de bu kısa listeyi kullanabilirsiniz:



EmailSiphonMicrosoft\ URL\ ControlNPBotWindows\ XPFrontPageMSIECrawlerHTTrack^Mozilla/4.0$SqwormWebCopierWebReaper

Bu listedeki FrontPage sayfanızı editlemeye çalışıp başarılı olamadıkça tekrar tekrar deneyen acemileri engellemek için. Windows XP yazısı ise hiçbir normal user-agent'ta görülmez. Diğerleri ise spam, casus ve offline robotları / agent'ları genelde. Sayfanızın Teleport, GetRight vb. programlarla sömürülmesini istemiyorsanız listeyi bunları da ekleyerek biraz daha genişletebilirsiniz:



DA\ GetRightFlashGetTeleportEmailSiphonMicrosoft\ URL\ ControlNPBotWindows\ XPFrontPageMSIECrawlerHTTrack^Mozilla/4.0$SqwormWebCopierWebReaper

Bu listeyi bir dosyaya yazıp kaydedin. Ben /usr/local/share/koturobot.lst dosyasına yazıp, squid.conf ayar dosyasına şu satırları ekledim:

acl koturobot browser "/usr/local/share/koturobot.lst"
http_access deny koturobot


Evet, hepsi bu. Eğer www sunucularınızın önünde bir squid httpd hızlandırıcı olarak çalışıyorsa, bu ayar sayfalarınızdan eposta adresi ve resim çalınması engellemek yönünde iyi bir adım olacak ve bandwidth'inizin de bir miktar rahatlamasını sağlayacaktır.

Eğer, squid'siz sadece apache sunucuyu kullanıyorsanız, virtual hostlarınız için aşağıdaki gibi bir ayar eklemesiyle apache'nin bu robotları engellemesini sağlayabilirsiniz:



RewriteEngine onRewriteCond %{HTTP_USER_AGENT} "DA " [OR]RewriteCond %{HTTP_USER_AGENT} GetRight [OR]RewriteCond %{HTTP_USER_AGENT} FlashGet [OR]RewriteCond %{HTTP_USER_AGENT} Teleport [OR]RewriteCond %{HTTP_USER_AGENT} EmailSiphon [OR]RewriteCond %{HTTP_USER_AGENT} "Microsoft URL Control" [OR]RewriteCond %{HTTP_USER_AGENT} NPBot [OR]RewriteCond %{HTTP_USER_AGENT} "Windows XP" [OR]RewriteCond %{HTTP_USER_AGENT} FrontPage [OR]RewriteCond %{HTTP_USER_AGENT} MSIECrawler [OR]RewriteCond %{HTTP_USER_AGENT} HTTrack [OR]RewriteCond %{HTTP_USER_AGENT} "^Mozilla/4.0$" [OR]RewriteCond %{HTTP_USER_AGENT} Sqworm [OR]RewriteCond %{HTTP_USER_AGENT} WebCopier [OR]RewriteCond %{HTTP_USER_AGENT} WebReaperRewriteRule .* - [F,L]

Bu yöntemle sadece user-agent'inden tanınabilen robotları durdurabiliyoruz. Diğerleri, user-agent bilgilerini normal olanlara benzeterek bu filtrelerden geçebiliyorlar. Bunları ise IP adreslerinden, IP bloklarından tanıyarak engellemek mümkün. Bu engeli de ister iptables ile, istersek de squid ile koyabiliriz. Kısa bir Kötü Robot IP Listesi olarak şunlar kullanılabilir:



64.140.49.66/3012.148.196.128/2512.148.209.192/2663.148.99.224/27

Bu listeyi, /usr/local/share/koturobotip.lst gibi bir dosyaya kaydettikten sonra, iptables ile şu şekilde kullanıyoruz:



cat /usr/local/share/koturobotip.lst | while read iplerdoiptables -A INPUT -i $DEV -s $ipler -p tcp --destination-port 80 -j DROPdone




Squid içinden kullanabilmek için listeyi önce squid'in anlayabileceği biçime getirelim:



64.140.49.66-64.140.49.69/255.255.255.6912.148.196.128-12.148.196.255/255.255.255.25512.148.209.192-12.148.209.255/255.255.255.25563.148.99.224-63.148.99.255/255.255.255.255

Bu IP listesini /usr/local/share/koturobotadres.lst dosyasına yazıp şu iki satırı da squid'e ekleyerek squid'in bu adresleri engellemesini sağlarız:

acl koturobotadres src "/usr/local/share/koturobotadres.lst"
http_access deny koturobotadres





Daha kapsamlı bir Kötü Robotlar Listesi olarak aşağıdaki kullanılabilir:



almadenCherryPickerCrescentDA\ DIIbotEmailCollectorEmailSiphonEmailWolfExtractorP roFlashGetFrontPageGetRightHTTrackInternetSeer\.co mLinkWalkerMicrosoft\ URL\ ControlMozilla.*IndyMozilla.*NEWT^Mozilla/4.0$MSIECrawlerNICErsPRONPBotpsbotsitecheck\.inter netseer\.comSqwormTeleportWebBanditwebbanditWebCop ierWebEMailExtracWebReaperWindows\ XPZeus.*Webster

Son Not: Bazen çok ufak unutkanlıklar, sorunu yanlış yerde aramamıza ve epeyce bir zaman kaybetmemize yol açabilirler. Sözün özü, yukarıdaki değişiklikleri yaptıktan sonra squid ve/veya apache'yi yeniden başlatmayı unutmamakta yarar var.







Yardımcı Kaynaklar:




Mart 2004
İlker FIÇICILAR
__________________
Remixlerim

Günler ne çabuk geçiyor.
Geldik..Gidiyoruz...
Dj Murat is offline   Alıntı Yaparak Cevapla
Eski 09-10-2005, 00:19   #2 (permalink)
cleyy
Etkisiz Üye
 
Giriş Tarihi: 08-10-2005
Mesajlar: 40
Rep Gücü: 3
Rep Puanı : 10
cleyy Yavaş ama emin adımlarla geliyorum
Varsayılan

teşekkürler
cleyy is offline   Alıntı Yaparak Cevapla
Eski 22-12-2005, 18:51   #3 (permalink)
10 numara
Etkisiz Üye
 
Giriş Tarihi: 22-12-2005
Mesajlar: 3
Rep Gücü: 3
Rep Puanı : 10
10 numara Yavaş ama emin adımlarla geliyorum
Varsayılan

teşekkür ederim
10 numara is offline   Alıntı Yaparak Cevapla
Yanıtla


Forum Araçları
Görüntüleme Biçimleri

Gönderme Kuralları
Yeni konular açabilirsiniz --> izin yok
Yanıtlar gönderebilirsiniz --> izin yok
Eklentiler gönderebilirsiniz --> izin yok
Mesajlarınızı düzenleyebilirsiniz --> izin yok

vB koduAçık
SimgelerAçık
[IMG] kodu Açık
HTML kodu Kapalı
Trackbacks are Kapalı
Pingbacks are Kapalı
Refbacks are Kapalı


Saat 16:15.

Porno

Powered by vB 3.6.7
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
SEO by 3.0.0
Tercüme Eden: ReSSaM

Reklam Vermek için ressam@gmail.com Adresine e-mail gönderiniz

For Advertising contact ressam@gmail.com




Şarkı Sözleri sohbet Forum
haber haber dizi izle dizi
1 2 4 5 6 7 8 10 11 12 13 14 15 16 22 23 24 25 29 30 31 32 33 34 35 36 37 38 39 44 45 46 47 48 50 51 52 53 54 59 66 70 77 78 83 84 85 86 87 88 89 90 91 92 94 99 100 101 102 103 104 105 106 107 108 109 110 111 113 114 115 116 119 120 124 125 126 127 128 130 131 132 133 134 135 136 137 138 140 141 143 144 145 146 147 148 149 150 151 152 153 154 159 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 240 249 250 251 253 256 257 260 267 268 269 270 272 273 274 275 277 278 279 280 281 283 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 306 307 309 310 312 313 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 346 347 348 349 351 352 353 354 356 357 358 359 360 361 362 363 364 365 366 367 369 370 371 372 373 374 402 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489