トップページ自宅サーバ
136コメント42KB
[クローラー]ロボット対策スレ[robots.txt]
0090DNS未登録さん
垢版 |
04/10/25 23:37:13ID:???
Yahoo! Slurp ってのがよく来るがヘ(゚д゚)ノ ナニコレ?
0092DNS未登録さん
垢版 |
04/10/27 20:26:49ID:???
2ch型掲示板のcgiがあるディレクトリ(/test/)を禁止にしたら凄く減った。
009392
垢版 |
04/10/29 00:15:47ID:???
大失敗
0094DNS未登録さん
垢版 |
04/11/04 18:53:48ID:KyJO56Ns
そうか
0096DNS未登録さん
垢版 |
04/11/12 01:30:00ID:Nh8fSwvV
ロボットは来ているのだが、Googleで検索して飛んでくる人が
最近とんと減ってしまった。なんでだろう?
YahooやMSNからの検索はそこそこ定常的にあるのに。
Googleからのもゼロって訳じゃないんだけどね。

うちのように小さなサイトは検索エンジンからのアクセスが
大切なアクセス源なのに。

原因がわかる人いる?
0097DNS未登録さん
垢版 |
04/11/13 01:06:47ID:???
スパム認定かも。
あんまり同じ単語繰り返しても無視される傾向にある様な気がする。
009896
垢版 |
04/11/13 16:16:27ID:???
>>97
うーん、普通にいろんな日々の話題を扱ったブログを公開している程度で、
目を付けられるような動きじゃないはずなんですが…。
もしかしたら、IPアドレスの逆引きがISPのドメイン名になっている事が
まずいのかも知れないと思い、逆引き設定してくれるISPに引越し予定です。
0099DNS未登録さん
垢版 |
04/11/16 02:38:13ID:???
うち、逆引きはプロバのドメイン名だけど、普通に登録されてるよ。

自分で検索してみて出てくる?
010096
垢版 |
04/11/17 00:58:01ID:???
自分で検索しても出てこんのです。(T_T)

そっか、逆引き不一致でも問題ないのかなぁ。とすると、原因は別のところか。
原因を探ってみます。
情報感謝です。
0103DNS未登録さん
垢版 |
05/01/29 01:01:41ID:???
>>89
レスさんくす。亀レススマソ。
ずっと、/~ore/を403かえすようにしてたら、
2,3ヶ月経った今、検索結果も更新されてた。

しかし、本当に最近はmsnとyahooのbotがすごい勢いでくる。
そのせいか、更新頻度はyahooとかのほうが高い気がする。
0104定期age
垢版 |
05/02/03 12:39:25ID:???
[Google,Yahoo!等]■ロボット型検索エンジン21■
http://pc5.2ch.net/test/read.cgi/hp/1106491459/
【Google】ページランクいくつよ6【PageRank】
http://pc5.2ch.net/test/read.cgi/hp/1092914063/
Googleから削除されました
http://pc5.2ch.net/test/read.cgi/hp/1081663521/
[Google,Yahoo!等]■ロボット型検索エンジン20■
http://pc5.2ch.net/test/read.cgi/hp/1106491335/
【Robots】Googleアーカイブが嫌い【NoArchive】
http://pc5.2ch.net/test/read.cgi/hp/1026114886/
0106DNS未登録さん
垢版 |
2005/11/09(水) 07:26:23ID:???
アニマル横町 第11話 第12話 「どき☆どき 占いパラダイス/どき☆どき 大げんか」 (WMV9 VGA 120f).avi rTS5D56UkW 225,006,346 ebae1fe40bdee39518a56c7109901839
ttp://www.imgup.org/file/iup115747.jpg

(=゚ω゚)ノ

0107DNS未登録さん
垢版 |
2006/06/02(金) 00:20:19ID:/2RXfUmf
0109DNS未登録さん
垢版 |
2008/10/02(木) 01:57:54ID:nEirrkI6
dissalowされたサイトだけ検索するエンジン作ったらヒットしそうだね!
誰か作って!
0111DNS未登録さん
垢版 |
2008/10/05(日) 00:15:29ID:???
大体RFC化もされていない「紳士協定」に対して
目くじら立てるやつっておかしいと思わないか?

フリーオを問題視してる団体と完全に構図が一緒だ
0112DNS未登録さん
垢版 |
2008/11/08(土) 08:10:01ID:oHYIhwg4
naver の Yeti というのは、naver しか使ってないのか ?
それなら、USER_AGENT で Yeti を丸ごと弾いてしまおうと思うが。
0113DNS未登録さん
垢版 |
2008/12/20(土) 20:11:22ID:91fDHPXk
htaccessでBaiduspiderはrobots.txtだけにアクセス出来るように設定したなら、
他のファイルに1秒20回アクセスするという暴挙に至っている。
それだけでエラーログが巨大化しているw
こうなるとルータで弾くしかないのか。
0114DNS未登録さん
垢版 |
2008/12/23(火) 15:11:38ID:aGiF1pXb
javascript使って、ブラウザアクセスでしか開けないようにしておけば良いんでない?
趣旨が違う?
俺、掲示板に広告書き込むスクリプトがウザくて使ったら、一切来なくなったよ。

こんな感じ↓
http://www.google.co.jp/ ←隠したいアドレス

-top.html-
<html><head>
<script type="text/javascript"><!--
function code(){add.innerHTML='<a href="http://www.goog'+'le.co.jp/">隠したいアドレス</a>';}
//--></script></head>
<body onLoad="code();">
<span id="add"><a href="noscript.html">隠したいアドレスへのジャンプページ</a></span>
</body></html>

-noscript.html-
<html><head></head><body>
以下のアドレスをコピーして移動してください。<br>
http://www<;span>.google</span>.co.jp/<br>
</body></html>

アドレスをブツ切りにして記載してやれば、単純にテキストを検索して来た時は見えないし。
トップページは隠すの無理だけど。
0116DNS未登録さん
垢版 |
2009/08/24(月) 18:11:05ID:???
とんだ先にアフィ貼るとかそういう落ちに期待したい(^◇^;
0117DNS未登録さん
垢版 |
2010/09/27(月) 10:57:04ID:9hieuaLl
robots.txtって、クローラはどこかのページにアクセスする際、
必ず見に来るものなのかな?
0118DNS未登録さん
垢版 |
2010/09/28(火) 02:34:40ID:???
お行儀が良いクローラならね。
見る義務は無いし、見ても記述内容に従う義務は無い。
0119DNS未登録さん
垢版 |
2010/11/01(月) 13:26:41ID:???
アクセスログを見ると、グーグルさんはちゃんとrobots.txtを見てくれてる
0120DNS未登録さん
垢版 |
2011/01/24(月) 23:43:10ID:???
66.249.69.91 googlebotのIPらしいけど、
sshの辞書攻撃を毎日してくる。
0125DNS未登録さん
垢版 |
2011/03/13(日) 08:04:32.30ID:???
>>124
IPヘッダ書き換えりゃ偽装自体は出来る。
でもIPパケット送りつける事しか出来ない。
0126DNS未登録さん
垢版 |
2011/10/16(日) 02:11:24.30ID:???
Ajaxばりばりのサイトでも突破できるクローラーってありますか?
0127126
垢版 |
2011/10/16(日) 13:33:18.84ID:???
かんたんなDHTMLはいけても、
さすがに、GoogleMapも自動でリンクたどるとか無理ですよね?
0128DNS未登録さん
垢版 |
2011/12/20(火) 14:10:31.57ID:???
yahooの検索結果に表示されては困る、でもgoogleやその他にはむしろガンガン表示して欲しいんだが、
そんな指定metaタグでできる?
無理ならブラウザ拡張のアドオンでもいいんだが。
教えてください。
0129DNS未登録さん
垢版 |
2011/12/20(火) 15:14:30.76ID:???
今yahooの検索エンジンってgoogleのやつを使ってるんじゃなかった?
0130DNS未登録さん
垢版 |
2011/12/20(火) 17:10:58.19ID:???
そこが問題なんだよなー。
なんかいい方法ないかな。
アドオン探してもgoogleのは見つかるが、yahooで検索結果から除外できるようなアドオンは無いみたいだし。
0131DNS未登録さん
垢版 |
2012/02/20(月) 20:02:21.28ID:???
八巻正治さんについて思うこと。
いつもは宗教心あふれる教師面して"福祉とはかくあるべき"と講釈たれてるのに、
自分の気に食わないことを言われると個人的な感情全開にして、己の懐の狭さが露見するよね。

八巻正治さんは、他人には潔さを求めるのに、自身の発言には一切の責任を取らない。
これ程まで薄っぺらい人間を、他には知らない。
ニューポート大学大学院博士だけのことはあるね。
0133クリスチャノ水戸
垢版 |
2016/04/20(水) 23:57:26.06ID:0U08Vzb+
!!押川の悪事警報!!
※常識的に事実でなければこの様な内容は書けません!
毎度お馴染みの極悪人、押川定和の被害にご注意下さい。
押川定和の悪事は犯罪の領域に達している。

大企業(株)クボタ筑波工場からも情報を盗み取ったのは決定的で対応に注目が集まる。
http://www.kubota.co.jp/siryou/jigyos.html


創価学会押川定和の
勤め先・株式会社WEIC(ウェイク)104-0053
東京都中央区3-1
http://www.ntt.com/bizhosting-basic/data/case2_1.html
0134DNS未登録さん
垢版 |
2017/02/03(金) 12:44:05.83ID:UpAhIUM+
yandexに本気で殺意を覚えた
どこから来やがった氏ね
0135DNS未登録さん
垢版 |
2017/08/24(木) 08:24:43.19ID:CVAFOrrA
最近,Baiduクローラーからのアクセスが来るよになったのでIPが変わったのかと思って,
確認したら変わっていない。
Apacheでアクセス拒否にしているのに…
で,しょうがないので上流のファイヤーウォールでアクセス拒否にしても何故かやってくる…
これは一体どういうことだw

送信元を詐称して,詐称先にパケットを返しているのかな?
謎挙動なんだがw
レスを投稿する


ニューススポーツなんでも実況