Web 制作 (SEO, SEM, CSS, Web デザイン等) に関する話題を扱うフォーラムです。
新規ユーザー登録 | パスワードを忘れた
リンク : フォーラム | Su-Jine | ブログ | HTML PING WORLD | ポイ探 | 広告について
★東京オフ会予定 3/1 (土)
★大阪オフ会予定 2/23 (土)
オフ会FAQ
Apache 等のインストールや設定方法等の話題を扱います。
トピック : googleの検索結果不具合について
googleのキャッシュに同一サーバー内の異なるドメイン(バーチャルホスト)のホームページ内容が記録されて困っています。
次の古いレス20件 << 最新のレス20件 >> 次の新しいレス20件
- No.1 - 2006年05月11日 22:31
つめこう (15ポイント)
-
If-Modified-Sinceヘッダチェックツール
http://www.su-jine.com/sujine_seo_if-modified-since_checker.php
で、私の自作HPを調べてみたら、
ヘッダーに続いて、ページの中身そのものが出てしまいます。
最近、googleの検索結果がおかしいので、これが原因なのかと思っていますが
いまいち、問題の切り分けができません。
調べたページは、 http://white.dobashi.jp/bbs/
実際には、 http://white.dobashi.jp/bbs/index.cgi
です。
検索結果がおかしい、というのは、
最近、2ちゃんねるの中でも話題になりはじめたようですが、
あるキーワードで検索すると、同じサーバー内にある複数の
バーチャルホストのドメインが引っかかる、
あるいは、googleの検索キャッシュが、実際とは異なる他のホームページを
記録してしまう、などのことです。
また、トップページのみがgoogle検索で見つけられなくなったりして大変困っています。
当方は自宅サーバーにつき、
AnHttpdのゲストブック http://www.st.rim.or.jp/~nakata/gbook/gbook.htm
に問い合わせしていましたが、2ちゃんねるの下記スレッドにも同じ不具合が報告されていました。
http://pc8.2ch.net/test/read.cgi/isp/1106554814/642-687
これによると、結局、検索結果の不具合は限りなくgoogle側の黒という
印象を持ちますが、どうも、サーバー側に、というよりも
このヘッダー情報のやり取りに問題が発生しているように思われてなりません。
そこで、こちらのサイトのチェックツールを使ってみたところ、
冒頭のような不具合?があり、ヘッダー情報に引き続き、サイトの情報がそのまま
表示されてしまったので、私の側にどんな問題が考えられるのか、
識者の皆様のお考えを教えていただけませんでしょうか。よろしくお願いします。
- No.2 - 2006年05月12日 10:33
報告者 (44ポイント)
-
HTTP/1.1 200 Document follows
って何ですかね?
僕の頭の中の常識からすると、200は"Document follows"じゃなくて"OK"なんですけど。
それと、なんとなくなんですが、ヘッダとデータ(本文)の間に空行が入ってないというような原因は考えられないでしょうか?
- No.3 - 2006年05月12日 10:54
Yosaku (10ポイント)
-
ソースがグチャグチャなんですけど.....
</head>がヘンなところに有るし、</body></html>も途中に
入っているし、一度ひょうじされたHTMLを確認して
CGIプログラムを見直された方がいいと思います。
私には、キチンと表示して動いているのが不思議に思えます。
↓コチラで、チェックして点数の多いところから
まず修正してみたら如何でしょうか?
http://openlab.ring.gr.jp/k16/htmllint/htmllint.html
- No.4 - 2006年05月12日 15:58
どきゅ (46ポイント)
-
タグは関係ありません。
2chでも「コンフィギュレーションエラー」と書いてありますが、
私も同じ現象が1年半ほど前に発生し、
Gogoleに問い合わせてみたら、上記のエラーが指摘されましたよ。
ちなみに私はYahoo!のキャッシュでPR8になりましたw
掲示板「過去ログ」に詳細を記載しております。
- No.5 - 2006年05月12日 18:40
つめこう (15ポイント)
-
>報告者さん
>僕の頭の中の常識からすると、
>200は"Document follows"じゃなくて"OK"なんですけど。
いろいろ検索してみたら、どちらも同じ意味のように思いました。
Document follows =すなわち、OKということとは違うのかしら。
>Yosakuさん
大変参考になりました。一応、タグは直しました。
確かにメチャクチャでした。
実は、htmlプログラムにマイクロソフトのFrontPage2003を使用しています。
FrontPageには「共有枠」という仕組みがあり、
ベースとなるページの左右上下に共通のドキュメントを
組み込むことができて、それが_bordersフォルダの中に、
top.htm bottom.htm left.htm right.htm の形で記述されています。
あまり深く考えずにそれらのファイルを読み込んで、
掲示板cgiの左右上下を修飾していたので、
例えば、<head>や<body>があちこちに出てくる、という状況でした。
大変便利なツールを紹介していただき、ありがとうございました。
>どきゅさん
過去ログ拝見していました。実は、この症状で困ったとき
どきゅさんの書き込みをいち早く見つけ、
ぜひお話を伺いたいと思っていました。ご降臨ありがとうございます。
ずばりお聞きしますが、どきゅさんは、どのようにして
改善を図られたのですか?
私もどきゅさんがgoogleから受け取ったのとすっかり同じメールをもらいました。
ただ、このまま待っていても解決するのかという不安があります。
もし解決策も掲示板にご投稿でしたら、教えていただけませんか?
(探せませんでした)
皆様のレスに感謝します。
- No.6 - 2006年05月13日 14:10
報告者 (44ポイント)
-
よく調べずにレスしてすみませんでした。
Document followsを200とともに返すサーバがあるようです。
ただ、
>それと、なんとなくなんですが、ヘッダとデータ(本文)の間に空行が入ってないというような原因は考えられないでしょうか?
こっちの方が気になるのですが・・・
- No.7 - 2006年05月13日 17:19
terra-natal (48ポイント)
-
手元からtelnetでアクセスしてみました。
GET /bbs/index.cgi HTTP/1.1
Host: white.dobashi.jp
User-Agent: telnet
に対して
========================
HTTP/1.1 200 Document follows
MIME-Version: 1.0
Server: AnWeb/xxx
Date: Sat, 13 May 2006 07:55:31 GMT
Transfer-Encoding: chunked
Content-type: text/html
6D4A
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
<HTML lang="ja-JP">
(以下略)
========================
「If-Modified-Sinceヘッダチェックツール」でテストした時には
========================
HTTP/1.1 200 Document follows
MIME-Version: 1.0
Server: AnWeb/* * *
Date: Sat, 13 May 2006 07:18:01 GMT
Connection: close
Content-type: text/html
========================
になっていて、両者のレスポンスヘッダが違いますね。
それにcgiならば
Transfer-Encoding: chunked
があってもよさそうですが、ありません。通常のhtmlコンテンツのようなヘッダです。もしかしたらヘッダー部分にcgiコンテンツが入っていて、データ部分には別のページのhtmlがあったりするのでしょうか。「If-Modified-Sinceヘッダチェックツール」と同じヘッダを再現できれば分かるかと思いますが、できませんでした。
例えば携帯電話向けとかでUser-Agentによってレスポンスを変える設定になっていて、あるUser-Agentだと他の(通常ならば携帯電話向け)サイトに飛ばすようになっているとかありませんか。
実際、私のサイトのうち、無料サーバーに載せているサイトはUser-Agentによってデータ内容が変わってます。主に強制バナー広告のサイズ制御に使っているみたいでしたけど。
なお、いろいろと調べる段階でつめこうさんのサイトにtelnetで何回も接続しました。アクセスログを汚してすみません。
次の古いレス20件 << 最新のレス20件 >> 次の新しいレス20件
Copyright © 2008 Web 制作フォーラム by Su-Jine All rights reserved.