ウェブマスターフォーラム

Web 制作 (SEO, SEM, CSS, Web デザイン等) に関する話題を扱うフォーラムです。

ログイン

新規ユーザー登録 | パスワードを忘れた

テーマ : SEO (検索エンジン最適化)

リンク : フォーラム | Su-Jine | ブログ | HTML PING WORLD | ポイ探 | 広告について

 

東京オフ会予定 3/1 (土)
大阪オフ会予定 2/23 (土)
オフ会FAQ

SEO (検索エンジン最適化) に関する話題を扱います。

トピック : キャッシュ対策

次の古いレス20件 << 最新のレス20件 >> 次の新しいレス20件

No.10 - 2006年01月12日 11:14
アラー (44ポイント)
>キャッシュが表示されないページは、恐らくgooglebotがクロールすることも滅多にないでしょう。

逆に言うと、GoogleBotが頻繁にアクセスするならば
良い感じでキャッシュされますかね?

>sitemapをXMLで作成しGoogleに登録して一週間たちますが

僕のサイトは1ヶ月ぐらいして挙動がありました
インデックスはまだです
No.11 - 2006年01月14日 02:53
メド (18ポイント)
キャッシュとsitemaps登録について自サイトでわかった範囲で書いておきます(参考にならないかもしれませんが(汗))。

一年ほど前から作り始めたサイト(ブログ形式MT自設置)
1.HTMLページは全部で120ページ程
2.非リンク数0
 (非公開状態なのでどこからもリンクしていません)
3.2005年の6月にsitemapsにXMLを登録
 (同時期にUSヤフーにキャッシュの申請)
4.各ページの文字数は200〜300文字程度
 (画像もあり)

上記のサイトですが、ヤフーのキャッシュ数は3ページ。それに対し、GOOGLEのキャッシュ数は105ページ(URLだけ表示は含まず)でした。また、おかしなことにトップページはURL表示で、sitemapsに申請したXMLのページが正常にキャッシュ、さもトップページかの如く一番上に表示されていました。

sitemapsの効果は定かではありませんが、私としてはある程度キャッシュしてもらう効果があるのではないかと思っています。
No.12 - 2006年01月14日 03:10
メド (18ポイント)
すみません、ちょっと分かり辛いところを追記します。

サイトの内容は専門ジャンルの辞書的なもので、タイトルに入れている単語はあまり一般的な単語ではありません。また、サイトはサブドメインで作っています。

>非公開状態
完成に至っておらず、コンテンツとして公開できていない状態です。訪問者もほぼいない状態なので、他サイトからのリンクも無いと思って問題ないと思います。

>sitemapsにXMLを登録
登録してからキャッシュされたまでの期間は憶えていません。また、この時期にもしかしたらGOOGLEにキャッシュの申請をしたかもしれませんが、これも申し訳ないことに憶えていません。

参考になりそうもなく混乱を招くだけかも、ごめんなさい。
No.13 - 2006年01月14日 07:53
アラー (44ポイント)
メドさん、貴重な意見ありがとうございます。

被リンク数0で、キャッシュ105ページという情報は、心強いですね。

他のSEOサイトなどを見てみると
「被リンクの力が足りないと、キャッシュされるページ数は限られてくる」などと書かれているのを見かけました。
僕はページランク計算は出来ないのですが
「内部リンクだけでは、全てのページがキャッシュされない」としたら
めぐりめぐって「世界中で、キャッシュされるページなんか1ページもなくなってしまうのでは?」
と思っていたので、内部リンクの構造を工夫して
何とか全ページキャッシュさせたいと思っています。
(外部リンクは、被リンクとして何十倍かのパワーで計算される、となると、事情が違ってきますが。)

少なくとも、無駄な部分への「ページランク漏れ」や
リンクのない「行き止まりページ」がないように
気をつけています。

>120ページ程

のページ数があるということですが、キャッシュページ数は105ページですよね?
このキャッシュ漏れの原因は何か思い当たりますか
No.14 - 2006年01月14日 08:41
アラー (44ポイント)
Googleの「URL表示のみ」のページについて

・タイトル(<title></title>)での検索では、検索結果に出てくる。ページタイトルはインデックスしているらしい。
・本文での検索では、検索結果に出てこない。本文はインデックスしていないらしい。
・サイト内検索で「補足結果」と表示されるページ(HTML)を、直接検索してみると「URLのみ表示」のページだった。URLのみ表示≒補足結果?
・URLのみ表示のページも、リンク元として出てくる。ページ自体はインデックスしなくても、リンク関係はインデックスすることがあるらしい
No.15 - 2006年01月14日 08:54
アラー (44ポイント)
被リンク(ページランク)に注目して仮説を立ててみました。あくまでも仮説です。

仮説:

・1ページがキャッシュされるのに、必要なページランク(被リンク)が1とする
・1ページから発信できるページランク(発リンク)が1.2とする
・ページランク(被リンク)が1に満たないページはURLのみの表示になる。あるいは、例えば500ページのページ群があるとして、1ページあたりのページランクが低い場合は、一部のみのインデックスとなる。400ページのみをインデックス、350ページのみをインデックス、など。
・ページがURLのみの表示となり、完全に削除されないのは、全体のページランク算出のため
・キャッシュページ数を増やしたい場合、内部リンクに「漏れ」がないようにページ&リンクを構成するべきである
・1ページのリンクの中で、最終的にページランクが自ページに戻ってこないような発リンクの仕方を、「無駄なリンク」とすると、もしも、例えば「1ページから発信できるページランク(発リンク)が1.2」である場合、0.2ポイントまでの無駄なリンクは許容されるが、それ以上の無駄なリンクは作らないこと
・1ページあたりの「無駄なリンク」の割合が、そのまま、全体のページ数に比べて、非キャッシュのページ数の割合である
No.16 - 2006年01月14日 19:58
アラー (44ポイント)
・URL表示のみのページも、リンク元として計算されるとすると、ページをたくさん作って、GoogleSiteMapなどでクロールさせるのも悪くない。全体のページランクが上がり、キャッシュされるページ数が増えるでしょう。
No.17 - 2006年01月15日 00:03
act (19ポイント)
仮説というか妄想なのだが・・・

リンク情報取得クロール、ページ情報取得クロール、更新情報取得クロール、ドメイン公開からの時間を計測する等、目的の異なる複数のロボットまたはクロールが実行される。間隔は異なる。フレッシュクロール時は、単にページ情報しか取得されず、検索結果用キャッシュに留まる。
総合情報を元に、3ヶ月に1度くらいPR更新、サイト価値が見直され順位の大幅入れ替えが行われる。PRはそのページが存在するセグメント(ページ数、ワード密度・・)によって、検索順位を決める重みが異なる。または過疎のセグメントほど高いPRはつきにくい。


同一カテゴリ(YAHOO)で複数管理している。それぞれのユーザーの予算、考え方によりSEO/SEM対策、ページ量、ページ更新頻度は違う。すべてアクセス解析、順位チェックを欠かさないが、順位を長期的に観察するとそんな妄想が芽生えてきた。

最近は、ページ更新頻度(どの程度を価値とするかは、少し見えてきた。)をクローラーはよく観察して順位要素として強化しているかも・・と思う。
No.18 - 2006年01月15日 00:08
act (19ポイント)
キャッシュの話題から外れてスマソ。

それとドメイン公開からの時間もPR値の決定要素となるのは
間違いなさそう。

サイト公開から7年以上経つサイトがある。いわゆる放置サイトで
バックリンクほとんどなし、MSフロントページで作られた簡単なサイトなのだがPRは4。老舗サイトとしての価値があるのだろう。たとえばメインクロールを100回カウントするとPRが上がるとか・・・
No.19 - 2006年01月15日 00:22
act (19ポイント)
Googleの評価する良いサイトとは何か?

下手くそなサイトでも、根気よく長期間にわたってこまめに更新され、ページを増やしていくサイトだろう。

HTML技術やバックリンクは、二の次、三の次だと思う。

なぜなら私が下手くそなサイトを公開して3年になるが、PR3のままでも順位が向上してきた。途中トップだけ詳しい人に頼みコーディングも試したが効果なし。
更新をこまめにして、ページをコツコツ増やしてきたころから多くの主要キーワードで順位向上してきた。激戦カテゴリではないが、
競合はまぁ多いです。

本来インターネットは、特別な知識や技術を持たなくても誰でも情報が公開でき、良い情報は広く伝えられるコミュニケーション手段なのだろう。アルゴリズムは相当高度に進化しているから、そのうちデジタル的なSEOは通用しなくなる。と思う。

アナログ的にコツコツと時間をかけるのが王道かもしれない。



なんか私見ばかりの能書きになってスマソ。スレ汚したかも。失礼。
No.20 - 2006年01月15日 10:30
メド (18ポイント)
>アラーさん
>のページ数があるということですが、キャッシュページ数は105ページですよね?
>このキャッシュ漏れの原因は何か思い当たりますか
ちょっと調べてみましたが、カテゴリーページと月別アーカイブページが全てキャッシュされていませんでした。
上記のページがキャッシュされていない原因ですが、単に個別記事のとの内容がかぶる為か、もしくはSITEMAPSに提出したXMLにカテゴリーページと月別アーカイブが含まれていない為でなないかと思います。

100少しある個別記事ページは1ページのみキャッシュされていませんでしたが、これに関しては違いが良く分かりません。

蛇足ですが、このサイトのPRは全てのページで0です。
No.21 - 2006年01月15日 21:03
アラー (44ポイント)
>単に個別記事のとの内容がかぶる為か
>もしくはSITEMAPSに提出したXMLにカテゴリーページと
>月別アーカイブが含まれていない為でなないかと思います。

情報ありがとうございます。
GoogleSiteMapに送ったXMLは、もう残ってないのですかね?
ちなみに僕は、GoogleではURL表示のページのみが増え続けてます。

>アナログ的にコツコツと時間をかけるのが王道かもしれない。

アナログ的な作業は欠かせませんね。
ただ「ロボットは所詮ロボット」という側面もあるので
アナログ的な内容の下敷きになる、デジタルなフォーマーットを求める価値はある、と思ってます。

>バックリンクほとんどなし、MSフロントページで作られた簡単なサイトなのだがPRは4
>老舗サイトとしての価値があるのだろう

たまにそういうページがありますよね
これは内部的なページランクが高いのか
それともツールバーで表示されるランクだけが高いのか?
どちらでしょうか

>act (16ポイント)

言葉の全ては理解できなかったのですが
考え(仮説)は参考になりました
No.22 - 2006年01月15日 21:08
アラー (44ポイント)
気まぐれで「キャッシュ対策」というキーワードで検索してみたのですが
「補足結果」と表示されているページも、検索結果に出てきてるんですよね。しかも本文からの検索で。
なぜかな、と思って調べたところ

> http://www.city.oyabe.toyama.jp/hptop/kensaku.htm

>検索が困難または結果の少ないキーワードの場合、補足のインデックス内でも検索が行われます。
>これらの検索結果には緑色で「補足結果」と表示されます。

だそうです。

検索結果数が少ない場合は、補足結果も役に立つということですね

・ひとつ気になること

ページランク計算って
リンクの貼りようによって、1の力が2になったり、3になったりするものなんでしょうか
それとも巡り巡って、1の力は1のままなのでしょうか
もし、発リンクと被リンクの関係で、ページランクがわずかずつでも、ネズミ算式に上昇していくならば

>メインクロールを100回カウントするとPRが上がるとか・・

こんな現象もうなずけるかな、と思います

よく、全ページ×全ページ型のリンクを見つけますが
あれはページランク的に言って有効なんでしょうかね?
No.23 - 2006年01月16日 00:56
act (19ポイント)
ページランクは、リンク数やリンクポピュラリティで評価される
数値で順位決定の要素の一つであるのは周知の通り。
私の脳内では、順位決定をするすべての要素の合計が100とすると50くらいの割合かな。と思っている。

最近はページ内要因(更新頻度など)を重視する方向にあると感じている。同一カテゴリ(業種)で同様のキーワード(タイトル)を
3つ管理しているので、順位変化をみるとそんな感じがしてきた。
(全部PRは3)

Googleの特許文書にも書かれていたが、ドメイン取得からの
期間もサイト価値を決める1つの要素であるのは、間違いなさそうである。
No.24 - 2006年01月16日 01:28
アラー (44ポイント)
>順位決定をするすべての要素の合計が100とすると50くらいの割合かな。と思っている。

僕はもっと少なく捕らえてました。

>最近はページ内要因(更新頻度など)を重視する方向にあると感じている。

更新頻度はどれぐらいの重み付け(だと感じる)でしょうか?

それぞれの要素の重み付けが分かれば
対策もしやすくなるかもですね
No.25 - 2006年01月16日 14:55
act (19ポイント)
3つのサイトの内、ひとつのサイトでトップページの更新の更新を
頻繁に行っている。
更新をよく行うようになってから少しずつだが確実に順位向上が見られる。ページ前半に新着情報のエリアを作り、その情報内でテキスト更新およびテキストでのリンク先(サブページ)をこまめに変えるのがいいみたい。100ページ以上のサイトなのもので、全頁更新は現実的でないが、2〜3日に1回のトップページのクロールで、ロボットに情報の鮮度をアピールすることは、重要ぽい。
>重みに関しては、観察中だが更新する情報量にも左右されるだろ。こればかりは、各サイトによって異なるだろうから一概には
いえないと思う。

蛇足だが3つともYAHOOカテには入れている。そのうち1つはJ-Wordに登録しているが、YSTに関してはこれも順位アップの要素となっているはずだ。

もうひとつ蛇足。ライブドアオート(現在PR0)のような、大手
ポータルと関連性のあるサイトが、次回更新時にPRを含めてどのような変化を見せるか注目中。SEOに関しては、他サイトも観察すると面白い情報が得られるかも。
No.26 - 2006年01月16日 15:03
act (19ポイント)
追記

トップページの更新で、新着情報内のテキストリンク先は、
CMS等で生成された動的ページでも効果があるらしい。
実際にやってはないが、プログラムに詳しい知人がいってた。

スレタイからずれてきてすまないが、Google/YSTの品質ガイドラインにある、過度の相互リンク(リンクファーム)とは、どれくらいからペナルティ対象になるのだろう?

同様のカテゴリサイト(住宅関連が多い)をたくさん作ってるのだが、トップページでの相互リンク、リンク集での相互リンクのやり過ぎはヤバイですかね。
No.27 - 2006年01月19日 16:58
Su-Jine (100ポイント)
ちょっと話題がそれますが、↓のサーバの検索件数が異常ですね。以前からでしょうか?
http://64.233.179.104/search?hl=ja&q=%E3%82%B4%E3%83%83%E3%82%B4%E3%83%AB&lr=

ゴッゴルの全盛期は 160 万ページでしたので。
No.28 - 2006年01月19日 19:03
POD (35ポイント)
http://www.mattcutts.com/blog/bigdaddy/
のMatt Cutts氏の記事内に
Q: I noticed some ranking changes across all data centers. Was that Bigdaddy?
A: Probably not. There was a completely unrelated data refresh that went live at every data center on December 27th. Bigdaddy is only live at 66.249.93.104 and 64.233.179.104 right now.

新データセンター「bigdaddy」のようです。

何となくですが、今までのGoogle検索では表示されなかった(排除?)完全なミラーサイトも別々のサイトとして認識されている気がします。記事の内容からすると、ここでいろいろなテストをするとのことなので、しばらく見守っていきたいと思います。
No.29 - 2006年01月19日 19:50
Su-Jine (100ポイント)
POD さん
情報ありがとうございます。テストデータセンタが変わったのですね。
本日インデックス数が変わったような気がします。

次の古いレス20件 << 最新のレス20件 >> 次の新しいレス20件

Copyright © 2008 Web 制作フォーラム by Su-Jine All rights reserved.