« 2006年11月 | メイン | 2009年05月 »

2006年12月 アーカイブ

2006年12月01日

Googleページランクの偽装を見破るツール

なんでも、世の中には301や302リダイレクトを使ってPageRankを9とか10に偽装する手法があるそうです。

これを見破って、ドメインの真のPRを表示するツールがあったので、ご紹介。
Fake PageRank Detection SEO tool

もちろん「偽装できる」といっても、検索エンジンを騙せるわけではありません。
(そんなことができたら「偽装」じゃないし)
では何故こんなツールが必要なのかと言えば、特に欧米ではPRの高いドメインの売買や、PRの高いドメインからのリンク売買が盛んに行われているからで。
eBayなんかで「PR9のページからのリンク売ります!」みたいに書いてあるのは、気をつけた方が良いかと。

しかしページランクの売買って、オンラインゲームで育てたキャラクターやアイテムを実際に売買する人のような「虚」の臭いがして嫌悪感。

2006年12月07日

Splogosphere - Spam Blog群の近況 -

Splog(=Spam Blog)の撲滅に関する近況が、"Destroy all Malware"より更新されました。
State of the Splogosphere, Part IV

レポートではBlogspot、Technorati 、Google blog searchなどの取り組みがSplog減らしに効果を発揮しているとし、各Blog検索エンジンの取り組みを称えています。
一方で「現時点で対策の無い」Spam手法としてcomment spamが挙げられていました。
これは主にAdSenseなどのキーワードマッチ系の広告を出しているBlogを狙い、自らが宣伝したい広告が表示されやすくなるようなコメントを連続投稿するもの。
この対策としてコメントを即時反映させずに一度承認を求めるBlogが増えると、Blog文化そのものの広まりに障害となるのではと危惧されます。

いずれにしろSplogの対策には、近年どこの検索エンジンも熱心です。
Blogマーケティングなども良いですが、あまり悪質な手法を用いる業者に依頼すると、ある日突然無効...どころか重いペナルティを課せられる可能性すらあるので、くれぐれもご注意を。

2006年12月09日

Google MapsのGeocoding APIが日本対応

Google Maps APIのGoecoding機能が、念願の日本住所対応です。
Japanese Address and Placename Support Added to the Geocoding API

Geocodingとは住所文字列から緯度経度を割り出す機能。
これによって、様々なサービス開発の際に、いちいち該当する場所を地図上で確認して緯度経度を割り出すといった作業が不要になります。

ところで全くの余談ですが、Google MapsやGoogle Earthで「セブ島」を探すとあんな場所がプロットされるのは、なぜなんでしょ?
前々から不思議だったんですが、今回のGeocodingサンプルで試しても同様でした。
http://zorgmon.googlepages.com/geocoder-jp.html
↑「セブ島」を入力して「地図を検索」

2006年12月10日

Search Engine Strategies Chicago '06 - コンテンツ複写と多重サイトについて -

12月4日~7日まで、シカゴで検索エンジン戦略に関するカンファレンスが開かれました。
全75セッションリスト
これについてSearch Engine Roundtableが、非常に有益なレポートをあげてくれています。

Search Engine Strategies Chicago '06 SER Coverage Recap

中でも個人的に興味のあるセッションを幾つか、いつも通りいい加減にですが書き留めておこうと思います。
まずは5日に開かれたDuplicate Content & Multiple Site Issues。ちょうど仕事上でも、ASPとして他社提供しているコンテンツが複写と見なされる可能性もあれば、サイトが完全にパクられている例もあり。まさに内憂外患の悩みどころでした。
以下、ここでの目的はセッションのレポートではなくナレッジ共有なので、要点の羅列だけで。

コンテンツ複写と多重サイトの問題について

Becom.comのJon Glick氏:
コンテンツ複写とは、複数の異なったURLで同じ内容のホームページが存在すること。
検索エンジンはコンテンツ複写を好みません。
動的URLはロボットを混乱させやすいので気をつけましょう。
Googleなどの検索エンジンは、あなたにとって最良のドメインだけを選ぶでしょう。
トラッキングのためのランディングページを検索エンジンに見せないよう、robots.txtなどを用いましょう。
あなたの持つ全てのドメインから1つのドメインに、301リダイレクトを使って集約しましょう。
302リダイレクトは一時的な移動を意味するので、イベントスケジュールのようにすぐに変わってしまうものにだけ使うようにしましょう。
ペナルティを受けた際には、Googleに直接コンタクトできます。
Yahoo!も同様のフォームを持っていますが、実際のところ彼らは除外した時にそれを通知してくれます。

GrantasticDesignsのShari Thurow女史:
例えば65%の文字列が同じ...というようなパーセンテージで計るものがコンテンツ複写ではない。その内容の類似性が問題。
検索エンジンは、同じ情報の繰り返しが検索性を落としユーザを落胆させることから、これを非常に嫌います。
※以下、彼女が説明してくれたGoogleをはじめとする検索エンジンのコンテンツ複写を防ぐクラスタリング手法

  • ナビゲーションやフッタなどの定型テンプレートを落とし、コンテンツだけを抽出する
  • 内部、外部の各リンクを抽出
  • 内容が更新されているかどうかをチェック(週次で見て、世の中の65%のサイトが変化していない。平均して0.8%のコンテンツが、週毎に完全に変わっている)
  • ホスト名解決(nao58注:複数のドメインが同じ或いは近いIPを指していないかの確認を指す?)
  • ページが持つ特徴を単語のパターンなどに分解して比較する。各単語の出現順序は関係ない

複写ページをクローラーに見られないよう、robots.txtなどを使いましょう。
必ずしもではないですが、コンテンツ複写はスパムと判定される場合があります。
もし誰かがあなたのコンテンツを盗んでいるなら、法律家を雇って訴訟すべきです。
それを知るために、Copyscapeは良いツールです。archive.orgも、あなたの著作権を守るのに有益でしょう。デジタルミレニアム著作権法を用いてGoogleやYahoo!、AskやMSNに報告すべきです。

RedZoneGlobalのMikkel deMib Svendsen氏:

wwwを付けるべきかどうかは、かつては問題であったが現在は無関係。ただし外からのリンクがwwwの無いドメイン、wwwドメインにバラバラにリンクしているのは良くはないので、301リダイレクトを使いましょう。
セッションIDは、場合によっては悪夢となります。あるサイトはYahoo!上で同一のページが20万もの種類でインデックスされました。セッションはcookieに入れ、URLには出てこないようにしましょう。
多くのオープンソースのblogでは、permalink作成において古いURLと新しいURLが同じように動作してしまうことがあります。これは大きな問題になりますので、カスタマイズしましょう。ただし、私見ではGoogleはこの問題を非常にうまく扱ってくれていると思いますが。301リダイレクトを用いて古いURLをブロックしましょう。Wordpressは、この問題に対処するためのプラグインを持っています。
パラメータの並び順は一般的な問題です。301リダイレクトでデフォルトのURLに飛ばしましょう。
パンくずもまた、問題になりえます。多くの場合、パンくずはURLと同じ構造をとるでしょう。それは幾つかの複写ページを作ることになってしまいかねません。ひとつの製品がひとつのURLを持つようにすべきです。

2006年12月11日

Search Engine Strategies Chicago '06 - 成功するサイト構造 -

前回に引き続き、Search Engine Strategies Chicagoから、今回はSuccessful Site Architectureを。

>>>>>
検索エンジンに対して成功するサイト構造やページ要素、デザイン技術を学ぶことはオーガニック・リスティングに有益でしょう。ここではディレクトリ/ファイル構成、サーバサイド取り込み(SSIs)、404エラートラッピング、JavaScript、robots.txtの利用、フレーム、セキュアエリアの使い方などを紹介します。

WebMama.comのBarbara C. Coll女史:

多くのウェブデザインはSEOに心を砕いていません。
製品を売りたいのなら、高ランキングのキーワードを得なければなりません。
デザインサイクルの中で、SEOについて考えるようにして下さい。
SEOの経験を持つ、あるいはそのようなパートナーを持つ開発者やデザイナーを探しましょう。
キーポイントは次のようなものです。ディレクトリ構造、ファイルシステム、ドメイン、エラー制御、URLリダイレクト。CMS、トラッキング、アプリケーション開発。

どうやって主要メンバーにサイトを最適化に導く方法を得させるのか。
チームを教育し、納得させましょう。ランディングページの状態やコンバージョンをなどを見せましょう。
検索エンジンはあなたのコンテンツを欲しがっているのですから、それがそこにないのはあなたの失敗です。
何人の方がGoogle Sitemapを使っていますか?
検索エンジンが確実にあなたのサイトを巡れるようにしてください。
彼らの提供するツールを使って、どのページがインデックスされているのかを確かめましょう。
www.se-spider.com(nao58注:www.se.spider.comとなっているが、恐らくはここ)を用いてリンクを辿ることができるか調べましょう。
www.rexswain.com(nao58注:恐らく、特にこのツールを指す)をHTTP Viewerとして使います。
検索エンジンに、サイト内のどのページが有効なのかを伝えましょう。
検索エンジンは、あなたのサイトのことを決して忘れません。
Google Webmasterページで情報提供の方法を調べてください。そのためにあなたは、サイトの所有者であるか少なくともサイトにアクセスできなければなりません。
Google Sitemapsはサイトのヒストリーをトラッキングし、コンテンツや外部リンクのレポートを見せてくれます。(nao58注:?WebmasterToolkitの説明と入り混じっている可能性有り)
Yahoo Site Explorerは情報提供はしてくれませんが、ページの外部リンクを見ることができます。

Acxiom DigitalのDerrick Wheeler氏:

Step 1: 検索エンジンがどのようにあなたのサイトを見て、扱うのかに関する基本。
まずあなたのホームページを見つけなければなりません。そしてそれから、他の全てのページにリンクしていなければなりません。コンテンツを得て、それをインデックスに入れる必要があります。
このプロセス見てみましょう。

  1. 検索エンジンがサイトをクロールする
  2. サイト全体をインデックスする
  3. ユーザが対象となるクエリーを実行する
  4. 検索エンジンが適切なページを格付けする
  5. ユーザがランク付けされたリストをクリックする
  6. ユーザが行動を取る、あるいはサイトと作用し合う

あなたは今、どこに居ますか?あなたのドメインやサブドメインはどうでしょう?それらを特定して下さい。301、302ページをトラックしましょう。各検索エンジンにインデックスされているページの数を数えてください。インデックスされていないページを特定しましょう。サイトのランキングをトラックしましょう。
これは、あなたがキーワードに焦点を当てる必要があることを示してくれます。トラフィックを学びましょう。ページ間がどう繋がっているかは非常に重大です。検索エンジンにテキストリンクを追わせることは簡単です。ページ毎に適したキーワードを持ったファイル名をURLに付けましょう。ナビゲーション用のJavaScriptはダメです。例えば"mouseover"のようなチンプンカンプンなパスがURLに出てこないようにしましょう。
検索エンジンがリンクを見つけられるよう、sitemapを用意しましょう。
ポップアップリンクは、やはり追跡が難しいです。
もし画像にaltが付いていなければ、検索エンジンは何の画像であるのかわかりません。
CSSをテキストリンクに用いて、画像であるかのように見せかけましょう。検索エンジンはCSSを扱えます。
検索エンジンはフォームを埋めることはできません。サイトマップなどでナビゲーションの代替手段を用意しなければなりません。

フッタのリンクは2行のテキストリンクが良いでしょう。
下の行には、フォローする必要の無いプライバシーやコピーライト、利用条件などを置いておきます。
上の行には、本当にエンジンに気づいて欲しいリンクを置きましょう。URLは短く。パラメータの数、ディレクトリの階層も減らし、トータルの文字列長を短くしましょう。
HTTPステータスコードやサーバのレスポンスコードは検索エンジンの手助けをします。例えば200はOK、301は恒久的な移動、302は一時的な移動のように。404は不正もしくはURLのタイプミスです。
検索エンジンは302を301のように扱います。お疑いなら301を使って下さい。
(nao58注:以下意味不明)
SE's will remove the old url and add the new url.as the value/occurrance of each goes up, chances of success go down.
長いURLにキーワードを詰め込みすぎないよう気をつけましょう。

noindex、nofollowのmetaタグやrobots.txtを用いて検索エンジンを禁止しましょう。サイト全体をブロックしてしまう事故を起こさないように。
検索エンジンはcookieを受け入れません。これはインデックス化を妨げます。
普遍的なパンくずを用いましょう。もしそれらが動的に作られているなら、検索エンジンは直接のパスを持たないことになります。
関連商品表示はユーザにとっても検索エンジンにとってもパスを複雑にしてしまいました。
※ここで良い具体例を見せてくれたようですが、説明は難しいとのこと。
robots.txtを使ってスパイダーがとても長いURLにひっかかるのを防ぎましょう。
検索エンジンにとってコンテンツ複写に見えるようなIDをトラッキングしましょう。
HTTPSに対しては、相対ではなく絶対パスで記述しましょう。
短くて簡単に覚えられる名前をドメインにつけましょう。
ダッシュを使ってはいけません。
ページのコンテンツは綺麗なコードでなくてはなりません。
※このプレゼン資料がここからダウンロードできます。

SiteLogicMarketingのMatthew Bailey氏

検索エンジンについて異なった見方をしみましょう。盲目の人や障害のあるユーザと同じ体験を検索エンジンはしていると言えます。あなたがアクセシビリティに対処していれば、それは検索エンジンにもよく対応していることになるでしょう。
(nao58注:以下、おそらくはformやanchorのtarget attributeについて言及していると思われるが定かで無し。それっぽく訳しておきますが、意味の通らない部分があります)
targetは問題になります。ウェブが実際のお店の延長線にある以上、例えば盲目の人もウェブ上のお店にアクセスしたいと感じます。彼らはalt属性や代替手段のきちんと用意されたイメージマップなどを求めるでしょう。そして、targetはそれらを拒否することになってしまいます。target formを使用できる唯一の方法は、あなたのマウスのボタンを押すことです。それが見えないのであれば、使うことはできません。
時々、サイトに入っていく際に言語を選択させるような場合があるでしょう。検索エンジンは言語を選択することができません。
FLASHページは何の情報も検索エンジンに与えません。

画像ベースのウェブがあったとすれば、その画像を取り除いてしまった場合に何も残りません。
全ての販売情報、アクションの呼び出し、無料出荷などが画像としてあったとしたら、画像が取り除かれた際にどうやって何が売られているのか知れば良いのでしょう?検索エンジンも同様です。
alt属性にキーワードを詰め込まないで下さい。altは画像が読めない場合の説明書きです。

GoogleとW3Cのガイドラインをよく読みましょう。
もしアクセシビリティのチェックリストを読み飛ばしているとすれば、それは検索エンジン対策のチェックリストを飛ばしているのと同じです。それらは殆ど同じものですから。
動的に生成された長すぎるURLでは、ごちゃごちゃしすぎて目的の商品を見つけることができません。
Faviconはブランディングの非常に良い方法です。それは単なるアイコンですが、無料の広告です。
ぐちゃぐちゃになったURLを書き直しましょう。古いリンクや301、302リンクを探して検索エンジンに最適化された新しいURLへの直接リンクに張り替えましょう。
最もエントリのあるページをURL毎に確かめましょう。それらはランキングの高いページでしょう。
MSNは彼らの検索エンジンにとって良いリダイレクトの制御方法を持っています。

CSSと規格について。正当なコードはランクを高めてくれるでしょうか?いいえ、CSSの利用は付加価値であり本質的な違いではありません。CSSは余計なコードを落とし、本当に大切なコンテンツ部分に焦点を当てさせてくれます。余計なごみをページの外に押し出してくれるのです。これは検索エンジンにとって良いことです。
CSS vs Tables。検索エンジンはテーブルをスタックしようとします。サイトを例えば携帯で見てみてください。スタックしたサイトがどのように見えるのかということを。検索エンジンは上から下に行を降りて行きます。画面読取装置と同じことです。妥当性はスパイダーがコンテンツをインデックスできることを保証します。
<<<<<

なんだか無駄に長くて内容の無いものになってしまった気がして残念です。
基本的には3人ともに極めて基本的なSEO的サイト構造の基礎を語っています。
やはり速記のためか、文脈が混乱したり意味のわからない箇所が多いですが、そこにこそ知らない知識が隠されている気がして歯がゆいですね...やはり直に行かないと。

2006年12月12日

Ms.Deweyに訊いてみよう

ちょっと変わった検索エンジン、Ms.Dewey

Ms.Dewey
何が変わっているって、いきなり登場するのが、ちょっと怖そうなお姉さんです。
この人がMs.Dewey。検索というか、この姐さんに調べてもらうわけですね。何かを。

最初はにこやかに登場しますが、どうもカルシウムが足りないらしく、すぐにイライラモード。
雑誌を読み始めてみたり、「Hello?!」「誰か居る?」「何か入れてよ!」と落ちつかないことこの上なく。
キーワードを入れると少し機嫌が直り、検索結果を待つ間には冗談を飛ばしたりもしてくれます。
が、検索結果をながめたり、他のウィンドウで結果ページを開いて閲覧していたりするとたちまち元の不機嫌モード。タブの後ろでイラついた声をあげ、ちょっと殺意すら覚えます。

このサービス、検索してみると色々と勘違いしている人も多いようですが、Google APIを使ったりしている単なる面白サイトではなく、MSNがWindows Live Searchのエンジンを使って立ち上げた公式な実験サイトです。
Adobe FlashをLive Searchに用いる実験のようで、Live Search 地図検索も同じ線上にあるのでしょう。
AJAXではなく、あくまでローカルにインストールしたコンポーネントとサーバの通信でのサービス提供に固執するのは、先日日本語版が公開されたLiveOfficeなどにも見えるMicrosoftらしい方針とも言えそうです。

ちなみにMs.Deweyを演じるのはこの方
珍しく...といってはナンですが、Microsoftにしては面白いサービスでした。

Web2.0 ロゴ当てクイズ

こんなマイナーなサイトまでチェックして、Web2.0なんぞ精通していると自負しているアナタ。
あなたがいつも利用しているあんなサイトやこんなサービス、本当に知っていると言えるでしょうか。
軽く確かめてみるため、息抜きにこんなクイズはどうでしょう。

Which is the real logo?

いや、出来たからって何てことはないロゴ当てクイズですけど。

Web2.0ロゴ当てクイズ

...むしろ出来なくたってなんてこと無いと言うべきでしょうか。
自分はほぼ全て最初は間違えて2回目で正解...ええ、毎日のように見ているつもりのロゴでも全くわかりませんとも。

2006年12月18日

韓国最大の検索エンジン Naver が日本進出

http://www.post-gazette.com/pg/06351/745824-96.stm

日本国内でどの程度の競争力を持てるのか、かなり疑問ではありますが。
もしかすると、在日韓国人など日本にも数多く存在する韓国人コミュニティにおいては、待ち望まれた参入なのかもしれません。
「地域属性」はWebというヴァーチャルな世界においても重要なキーワードになっていますが、どうしても「市区郡」とか「駅」とかドメスティックな部分に目が行きがち。国内に潜在する外国の「地域属性」にスポットを当てる施策になり得るのか...注目です。
サービス開始は2007年末頃になるとのこと。

2006年12月19日

コンテンツ重複についてGoogleからのTips

先日から紹介しているシカゴでの検索エンジン戦略会議においても、コンテンツ重複/複写の問題について多くのセッションが開かれ、Googleも多くの質問を受けたようです。
そこでGoogleが、公式にこの問題についてTipsを出してくれました。

Deftly dealing with duplicate content

以下、要約。


コンテンツ重複になるものは何?

一般的には、ドメイン内に/またはドメインを跨ってほぼ同じコンテンツブロックが存在すること。
大抵の場合は悪意を持って意図的にやっているわけではないものの、例えば自動的にサマリーが作られたり携帯用のページが生成され、複数のURLで内容が同じになるフォーラムなどが例として挙げられます。
場合によっては、検索エンジンのランクを上げるためや、人気の/ロングテールのクエリーからの集客のために、ドメインを跨いだコンテンツ重複が見られるケースもあります。

コンテンツ重複にならないのは?

同じ内容が、英語とスペイン語などの複数の言語で書かれているものは重複とは見做しません。 また、スニペットのような引用に関しては、括弧でくくられているかどうかにかかわらず重複とすることはありません。

何故、Googleはコンテンツ重複を気にするのか?

検索に来るユーザは、通常は多様な種類の一意な内容のコンテンツを欲しがります。 そして対照的に、検索結果に似たような内容のサイトが並ぶことを、あきらめと共に受け入れています。 またウェブ管理者にしても、例えば example.com/en/shorty-george.htm のようなわかりやすいURLではなく example.com/contentredir?value=shorty-george〈=en のようなゴチャゴチャしたURLが表示されるのは残念でしょう。

この問題について、Googleは何をするのか?

クロールする際や検索結果を表示する際に、出来るだけ重複しない情報が表示されるようにしています。 このフィルタは簡単に言うと、例えばあなたのサイトが「通常版」と「印刷用」のページを持っていて、どちらもrobots.txtやnoindexメタタグなどでインデックスを拒否していない場合、どちらか片方を選択してリストに載せることになります。 稀なケースですが、重複コンテンツがページランクを操作しようとしていたりユーザを騙そうとしているように見えた場合、それらの関連するサイトの索引やランクに対して適切な調整を行います。 しかしながら、我々はランクの調整よりもフィルタリングの方に注力しています。ほとんどの場合、ウェブマスターにとっての最悪の出来事は、「望まない方のページがインデックスされる」ことになります。

ウェブマスターは、どうやって重複コンテンツ問題に対処したら良いのか?

  • 適切なブロックを行う:我々のアルゴリズムに任せて「最善の」ドキュメントを選択させるよりも、おそらく望ましいコンテンツを案内してくれる方が良いでしょう。手っ取り早いのは、望まない方のディレクトリをアクセス不可にしたり、robots.txtに正規表現を用いたりすることです。
  • 301を使う:サイトを再構築したのであれば、.htaccessなどに301リダイレクトを書き、そのことをGooglebotや他のスパイダーに教えて下さい。
  • 統一性を持つ:内部リンクを作る場合、例えば /page/ や /page や /page/index.htm などバラバラのURLで同じページにリンクしないようにしましょう。
  • TLDの使用:多言語対応する場合、その言語に特化したサイトを作ることが可能であればTLDを使って下さい。例えば www.example.com/de や de.example.com よりも、 www.example.de の方がドイツにフォーカスしたコンテンツだと理解しやすいです。
  • 配給に注意:もしコンテンツを他のサイトに配給しているならば、彼らがオリジナルの記事に対してコンテンツ毎にきちんとリンクを返しているか確認して下さい。そしてよしんばそうであっても、我々がブロックされていない複数のバージョンからあなたが最も適切だと思うバージョンを必ずしも表示するわけではないことに注意して下さい。
  • Webmaster toolsを使って望ましいドメインを指定:もし他のサイトがwwwと非wwwドメインにバラバラにリンクしている場合、どちらの方をインデックスして欲しいかをWebmaster toolsを使って我々に知らせることができます。
  • 決まり文句の繰り返しを少なくする:例えばページ最下部に長いcopyright文を載せるよりも、概要だけを記述して詳細な内容のページへリンクする方が良いです。
  • 半端なページを公開しない:エンドユーザは空のページなどを見たく無いので、出来るだけやめましょう。つまり例えば不動産サイトなどで、ユーザやロボットは「以下に、素晴らしい○○市の賃貸物件を紹介します」などと書いておきながら何のリストも無いようなページは見たくないということです。
  • 使っているCMSを理解する:特にblogや掲示板、関連コンテンツ表示システムなどにおいて、サイトがどのように表示されるのかを理解しておきましょう。それらはしばしば、同じページを複数のフォーマットで表示します。
  • 心配しすぎない:入り口が適切でなかったり、再発行されたページだったりすることに苛立ちすぎることはありません。とはいえ、非常に稀ですがこのようなサイトがあなたのサイトに対してGoogle的にネガティブな影響を与えている場合、DMCA要求フォームを使って盗人サイトを知らせて下さい。
要するにコンテンツ重複問題に対する理解と数分の注意深いメンテナンスで、我々がユーザに一意の適切なコンテンツを提供することを手伝ってくださいということです。

--

ちなみにフォーラムの例などが挙がっていますが、Yahoo!は前回12月のアルゴリズム変更で同じフォーラムの別バージョンページが山ほど1ページ目にインデックスされているなどとWebmaster Worldで叩かれていました。
こういった時に公式に方向性を示してくれるのは、いつもGoogle。Yahoo!にも少し見習って欲しいような。

2006年12月20日

サイトがGoogleにインデックスされているかを知る方法

通常、サイトがGoogleにインデックスされているかを知る方法は次の2つです。

  1. site:buzz.dendrocacalia.com クエリーを投げてみる
  2. buzz.dendrocacalia.comで普通に検索してみる

しかし最近、Googleにより第3の方法が提供されました。

ウェブマスターツール サイトのステータス

自分のサイトアドレスを入力するだけ。
しかし、sitemap.xmlやatom.xmlをWebmaster toolsできちんと食わせているにも関わらず
「お客様のサイトのページすべてを把握していません。 サイトマップを送信して、サイトに関する情報をお知らせください。」
と表示されてしまいます。
海外サイトも含め幾つかチェックしてみましたが、このメッセージの出ていないスナップショットは見当たらなかったので、正式リリースでないためか不具合なのではないかと。

いずれにしろ結果ページ下部にリンクもあるように、きちんとウェブマスターツールに登録するのが最善の道とは思いますが、簡易的に見たい場合のちょっとしたツールとして。

flogに注意

Spam blogはsplogと呼ばれていますが、今度の造語は「flog」。もちろん蛙じゃございません。

New York Times

flogは"fake blog"のこと。
一般消費者がblogで良い商品を紹介しているフリをして、その実は関係者だったり商売人だったり。
いわゆる「サクラ」を指すようです。
紹介記事の中でも2件ほど事例が紹介されていますが、ほじくりかえせば日本にも山ほどありそう。
特定の呼び名が付くのは、存在がクローズアップされて対策が練られる前兆と言います。
消費者として騙されないよう/やっている人は取り締まられないよう ご注意を。

2006年12月22日

サイト自体の大きさがページランクに影響するのか

GoogleのPR(ページランク)の評価方法についてCre8asite Forumsで熱心に議論されていますが、標題にあるように「サイトが持つページ数が、PRに影響をおよぼすのか」という興味深い考察が結論を見たようです。

Do Larger Web Sites Require More Links Than Smaller Sites To Rank Well?

今まで、PRはあくまで「ページの」ランクであり、ドメイン全体がどのような評価を受けているのか、そのページがどれだけ被リンクされているのかなどが影響するだけで、少なくともリンクポピュラリティはページレベルでありサイトレベルでは影響を受けないと思われてきました。
しかし今回の情報交換で、どうやら総ページ数も各ページのPRに影響するようだと結論付けられました。

例えばAというサイトが1,000の外部被リンクを持っており、総ページ数は25ページだけ、一方Bというサイトは、同様に1,000の外部被リンクを持っていますが、総ページ数は10,000を超える場合、サイトAの方がBに比べ良いPRを得る傾向が強いとのことです。

これはGoogleからの公式発表ではなく、あくまでEGOL氏が数百の事例から見出した「傾向」にすぎません。
多くのページを量産して物量でサイト全体の被リンクを増やす方法もあるでしょうし、1ページあたりの精度や価値を高めて集中的にリンクを得る方法もあるかと思います。
Googleは後者を、より価値あるものと見做しているということでしょうか。

2006年12月27日

Google Mapsのルート検索がテキストUI対応

Ajaxを世に広め、WebのGUIに革命をもたらせたGoogle Mapsが、逆にテキストベースUIのサービスを開始しました。

Speech-friendly textual directions from Google Maps

こちらのテキストUIページで、例えば
「from lax to Los Angeles, CA」
と入力すると、非常にレガシーなHTMLで道順指示が表示されます。
通常のMapsで同様の検索をした場合と、見比べてみて下さい。

これにより、例えば音声読み上げブラウザとの相性が良くなります。
いわゆるアクセシビリティのガイドラインにもあるような、テキストを降順に追っていくしかないクライアントへの対応が行われた形で、以前よりGoogleが進めているAccessible Web Searchと近いところにあるプロジェクトなのでしょう。

個人的には闇雲なGoogle信者にはなるまいと自戒しているつもりなのですが、やはりこういったところに心を割く企業姿勢と、それを先陣を切ってサービス化してしまうパワーには脱帽です。

2006年12月28日

Google 特許検索

Googleが特許情報を検索するサービスを12月14日から開始していました。

Google Patent Search

現在のところアメリカの特許に関する情報だけのようで、日本を含めた各国のデータに対応するかどうかの情報は見当たりませんでした。
しかし、これは便利。
700万を超える膨大な特許の単なる全文検索でもかなり有用ですが、更に特許コード、発明者や登録者の名前、登録日付の範囲指定なども可能で、申請前に重複が無いか調べたり、サービス設計時に抵触しないかどうかを調査する工数がかなり削減されるのではないでしょうか。
また、Google Aleartのような機能を盛り込む事で、企業が自社サービスに関連しそうな特許の登録をウオッチするのにも役立ちそうです。
トップページに図のサムネイルがピックアップされていますが、イメージ検索のように図だけの検索なども可能になると嬉しいですね。

日本の特許にも対応して欲しい。

2006年12月29日

iloggo - サイトロゴで見るSBS/SE

del.icio.usやdigg、furl、ma.gnoliaなどソーシャルブックマークも1つのジャンルとしてすっかり定着しました。
おかげでブラウザ上で「ctrl+d」を押す機会がすっかり無くなった昨今ですが、ちょっと変り種のSBSを見つけたのでご紹介。

iloggo

テキストや説明文、タグクラウドが並ぶのではなく、サイトの「ロゴ」が視覚的に閲覧できるのが最大の特徴。
実際に使ってみるとサイトを直感的に見つけやすいので、よく行くサイトはもちろんのこと、たまにしか行かないサイトでも色合いなどは意外と覚えていてアクセスしやすくなります。

続きを読む "iloggo - サイトロゴで見るSBS/SE" »

About 2006年12月

2006年12月にブログ「Buzzy Dizzy Biz」に投稿されたすべてのエントリーです。過去のものから新しいものへ順番に並んでいます。

前のアーカイブは2006年11月です。

次のアーカイブは2009年05月です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。