メイン

ニュース アーカイブ

2006年11月19日

Google Newsがヨーロッパで紛争

Webマスターの誰もがGoogleに取り上げてもらおうと躍起になっているかのように見える昨今ですが、世の中にはそうでもない人も居るようで。

Google's Belgium Fight: Show Me The Money, Not The Opt-Out, Say Publishers

かいつまんで読むと、ベルギーの新聞や雑誌の出版社グループがGoogleを訴えたわけですね。
Google News自分たちのコンテンツをクロールしているのは知的所有権の侵害だから、即刻インデックスを削除するか罰金を払えと。
もちろんGoogleは索引削除を行ったわけですが。

なぜ、彼らは「訴訟」したのか

ここでちょっと疑問なのは、彼らがクロールを止めさせたいのであれば単純にrobots.txtなりに「拒否」と書けば良いだけなのに、なぜ大仰に訴訟まで起こして事を荒立てているんだろうということ。 確かに、Google Newsはトップページからニュースのヘッドラインと写真が並び、それ自体があたかも新聞の一面のような性格を持っており、いわゆる検索エンジンとはやや趣を異にするサイトです。 足を使ってニュースを集め、写真を揃え、報道の正確さと文章の洗練に心血を注ぐ現場の人間からすれば、確かにその上澄みをすくって自販機のように陳列されるのは面白くないのかもしれません。 しかし、それを拒否するためにお金と時間をかけ、企業イメージを落とすような乱暴な手段に出る行為に疑問を抱くわけです。もっと簡単で確実な方法が用意されているのに。

私は残念ながら訪れたことは無いのですが、ベルギーは英語、仏語、独語、蘭語がほぼ全て通じる国で、地理的にもヨーロッパの中心に位置することからEU統合により周辺諸国より多くの企業や人材が集まり、ITリテラシーも非常に高い国だと聞いています。
Googleとの付き合い方に単に無知であったり、これで金をせびれるというような陋劣な考えで動いたというような出来事とは考えにくいのですが。(今回のニュースヘッドラインは、明らかに訴えた側の悪辣さを揶揄する論調ですが)

それが成り立つ仕組みを壊しかねないモデル

もしかすると、彼らはGoogleやYahoo!との棲み分けを、元のように「サイト検索」と「各ポータルサイト」のような形に戻すべく、その意思を表明しているのかもしれません。 このままいけば、もしかすると人は、新聞は購読せず新聞社のスタイルの違いも気にせず、ニュースはキーボードを叩けば与えられるものと自然に思うようになるでしょう。いや、すでになりつつあるのかもしれません。 Googleの究極の理念が「世界中の全ての情報を検索可能に」である以上、彼らがそれを目指すのは当然ですし、素晴らしい理念だとも思います。 ですが、それによって報道をして収入を得るシステムそのものの存在が危うくなることを、彼らは危惧しているのではないでしょうか。

Googleのビジネスモデルは、基本的にほぼ広告収入です。
それは現在の報道機関も同様です。
広告主は、多くの消費者の眼に止まる場所に、彼らの広告を出したいと願っています。
もし、消費者の多くが新聞を購読せず雑誌を買わず、Web上から無料で興味のある記事だけを検索できるようになれば、広告主達は報道機関ではなくGoogleへの広告を増やした方が効率が良いと思うでしょう。
では、そのコンテンツを作った者への対価は誰が払うのでしょうか?

広告主に依存されない報道

私は、現在の報道機関を過度に保護すべきだと主張しているわけではありません。 テレビや新聞を含めた報道機関の広告主を最上級顧客とした現在のあり方は、例えば大手消費者金融の悪辣さを、事件化されない限り全くといっていいほど伝えようとしないような点からも明らかに問題が山積しています。

思うに、消費者がGoogleやYahoo!のニュースを好むのは、単にそれが無料だからということも大きいでしょうが、それゆえにそこに貸借関係が発生せず無心で与えられた情報を取捨選択できるからではないでしょうか。
「コンテンツ制作者」が消費者に伝えたいことだけを正しく魅力的に作れることだけを目指し、「コンテンツ提供者」が消費者ともスポンサーとも圧力関係の無い状態でコンテンツを検索させる。「スポンサー」は「コンテンツ制作者」や「コンテンツ提供者」との政治的駆け引きではなく、いかに消費者に受け入れられる広告を作るかに集中する。
そんなあり方が、たとえばGoogleが少しだけ、広告収入をコンテンツ制作者に還元するだけで拓けるような気がするのですが、夢想癖が過ぎるでしょうか。

2006年11月20日

Googleの検索結果にGoogle Mapsへのリンク

Googleの検索結果の一部に、Google Mapsへのリンクが表示されはじめているようです。

Google SERP Embeded Map Link

ABテストのようで同URLを叩いても再現できませんが、Threadwatchは確かに確認したと伝えています。

スナップショットより抜粋

これは例えば、店舗を検索する際に従来であれば

  1. 店舗を名称や商品などで検索

  2. 検索結果から住所や地図へのリンクを探す

  3. 地図を確認

という手順を踏んでいたものが、検索→地図(→必要なら、地図上から検索結果ページへリンク)ということも可能になるんでしょうか。
Web2.0ブームの火付けになったともいえるGoogle Maps。
情報から地形的制約を取り払ったのがWebの黎明期なら、バーチャルな空間に再構築された世界に再び地理的概念をプロットしなおしているのが現在のステージか。

日本ではかのマピオン特許のおかげで、こういった
拡がりが阻害される可能性も多分にあるのですが...(この話はまたいずれ)

2006年11月22日

Google Page Creatorが久しぶりに機能追加

今年はじめにリリースされ、「Google Base + Google Ajax Codeで凄いページが誰でもカンタンに作れちゃうツールなんじゃ?!」と一部で期待されたりもしたものの、リリースされてみたら泰山鳴動してネズミ一匹な感じのGoogle Page Creator。
忘れかけていたころに、久しぶりの機能追加です。

Simplicity and power

失望感あらわな前ふりを書いてしまいましたが、ここで彼らが強調するように「目指したものは単純で簡単なサイト作成」ということであれば、今回の機能追加の方向性もなるほどと思わせます。


  1. イメージエディタ機能

  2. 複数ページ作成&Gmailアカウント名での公開用URL

  3. 携帯用ページ自動生成


とはいえ、(ほぼ使ったことはないけど)ホームページビルダーの方がまだしも使い易い程度の出来。
自由度が低い分、テンプレートの適用によって情報をメタ化し、携帯用サイトなどに展開しやすくなっているのが単なるオーサリングツールとの違いでしょうか。
Google Page Creatorのスナップショット

ちなみに、私の環境の問題かもしれませんがFirefox2.0では動作しませんでした。
(テキストが編集できず。IEでは動作)
まだまだ、これからのサービスですね。

2006年11月23日

MSNがリンク交換を行っているサイトにペナルティ

日本でも起きる/既に起きているんでしょうか。

Microsoft Banning Sites from Live.com For Link Exchanges

海外サイトの管理者の元にMSNから、次のようなメールが届いていることが幾つかのフォーラムで話題になっているようです。

Your site is acquiring links through posting to or exchanging links with sites unrelated to your site content. Techniques which attempt to acquire unrelated spam links in order to increase ranking are considered spam and your site has been excluded from our index as results. Please contact us once you've removed these links and we will reevaluate.

Live Search

要は「Posting(投稿)やLink Exchange(リンク交換)によって、あなたのサイトは内容に無関係なサイトからリンクされているんで、スパムと見なしてインデックスを削除します。これらのリンクを取り除いたらまた連絡して下さいな。そしたら再評価するから。」ってことですね。
更にSEARCH ENGINE ROUNDTABLEでは「100%の確信は無いけれど」としながらも、Googleもコンテンツ内容に無関係なリンクを除外しないまでもノーカウントにしていると伝えています。

私は安直な「SEOコンサル」による「被リンク売買」が大嫌いなので、このテのスパム対策が向上してくれるのは嬉しい限り。
Googleが、たぶんAdWordsのblogで語っていた(リンク発見できず)、「広告や検索結果をクリックしたユーザに良い体験をさせてくれるサイトこそが自分たちにとって優良な顧客であり」というGoogle Slapにおける概念の説明は、綺麗ごとながらも本質的な真実をついているかと。

2006年11月25日

Blog SearchがGoogleの検索結果に表示

Googleは相変わらず、こっそりと色々試しているようです。

Google Integrating Blog Posts Into Search Results

検索結果一覧にBlog Searchが表示されている様子:
Blog SearchがGoogle検索結果一覧に表示されている

Blogと通常のオーガニックサーチを分けるということは、どういう意味があるのでしょうか。
ジェネレータがblogであれ何であれ、出力されるページはhtmlになっているわけで。
xml feedを検索対象にしているのでしょうが、blogだけを切り分けて表示するというのは、blogに対して何らかのランキング操作が行われる前兆のような気もします。
これが、くだらないスパム・ブログのリンク売買を駆逐するための一歩だったら嬉しいのですが。

2006年11月29日

Google Audio Ads いよいよ開始(?)

Googleが例のdMarcを買収して始める新しい広告事業「Google Audio Ads」が、いよいよ始まりそうな気配です。
というのも、巷でこんなURLが報告されているから。

Google Audio Adsのホームページと思われるドメイン
http://audioads.google.com/

Google Audio AdsのSign-Upページ
https://www.google.com/accounts/NewAccount?service=audioads

とはいえ、なんだかエラーが出ていてうまく完了できません。
ダメ元でSign-Upしてみると、Accountページに「Audio Ads」のリンクが出てきたりはするのですが。

いずれにしろ、近いうちにオープンするのは確かな様子。
今後もGoogleは紙媒体など広告事業の範囲を広げていくと思います。
ネットとリアルの世界が有機的に繋がりそうで、楽しみなような(一企業がここまで握っていることが)恐ろしいような。

2006年11月30日

Yahoo! Answersが元Google Answersに招待状

昨日、閉鎖が発表されたGoogle Answersですが、これに関しては「勝ち組」と言えるYahoo! AnswersがGoogleのアクティブな回答者を取り込もうとしているようです。

Got Answers and Nowhere to Share Them?

Yahoo! Group内にexGARというグループ(ex Google Answers Researchersの略?)を立ち上げて、引き続き活発な情報交換をしてもらえるよう促しています。

なかなか珍しい図式で、Yahoo!の鷹揚な論調がなかなか微笑ましくもありますが。

2006年12月07日

Splogosphere - Spam Blog群の近況 -

Splog(=Spam Blog)の撲滅に関する近況が、"Destroy all Malware"より更新されました。
State of the Splogosphere, Part IV

レポートではBlogspot、Technorati 、Google blog searchなどの取り組みがSplog減らしに効果を発揮しているとし、各Blog検索エンジンの取り組みを称えています。
一方で「現時点で対策の無い」Spam手法としてcomment spamが挙げられていました。
これは主にAdSenseなどのキーワードマッチ系の広告を出しているBlogを狙い、自らが宣伝したい広告が表示されやすくなるようなコメントを連続投稿するもの。
この対策としてコメントを即時反映させずに一度承認を求めるBlogが増えると、Blog文化そのものの広まりに障害となるのではと危惧されます。

いずれにしろSplogの対策には、近年どこの検索エンジンも熱心です。
Blogマーケティングなども良いですが、あまり悪質な手法を用いる業者に依頼すると、ある日突然無効...どころか重いペナルティを課せられる可能性すらあるので、くれぐれもご注意を。

2006年12月10日

Search Engine Strategies Chicago '06 - コンテンツ複写と多重サイトについて -

12月4日~7日まで、シカゴで検索エンジン戦略に関するカンファレンスが開かれました。
全75セッションリスト
これについてSearch Engine Roundtableが、非常に有益なレポートをあげてくれています。

Search Engine Strategies Chicago '06 SER Coverage Recap

中でも個人的に興味のあるセッションを幾つか、いつも通りいい加減にですが書き留めておこうと思います。
まずは5日に開かれたDuplicate Content & Multiple Site Issues。ちょうど仕事上でも、ASPとして他社提供しているコンテンツが複写と見なされる可能性もあれば、サイトが完全にパクられている例もあり。まさに内憂外患の悩みどころでした。
以下、ここでの目的はセッションのレポートではなくナレッジ共有なので、要点の羅列だけで。

コンテンツ複写と多重サイトの問題について

Becom.comのJon Glick氏:
コンテンツ複写とは、複数の異なったURLで同じ内容のホームページが存在すること。
検索エンジンはコンテンツ複写を好みません。
動的URLはロボットを混乱させやすいので気をつけましょう。
Googleなどの検索エンジンは、あなたにとって最良のドメインだけを選ぶでしょう。
トラッキングのためのランディングページを検索エンジンに見せないよう、robots.txtなどを用いましょう。
あなたの持つ全てのドメインから1つのドメインに、301リダイレクトを使って集約しましょう。
302リダイレクトは一時的な移動を意味するので、イベントスケジュールのようにすぐに変わってしまうものにだけ使うようにしましょう。
ペナルティを受けた際には、Googleに直接コンタクトできます。
Yahoo!も同様のフォームを持っていますが、実際のところ彼らは除外した時にそれを通知してくれます。

GrantasticDesignsのShari Thurow女史:
例えば65%の文字列が同じ...というようなパーセンテージで計るものがコンテンツ複写ではない。その内容の類似性が問題。
検索エンジンは、同じ情報の繰り返しが検索性を落としユーザを落胆させることから、これを非常に嫌います。
※以下、彼女が説明してくれたGoogleをはじめとする検索エンジンのコンテンツ複写を防ぐクラスタリング手法

  • ナビゲーションやフッタなどの定型テンプレートを落とし、コンテンツだけを抽出する
  • 内部、外部の各リンクを抽出
  • 内容が更新されているかどうかをチェック(週次で見て、世の中の65%のサイトが変化していない。平均して0.8%のコンテンツが、週毎に完全に変わっている)
  • ホスト名解決(nao58注:複数のドメインが同じ或いは近いIPを指していないかの確認を指す?)
  • ページが持つ特徴を単語のパターンなどに分解して比較する。各単語の出現順序は関係ない

複写ページをクローラーに見られないよう、robots.txtなどを使いましょう。
必ずしもではないですが、コンテンツ複写はスパムと判定される場合があります。
もし誰かがあなたのコンテンツを盗んでいるなら、法律家を雇って訴訟すべきです。
それを知るために、Copyscapeは良いツールです。archive.orgも、あなたの著作権を守るのに有益でしょう。デジタルミレニアム著作権法を用いてGoogleやYahoo!、AskやMSNに報告すべきです。

RedZoneGlobalのMikkel deMib Svendsen氏:

wwwを付けるべきかどうかは、かつては問題であったが現在は無関係。ただし外からのリンクがwwwの無いドメイン、wwwドメインにバラバラにリンクしているのは良くはないので、301リダイレクトを使いましょう。
セッションIDは、場合によっては悪夢となります。あるサイトはYahoo!上で同一のページが20万もの種類でインデックスされました。セッションはcookieに入れ、URLには出てこないようにしましょう。
多くのオープンソースのblogでは、permalink作成において古いURLと新しいURLが同じように動作してしまうことがあります。これは大きな問題になりますので、カスタマイズしましょう。ただし、私見ではGoogleはこの問題を非常にうまく扱ってくれていると思いますが。301リダイレクトを用いて古いURLをブロックしましょう。Wordpressは、この問題に対処するためのプラグインを持っています。
パラメータの並び順は一般的な問題です。301リダイレクトでデフォルトのURLに飛ばしましょう。
パンくずもまた、問題になりえます。多くの場合、パンくずはURLと同じ構造をとるでしょう。それは幾つかの複写ページを作ることになってしまいかねません。ひとつの製品がひとつのURLを持つようにすべきです。

2006年12月11日

Search Engine Strategies Chicago '06 - 成功するサイト構造 -

前回に引き続き、Search Engine Strategies Chicagoから、今回はSuccessful Site Architectureを。

>>>>>
検索エンジンに対して成功するサイト構造やページ要素、デザイン技術を学ぶことはオーガニック・リスティングに有益でしょう。ここではディレクトリ/ファイル構成、サーバサイド取り込み(SSIs)、404エラートラッピング、JavaScript、robots.txtの利用、フレーム、セキュアエリアの使い方などを紹介します。

WebMama.comのBarbara C. Coll女史:

多くのウェブデザインはSEOに心を砕いていません。
製品を売りたいのなら、高ランキングのキーワードを得なければなりません。
デザインサイクルの中で、SEOについて考えるようにして下さい。
SEOの経験を持つ、あるいはそのようなパートナーを持つ開発者やデザイナーを探しましょう。
キーポイントは次のようなものです。ディレクトリ構造、ファイルシステム、ドメイン、エラー制御、URLリダイレクト。CMS、トラッキング、アプリケーション開発。

どうやって主要メンバーにサイトを最適化に導く方法を得させるのか。
チームを教育し、納得させましょう。ランディングページの状態やコンバージョンをなどを見せましょう。
検索エンジンはあなたのコンテンツを欲しがっているのですから、それがそこにないのはあなたの失敗です。
何人の方がGoogle Sitemapを使っていますか?
検索エンジンが確実にあなたのサイトを巡れるようにしてください。
彼らの提供するツールを使って、どのページがインデックスされているのかを確かめましょう。
www.se-spider.com(nao58注:www.se.spider.comとなっているが、恐らくはここ)を用いてリンクを辿ることができるか調べましょう。
www.rexswain.com(nao58注:恐らく、特にこのツールを指す)をHTTP Viewerとして使います。
検索エンジンに、サイト内のどのページが有効なのかを伝えましょう。
検索エンジンは、あなたのサイトのことを決して忘れません。
Google Webmasterページで情報提供の方法を調べてください。そのためにあなたは、サイトの所有者であるか少なくともサイトにアクセスできなければなりません。
Google Sitemapsはサイトのヒストリーをトラッキングし、コンテンツや外部リンクのレポートを見せてくれます。(nao58注:?WebmasterToolkitの説明と入り混じっている可能性有り)
Yahoo Site Explorerは情報提供はしてくれませんが、ページの外部リンクを見ることができます。

Acxiom DigitalのDerrick Wheeler氏:

Step 1: 検索エンジンがどのようにあなたのサイトを見て、扱うのかに関する基本。
まずあなたのホームページを見つけなければなりません。そしてそれから、他の全てのページにリンクしていなければなりません。コンテンツを得て、それをインデックスに入れる必要があります。
このプロセス見てみましょう。

  1. 検索エンジンがサイトをクロールする
  2. サイト全体をインデックスする
  3. ユーザが対象となるクエリーを実行する
  4. 検索エンジンが適切なページを格付けする
  5. ユーザがランク付けされたリストをクリックする
  6. ユーザが行動を取る、あるいはサイトと作用し合う

あなたは今、どこに居ますか?あなたのドメインやサブドメインはどうでしょう?それらを特定して下さい。301、302ページをトラックしましょう。各検索エンジンにインデックスされているページの数を数えてください。インデックスされていないページを特定しましょう。サイトのランキングをトラックしましょう。
これは、あなたがキーワードに焦点を当てる必要があることを示してくれます。トラフィックを学びましょう。ページ間がどう繋がっているかは非常に重大です。検索エンジンにテキストリンクを追わせることは簡単です。ページ毎に適したキーワードを持ったファイル名をURLに付けましょう。ナビゲーション用のJavaScriptはダメです。例えば"mouseover"のようなチンプンカンプンなパスがURLに出てこないようにしましょう。
検索エンジンがリンクを見つけられるよう、sitemapを用意しましょう。
ポップアップリンクは、やはり追跡が難しいです。
もし画像にaltが付いていなければ、検索エンジンは何の画像であるのかわかりません。
CSSをテキストリンクに用いて、画像であるかのように見せかけましょう。検索エンジンはCSSを扱えます。
検索エンジンはフォームを埋めることはできません。サイトマップなどでナビゲーションの代替手段を用意しなければなりません。

フッタのリンクは2行のテキストリンクが良いでしょう。
下の行には、フォローする必要の無いプライバシーやコピーライト、利用条件などを置いておきます。
上の行には、本当にエンジンに気づいて欲しいリンクを置きましょう。URLは短く。パラメータの数、ディレクトリの階層も減らし、トータルの文字列長を短くしましょう。
HTTPステータスコードやサーバのレスポンスコードは検索エンジンの手助けをします。例えば200はOK、301は恒久的な移動、302は一時的な移動のように。404は不正もしくはURLのタイプミスです。
検索エンジンは302を301のように扱います。お疑いなら301を使って下さい。
(nao58注:以下意味不明)
SE's will remove the old url and add the new url.as the value/occurrance of each goes up, chances of success go down.
長いURLにキーワードを詰め込みすぎないよう気をつけましょう。

noindex、nofollowのmetaタグやrobots.txtを用いて検索エンジンを禁止しましょう。サイト全体をブロックしてしまう事故を起こさないように。
検索エンジンはcookieを受け入れません。これはインデックス化を妨げます。
普遍的なパンくずを用いましょう。もしそれらが動的に作られているなら、検索エンジンは直接のパスを持たないことになります。
関連商品表示はユーザにとっても検索エンジンにとってもパスを複雑にしてしまいました。
※ここで良い具体例を見せてくれたようですが、説明は難しいとのこと。
robots.txtを使ってスパイダーがとても長いURLにひっかかるのを防ぎましょう。
検索エンジンにとってコンテンツ複写に見えるようなIDをトラッキングしましょう。
HTTPSに対しては、相対ではなく絶対パスで記述しましょう。
短くて簡単に覚えられる名前をドメインにつけましょう。
ダッシュを使ってはいけません。
ページのコンテンツは綺麗なコードでなくてはなりません。
※このプレゼン資料がここからダウンロードできます。

SiteLogicMarketingのMatthew Bailey氏

検索エンジンについて異なった見方をしみましょう。盲目の人や障害のあるユーザと同じ体験を検索エンジンはしていると言えます。あなたがアクセシビリティに対処していれば、それは検索エンジンにもよく対応していることになるでしょう。
(nao58注:以下、おそらくはformやanchorのtarget attributeについて言及していると思われるが定かで無し。それっぽく訳しておきますが、意味の通らない部分があります)
targetは問題になります。ウェブが実際のお店の延長線にある以上、例えば盲目の人もウェブ上のお店にアクセスしたいと感じます。彼らはalt属性や代替手段のきちんと用意されたイメージマップなどを求めるでしょう。そして、targetはそれらを拒否することになってしまいます。target formを使用できる唯一の方法は、あなたのマウスのボタンを押すことです。それが見えないのであれば、使うことはできません。
時々、サイトに入っていく際に言語を選択させるような場合があるでしょう。検索エンジンは言語を選択することができません。
FLASHページは何の情報も検索エンジンに与えません。

画像ベースのウェブがあったとすれば、その画像を取り除いてしまった場合に何も残りません。
全ての販売情報、アクションの呼び出し、無料出荷などが画像としてあったとしたら、画像が取り除かれた際にどうやって何が売られているのか知れば良いのでしょう?検索エンジンも同様です。
alt属性にキーワードを詰め込まないで下さい。altは画像が読めない場合の説明書きです。

GoogleとW3Cのガイドラインをよく読みましょう。
もしアクセシビリティのチェックリストを読み飛ばしているとすれば、それは検索エンジン対策のチェックリストを飛ばしているのと同じです。それらは殆ど同じものですから。
動的に生成された長すぎるURLでは、ごちゃごちゃしすぎて目的の商品を見つけることができません。
Faviconはブランディングの非常に良い方法です。それは単なるアイコンですが、無料の広告です。
ぐちゃぐちゃになったURLを書き直しましょう。古いリンクや301、302リンクを探して検索エンジンに最適化された新しいURLへの直接リンクに張り替えましょう。
最もエントリのあるページをURL毎に確かめましょう。それらはランキングの高いページでしょう。
MSNは彼らの検索エンジンにとって良いリダイレクトの制御方法を持っています。

CSSと規格について。正当なコードはランクを高めてくれるでしょうか?いいえ、CSSの利用は付加価値であり本質的な違いではありません。CSSは余計なコードを落とし、本当に大切なコンテンツ部分に焦点を当てさせてくれます。余計なごみをページの外に押し出してくれるのです。これは検索エンジンにとって良いことです。
CSS vs Tables。検索エンジンはテーブルをスタックしようとします。サイトを例えば携帯で見てみてください。スタックしたサイトがどのように見えるのかということを。検索エンジンは上から下に行を降りて行きます。画面読取装置と同じことです。妥当性はスパイダーがコンテンツをインデックスできることを保証します。
<<<<<

なんだか無駄に長くて内容の無いものになってしまった気がして残念です。
基本的には3人ともに極めて基本的なSEO的サイト構造の基礎を語っています。
やはり速記のためか、文脈が混乱したり意味のわからない箇所が多いですが、そこにこそ知らない知識が隠されている気がして歯がゆいですね...やはり直に行かないと。

2006年12月18日

韓国最大の検索エンジン Naver が日本進出

http://www.post-gazette.com/pg/06351/745824-96.stm

日本国内でどの程度の競争力を持てるのか、かなり疑問ではありますが。
もしかすると、在日韓国人など日本にも数多く存在する韓国人コミュニティにおいては、待ち望まれた参入なのかもしれません。
「地域属性」はWebというヴァーチャルな世界においても重要なキーワードになっていますが、どうしても「市区郡」とか「駅」とかドメスティックな部分に目が行きがち。国内に潜在する外国の「地域属性」にスポットを当てる施策になり得るのか...注目です。
サービス開始は2007年末頃になるとのこと。

2006年12月20日

flogに注意

Spam blogはsplogと呼ばれていますが、今度の造語は「flog」。もちろん蛙じゃございません。

New York Times

flogは"fake blog"のこと。
一般消費者がblogで良い商品を紹介しているフリをして、その実は関係者だったり商売人だったり。
いわゆる「サクラ」を指すようです。
紹介記事の中でも2件ほど事例が紹介されていますが、ほじくりかえせば日本にも山ほどありそう。
特定の呼び名が付くのは、存在がクローズアップされて対策が練られる前兆と言います。
消費者として騙されないよう/やっている人は取り締まられないよう ご注意を。

2006年12月27日

Google Mapsのルート検索がテキストUI対応

Ajaxを世に広め、WebのGUIに革命をもたらせたGoogle Mapsが、逆にテキストベースUIのサービスを開始しました。

Speech-friendly textual directions from Google Maps

こちらのテキストUIページで、例えば
「from lax to Los Angeles, CA」
と入力すると、非常にレガシーなHTMLで道順指示が表示されます。
通常のMapsで同様の検索をした場合と、見比べてみて下さい。

これにより、例えば音声読み上げブラウザとの相性が良くなります。
いわゆるアクセシビリティのガイドラインにもあるような、テキストを降順に追っていくしかないクライアントへの対応が行われた形で、以前よりGoogleが進めているAccessible Web Searchと近いところにあるプロジェクトなのでしょう。

個人的には闇雲なGoogle信者にはなるまいと自戒しているつもりなのですが、やはりこういったところに心を割く企業姿勢と、それを先陣を切ってサービス化してしまうパワーには脱帽です。

2006年12月28日

Google 特許検索

Googleが特許情報を検索するサービスを12月14日から開始していました。

Google Patent Search

現在のところアメリカの特許に関する情報だけのようで、日本を含めた各国のデータに対応するかどうかの情報は見当たりませんでした。
しかし、これは便利。
700万を超える膨大な特許の単なる全文検索でもかなり有用ですが、更に特許コード、発明者や登録者の名前、登録日付の範囲指定なども可能で、申請前に重複が無いか調べたり、サービス設計時に抵触しないかどうかを調査する工数がかなり削減されるのではないでしょうか。
また、Google Aleartのような機能を盛り込む事で、企業が自社サービスに関連しそうな特許の登録をウオッチするのにも役立ちそうです。
トップページに図のサムネイルがピックアップされていますが、イメージ検索のように図だけの検索なども可能になると嬉しいですね。

日本の特許にも対応して欲しい。

2007年01月10日

世界で最も働きやすい企業は?

Fortuneによる、世界で最も働きやすい企業の今年のランキングが発表されました。


100 Best Companies to Work For

1位はGoogle。
最近は日本のマスコミに取り上げられることも多くなり、「職場にビリヤード台がある!」ということだけが独り歩きしている感もありますが...本当に、色々といいですよね。
同ページにGoogleの職環境に関するクイズがありましたので、興味があれば挑戦してみて下さい。
ちなみに自分は40/60点。マッサージは無料じゃないのか...
なお、Yahoo!は44位、Microsoftは50位でした。

2007年01月12日

Gatineau - MicrosoftがGoogle Analyticsの競合サービスを開発中

Microsoftが無料のサイトのアクセス解析ツールを開発中と噂がありましたが、Gatineauというコードネームとアルファログインページが発見されました。

Gatineau: Microsoft Live Analytics

とはいえ、Live IDでログインしても、なにやらurlのidを少しずつ変えながらリダイレクトをしまくるようなサルベージ式の怪しいリクエストを繰り返すだけでログインできません。
実際のサービスを見てみるには、もう少し時間が必要なようです。

ちなみにGatineauとはカナダの都市名で、昨年8月にMicrosoftに買収されたサイト解析企業DeepMetrixが本拠にしていた土地。
このプロジェクトのプランナーであるIan Thomas氏によると、ベータ版は招待ユーザのみを対象に来月からスタートし、実際のサービス開始は今年末くらいを予定しているとか。
この分野では安価なサービスとしてWeb-StatHitBoxOneStatなどが有名ですが、最近はGoogleがUrchinと共に全く無料のサービスを提供しユーザを急速に拡大中。
無償の有益なツールを提供することで、ブランディングイメージの向上やネットのトラフィックトレンド情報を獲得してマーケティングに活かすような方策を考えているのでしょうか。

実際自分もこのサイトでGoogle Analyticsを使っていますが、非常によくできたツールです。
Javascriptページタグ型なので制約も多く、ビジネスシーンで単体では要件を満たしきることは出来ませんが、個人サイトでの利用範囲であれば充分ですし、パケットスニファやアクセスログ解析型のサービスと組み合わせれば強力な戦力になります。
Gatineauが公開されれば当然比較されるでしょうが、ビーコン型は収集サーバがトラブルで動いていなかったり、scriptが何かの理由でエラーになると全く収集できなくなるので、競合というよりは併用して使うユーザが増えるのではないでしょうか。

2007年01月16日

GoogleがYahoo!のデザインをパクったら

隠しリンク騒動などでお馴染み、Yahoo!の検索エバンジェリストJeremy Zawodnyが自身のblogでGoogleがYahoo!のデザインをパクった!と訴えていた件は、あちこちで紹介されました。
これに対してGoogle Watchが1週間ほど前に、「じゃ、Googleが本格的にYahoo!のデザインを取り入れたらどうなるか」とスクリーンショットを作って公開しています。
少し古い記事ですが、ちょっと面白いのでご紹介。
でも、PersonalizedでGoogleをこんな風にして使っている人も結構居そう?

2007年01月17日

Search WikiaはGoogleを超えるサービスになり得るのか

以前の特集でも紹介したWikipediaの創業者による新検索エンジンWikiaについて、当のJimmy Wales氏がTVインタビューに応え、なかなか見えてこないその状況について伝えました。

Wikiaサービスの向かうところに関しては他の幾つかのインタビューで答えていることと殆ど変わらず、既存の主要な検索エンジンのような単純なクローリングと不透明なアルゴリズムによる順位付けではなく、エンドユーザによる評価や有志によるコミュニティで検索精度を上げていくという「Wiki Type」な基本方針がGoogleを超える検索性能を示すと強調しています。

2、3ヶ月後には何らかの形で実際に検索を行うことができるサービスが公開されるということですが、Wikipediaがそうであったようにスタートアップ時には期待されるような上質な品質を持つことはできないだろうとしました。
一見トーンダウンしているようにも聴こえますが、ソーシャル的にエスカレーションしていくサービスである性質を考えれば当然のことで、Wikipediaを引き合いに出したのも「同じWiki Typeスキーム」であることを考えれば無理の無い話です。
# もちろん、同じスキームが検索エンジンでも盛り上がり、同様の成功をおさめるかは別の話ですが。

Wikipediaは先週、Wikipedia内を高度に検索できる(ようになる)新たな検索サービスWikiseekをひっそりとベータリリースさせました。
数ヵ月後に公開されるWikiaの基本クエリー解析アルゴリズムはこれに近いものになるのではないかと目されていますが、果たしてどうなるでしょうか。

2007年01月18日

シニア向け検索サイト cRANKy

シニア向けのメディア企業Enosが、彼らがターゲットとする50歳以上のセカンドライフ世代に特化した検索サービスを開始しました。

cRANKy

同社が調査会社と連携して、シニア世代向けに行ったサーベイを元に検索結果を作成。
興味を惹き易い結果リストやシンプルなUIが特徴になっています。
検索結果をユーザが格付けでき、実際にEnosが用意した結果が現在のエンドユーザのニーズに則しているのかを常にチェックしていくようです。

実際にサイトを訪れてみると、確かに適度にシンプルな画面構成。
検索上位10ワードがありますが、上から順にセックス、家で出来る仕事、定年後の仕事...と、作為的とも思える見事にセグメント化されたキーワードが並んでいます。(1/18現在)

試しに「bonsai」で検索してみると、まず結果として何件ヒットしたのかが見当たりません。
(ざっと数百以上はヒットしているようですが)
そして、1ページに表示されているのは4件だけ。これも「シンプルさ」を追求した故なのでしょうか。
Google.comで検索した場合の最上位サイトはWikipediaでしたが、cRANKyで検索すると同サイトは3位で、実際のHowTo系のサイトや写真の並んだ盆栽ギャラリーが上位に来ていました。なるほど。

以前TOYOTAの話題でも触れましたが、「とにかくユーザを取り込んで、好きに棲み分けてもらう」式のリテラシーの高いユーザを対象にするのではなく、「先にユーザセグメントありきで最適なサービスを提供する」というスタイルは今後も拡がっていくような気がします。
例えば次は逆に、完全に子供(それこそ10歳以下とかの)向けの検索エンジン...とか誰でも夢想しますし、かなり特色の出る面白いサイトになりそうな。

2007年02月09日

PowersetはGoogleを超える代物なのか?

以前、自分も「Googleを超える可能性のある検索エンジンの大本命」と評しましたが、その後もなかなかサービスが見えてこないPowerset。
今月9日に、かのパロアルト研究所と自然言語技術についての独占ライセンス契約を行ったようです。

Powerset and PARC Sign Exclusive Deal to Commercialize Breakthrough Search Engine Technology in Consumer Search

このニュースに対してGoogle WatchでSteve氏が「もうウンザリ」と、プロパガンダばかりで一向にサービスの実像が見えてこないPowersetのやり方を批判しています。
Powerset Hype, Part Deux

果たしてその実像は「Next big thing」なのか「泰山鳴動して鼠一匹」なのか。
とぼけたPowersetのロゴマーク同様に、世界中が疑問符と共に期待をこめて待っています。

2007年02月16日

Google、自分のサンプルでライセンスオーバー

昨日、Google Maps APIでMaps上にメッセージを表示する例を紹介しました。
Google Maps APIのオフィシャルblogのものですが、2月16日 1:00am時点でサンプルページにアクセスしてみると、"The bandwidth limit for this site has been exceeded."というメッセージが表示されて閲覧できません。
Google bandwidth limit exceeded
これはどうやらAPIのGeocoding機能の1日あたりの使用回数制限(ライセンスあたり50,000回)を超えたためらしく、公式サイトが自社サービスのライセンスに抵触するという、ちょっと間抜けな事態に陥っています。

ま、こんなこともあるさという話で。

2007年02月22日

クリックポピュラリティという言葉を耳にする機会が何故か増えて徒然と想う

最近、また「クリックポピュラリティ」という言葉を耳にする機会が増えたなぁと思っていました。
「Googleが一時取り入れたが、既に無くなった」
「Yahoo!は実はまだ使っている」
というのが通説でしたが、なぜ突然...?と思ったら、cre8asist forumsで話題になっていたのですね。
(いや、実際の火元は別にあって、これはまた飛び火なのかもしれませんが)

クリックポピュラリティという考え方は、結局のところ「行列のできる店にはもっと行列ができる」式の論理で、個人的には本質的にはエンドユーザのためになっていないと考えています。
リンクポピュラリティをスパム的手法で買い集め、リンクベイティング的手法でクリックさせるサイトや「クリック代行業者ロボット」が串を変えつつクリックし続けるようなサイトが上位を占めるような検索結果は、繁華街のポン引きの波を掻き分けるような不快な場所にしかなりえないでしょう。

では、ChaChaWikiaのような人間力を介した検索結果がこれを解決するかといえば、それも疑問です。
先日ChaChaがPPC型の広告を始めるとPRが流れた際に書きそびれましたが、検索結果をリストアップするオペレータの「主観」と「最大公約数的公平性」という二律背反を抱えながら常に後者に軸足を置くスタンスを取る必要のある同社のビジネスモデルとしては、あまりに芸が無いというか自己否定に繋がりかねない危険な方法だと思っています。
(当然、彼らもそれを認識しつつ選択したのだと思いますが)

結局のところ、それがブラウザをクラッシュするような類の悪質なサイトでない限り、広告的な「釣り」を恐れずに信頼できるサイトを探して回るしか当面はなさそうです。
# 幸いにして回線の利用料は数年前に比べて格段に下がっていることですし。
そして世の企業やウェブマスターに、安易なスパム手法による集客に飛びつかないよう自制を求めましょう。
テクノロジーは...多くの人の無償の善意をシステムに昇華することはできても、その中に潜む欺瞞や姑息な欲望をより分け、駆逐するような力は究極的には持ちえません。
それが出来るのは、やはり人間の力でしかないでしょう。


# タイトルから離れていく&解決策の無い愚痴的投稿になってしまいました。。すみません。

2007年03月01日

Snap.comでSnap Preview Anywhereのアイディアコンテストを開催

既にSnap Preview Anywhereを導入しているWeb Masterには招待状が行っているのではないかと思いますが、Snap.comにて更にSnap Preview Anywhereを良くするためのアイディアコンテストが開催されています。

公式blogによる紹介
アイディアに投票

勝敗はユーザ投票で決まり、1位になれば現金で$2,500が与えられます。
また、アイディアに対するコメントも、良いもの2点について$500が贈られるようです。

ちなみに3/1 15:00時点での得票一位はこちら
...って、アイディアじゃないじゃん!(いや、アイディアか?
「インターナショナルなサービスの参加資格が米国居住者に限られるってのは許せん!」という意見なのですが、「いやいやオールカマーだって書いてあるじゃん」とコメント入れられたり紛糾。ある意味では流行りのベイティングとも言えるか。
もしかすると、景品法などの関係で本当に米国居住者に限るってことがあるのかもしれませんが...どうなんでしょ。

2007年03月09日

Googleはいつまで404ページをクロールし続けるのか

うっかりおかしなページへリンクを貼ってしまい、スパイダーがアクセスし続ける。あわててページを削除、或いはエラーを返すようにしたものの、相変わらずクロールされ続けてエラーログが溜まる一方...
そんな経験をしている方は、一体いつになったらロボットは「ここにはアクセスして欲しくない」ということを理解してくれるのだろう?と考えたりしないでしょうか。
WebmasterWorldでその議論がされていましたが、結論から言うと「ずっと来続ける」ということのようです。

How long does Google request 404 page?

逆にクローラーが「ここは404だ」と学習して来るのを止めてしまうと、そのページが復活しても「ここには無い」という情報が残ってしまうのが問題じゃないかという見解ですが...その時はまた、復活するであろう被リンクを辿って来てくれれば良い話な気もします。
スレッドでは既に2年も前に削除したページにアクセスし続けられている人の話もありますが...
どうしても止めたい場合は、robots.txtを使うのが正解のようです。

2007年04月11日

sitemap.xmlのfeedがrobots.txtでカンタンに

忙しくて久々の投稿...の割りにたいした話じゃないんですが。
プロトコルが統一されたsitemap.xmlのfeedがrobots.txtで出来るようになったというお話。

Webmasters Can Now Auto-Discover With Sitemaps

今まではGoogle Webmaster ToolsやYahoo! Site Explorer上でverifyされたサイトに対してfeedするしかなかったのですが、今後はrobots.txtに以下のように記述するだけでクローラーが拾ってくれるようです。
(sitemap.xmlとsitemap2.xmlという名前でルートにxmlを置いている場合の例)

user-agent: *
sitemap: sitemap.xml
sitemap: sitemap2.xml

ふむ。

2007年07月10日

Googleがセキュリティ企業Postiniを買収

既に今年4月にGMailにおける協業を発表していたPostiniですが、正式にGoogleに買収されるようです。
http://www.google.com/intl/en/press/pressrel/postini_20070709.html

GMailもそうですが、GoogleAppsなどのセキュリティが重要となるサービス展開もどんどん増えているGoogle。
そういえば、Google Calenderにおける脆弱性なども過去に問題になりました。
# 仕様的なあの脆弱性と、今回の買収劇における強化ポイントは大分違いますが。

Postiniも既にオンデマンドのメールアーカイバではリーディングカンパニーなわけで、MX Logicなどは戦々恐々でしょうか。
買収額は$625,000,000、今年中には正式なものになりそうとか。
IPOを目指していた矢先という噂もあるようですが、どちらが良かったんでしょうか。

blogへのspamコメント、売ります

なんともはや、露骨に情け無いサービスが誕生したもので。

Buy Blog Comments

spam業者がやっているアレですが、代行業が現れるとは。
「やっちゃった」って感ですが、上手く取り締まれないなら意外と軌道に...乗らないと思う/ことを祈りますが。

blogのコメントスパムといえば、アダルトサイトへの誘導なんかがメイン。
訪問者がリンクを踏まなければなんてことないものだったのですが、昨年くらいからは「コメント欄でターゲット商品に関連するキーワードを連呼し、AdSenseなどのコンテンツマッチでの表示頻度を高くする」なんていう手法も登場しました。
その創意工夫を別なことに活かせと。
ここで彼らが謳っているのは、単にバックリンクを貼りまくることでSEO効果を上げましょうって話のようですが。


あ、実はこれってゴキブリホイホイで、どこかのスパム対策チームが悪徳業者に罠張ってるとか。

2007年07月11日

Searchnomics 2007 Search Award発表

WebGuide Silicon Valleyが開催するSearchnomics 2007で、各種Search Awardが発表されました。

http://www.webguild.org/meetings/2007/searchnomics/

受賞サイトは以下の通り

Best Media Search Engine:
YouTube
Best Emerging Search Discovery Engine
StumbleUpon
Best Social Search Engine:
LinkedIn
Best Overall Search Engine:
Google
Best Content Search Engine:
Compete.com

特に愛用のStumbleUponが受賞したのが嬉しいところ。
おめでとうございました。

2007年07月19日

Gmail TシャツデザインコンテストでiPhoneをGET!

日本でiPhone使えないじゃん!ってツッコミは無しで。
GoogleがThreadless.comと組んで、Tシャツのデザインコンテストを開催しています。
Win this competition and the shirt off our backs. Literally.

テーマは「Connect!」
なんだか繋がってる感のあるデザイン(?)で審査員のハートを掴むと、8GBのiPhoneと現金$400$2,000(よく読んだら、現金は$2,000でした。$400は航空会社の金券。失礼しました)などがもらえるそうです。
締め切りは8月16日。
詳細はこちらで。

2007年07月27日

URL_Google_SEO___OK

先日行われたWordCamp2007で、かのGoogleのMattCutts氏が語ったところによれば、URLの「_(アンダースコア」が「-(ハイフン)」と同様に文字区切りとして認識されるようになったとのことです。

Underscores are now word separators, proclaims Google

例えば「tokyo-shops」というURLは「tokyo」「shops」という2つの単語として認識されますが、「tokyo_shops」であれば1語として見做されるのが従来でした。
これが同様の判断をされるようになったとのことです。

英語圏に比べればインパクトの強い話ではないですが、これで文字区切りのデフォルトが「_」なMTなんかも(このblogもそうですが)マイナス要素がひとつ減ったことに。
軽く覚えておくと良いかもしれません。

2007年10月25日

Googleが被リンクスパム締め出しに本腰

以前からMattCutts氏がblogで書くなど「噂」レベルでは実しやかに囁かれていたリンク売買などへのペナルティですが、いよいよ現実のものとなってきたようです。
米国時間で10/24の朝くらいから、あちこちで悲鳴が聴こえ始めました。

http://blog.searchenginewatch.com/blog/071024-170119
http://www.quickonlinetips.com/archives/2007/10/google-pagerank-drops-pr6-to-pr3/
http://www.seomoz.org/blog/toolbar-pagerank-losses-for-hundreds-of-websites

何が起きているのかは、普段あまりSEOの話題は扱わないMashableで比較的わかりやすくまとめられていました。

いつもの例では、日本にこのアルゴリズムが入ってくるのは数ヶ月先。
年明け~年度末くらいが危ないでしょうかね。
見る限り、被リンクスパムを受けているサイトが「ペナルティを受けた」というよりは、「ノーカウントとしてPRを補正された」というのが正しいようにも思えますので、慌ててSEOコンサル(とは名ばかりのスパム業者)と手を切る必要も無さそうですが。

「被リンクを買ったり、スパムサイトを作ったりするお金と暇があったら、それで世の中に有益なサイトを創って下さい。そして広告費はAdWordsだけに、もっともっと注ぎ込んで下さい。」

というのがGoogleの声でしょうか。
前半は全く同意で。

2007年10月26日

Google Sitemapが複数ドメインに跨ったサイトに対応

Googleが、複数のドメインを含むsitemap.xmlの受け入れを可能にしたとの発表がありました。

従来はセキュリティ上の問題から禁止とされていたことですが、例えば「サイトのトップは自分のドメインで、頻繁に更新するところはGoogle Page Creatorで」というような場合には別々のsitemap.xmlを作成しなければいけなくなっていました。

今後は、含まれる全てのドメインがGoogle Webmaster Toolsでサイトオーナーだと認識されているものに限り、混在していてもエラーとはしないとのことです。

複数のサイトを所有している場合、サイトマップをどのように管理すればよいですか。

尚、この対応を行っているのは現時点ではGoogleのみ。
なかなか対応してくれないlivesearchはともかく、Yahoo!がSiteExplorerで対応してくれない限りは、結局バラバラのsitemap.xmlを作っておくしかなさそうです。

しかし、こういった細かいところでジリジリと先を行かれると、否が応でも「誰が業界をリードしているのか」を印象付けてしまいますな。