Googleは検索ランキングの計算に、人工知能(RankBrain)を導入して、いよいよ完璧だと思っていた矢先に、キュレーションサイト問題が勃発。
人力ワードサラダ記事を見抜けない、検索エンジンアルゴリズムの欠陥が浮き彫りになってしまいました。
しかし、検索エンジンは実際の人々の検索行動を監視して、コンテンツに対する人々の満足度を測定してランキングしている面があります。人力ワードサラダ記事を信用して満足していたのは、我々なのです。Googleからしたら「何が悪いの?」という感じなのかもしれません。
2017年元旦記事「最後の使徒 検索エンジンの敵は「人間」だった」に引き続き、Google検索のランキング精度について考察しました。
売れた順に並べる
Googleは被リンクの数と質(ハイパーグラフ)をカウントすることで、検索精度を飛躍的に高めました。しかし、サテライトサイトの乱立やペイドリンク(リンクの売買)によって、リンクが必ずしも良いサイトを指し示すとは限らない状態となってしまいました。
検索精度を高めるために、もっと信用できる指標はないのか?
例えば書籍専門の検索サイトがあったとします。当然、書籍タイトルにキーワードが入っているとポイントが高いでしょう。説明文や所属カテゴリなども検索対象になるはずです。検索対象の本をすべてリストアップします。
それらをどう順位付けすれば、人々にとって有益なランキングになるでしょうか?
そう、「売れている順」が最も信用できます。人が選んで、実際に買っているという事実は大きいです。人々は著者の経歴や、口コミなどを総合して買う本を決めています。新しい本がランキング上位に上がりやすいですが、古くからの名作もしっかりランクインします。Amazonも売上順に並べていると言われています。
売れる記事を見抜く
Googleの検索エンジンも、同じ原理を利用すれば、検索順位の精度を上げることができます。「売れる記事」を探すのです。Amazonは売上数順に並べましたが、一般のWebの場合は、「読者の満足度」を測定して、その順番に並べれば良いのです。
では、読者の満足度とはどうやって測定すればよいのか? 被リンクは確かに「読者の満足度」反映している部分はありますが、一般の読者の行動からは離れている感じがしますし、スパムされやすいデメリットもあります。
満足度として「全部読まれた」「長い時間滞在した」といった、実際の人間の行動を監視したほうが確実です。Google検索ランキングから、Webページへ遷移して、すぐにGoogle検索に戻ってきてしまえば「役に立たないページ」と判断できます。
また、対象のページはインデックスしてあるので、コンテンツ量は既知です。コンテンツの量の割に速く戻ってきてしまえば、そのページも「役に立たない」と判断できます。
ランキングが低くても良くクリックされて、読まれている記事はポイントが高いでしょう。タイトルやスニペットが魅力的であれば、内容も充実している可能性が高いです。
もちろん、「いいね、シェア」や「被リンク」もカウントしてポイントに加えます。Googleの検索ランキングを決定するシグナルは、200個ぐらいあるそうです。
そして、人々がGoogleを利用する時間の総計が最大化するように、各々の重みを調整します。
人工知能(RankBrain)の役割
人工知能(RankBrain)がどのように使われているかというと、未知の言葉の意味を推測するために利用されていると言われています。新しい言葉は毎日生み出されているそうです。初めて入力された言葉でも、人々の行動を監視することで、似た言葉を探すのです。
もしかすると、前述の各シグナルの重み付けのチューニングも人工知能が監視しているのかもしれません。多くのパラメーターを人間で調整するのは職人技で、大変です。
改善すべきは人々の情報リテラシー
昨年末のキュレーションサイト問題では、人力ワードサラダ記事が上位を独占してしまい、絶対的だと思われていたGoogleの検索精度に疑問符がつきました。しかし、Googleから公式見解のようなものは出ていません。
Googleとしては、検索ランキングは人々の満足度を指標として集計したものであり、人力ワードサラダ記事であろうとも、人々がそれらの記事を信用して読み、満足している以上、問題はないという立場なのかもしれません。
本に例えれば、素人が書いたガン治療に関する書籍が内容はともかく売れている状況のようなものです。本来なら、がん治療専門の医師が書いた書籍を読むべきですが、忙しい医者は本を書いている暇がありません。
検索エンジンのランキング計算に、利用者の行動を監視したデータが利用されてることは、間違いないでしょう。検索エンジンはコンテンツの質に対して絶対的な理論を持っていて、それを元に順位を決めているのではなく、単に人々のニーズにランキングを合わせているだけとも言えます。
キュレーションサイトの人力ワードサラダ記事の内容を元に、医者に食って掛かった患者さんは多く、実際に医療現場で問題になったそうです。
改良すべきは検索エンジンのアルゴリズムではなく、人力ワードサラダ記事を見抜けず信用してしまう我々の情報リテラシーの方です。
今回の一件で、検索エンジンの信頼性について、多くの人が考えを改めたはずです。検索エンジンはあくまでツールであり、必ずしも正確な情報をいつも提供するものではない。情報を集めて最終的には自分で判断するしかないと。
検索エンジンは、ちょっとダサくなってしまった
コンテンツを提供する側も注意しなければなりません。検索エンジンから集客を意識して記事を書くことは大切です。しかし、人力ワードサラダ記事のように、単に長い記事を書くことで検索エンジンの不備を突くような方法をとっているのであれば、その方法は長くは続かないでしょう。
情報リテラシーが向上した人々は、ただ水増しした長い記事を敬遠するようになります。最近はスマホが主流で、長い記事は読みにくいです。一記事に多くの内容を詰め込んで、ビッグキーワードを狙いにいく最近流行りの方法よりも、専門サイトを作って、小項目ごとにページを切ったほうが読みやすいケースもあります。
検索エンジンを意識しすぎたコンテンツは、頭が悪そうに見え始めています(少なくとも私には)。検索エンジンで集客しても、書き手やブログ、ウェブサイトに信用が蓄積されません。
人々に直接働きかける、リアルにより近づいたマーケティングが、大切になってくるでしょう。小手先ではなく、真摯な取り組みこそが力となります。
新たなネットマーケティング元年
最新の情報を探す場合はTwitter、飲食店の情報を得るためにInstagramを利用する人が増えています。Facebookで知人からの口コミは絶大な信用があります。よりダイレクトな情報を人々が信用するようになり、ネット上における検索エンジンのシェアは縮小しています。検索エンジンに傾倒するマーケティングには黄色信号が灯っています。
ネットマーケティングは、ようやくスパム競争から抜け出して、ヒトに対して直接働きかけるものになりました。2017年は新たなネットマーケティングの幕開けとなるでしょう。
コメント