ブログやサイトを運営していると、面白ことが発生します。
実は、ひと月ほど前に、知らない人(会社?)にふぁろすが完全にコピーされていることを知りました。
Googleへのインデックス削除なども依頼したのですが受理されず
独自に対処したことを、今回は記事にまとめておきます。
(今回は同じ経緯の人も今後でてくるかもしれないので)
①今回の経緯
②想定される問題点と実際に起こった問題
③初動(Googleとのメールのやり取りを含む)
④結果として最終的にどう対処したのか
に分けて順に説明しますが、割と長めなので、
結果だけ知りたい人はこちらをクリックすれば、
最後の部分(「結果として最終的にどう対処したのか」)に飛びます。
丸コピーサイトが発覚した経緯
実は、ふぁろすでは
Googleのアドセンスという広告を利用しているのですが
自サイトなど、許可したサイト以外に自身のIDが付与された広告が表示されると、
「ここにあなたの収益になる広告が載ってるけど、あなたのサイト?」とGoogleが教えてくれます。
↓このような通知がされます↓
※別に収益になるならいいんじゃないの?と思う人もいるかもしれませんが、
広告掲載に関して違反をすると、ペナルティーを被ります。
勝手に自分のIDの付与した広告が、ルール違反しているサイトに載っていると
全く関係のない実際のID所有者(この場合「私」)がペナルティーを受けるということです。
なので、「それは私と全く関係のないサイトで、勝手に私のIDを使って広告を載せているサイトです。」
と、Googleに伝えておく必要があります。
(ちなみに、承認していないサイトの場合、いくら表示されても収益にはなりません。)
と話がそれましたが、
Googleから通知があったため、そのサイトを見ると、
ふぁろすが、そっくりそのままコピーされていたわけです。
一応、ウェブ魚拓でコピーされたページ(サイト)情報を保存しておきました。
コピーサイト(キャッシュ)
見た目には、どう見てもふぁろすなんですが、
完全コピーサイトです。
想定される問題点と実際に起こった問題
サイト(や記事など)のコンテンツをコピーされると、
個人的に嫌(気持ち悪い、腹が立つ)というのもありますが
サイトに来てくれる人が減るのに加え、他にもさまざまな問題が発生します。
・robots.txtで検索に表示されないようにしているページが表示される。
サイトを運営すると、このページは検索結果に出したくないと言うのものがあります。
(例えば、社員の氏名が載っているページやサイト内掲示板など。)
それは、「robots.txt」と言うものを作っておくことでブロックすることが出来るのですが
コピーサイトの場合、それがないのでブロックしていたページも全て検索結果に表示されます。
ふぁろすも、一部のページを検索に出ないようにしていたのですが、
そのすべてが、コピーサイトのコンテンツとして検索対象になっていました。
・重複した(同じ)コンテンツのために、本家サイトへの流入が減る(可能性大)
多くのウェブサイトやブログを運営している人が気にする(心配する)のがこれです。
記事がコピーされ、放置しておくと、
場合によっては
A)検索結果に、本家(オリジナル)よりも悪意のあるサイト(コピーしたサイト)が上位に表示される。
B)最悪の場合、本家がコピーサイトとGoogleに勘違いされ、本家のサイトがペナルティーを受ける。(ランキングダウンや、検索結果に表示されないなど)
などが起きます。
現在、日本ではYahoo!もGoogleの検索エンジンを使っているので、
サイト運営者にとってGoogleはある意味、神のような存在なわけです。
Aだと、もちろんサイトに来てくれる人が減りますし、
Bだと、サイトがなくなるのも同然です。(wikipedia:グーグル八分)
で、今回このAが見事に発生しました。
他にも調べると、
本家は出てこず、コピーサイトの記事だけが検索結果に出てくるキーワードなどもありました…
初動(Googleとのメールのやり取りを含む)
この時点で、やるべきことは2つ。
(1)コピーサイトの運営者の連絡先に「違法なので、やめてください。」と伝えてコンテンツ削除を依頼。
→サイト自体を削除してもらう。
(2)Googleに、コピーサイトを通報し、検索インデックスから削除を依頼。
→サイトは削除されないが、Google(=Yahooも)で検索しても出ないようにしてもらう。
まず、(1)から。
サイトは丸コピーされいるので、
サイトの運営者情報は、ふぁろすの運営者情報。(←当たり前)
サイトのどこを探しても、コピーサイトの運営者の連絡先は見つからない。(←これも当たり前)
コピーサイトの情報(IP情報など)調べると、アメリカのサーバーで、ドメインの契約は中国の方らしき名前が。
連絡出来ない…
(1)のコンテンツ削除依頼はあきらめて、(2)インデックス(検索結果)から削除してもらうに。
調べていると、いろいろ同じような人がいるんだなと思いながら
早速、Googleの「著作権侵害による削除」というページから通報出来ることを知りました。
そこで、このページ(フォーム)から申請(2014年3月16日)。
数日後、返事があり、
Google へご連絡いただきありがとうございました。
お客様の DMCA に基づく申し立て通知を受領しましたのでご連絡します。お客様が、対象コンテンツの正当な権限を有する著作権者であるのかどうかが明確ではありません。…省略…
お客様またはお客様のご依頼主が著作権者である場合は、どのような経緯でこの申し立てを行うに至ったかをより詳しく記載してください。
(2014年3月20日)
とのこと。
、
すぐに事情を詳しく説明したメールを
ふぁろすのGoogleのアドセンスおよびアナリティクスを登録しているGメールから送信(2014年3月20日)。
数日後…
申し訳ございませんが、お客様が対象コンテンツの正当な権限を有する著作権者であるのかどうかがまだ明確ではありません。
お客様またはお客様のご依頼主が著作権者である場合は、より詳しく記載してください。
(2014年3月25日)
Gメールも、アドセンスも、アナリティクスも、ふぁろすの登録も、ウェブマスターツールも
すべて同じアカウントなので、ふぁろすの運営者からメールしているというのはわかると思ったのですが
そのすべてを説明したにも関わらずアウト。
どうすれば、いいのかわからず
「他の方法で証明することが必要なのであれば、その方法(手段)をご教授いただければと思います。(サイトに何らかのタグを設置するなど。)」
と送信。
そして、最後に返ってきたメール
お客様のリクエストを受領し確認いたしましたが、コンテンツ削除に関する Google のポリシーに基づき検討させていただいた結果、現時点では特に具体的な対応はしないと決定するに至りました。本件につきましては対象のウェブサイトのオーナーと直接協議されることをおすすめいたします。
…省略…
申し訳ございませんが、本件について現時点ではこれ以上お力になることはできません。
(2014年4月1日)
ちーん…
完全にコピーされてるのに…
要するに、
「あとは当事者同士で話し合ってね。」
ということでした。
と、こうしている間にも
コピーサイトのコンテンツのGoogleのインデックス数は
報告当初の1000件ちょいから、3000件を突破。
本当、エイプリフールのネタであって欲しかった。
結果として最終的にどう対処したのか
コピーサイトの運営者に連絡がとれず、
Googleからも「自分たちで話し合って」と見放され
自分たちでなんとかすることにしました。
考えた結果、思い付いたのが、
自サイトでは何の影響もないが、特定のサイトで開いたら(表示されたら)起動するスクリプトを埋め込む
というもの。
要するに、
自分にとっては毒にはならないが、
他人に対しては毒になるものを、体内に仕込むという発想。
■目標■
検索から、(間違って)コピーサイトに行っちゃった人を、ふぁろすに呼び戻す。
■手段■
あっちの(コピー)サイトを開いたら、自動でふぁろすにリダイレクト(転送/移動)させる。
最初は、WPのテーマ内に
phpでリダイレクトするコードを記入したのですが、失敗。
理由)テーマなどWordPress内のphpデータや、
MySQLデータベースにまでアクセスしてコピーしているサイトではなく
サーバーから帰ってきたデータを再生成して表示しているサイトのため
サーバ側で動作するプログラム(php)では効果なし。
なので、
クライアント側の言語でもある不慣れな(というかほとんど無知の)
javascriptを使うことに。
いろいろ調べながら&「ふぁろ裏」を実験台に試しながら
出来たのがこちら。
<script type="text/javascript"> var url = location.host; if (url == 'コピーサイトのドメイン'){ location.replace('リダイレクト先URL'); } </script>
たった数行。
このために…すごい時間が。
これを、ヘッダーに埋め込んでおけば
コピーサイト(のドメイン以下のすべてのページ)で表示されたら、
設定したリダイレクト先のURLに勝手に飛びます。
↓実際の記入画像↓
現在、検索結果に表示されるコピーサイトの3090件ページ
そのどれにアクセスしても、今はふぁろすにリダイレクトされています。
ちなみに、これは
“特定のサイトで表示されたら”リダイレクトさせる
という形式ですが
あまりにも多くのサイトにコピーされているなら
“自サイトじゃないなら”リダイレクトさせる
というのもありだと思います。
正直に言えば、
コピーサイトの運営者が、このことに気付いて
リダイレクトされるjavascript部分を除去して表示するようにすれば同じですし
そしたら、また新たに違う方法で追加してと、イタチごっこになりそうな気もしますが
今回、javascriptに触れる機会が出来てよかったです。
壁にぶち当たると、それを乗り越えた時
人は成長するってことですね。