Previous Topへ Next

迷惑メール、有害サイト封じ込めの動きがいろいろあるのは良いことなんだけど・・・

「有害サイト」の構造


迷惑メール、有害サイト封じ込めの動きがいろいろあるのは良いことなんだけど・・・追記あり

今日の朝刊で「迷惑メール配信業者を規制する法整備」が検討されるというニュースが掲載されていた。
個人的にはスパムメール業者は見つけ次第公開銃殺してほしいくらいに思っているが、この規制、実効的にはどうだろうか?
これまではこういう法規制が無かったから、
「スパムでも金になりゃ良いんだ、スパムは犯罪じゃないし」
とか公然と書くような高校生が現れたりするんだと思う。
法律で具体的に規制されなければ人に迷惑かけてもかまわないという人達は、法律で具体的に規制して「犯罪だ」ということを分からせるしかないのかもしれない。

ただこういう話題になると例の「違法ダウンロードの違法化」の話でもそうだけど
「海外サーバに拠点を置いている業者の規制はどうするのか?」
ということがネックになると思う。
それを考えると法整備をしても実効性にははなはだ疑問が残る。
ただしないよりは「そういう迷惑行為は犯罪なのだよ」と示せるだけマシだと思う。
少なくとも素っ頓狂なことを書く高校生に物を分からせる論拠程度には役に立つ。

サイトのリンク構造から有害コンテンツを判定、東大とトレンドマイクロ〜InternetWatch
という記事は最近知った面白い話。
サイトを全てチェックして内容がよろしくないサイトをブラックリスト方式ではねるとか、あるいは内容がよろしいサイトをホワイトリスト方式でそこだけパスさせるとかいろいろ有害サイトの特定および未知サイトのカテゴライズ精度の向上の方法があるが、どちらもいちいち人が見てその内容を判断しないといけないという意味では、非効率的でアナログ的だ。

サイトの構造そのもので有害サイトを判定する方法はないかという研究で、特に

「相互リンクの密度はアダルトカテゴリが最も強いという。また、ホスト間のリンク数が150以上の強い結び付きを持つところも多数存在し、ここでもアダルトカテゴリに顕著な傾向が見られた。」

「アダルトカテゴリ内では、930ドメインがすべて相互リンクする集合(巨大クリーク)が確認された。 」


という記述が興味深い。
確かにアダルト系、出会い系、そういうのはこういう構造を持っていると思う。
だからあまりたくさんサイトを立ち上げて、相互リンクを何重にも貼っているとこれからは有害サイトとして自動判定されるかもしれない。
もっともそういうサイト運営のやり方をしているところは大抵はプロのアフィリエイターで、「商材販売」を目的にしているところが多いから、有害判定は妥当かもしれないが。

ただ、

「安全なカテゴリのページからであっても、リンクを辿ることによって、有害サイトに到達する可能性が高まることが判明した。例えば、アダルトカテゴリに到達する率は、安全なカテゴリ(アート・エンターテイメント、スポーツ、旅行など)から出発し、1ジャンプ先では平均0.27%だが、2〜3ジャンプ先では平均2.69%まで高まった。特に、ユーザーがリンクを貼るCGMコンテンツは他のカテゴリに結び付く可能性が高くなり、結果的に有害サイトへ行き着きやすい傾向であることがわかった。」

この記述は聞き捨てならないところ。

実際のところ最近mixiのアカウントは活動らしい活動をしていないので、新たに足跡を残してくれる人はみんな
「実は私、上京後は苦しい生活をしていたのですが、今では月収1000万円のセレブの仲間入り。
その秘密を知りたいですか?
人生を変えたいと思っている方はこちらのリンクをクリック」
というような内容が多い。

こういうアカウントの特徴はしばらくたったら消えてしまうこと。
おそらく一人で何十、何百ものアカウントを作って自分で自分をインバイトして幽霊アカウントを量産し、それで次々とこういう商材販売サイトのリンクを置いたアカウントで無作為にmixi内で足跡をつけまくっているのだろう。
こういう方法も「ネットで巨額を稼ぐ方法」として「商材」に載っているに違いない。
今やmixiはこういう偽アカウントがどっさり詰まったスパムの巣窟になっていて、いくら通報しても減るどころかどんどん増えているに違いない。
mixiの会員が数千万だのいっても、実際アクティブなアカウントはその数十分の一しかない筈だ。
大体日本国民の二人に一人が会員なんて原理的におかしいと思う。
赤ん坊もパソコンを触れないおじいちゃんも全部ひっくるめての二人に一人だから、あり得ないし本当ならもうそれは
「友達の輪に限定されたソシアルネットワーキングサービス」
なんて状態ではないのは冷静に考えれば分かる。
見かけの利用者数は2ちゃんねるより多いのに「限定された」もクソもないんじゃないだろうか。

ただブログはトラックバック等でやはりこういうリンク先に飛んでいく可能性があるわけだから、原理的には
「ネットのどこにいたって最終的には有害サイトにつながっている」
と考えるのが正しいと思う。

そうするとここでも「違法ダウンロードの違法化」議論で「違法サイトと気がつかないでダウンロードした場合も罰則の対象になるのか」という問いかけはまことに妥当だと思う。
どこからどこまでが、一般サイトでどこからが有害サイト、違法サイトかは判定の仕様がない。

このトレンドマイクロと東大の研究のように機械的に判定して、ブラウザにその機能を実装してくれるというのが唯一の実用的な方法かも。
でもそうなるとブラウザの製造者責任が問われかねないからブラウザの利用規約に
「有害サイトフィルタは閲覧するサイトの合法性を保証するものではありません。フィルタを通過したサイトを閲覧して刑事罰を科せられた場合でも当者はその補償を一切できかねます」
と書かれて、結局自己責任になるのだろうなぁ。
それにこれもイタチごっこなのだろうなぁ。
きっと抜け穴を見つけ出すサイト運営者が出てくると思うし・・・・

<追記>

「実は私、上京後は苦しい生活をしていたのですが、今では月収1000万円のセレブの仲間入り。
その秘密を知りたいですか?」
みたいな例文を書いてしまったら、下のadsenseがそういう広告ばっかりになってしまうのではないかと心配したが、実際その通りになってしまったようだ。
スゴい感度の良さ・・・というか他の大部分のMacやネットについての記事にもっと反応しろよと思ったり・・・




2008年1月30日













Previous Topへ Next




site statistics
青木さやか