#followfridayはフェアなユーザーディスカバリーメソッド、よりフェアにするための工夫も

マストドンのユーザーディスカバリーメソッドのうち、人手で作成されたリストは、アンフェアであることが知られている。このことは定性的な評価で予想され、定量的な評価でも裏付けられている。

ところで、英語圏のマストドンには、#followfridayという風習がある。これは、特定のハッシュタグを用いて、他のアカウントを推薦するという風習である。この風習をユーザーディスカバリーメソッドとして見ると、人手で作成されたリストの一種であると言える。ということは、このハッシュタグも、アンフェアなユーザーディスカバリーメソッドであると言えるだろうか?

そこで、以下のような手順で、定量的な観測を試みた。観測範囲はPeers APIで到達可能なインスタンスのローカルタイムラインである。2018年8月17日0時から18日6時ごろ (協定世界時) にかけて観測を行った。そして、#followfridayハッシュタグを持つトゥートでメンションされているユーザーを抽出した。そして、それらのユーザーのフォロワー数の幾何平均を、#followfridayハッシュタグのアンフェアネス値とした。

結論から言うと、#followfridayハッシュタグのアンフェアネス値は182.3であった。他のユーザーディスカバリーメソッドと比較すると、これは十分にフェアである。

また、#followfridayハッシュタグで推挙されたユーザーのうち、フォロワー数が多いものを順に挙げる。重複があるのは、複数のトゥートで推挙されたユーザーを重複して挙げているためである。

  1. Curator@mastodon.art (7927)
  2. nolan@toot.cafe (4245)
  3. jk@mastodon.social (3542)
  4. jk@mastodon.social (3542)
  5. aral@mastodon.ar.al (2739)
  6. sebsauvage@framapiaf.org (2731)
  7. aparrish@mastodon.social (2393)
  8. CobaltVelvet@octodon.social (2325)
  9. davidrevoy@framapiaf.org (2060)
  10. cypnk@mastodon.social (1966)

このように、少数ではあるが、フォロワー数の多いユーザーが#followfridayで推挙されることもある。#followfridayでユーザーを推挙するにあたっては、フォロワー数の多いものを避けるようにすれば、よりフェアなユーザーディスカバリーを提供できることが期待される。また、Curator@mastodon.artが、フェアネスを重視した「キュレーション」を行うかどうかも、注目に値する。

また、今回の観測では、here is a list of people that I follow and have fewer than 100 followersというフレーズを#followfridayハッシュタグとともに使用している例が見られた。これは、ユーザーディスカバリーをフェアにするための、直接的かつ効果的な方法である。

広告

レコメンデーション・フェアネスがマストドンでうまれたわけ、あるいは、インターネットをGoogleがうまれるまえまでさかのぼる

このきじは、かんじをつかわずに、かんたんなにほんごでかかれています。

わたしがレコメンデーション・フェアネスというアイディアをつかって、なにをくらべたかというと、はじめはマストドンのインスタンスいちらん、つづいてマストドンのおすすめユーザーでした。では、わたしがレコメンデーション・フェアネスをマストドンにあてはめたのは、なにがきっかけだったのでしょうか? なぜ、べつのソフトウェアやウェブサイトではなかったのでしょうか?

ひとつには、マストドンのインスタンスいちらんのうちのおおくが、あまりにアンフェアであったからです。とくに、インスタンスのユーザーのかずは、マストドンのAPIでかんたんにえることができたので、おおくのインスタンスいちらんがそれをつかいました。しかし、これまでにはなしてきたとおり、インスタンスのユーザーのかずをつかったインスタンスいちらんは、とてもとてもアンフェアです。そのため、わたしは、よりよいインスタンスいちらんをつくるだけでなく、なぜこれまでのインスタンスいちらんがよくないのか、せつめいしたいとおもいました。インスタンスいちらんのフェアネスとアンフェアネスというアイディアは、ここからうまれたのです。

もうひとつは、マストドンのこうしきの、あるいは、マストドンのほんたいにないぞうされたレコメンデーション・システムが、かなりおくれてつくられたことです。インスタンスいちらんでいえば、マストドンこうしきのインスタンスいちらんがつくられたのは2017ねん5がつ、にほんごでみられるようになったのは2017ねん9がつです。それよりもさきに、たくさんのインスタンスいちらんがつくられました。マストドンほんたいがユーザー・レコメンデーションをないぞうするようになったのは、2018ねん6がつのことです。そのため、フェアなインスタンスいちらんや、フェアなユーザー・レコメンデーションをじぶんでつくってしまいたいということに、つよいモチベーションがありました。もし、マストドンこうしきのものがさきにあれば、じぶんでおなじものをつくろうとはおもわなかったし、つくったとしても、まったくつかってもらえなかったにちがいありません。

さらにべつのりゆうは、いまのインターネットには、アンフェアなレコメンデーション・システムがあまりにもおおいことです。とくに、ほとんどすべてのレコメンデーション・システムが、ポジティブ・フィードバックというアンフェアネスをかかえています。なぜなら、おおくのレコメンデーション・システムが、すでにおおくのユーザーのあいだでにんきになっているウェブサイトやコンテンツを、さらにおすすめするというしくみになっているからです。Googleけんさくのページランクもそうですし、Amazonがしょうひんをおすすめするときもそうです。

むかしむかし、インターネットがいまのようにはふきゅうしていなかったころ、Yahooは、ひとがじぶんのめでウェブサイトをみて、ウェブサイトのいちらんをつくっていました。Googleは、おおくのウェブサイトからリンクされているウェブサイトは、きっとすばらしいものにちがいないというもくろみから、ウェブサイトのけんさくを、じどうかしました。これは、たしかにすばらしいしくみでした。しかし、このときから、インターネットのレコメンデーションは、つよいポジティブ・フィードバックをもつようになったのです。なぜなら、Googleのけんさくけっかでじょういにでるウェブサイトは、たくさんのひとにみられて、そのけっか、さらにたくさんのウェブサイトからリンクされるようになるからです。なお、こうへいのためにいっておくと、ひとがじぶんでつくったリストも、やはりアンフェアであることがしられています。

ですから、わたしたちは、レコメンデーション・システムがポジティブ・フィードバックをもたないインターネットを、そうぞうすることがむずかしくなってしまいました。ポジティブ・フィードバックをもたない、よりフェアなレコメンデーション・システムをつくるということは、インターネットのじかんをGoogleよりもまえまでさかのぼることです。そして、マストドンのようなあたらしいメディアでは、それがかのうであったということです。

ざんねんながら、インターネットには、わるいひとがたくさんいます。ひどいわるくちをいうひとや、おかねもうけのことしかかんがえていないずるいひとが、たくさんいます。やくにたつことや、おもしろいことをいうひとは、わりあいとしては、どんどんすくなくなってしまいました。だから、そのようなひとたちをみつけだすためには、すでにおおくのひとのあいだでにんきになっているひとを、さらにおすすめするというほうほうしか、きのうしなくなってしまいました。

マストドンはアーリーアダプターのあつまりなので、わるいひとやずるいひとは、まだあまりおおくありません。また、ものすごくゆうめいなひとや、とてもえらいひとで、マストドンをやっているひとは、まだまだほとんどいません。なので、ポピュラリティ・ベースのレコメンデーションだけでなく、シミラリティ・ベースのレコメンデーションも、わるくないけっかをだします。

マストドンと、レコメンデーション・フェアネスには、このようなかかわりがあったのです。

ところで、マストドンにも、わるいひとやずるいひとがふえてきたら、やはり、ポピュラリティ・ベースのレコメンデーションがひつようになるのでしょうか? ポジティブ・フィードバックのあるレコメンデーション・システムしか、きのうしなくなり、フェアネスはうしなわれてしまうのでしょうか? ひとにぎりのセレブたちだけがますますゆうめいになり、そうでないふつうのひとたちは、わすれられてしまうのでしょうか?

きぼうをすててしまうのはかんたんですが、わたしたちにできることは、まだまだたくさんあります。シミラリティ・ベースなしゅほうのかいりょうをつづければ、フェアネスだけでなくコンビニエンスにおいても、ポピュレーション・ベースなしゅほうよりもよいものができるかもしれません。

さらにたいせつなことは、ポジティブ・フィードバックはしかたないにしても、アンフェアネスのげんいんになる、ほかのアンチパターンをさけることです。まず、オルディーズ・エフェクトをさけることがたいせつです。オルディーズ・エフェクトのあるレコメンデーション・システムでは、かこにいちどでもゆうめいになったひとは、ずっとゆうめいなままです。それをさけるためには、1しゅうかんや1かげつといった、きかんをかぎったかずをつかうべきです。

さらに、シュリンクラップ・エフェクトをさけることもたいせつです。ユーザーをひょうかするとき、ユーザーそのものではなく、そのひとがうみだしたコンテンツでひょうかすることは、レコメンデーションのフェアネスをよくします。たとえば、フォロワーのかずでユーザーをひょうかするのは、とてもアンフェアです。かわりに、トゥートをブーストされたかいすうをつかえば、そのひとのトゥートがほんとうにおもしろかったかどうかを、ひょうかすることができます。

これらをかんがえあわせると、たとえば、1しゅうかんにブーストされたかずをつかったユーザー・レコメンデーションは、よいアイディアであるといえます。ポジティブ・フィードバックはしかたないとしても、オールディーズ・エフェクトとシュリンクラップ・エフェクトを、さけることができます。

さらに、もうひとくふうしてみましょう。アンフェアなクライテリアを、ぎゃくむきにつかうと、フェアになります。たとえば、フォロワーが100にんよりもおおいひとは、レコメンドされないというルールを、くわえるのもよいでしょう。フォロワーがおおいひとは、レコメンドされなくても、フォロワーをふやすほうほうが、ほかにいくらでもあります。

これまでにみてきたように、レコメンデーション・フェアネスというアイディアは、マストドンのこゆうのじじょうにたすけられてきました。しかし、けんきゅうをすすめれば、よりいっぱんに、さまざまなウェブサイトやソフトウェアに、レコメンデーション・フェアネスのアイディアをてきようすることができるはずです。そのとき、わたしたちは、Googleのせいこうによってうしなわれてしまった、ありえたかもしれないもうひとつのインターネットを、とりもどすことができるのかもしれません。

ヨーロッパ著作権法13条「コンテンツ認識技術」は本当にインターネットを破壊する、11条「リンク税」は言及したら負け

ヨーロッパ著作権法、直訳すると「デジタル単一市場における著作権に関するヨーロッパ議会と委員会の指令」は、2018年7月5日にヨーロッパ議会で否決された。9月頃には修正案が採決される見通しである。

ヨーロッパ著作権法についての日本語圏の言及は、11条を「リンク税」と揶揄する記事リンク税言うなキャンペーンの泥仕合が主流である。それを後知恵で解説する記事もあり、いずれも責任ある態度とは思えない。

7月5日の否決に向けた戦術としては、それが事実であるかどうかに関わらず、11条を「リンク税」と揶揄することは有効に作用した可能性がある。しかしながら、9月の修正案の採決をめぐっては、事態はまったく異なる。評判の悪い11条を削除または修正することで、他の破滅的な条文が温存されたまま、議員たちが満足する可能性があるからだ。

11条は著作権所有者が報道機関に限定されることが明記されているので、影響は限定的である。それに対して、13条は、ユーザーがメディアをアップロードすることができるすべてのウェブサイトに、コンテンツ認識技術の導入を義務づけることが (解釈によっては) 可能である。

ここで、すでに存在するコンテンツ認識技術であるGoogle Content IDについて見てみよう。Content IDについての不満はインターネットで広く見ることができる。よくあるのは、誤検出によって広告料収入が横取りされている事態と、そもそも広告料収入の横取りを狙ってContent IDを利用しているユーザーがいるらしいということである。気の毒なのは、著作権所有者による一方的な規約の変更という、第三者から見れば著作権所有者に非があるであろう事態において、Content IDの申し立てを受けた側が「それにしても穏便な処置です。ここは著作権者様に感謝ですね。」などとすっかり委縮している例があることである。

広告料収入の横取りも重大な事態ではあるが、より深刻なのは、Content IDを言論弾圧に利用できることである。たとえば、BGM用のイージーリスニング楽曲や、装飾用のエフェクト画像を「フリー素材」として広く公開したうえで、Content IDを利用するという手法がある。この手法は広告料収入の横取りにも利用できるし、より深刻なのは、政治的な党派、あるいは人種や宗教といったセンシティブな属性を標的にして、特定のメディアを削除することができることである。

著作権所有者が、その地位を利用して、インターネットコミュニティに対して過大な要求をすることは、しばしば問題になっている。古典的な例では、MMD界隈における複数の騒動が知られている。Content IDとコンテンツ認識技術は、この種の著作権所有者に、テクノロジーとコンピューティングの力を与えるものである。

Content IDの利用登録画面では、個人やバンドを選択することも可能である。無名あるいは偽名を用いた個人であれば、Content IDの濫用も簡単であろう。では、Content IDの利用を、信頼できる企業や著名人に限定することは、問題の解決につながるであろうか?

ヨーロッパ著作権法の提案文書では、著作権所有者のために透明性と交渉能力がもたらされることを重視している。インターネットは広大なので、著作権所有者は自分たちの知的財産がインターネットのどこにアップロードされているかを知ることは困難である。そして、自分たちの知的財産がどこにアップロードされているかを知らなければ、交渉を開始することもできない。EUの委員たちが、苛烈な反対意見に晒されながら、なおも「コンテンツ認識技術」を法案に盛り込むことにこだわったのは、この考えがあるためである。

だとすれば、Content IDが有名企業とセレブリティだけを優遇し、インディーズとアマチュアを締め出せば、より大きな批判を浴びるだろう。もちろん、その場合には、無名ないし偽名の者たちによる悪用を防ぐのは困難になる。このジレンマは、Googleの圧倒的な技術力をもってしても、解決することは難しい。

ヨーロッパ著作権法案の13条は、コンテンツ認識技術の導入を一律に義務づけるものではない。コンテンツ認識技術はあくまでも例示であり、実際に義務づけられるのは「適切かつ比例した措置」である。Googleのような巨人にとっては、現行のContent IDですら「適切かつ比例した措置」と言えるかどうかは疑問である。むしろ、デジタルウォーターマークのような先進的な技術を率先して導入することで、範を示すべきだろう。対照的に、PeerTubePixelFedのような零細勢力にとっては、「何もしない」ことすら「適切かつ比例した措置」として妥当であるという主張も可能である。

いずれにせよ、誤って「リンク税」と揶揄されている11条は、議会での交渉のための「おとり」であった可能性がある。本当にインターネットを破滅させるのは13条である。9月の再投票の結果が決まるまで、ヨーロッパ議会の動向から目が離せない。

ユーザーレコメンデーションがマストドン本体に導入された: フェアネスの評価は「現状維持」

まずはこれを見てくれ。Re-add follow recommendations API #7918

ついに来るべきものが来た。それも、Decentralization by design: How to get back the internet of celebrities into the 99 %’s hands の翻訳完了から1週間も経たないうちに。

Gargronはマストドンのユーザーレコメンデーションを実装し、それをmasterにプッシュした。早ければ数日後にも、リリースタグが切られ、複数の主要なインスタンスに導入されるだろう。

まずは仕様を見てみよう。あるユーザーがリプライ、ファボ、ブーストを行うと、対象となったユーザーにポイント (Potential friendship) が加算される。まだフォローしていないユーザーのうち、このポイントが高い者が推挙される。

リプライ、ファボ、ブーストの対象となるトゥートは、ほとんどの場合、いずれかのタイムラインに出現したトゥートである。ということは、Gargronによるユーザーレコメンデーションのフェアネスを評価するには、タイムラインをユーザーディスカバリーメソッドと見たときのフェアネスがそのままあてはまる。

タイムラインにはホーム、連合、ローカルがある。ホームタイラインは自分のフォローがブーストしたトゥート、連合タイムラインは「同じインスタンスの別のユーザーのリモートフォロー」のトゥートが流れる。いずれも、他の誰かにフォローされているユーザーのトゥートが多く流れるので、ポジティブフィードバックが発生する。

ローカルタイムラインは、同じインスタンスのユーザーであれば誰でもトゥートを流すことができるので、ポジティブフィードバックは発生しない。しかし、パワーユーザーエフェクトという、別の種類のアンフェアネスが存在することが分かっている。

というわけで、Gargronによるユーザーレコメンデーションのフェアネスは、既存のタイムラインと同等である。ということは、レコメンデーションのフェアネスという観点において、現状よりも悪くなるわけではないということは安心できる。インスタンスが持っているローカルな情報のみでレコメンデーションを構成するという厳しい制約のもとでは、最良の選択だったのではないか。

もちろん、よりフェアなサードパーティのレコメンデーションシステムをねじ込んでいくことは必要である。絶対にマストドンユーザーマッチングのAPIをマストドン公式レポジトリに飲ませてやるぞという気持ちでやっていく。

gargron-recommendation-fairness

余談

triadic closuresが導入されなくて本当に良かった!!! 命拾いしたな。

レコメンデーション・フェアネスの萌芽: 無名クレーマーの孤独な戦い

先行研究を明らかにすることの重要性は広く知られている。マストドンのインスタンスの一覧をフェアネスによって評価するというアイディアについても、その先駆的な事例について明らかにすべきだろう。

私自身の貢献としては、レコメンデーション・フェアネスの概念は、以下の段階を経て洗練されていった。

本稿では、これとは独立に、インスタンス一覧のフェアネスの概念を発明していたかもしれない無名氏の貢献を紹介したいと思う。

日本Mastodonインスタンス一覧は、古参順、すなわち、インスタンス一覧に登録されたのが古い順に配列されている。この配列のアンフェアネスは複数の文書で指摘されている。類似した事例を挙げると、joinmastodon.orgSearch Mastodon Toolsは、いずれも開設当初は古参順に配列されていたが、現在はそれを是正するプルリクエストが受理されている。

問題のインスタンス一覧は、Qiitaの記事として作成されており、編集リクエストによってインスタンスを追加するという運用がなされている。

無名氏は、リストの末尾にインスタンスを追加するというルールを破り、その結果、編集リクエストは受理されなかったらしい。ただし、記事主は無名氏のコメントをすべて削除しているので、無名氏の実際の主張を知ることはできないし、無名氏のハンドルネームも不明である。

キリスト教で異端とされた者たちの著書は容易に焚書されてしまうので、現在の学者たちが彼らの主張を知る手がかりは、異端を弾圧してきた者たちが異端の思想を (さまざまな歪曲や偏見を交えながら) 紹介した文書である。記事主は無名氏のコメントをすべて削除しているが、記事主が無名氏を非難しているコメントは残されているので、それを通して無名氏の行動を推察することができる。そこから言えることは、無名氏はおそらく、インスタンス一覧のフェアネスという概念の発明者であるということである。

もし記事主がインスタンス一覧のアンフェアネスを是正する行動を取っていれば、このインスタンス一覧は、インスタンス一覧のフェアネスのために行動した最初のウェブサイトとなっていた可能性がある。その機会を逃し、無名氏を単なる荒らしかクレーマーであるかのように扱ったことは残念である。

日本のマストドンインスタンス各位、GDPRにビビりヨーロッパ人を締め出す

違法か合法かではなく邪悪か善良かを考えて行動すべきだ。

追記 この記事よりも 正しく知れば怖くない GDPRの基本と対策のポイントをIIJが解説 を読んだほうがいい。「細かな対策法だけを論じたり、「守らないとこんな怖いことになるよ」といったようなブラックメール論法がよく見られたりしますが、監督機関が最も注視しているポイントは実は難しいことではない。(中略) 極端な話、「個人データについて何をやるかを正直に説明せよ」の一言で済ませることさえできます。 」と書いてあるぞ。

GDPR (General Data Protection Regulation) が2016年5月24日に発効、2018年5月25日に施行されることを受けて、日本のマストドンインスタンスに、EU圏内のユーザーを締め出す動きが広がっている。

GDPRについてはJETRO (日本貿易振興機構) の解説を読めばそれほど間違いはないと思う。ところで、プライバシーを保護するための規制であるGDPRがEU圏外のウェブサイト運営者にパニックを引き起こし、EU圏内のユーザーを締め出す動きが広がったことは、とても残念だ。

マストドンは、営利企業に支配されたウェブサイトと比較すれば、ユーザーのプライバシーを保護しやすい仕組みである。このことについてはGargron (マストドンの作者) とlain (Pleromaの作者) がそれぞれ解説している。

EUはプライバシーの権利を基本的人権として擁護する決意を固めており、GDPRはその手段にすぎない。私たちはユーザーデータをロシアの選挙コンサルタントに売ることはないし、著作権窃盗者の収入源となるアドネットワークに参加することもない。結局のところ、私たちはプライバシーの権利という本質的な価値観をEUと共有している。形式的な規則に違反しているかどうかは些細な問題にすぎない。EUの職員は馬鹿ではないのだから、「良いこと」をしているウェブサイト運営者に対して形式的にGDPR違反を適用して罰金を課すことは、絶対にあり得ない。

それでも私たちは、自分自身が規則に違反していないことを確認して安心したいかもしれない。しかし、それは法と規則に対する愛が行きすぎているように思われる。私たちは法と規則を題材にした論理パズルに熱中すべきではないし、形式的な違反を回避するために別のより重大な罪を犯すべきでもない。実際のところ、善良であることは合法であることよりもはるかに重要である。確固たる信念のもとにあれば、いかなる罰を受けても笑っていられるはずだ。

GDPRの違反者には2000万ユーロまたは年間売上高の4 %の罰金を課すことが可能である。しかし、これはGoogleやFacebookのような巨人と戦うために設定された金額であって、ピクシブやドワンゴのような地元資本を想定したものではない。ましてや、非営利の個人が運営しているウェブサイトについては、何かを心配するほうが馬鹿げている。

私たちが自由とプライバシーを愛するかぎり、同じ価値観を共有する全世界の人々に、言語と国境の壁を越えて、ウェブサイトのアクセスを開放すべきだ。マストドンのインスタンスからEU住民を締め出すべきではない。

参考文献

アジテーション駆動開発: その機能に理由はあるか?

駆動開発という接尾語は19世紀末には死語となっていたようであるが、リバイバルを試みたい。以下はアジテーション駆動開発の例である。

明らかにアジテーションがプログラミングよりも先に行われていたのはこの3件くらいで、他はアジテーションが後付けになったり、プログラミングと平行したりしている。

アジテーションのないプログラミングはユーザーに対する媚びだという信念でやっていく。後付けでもいいからアジテーションをやっていけ。