不動産所有者の傲慢と落魄

中山金治は2019年に90歳になったと言っていたから、おそらく1929年に生まれた。終戦を15歳で迎え、その歳から、電気材料の商社で働いていた。

泉町という横浜都市圏のはずれに家があり、都市圏の拡大とともに、その土地に5階建てのビルを建てて不動産収入を狙った。しかし、当初はオフィスビルとして建設したために、空室が目立つようになった。全室を住宅に改装することで家賃収入は向上したが、その改装費用のローンのため、金治はタクシー運転手をしてローンを返しながら、不動産経営を続けた。

現在、そのフェニックスナカヤマという5階建てのアパートは、1階が飲食店、2階から4階は各階に3戸ずつの集合住宅。5階は2戸に分けて、そのうち1戸にオーナーの金治が、もう1戸に娘のアケヨが住んでいる。

わが家はこのアパートの202号室で、私とわが妻とわが娘が住んでいる。わが妻は金治の孫で、アケヨでないほうの娘 (ハルミ) の子である。

アパートの治安は悪く、オーナーである金治がなんでも首を突っ込みたがるが、90過ぎて知性はだいぶ衰えている。エアコンが壊れた、蛍光灯が切れたという些細なトラブルでも、金治が出てくると何週間もそのままだし (むかしは電気材料の商社をしていたはずなのだが)、アパートの前のゴミ収集所も治安が崩壊している。アパートの4階と5階のあいだ、そして5階と屋上のあいだの階段は、ゴミ屋敷さながらに不用品が山積みになっている。もっとひどいのは、アパートに隣接して屋外に設置された冷蔵庫が故障したまま放置されていることである。中には腐りきった食材が満載で、不気味な色の液体が染み出している。ここになら人間の死体を隠すことも容易だろう。

金治は些細なことでマウントを取ってくる嫌な成金で、春先に私がエアコンで暖房をつけていると、日があたって暖かいからエアコンなんていらないんだ、と嫌な健康自慢をしてきたことがあった。さらに困ったのは、エアコンが故障したときに、知り合いの業者に頼むと称して、修理の手配をわざと遅らせようとしたことである。私にとって冷え性は深刻な疾患で、放置すれば肺炎や低体温症といったより深刻な疾患の原因になり得る。このときの私は、本人のいる前ではないが、酒瓶を叩き割るくらい激しく怒ったし、その甲斐あってか、エアコンの修理は私がインターネットで探してきた業者に発注していいことになった。

私たち (私とわが妻とわが娘) は2018年の夏ごろからフェニックスナカヤマ202号室に住んでいる。家賃がタダでいいというから喜んで住んでいるが、人間が3人で住むには手狭だし、金治じいさんがちょいちょい生活に介入してくるのは鬱陶しい。昔の人のいう、タダより高いものはないというわけだ。

悪いことは続くもので、私は2019年4月から代田ソフトウェア株式会社に雇用されていたのだが、6月末をもってクビになってしまった。理由はいろいろあって、代田ソフトウェアの雇用は高給好待遇だったのだが、先進的な給与体系を誇りとする文化には馴染めなかった。また、ちょうど5月の連休の時期に、炎上したプロジェクトに投入されてしまい、さらに、休日出勤の合間を縫ってわずかな休みに家族旅行に出たところ、妻の親戚とトラブルになった (これは金治じいさんとは別の方面) のも重なって、メンタルがアになってしまった。

私が無職になったと知った金治じいさんの反応は意外で、本人が言うには、心配で夜も眠れないとのことである。夜中に目が覚めると、私のことが気がかりで眠れなくなるそうである。

現代人の感覚からすれば、孫の婿なんて完全に他人だし、せいぜい遠い親戚くらいのものだろう。なぜ私の人生にここまで煩雑に干渉しようとするのだろうか?

金治じいさんは、わが妻に対して、私と離婚して、わが妻とわが娘を5階の金治じいさんの部屋に居住させることを提案したらしい。なるほど、婚姻とは聖別された売春であることがわかる。私もこの種の規範からは決して自由ではなく、代田ソフトウェアの職場から脱走して失踪したときには、妻子とは別れるつもりでいた。しかし、わが妻はそれを選ばなかった。わが妻は職を探して、何らかの非正規雇用で悪くない額の給与を得るようになった。私はハローワークに通いながら雇用保険の給付を受けるようになった。さいわいなことに、自閉症と発達障害の診断で精神障害者手帳3級を取得しており、雇用保険の受給期間は300日であった。また、娘の学童保育の送り迎えや、あるいは炊事や洗濯といった家事は、私が引き受けることになった。

結局のところ、私は雇用保険の受給期間の最初の40日くらいの間に、ハローワークが主催する障害者向けの合同面接会というイベントで、あっさり次の仕事を決めた。週20時間のパートタイムで時給は法定最低賃金、スーパーで総菜を作るような単純作業に従事している。賃プログラマーという職業にはもはや何の未練もないし、かといって他にキャリアプランがあるわけでもない。精神科医からも週20時間くらいの短時間の勤務が限界ではないかと言われているので、そのような職業選択になっている。

古い時代のひとびとは、孫の婿という血の繋がっていない遠い親戚にも、自分たちの価値観を押し付けなければ気が済まないのだろうか? それとも、不動産所有者にとっては、自分自身が所有するアパートに、ゴクツブシがタダで住み着いていることが許せないのだろうか?

実際のところ、私たちの社会において、不動産所有者と居住者のあまりに非対称な関係は、自由や平等といった近代的な価値観の零落を物語るに有り余るものがある。古い時代の価値観にとらわれた老人が、その価値観を誰かに押し付けることで自己肯定感を充足することを試みるとき、もしその老人が不動産所有者であれば、その居住者という資源を、そのような目的に利用することができるだろう。

デコブログ: 素朴なユーザーコミュニケーションと、その滅亡

デコブログについての記事の続き。

デコブログは、ブログでありながら、そのユーザー体験の中心は、「オウジ」や「ウサ子」といったキャラクターたちとのインタラクションであった。では、他のユーザーとの交流は、どのように行われていたのだろうか?

デコブログにはトラックバックがない。それでブログを名乗っていいのかどうか疑問ではあるが、デコブログにおいては、それは良い判断だったように思える。トラックバックは、ある記事が別の記事を参照したときに、それを逆方向からも知ることができるようにする仕組みである。参照という行為はどちらかというと論文風の、硬い文章に親和的な風習である。デコブログの記事はたいていが身辺雑記であり、他の記事を参照する機会は稀である。

トラックバックのかわりというか、デコブログには「あしあと」がある。デコブログが生きた時代からすれば、この概念はmixi風である。あしあとを通じて、複数のユーザーのあいだに、無言のうちに親密な雰囲気が生じる。

あしあとは、どちらかというと、既知のユーザーとの親密さを深める機能であり、未知のユーザーを発見する機能としては使いにくい。では、デコブログにおいて、未知のユーザーを見つける手段 (レコメンデーションフェアネス論でいうところのユーザーディスカバリーメソッド) には、どのようなものがあるだろうか?

デコブログの主要なユーザーディスカバリーメソッドは、新着記事のリスト (デコブログの用語では「新着ページ」) と、人気記事のリスト (デコブログの用語では「人気ランキング」) である。ここで、人気記事のリストのほうは、開設直後に崩壊し、まともに機能しなくなった。人気記事のリストは、単純に、アクセス数が多い順に配列されたリストである。ということは、何らかの理由でたまたまアクセス数が多くなった記事は、人気記事のリストを通してその記事を見に来たユーザーの行動によって、さらにアクセス数を増やすことになる。アクセス数は通算であり、たとえば月間や週間のような期間を限った計測方法ではなかったために、人気記事のリストの上位が入れ替わる機会はほとんどない。実際のところ、デコブログの人気記事のリストで上位の記事は、単なる身辺雑記であり、他の記事と比較して特に興味を引くようなものではなかった。それらの記事が大量のアクセスを獲得しているのは、当初の偶然と、人気記事のリストそれ自体のためであった。

残念ながら、新着記事のリストも、最終的には崩壊の運命をたどった。とはいえ、新着記事のリストは、デコブログそのものがサービスを終了する直前まで、未知のユーザーを発見する手段として、実際に使用することができた。

デコブログの短い歴史のなかで、ユーザー数が急増した「事件」が2回あった。第1は坂本真綾ショックであり、第2はECOショックである。私がデコブログを始めたのは坂本真綾ショックよりは後であり、それ以前のことはよくわからない。坂本真綾ショックによりユーザー数が急増したとはいえ、その時点でのデコブログはやはり小規模なプラットフォームであり、ユーザーたちの雰囲気は親密であった。コンセプトとビジュアルが独特であることから、デコブログのユーザーたちはわざわざデコブログを選んで来た人たちである。だから、ユーザーたちの嗜好や価値観は共通するところが多く、他のユーザーとの交流も容易であった。

結論から言えば、第2の「事件」であるECOショックによって、新着記事のリストは崩壊したし、ひいてはデコブログそのものの滅亡がもたらされた。2008年4月23日より、エミル・クロニクル・オンライン (ECO) というMMORPGがデコブログとコラボした。それにより、ECOからデコブログに大量のユーザーが流入した。すると、新着記事のリストは「ECOから来ました」「始めてみました」のような、新規ユーザーの最初の投稿ばかりで埋まるようになった。そして、大量に流入したユーザーが定着することは稀で、ほとんどは最初の1個の投稿だけを残して去っていった。これにより、新着記事のリストは、未知のユーザーを発見する手段としては使い物にならなくなった。

デコブログは2007年3月21日に誕生し、ECOとのコラボは2008年4月23日から7月23日まで、そしてデコブログのサービス終了が発表されたのが10月30日、実際にサービスが終了したのは12月1日であった。ECOとのコラボで荒廃したデコブログに、焼け跡からの復興のチャンスが与えられることはなかった。

独特のコンセプトとビジュアルを持って生まれてきたブログプラットフォームが、アーリーアダプターたちに強く支持されながらも、ユーザー数の無理な急拡大によって、あっけなく崩壊した。これだけならよくある話にすぎないが、その崩壊を内側から見届けたユーザーにとっては、特別な感情がある。

デコブログ: キャラクターがユーザーを励ます特異なユーザー体験

デコブログという特異なウェブサイトの思い出を書きたい。デコブログは2007年3月21日に誕生し、2008年12月1日に消滅した。現時点でデコブログの雰囲気を最もよく伝えているのはアーニマによる記事である。公式の情報としては2007年9月3日のプレスリリースがある。

デコブログの特異なのは、ユーザーがブログを書くことを、さまざまな手法で動機づけようとするところである。まず、ユーザーがブログの記事を書くと、デコパーツという報酬がもらえる。これは現代風に言うとガチャのようなもので、宝箱から何らかのアイテムが出てくるという演出がなされる。集めたデコパーツは、ユーザーのプロフィールページに飾りつけることができる。デコモードというモードに入ると、デコパーツに対して回転・移動・リサイズ・重ね合わせ順の変更などの操作が可能で、それによりユーザープロフィールページを飾ることができた。

さらに特異なのは、デコブログの体験の主要部分が、ユーザーとキャラクターとのインタラクションで成り立っていることである。通常のブログの機能は、誰かのブログを読むことと、自分のブログを書くことであるはずである。デコブログでは、そのどちらにも、キャラクターとのインタラクションが深く関わってくる。デコブログの初期にはキャラクターは「オウジ」という1種類しか実装されておらず、2007年9月にようやく「ウサ子」が投入された。

デコブログのほとんどのモードにおいて画面上にはオウジがいて、さまざまな言葉を話す。その言葉は単純なルールベースで制御されていて、デコブログを始めたばかりのころはよそよそしいが、書いた記事の数が増えてくると好感度が上がって親密な雰囲気になる。また、しばらくアクセスがないと寂しがるという特徴もある。仕組みは単純だが、用意されている言葉のバリエーションは多く、ていねいに作り込まれていた。

同じ「オウジ」というキャラクターでも、ユーザーごとに別個体であると想定されている。他のユーザーのブログを読みにいったときにも画面上にはオウジがいるが、その言葉は敬語でよそよそしく、限られた定型文を話すのみである。

そんなオウジの言葉のなかでも、ユーザーに新しい記事を書くように促す内容の言葉が多い。ログインするとまずブログを書くようにねだってくるし、記事作成画面では対話的に記事のテーマを考えてくれる機能もあった。(図はアーニマの記事より。)

1

ブログをやっているはずなのに、ほとんどの時間をオウジといちゃいちゃして過ごすというのは、特異な体験であった。他のソフトウェアにたとえれば、マイクロソフト・オフィスのイルカと会話して休日を過ごすようなものだ。まあ、伺かあたりのデスクトップマスコットは会話の内容も豊富だし、近年の例ではSiriあたりも気の利いた受け答えができる。

とはいえ、user-generated contentのプラットフォームにおいて、継続的に投稿を促す仕組みを持っているのは稀である。YouTubeやTwitterのような巨大なプラットフォームでは、大多数のユーザーが単なる消費者に甘んじることに、むしろ肯定的である。まして、ていねいに作り込まれた人格を持った存在が、ユーザーに投稿を促すための案内役を務めているのは、user-generatedであることへの強いこだわりを感じさせる。

いずれにせよ、キャラクターとのインタラクションが主要な体験となるブログというのは、不思議な存在だった。では、他のユーザーとの交流は、どのように行われていたのだろうか? これについては次の記事で検討するかもしれない。

食べログは評価の分散が小さいと得点が3.22に底上げされるかもしれない

概要

食べログの得点は、ユーザーが入力した評価の分散が小さく、かつ得点が3.20未満のとき、3.22に底上げされる処理があるかもしれない。あまり自信ない。

背景

食べログの掲載店舗の得点について、インターネットのまとめサイトでは、「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言がしばしば掲載されてきた。さらに、この仮説を統計的な手法で実証したと主張するブログ記事が出現し、話題となった。これに対して、食べログの運営者である株式会社カカクコムは、この疑惑を否定するプレスリリースを発表した。また、この件について検証を試みた複数の記事がブログなどで掲載されている。

井上明人は、店舗のレビューの数によって得点の最頻値が異なることを示し、少なくとも4種類の異常なピークが存在することを明らかにした。以下の図は井上明人からの引用である。

20191012-00146614-roupeiro-008-2-view

この図から読み取れる4種類のピークは、3.0のすぐ上、3.2のすぐ上、3.6のすぐ下、3.8のすぐ下である。

これらの異常値のうち、3.01のピークについては、得点が3.00未満の店舗の得点を3.01に底上げする処理の存在が示唆されている。では、他の3種類のピークについても、定性的な理解を進めることが可能だろうか?

データの収集

今回の調査では、2019年10月14日時点に収集したデータを使用した。食べログの掲載店舗のうち、宮城県仙台市に立地し、なおかつレビュー数が30以上40以下であるものを調査対象とし、これらの店舗の得点とレビュー数を収集した。

また、これらの店舗のうち、得点が3.22ちょうどであるものと、得点が3.20未満であるものについて、ユーザーによる評価点を収集した。ユーザーによる評価点は、0.5点刻みのビン (1.0以上1.5未満、1.5以上2.0未満、2.0以上2.5未満、……、4.5以上5.0未満、5.0ちょうど) ごとの人数を収集した。これは、以下の図のような画面を目視することで収集できる。

user-evaluation-example

データの収集はスクレイピングを用いず、ウェブサイトの目視によった。

統計的な処理

以下の図は、レビュー数が30以上40以下である店舗の得点のヒストグラムである。ヒストグラムのビン幅は0.01である。このビン幅を選択したのは、食べログの得点が0.01を最小単位として表示されるためである。この図は得点が3.00以上3.40未満の店舗のみを示している。得点が3.40以上の店舗もわずかに存在するが、この図では省略した。得点が3.00未満である店舗は、実際に存在しない。

sendai-reviews-30-to-40-histogram

この図から読み取れるように、3.22に異常なピークがある。レビュー数が30から40あたりの領域において、3.2のすぐ上に異常なピークがあることは、井上明人 (前掲) の調査ですでに明らかである。今回の調査でもそれが裏付けられた。

次に、得点が3.22である店舗群と、得点が3.20未満である店舗群について、ユーザーが入力した評価点の分布を調査する。ここでは、評価点を入力したユーザーに占める、2.0点以上4.0点未満の評価点を入力したユーザーの割合を、評価点のばらつきのなさの指標として用いる。

以下の表は、得点が3.22である店舗群と、得点が3.20未満である店舗群について、評価点のばらつきのなさを比較した表である。表の第1列は店舗の得点である。第2列はレビューの数である。第3列は、得点が3.22ちょうどであればX印を印字し、そうでなければ空欄とした。第4列は、評価点のばらつきのなさ、すなわち、2.0点以上4.0点未満の評価点を入力したユーザーの割合である。

sendai-anomaly

この表から読み取れることは、「評価点のばらつきのなさ」の閾値を0.900あたりに見ると、それよりも上にX印が集中していることである。ただし、集中しているといっても、例外も多く、すべてのデータを完全に説明できるものではない。

考察

得点を10進法で表記したときの心理的な影響から、得点が3.20を下回った店舗に対して、何らかの条件によって、得点を3.22まで底上げする処理が存在すると推測した。また、食べログの公式ドキュメントでは、「評価が割れているお店」の処理を低く抑えているかのような記述があることから、得点を3.22に底上げする処理は、ユーザーによる評価点のばらつきが小さい店舗に対して行われていると推測した。

実際に、得点が3.22である店舗は、評価点のばらつきが小さい店舗が多く、得点が3.20未満である店舗は、評価点のばらつきが大きい店舗が多い。しかしながら、この仮説によってすべてのデータを説明できているわけではない。特に、この処理が、評価点のばらつきが小さい店舗への救済措置であると仮定するならば、評価点のばらつきが小さいにもかかわらず得点が3.20未満にとどまっている店舗の存在は、たとえ1件であっても問題になる。

これらの考察から、得点が3.20未満である店舗のうち、ユーザーが入力した評価点のばらつきが小さい店舗は、得点が3.22に底上げする処理が存在するかもしれない、ただし確信は持てない、ということが言えるであろう。

議論

今回の一連の騒動では、食べログの得点には3.6と3.8に異常な特徴が存在するという統計的な分析と、「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言を結び付けた主張を行った者がいたことから、人々の耳目を集めることとなった。しかしながら、井上明人 (前掲) によれば、食べログの得点には少なくとも4種類の異常なピークが存在する。そのうち2種類の特徴だけを取り出して、流言飛語の類と結びつけるのは、いささか軽率であろう。

このような騒動に立ち向かうためには、統計的な処理をもてあそぶだけでなく、定性的な理解を進めることが欠かせない。墓場人夜 (前掲) は、3.01のピークについて、得点が3.00未満の店舗の得点を3.01に底上げする処理が存在することを示し、これを低得点の店舗に対する救済措置であると解釈した。今回の調査では、3.22のピークについて、ユーザーが入力した評価点のばらつきが小さな店舗の得点を3.22まで底上げする処理が存在するという解釈を示した。ただし、この解釈によってすべてのデータを説明できるわけではなく、あくまでも、このような処理の存在を示唆するにとどまった。

課題

得点が3.22ちょうどである店舗群に対して、得点が3.20未満である店舗群を対照群としたのは、あまり良い判断ではなかった。たぶん3.20と3.21も対照群に含めるべきだったと思う。食べログの得点調整アルゴリズムの設計者が、10進法の切りの良い数字に心理的な効果を認めているという仮定は、あくまでも推測であって、明確な根拠があるわけではない。

まとめ

食べログの得点分布に存在する複数の異常な特徴のうち、3.22のピークについて、ユーザーが入力した評価点のばらつきが小さな店舗の得点を3.22まで底上げする処理が存在するという解釈を示した。

食べログの得点は3.00を下回ると3.01に底上げされる

概要

食べログの得点は3.00を下回ると3.01に底上げされることが分かった。

背景

食べログの掲載店舗の得点について、インターネットのまとめサイトでは、「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言がしばしば掲載されてきた。これを受けて、藍屋えんは、統計的手法によりこの仮説を実証したと主張した。これに対して、konkon3249は、店舗が会員店舗であるか否かで得点の傾向に違いが見られないことから、食べログによる得点の処理が会員店舗への利益誘導ではないことを示した。さらに、井上明人は、店舗のレビューの数によって得点のピークが異なることから、食べログによる得点の算出は複数の閾値を用いた複合的な処理であることを示した。

トデスキングと井上明人 (前掲) が引用しているように、食べログは公式ドキュメントで得点の算出方法を明らかにしている。核心部分は「悪意のある不正な業者」に悪用されることを防ぐためとして非公開としているが、公開されている部分だけでも多くの情報を含んでいる。

食べログの得点が複雑な処理を経て算出されていることは、食べログの公式ドキュメントが自ら明らかにしている通りである。では、食べログの得点の算出アルゴリズムは、まとめサイトと藍屋えんが主張するような、会員店舗 (食べログの運営者による用語では「有料集客サービス」) への利益誘導に利用されているのだろうか? それとも、すべての処理が、純粋な善意 (あるいは、サービスの向上という営利企業として当然の行為) によって説明可能なのであろうか?

データの収集

今回の調査では、2019年10月10日時点に収集したデータを使用した。食べログの掲載店舗のうち、山形県米沢市に立地し、なおかつレビュー数が2以上20以下であるものを調査対象とし、これらの店舗の得点とレビュー数を収集した。データの収集はスクレイピングを用いず、ウェブサイトの目視によった。

統計的な処理

以下のグラフは、店舗のレビュー数と得点の関係を示した散布図である。横軸がレビュー数、縦軸が得点である。

yonezawa-schatter

この図より、レビュー数が20以下の領域では、レビュー数が得点にほぼ線形に重畳されていることが分かる。これは、食べログの公式ドキュメント (前掲) のいう「評価が集まらないと点数が上がらない」という説明を裏付けるものである。

また、得点が3.00を下回る店舗が存在しないことは、顕著な特徴である。

次に、以下のグラフは、レビュー数が2以上5以下である店舗についての、得点のヒストグラムである。ヒストグラムのビン幅は0.01である。このビン幅を選択したのは、食べログの得点が0.01を最小単位として表示されるためである。

yonezawa-boundary-histogram-1

この図より、得点が3.01である店舗が顕著に多いことが読み取れる。

なお、井上明人 (前掲) の調査でも、レビュー数が25以下の領域では得点の最頻値は3.01であることが示されている。以下の図は井上からの引用。

20191012-00146614-roupeiro-008-2-view

次に、以下のグラフは、レビュー数が6以上20以下である店舗についての、得点のヒストグラムである。他の条件は前の図と同じである。

yonezawa-boundary-histogram-2

レビュー数が6以上20以下である店舗については、3.01に顕著なピークは見られない。

考察

得点が3.00未満の店舗が存在しないことと、レビュー数が2以上5以下である店舗については得点が3.01である店舗が顕著に多いことから、得点が3.00未満の店舗の得点を3.01に底上げする処理が存在することが推測できる。

ここで、レビュー数が20以下の領域ではレビュー数が得点にほぼ線形に重畳されているという特徴を思い出そう。すると、レビュー数が少ない店舗はそのままでは得点が3.00を下回ることが多く、それにより、それを3.01に底上げされる処理も多く行われていると推測される。これに対して、レビュー数の多い店舗では、得点が3.00を下回ることは珍しく、それを3.01に底上げされる機会も少ないと推測される。

実際に、レビュー数が2以上5以下のヒストグラムでは、もし3.00未満の領域にもグラフが続いているとすれば、その領域にも長く裾が伸びていて、少なくない数の店舗がそこに含まれるように見える。さらに楽観的に見れば、そのような「自然な」分布における得点が3.00未満の店舗の数と、得点が3.01のピークに積み上げられている店舗の数は、おおよそ等しいようにも見える。

一方、レビュー数が6以上20以下のヒストグラムでは、得点の分布を3.00未満の領域に延長したとしても、そこに含まれる店舗の数は少ないだろう。先ほどと同様に楽観的な見方をすれば、こちらのヒストグラムでも、「自然な」分布における得点が3.00未満の店舗の数と、得点が3.01のピークに積み上げられている店舗の数がほぼ等しいように見える。

これらの特徴から、得点が3.00未満の店舗が存在しないというデータと、レビュー数が2以上5以下の領域では得点が3.01である店舗が顕著に多いというデータを結び付け、得点が3.00未満の店舗の得点を3.01に底上げする処理が存在するという結論を得ることが自然であると考えられる。

議論

得点が3.00未満の店舗は得点を3.01に底上げするという仕様は、食べログに掲載された店舗の立場からすれば、恩恵の多い救済措置であろう。しかし、このような大胆な仕様を、ユーザーへの十分な説明なしに導入することは、ユーザーの立場からすれば不遜に感じられるかもしれない。

実際のところ、ユーザーが入力した生の得点ではなく、それを複雑に処理した得点を提示するという食べログの方針は、いささかパターナリスティックに感じられる。とはいえ、食べログにとってユーザーと店舗とどちらが重要な関係先であるかといえば、店舗を優先すべきであるのは当然である。店舗の立場からすれば、インターネットの存在に勝手に点数をつけられることは感情を著しく害する場合が少なくないし、経済的な不利益に直結する場合もある (文春オンラインの記事などを参照)。

今回の一連の騒動では、まず藍屋えんが3.6と3.8のアノマリー (異常な現象) を統計的な手法で明らかにしたうえで、それを「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言を立証したものとして論じた。しかし、konkon3249は、会員店舗であるか否かという情報を付け加えることで、まったく別の解釈を示した。井上明人は3.6と3.8のほかにも複数のアノマリーが存在することを示し、食べログの得点の算出方法については多面的な理解が必要であることを示した。私の今回の調査では、井上明人が示した複数のアノマリーのうち3.01のピークについて、低得点の店舗に対する救済措置であるという解釈を示した。

今回の騒動を振り返ると、食べログの得点の算出が複雑な処理を経ていることは公式ドキュメントで明らかにされているのだから、争点があるとしたら、それらの処理が、例えば金銭の授受をともなうような不正であったかどうかという点に尽きる。この点については統計的な処理だけでは決して明らかにすることはできず、食べログの仕様についての定性的な理解が不可欠である。

食べログの得点の分布における複数のアノマリーのうち少なくとも一つ、すなわち3.01のピークについては、得点が3.00を下回る店舗に対する救済措置であるという解釈が妥当であることが、今回の調査で示された。驚き最小の原則からすれば、他のアノマリーについても、不正ではなく正当な理由のある処理であると推察すべきだろう。

一般に、統計的な処理から知識を得るためには、定性的な理解による裏付けが欠かせない。定性的な理解を欠いたまま、統計的な処理だけに耽溺すれば、今回の騒動で藍屋えんがしたように、たまたま発見した異常な現象を根拠に、安易に流言飛語を信用することになりかねない。

まとめ

食べログの得点には複数の奇妙な特徴があることが知られている。今回の調査では、そのうち3.01のピークについて、得点が3.00を下回る店舗は3.01に底上げされるという処理が存在することを示した。また、これを低得点の店舗に対する救済措置であると解釈すれば、この処理は正当な仕様であり、不正な利益誘導ではないことを示した。

Misskeyの「みつける」はフェアネスもオープンネスも最悪

マストドンのProfile directoryが盛り上がりを見せているのに対して、Misskeyの「みつける」は、フェアネスでもオープンネスでも大きく水をあけられている。

マストドンのProfile directoryとMisskeyの「みつける」は、どちらもURLが /explore であり、コンセプトも共通する。ただし、マストドンではユーザーが最近トゥートした順に配列される (旧仕様。新仕様では新しいユーザーの順を選択できる) のに対して、Misskeyでは「ピン止めされたユーザー」、「人気のユーザー」、「最近投稿したユーザー」、「新規ユーザー」というセクションがこの順にならんでいる。ここで「ピン止めされたユーザー」とは、当初は「公式アカウント」と呼ばれていたものである。「人気のユーザー」は、フォロワー数の順である。

また、Misskeyには「みつける」とは別に「おすすめユーザー」パネルがあり、こちらのほうが古い。「おすすめユーザー」パネルの配列は、フォロワー数の順である。

さて、Misskeyの「みつける」のフェアネスはどうだろうか? 「ピン止めされたユーザー」の実態は公式アカウントなので、フェアネスを議論する意味がない。「人気のユーザー」、すなわちフォロワー数順のリストのフェアネスは最悪である。「最近投稿したユーザー」は、パワーユーザーエフェクトの懸念があり、フェアネスはそこそこ。「新規ユーザー」はフェアであるが、しかし、「最近投稿したユーザー」と「新規ユーザー」があるあたりまで、わざわざ下にスクロールするユーザーがどれだけいるだろうか?

というわけで、Misskeyのユーザーディスカバリーメソッドのフェアネスは、ページのはるか下の方にある「最近投稿したユーザー」と「新規ユーザー」を除けば、率直に言って最悪ということがわかる。

ここでめいめいによるフォークに言及すると話がややこしくなる。めいめいによるフォークの「みつける」は「おすすめユーザー」というセクションがあり、User Matching in FediverseのAPIを呼んでいる。User Matching in Fediverseは、作者が私なので当たり前だが、レコメンデーションがフェアになるように設計されている。とはいえ、めいめいによるフォークの「みつける」は、「公式アカウント」、「人気のユーザー」のセクションがあってその下に「おすすめユーザー」なので、フェアネスについてはあまり期待できるものではない。

話を戻すと、Misskeyの「みつける」は顕著にアンフェアであり、ついでに「おすすめユーザー」パネルもアンフェアである。例えばmisskey.ioでは、作者のしゅいろと管理者の村上が常にリストの最上位に掲載されている状態である。これは相当に面の皮が厚くないとできない芸当である。マストドンのProfile directoryでは、当初はフォロワー数順の配列が選択できたが、リリースまでにこっそり削除されている。Gargronのようなシャイな青年にとって、自分自身がリストの先頭に居座り続けることは、きまりが悪かったのだろう。

フェアネスではなくオープンネスについて言えば、マストドンのProfile directoryもMisskeyの「みつける」も、表示されるのはローカルなユーザーに限定されていた。マストドンはリモートのユーザーも表示されるように改良を加えたが、まだリリースバージョンには反映されていない。

これまでフェアネスについてはさんざん言及してきたが、オープンネスはなぜ重要なのだろうか? ユーザーディスカバリーメソッドがオープンでなければ、ソーシャルグラフは小集団に分割され、それらの小集団を超えた交流は希薄になる。これはインターネットを電話かLINEグループのように使うことになる。それぞれの閉鎖的な小集団は、民主主義者の集まりであれば民主的に運営されるだろうし、強権的な人物とその追従者の集まりであれば強権的に運営されるだろう。荒くれものの集まりであればニガーやファゴットでは済まないような強い言葉が飛び交うだろうし、攻撃性を嫌悪し集団の和を重んじる小集団であれば、それに従わない人物を一致団結して追い出しにかかることだろう。

それぞれの小集団には良いところもあれば悪いところもある。一般論としては、外部の目が届いているほうが、その集団の悪いところが凝縮されていくのを防ぐことができる。

あるいは、Misskeyの作者とmisskey.ioの管理者は、意図的にアンフェアかつクローズドなコミュニティを志向しているのかもしれない。他の小規模なインスタンスの管理者たちが、そのあたりの機微を理解しているかどうかは、また別の問題である。

Profile directoryの仕様変更でフェアネス・オープンネスは大幅改善へ

Gargronよ、これまでさんざん悪口を言って本当に悪かった。新しいProfile directoryは、マストドンのレコメンデーション・フェアネスに関するすべての不名誉を一掃する可能性がある。

2019年8月30日頃にマージされたプルリクエストで、Profile directoryの仕様が大幅に変更された。リリースとしてはマストドン3.0に含まれる見込みである。

とにかくびっくりしたのが、Profile directoryにリモートの (他のインスタンスの) ユーザーも掲載されるようになったことである。どうやって他のインスタンスの情報を得ているかというと、これにはちょっとした肩透かしがあって、そのインスタンスですでに観測されているユーザー、典型的には、そのインスタンスのいずれかのユーザーにリモートフォローされているユーザーが、Profile directoryに掲載されるようになる。これは連合タイムラインとだいたい同じ仕組みだ。

ユーザーが配列される順序は、これまでは最近ツイートした順であったのが、これに加えて、新しいユーザーの順が選択できるようになった。なお、リモートのユーザーにとって、新しいユーザーの順とは、アカウントが作成された日時ではなく、そのインスタンスから観測され始めた日時が基準になる。

インターネット (正確にはコンシューマー・ジェネレイティッド・メディア) をテレビのようにしないためにフェアネスがあり、インターネットを電話のようにしないためにオープンネスがある。テレビも電話もそれなりに役に立つこともあるが、インターネットのパワーをそれだけに限定するのはもったいない。

マストドンの標準のユーザーレコメンデーションがリモートのユーザーも含むようになったことで、このレコメンデーションのオープンネスは格段に向上した。いまのところ、デフォルトではローカルな (インスタンス内部の) ユーザーのみが表示されるらしく、それは残念ではあるが、ラジオボタンをワンクリックするだけで、外の世界に目を向けることが可能になる。

では、フェアネスはどうだろうか? 最近ツイートした順の配列は、オールディーズエフェクトとポジティブフィードバックが発生しないものの、わずかにパワーユーザーエフェクトの懸念があり、フェアネスはまあまあである。これに対して、新しいユーザーの順の配列は、まだよく知られていない者を積極的に推挙する仕組みであるため、きわめてフェアである。これも、デフォルトが最近ツイートした順であって新しいユーザーの順ではないところが残念ではあるが、オープンネスだけでなくフェアネスも大幅改善と言ってよいだろう。

ところで、ちょっと細かいことを気にしておくと、Profile directoryに掲載されるリモートのユーザーとは、そのインスタンスですでに観測されているユーザー、典型的には、そのインスタンスのいずれかのユーザーにリモートフォローされているユーザーである。ということは、Profile directoryに掲載されるリモートなユーザーは、すでに他の誰かにフォローされているという制約を含むことになり、これはユーザーディスカバリーがアンフェアになる要因になり得る。これは、連合タイムラインがローカルタイムラインよりもアンフェアであるのと原理は同じである。

とはいえ、 Profile directoryに掲載されるリモートなユーザーは、すでにローカルなユーザーにリモートフォローされているユーザーだけとは限らない。インスタンスがリレーに参加するか、Federation Botを飼うなどすれば、この種のアンフェアネスを軽減することができる。

あと、Profile directoryに掲載されるにはフォロワーを10人集めることが必要であるという評判の悪い仕様が、こっそり廃止されていた。君子豹変す。