第三回SBM研究会に参加した

昨日9/13はソーシャルブックマーク研究会(SBM研究会)に参加していました。

ソーシャルブックマーク..オンラインブックマークとかとも言われますが、今代表的なのものは「はてなブックマーク」などがあります。ブラウザの「お気に入り」をネット上で公開して共有しよう!というものですな。

今回で3回目。 前回は参加できなかったので、計2回の参加です。

昨年夏の1回目に参加申し込みしたときソーシャルブックマークなどのWEBサービスが、研究会などになるのだろうか..と興味と疑問を持ったのですが、最近の情報理論の研究はこういうインターネット系のサービスの実装や大規模運用した結果の解析などもメジャーなテーマだそうですな。 そういえば私が学部生の頃はそもそもインターネットなんて大学の研究室間で細々とJUNETが繋がっていたぐらいだから隔世の感があり、現代の状況を知るだけでも研究会に参加する意義があるなあ。

情報処理界やWEBエンジニア界でSBMに関する今のホットなトピックは、

「おすすめエントリの提示」
ブックマーク数のランキング(hotentry) だけではなく、その人の興味に近いエントリや、ブックマークした記事に関連するエントリを表示する技術(レコメンデーションといわれる)ですな。アマゾンの「この商品を買った人はこれも買っています」みたいな。SBMの場合は、「ちょっと関係なさそうだけど、でも新しい発見がありそうなエントリを紹介する」という「セレンディピティ」という尺度も重要になりそう
「検索性の改善」
検索情報をリアルタイムで更新する手法(数秒前に投稿されたコメントを検索対象とするような技術)がホットだそうです。これはまだGoogle でもこれから導入されるような技術ですな。
ギーク以外でも利用できるGUI/操作性の提供」
といったところらしい。発表もほぼこれらのどれかの課題を解決する方法の紹介でした

■ 所感


Twitterについて
第一回の時は自然発生的に参加者、講演者Twitterでつぶやきはじめたところ、会場の中だけでなく、外まで巻き込んでSBM研究会がバズるということがありました。
(当時の感想)
http://blog.pasonatech.co.jp/yokota/104/7893.html 横田さん(P2Ptoday)のブログ
http://d.hatena.ne.jp/takeim/20080712#p1 私の日記

今回は会場でのTwitter利用が事務局から公式に推奨され公式タグ( #sbmconf),Twicco (http://twitter.com/sbm3)が指定されていました。
1回目に比べるとおとなしかったかな。。 という印象。1回目はある意味アングラでVIPPER的なノリで自重せずに書いていたところもあるけれど、今回は最初から多くの人の目に触れることが分かるし、この1年で「勉強会をtsudaる」ということの意義と作法が普及したということもあったかもしれない。

ただ、講演も終盤に近づくとだんだん書き込みが加速して少し危うい(?)状況にもなったな。 目の前の登壇者への突っ込みがリアルタイムで入ることで、場の空気が可視化され、増強されていくのだった。これは、去年7月のニコニコ動画ニコニコ大会議でみた光景に近い。
http://d.hatena.ne.jp/takeim/20080704/p1 ニコニコ大会議に参加した
http://d.hatena.ne.jp/takeim/20080705/p1 ニコニコ大会議2008生放送と「同期性」

・ 「アフォーダンス」がばずったーに補足される。
http://twitter.com/buzztter/status/3951088056

ボランティアやってみた
今回、早めに行ってボランティアとして勉強会に参加させてもらいました。
活動したのはベル係程度ですが、それでも参加したという実感があるなあ。


発表者、参加者のレベルが高いよ!!

まず、発表者のレベルが高い。多くの勉強会でも同じか。未踏出身者もしくはそのレベルの人たちがほとんどだ。毎回、自分のスキルとのギャップ差に愕然とする。なんというか最近は「どうにかしなきゃ!自分」という危機感も少なくなってきてちょっと危険かも。。

聴講者の方も有名なエンジニアの方がたくさん。 顔を知らなかったが名前を聞くと「ああ!ブログで有名な/あのサービスを開発された あの方!」という例が多い。

東工大大岡山キャンパス
・ 新図書館を建築中。100周年記念館の横、旧機械科研究室があったあたり。
・ インカレのジャズコンサートが開催されていた。学内にはジャズの練習の音が響き渡る。大学らしく、いい雰囲気。学生時代を思い出し懐かしくなる。
・ 大岡山キャンパスは芝生がきれいだ。 芝生越しに本館を眺めると、アメリカのキャンパスじゃないかと思うほど。
・ 「休日の東工大リア充」というTweetがあった。そうだなあ。

懇親会など
Poken充。 4名の方とPoken交換

・ 帰りの電車で UI界の神様の元SONYApple/現 慶応SFCの増井さんと二人になった。御大と何を話そう。。。と身構えてしまったが、フランクに話していただけたので、iphoneからUIのことからWEBサービスや企業でのセキュリティのあり方などざっくばらんに話すことができた。今回の勉強会の大きな成果の一つだ



■ 発表
エコメンデーション / 東工大 佐々木さん 上村さん
レコメンデーションを行うための「協調フィルタリング」というフィルタ手法が有用なのだが、これはは膨大な計算量が必要。これを効率的なNormalized Cut という計算手法を適用して計算量を下げた
  計算量が減らせるということは、サーバ台数が減らせるのでエコノミーエコロジー
  とのこと
ふむ... 方法はよく分からないが、「枝刈り」などというタームを聞くと、昔のコンピュータオセロを思い出す(森田オセロ森田オセロー.. という程度の理解です。。。)
SBMの推薦アルゴリズム 〜はてなブックマークのレコメンド(関連エントリ)の仕組み〜
岡野原大輔さん(株式会社プリファードインフラストラクチャー

周りの方の反応を聞くと、今回もっとも注目されていた講演だそうだ。はてなブックマークの開発に関わって「関連エントリ−」というレコメンデーション機能を実装したとのこと。
このシステムのキモは、 LSH という高速なハッシュ技術。
従来の計算手法の1/2000という効率化ができるようになり、大規模な情報から類似するエントリを現実的な速度で検索できるようになったとのこと
なるほど。 普段何気なくつかっている、はてブ。最近便利な機能がついたな。。。 と思っていたが、裏ではこういう技術的な工夫がされているわけだ。
SBMミニブログです」 福冨 諭さん
ミニブログTwitterなど)の検索性は実は悪い。これだけTwitterは流行っているけれど、過去のつぶやきはGoogleでは検索できない。
(あまりにエントリが多いから、過去の分は検索できないようにしているのかもしれない)
一方、SBMのコメントは過去エントリであっても検索ができる
じゃあ、SBMのコメント欄をTwitter代わりにすればいいんじゃん。 URLはダミーでつくればいいし。。 ダミーのURL作成とはてブを一括で行うシステムをつくったよ : http://hateber.fuktommy.com
というもの。
Twitter が過去ポスト含めて検索ができるようになればいいいとは思うが今のサービスの想定外の使い方をして新しいサービスにしてしまうというノリが面白い。    
SBMを利用したフィッシングサイト検知とその展望 −集合知セキュリティという考え方−NTT 中山心太さん  
フィッシングサイトの判定を、SBMのブクマ数の多寡で判断しようぜ! というのが主題。フィッシングサイトはブクマされないから、それで分かる。。という理屈だが、正しいサイトであってもブクマされないところも多く、その点は課題が多そう(講演では、正しいサイトをブクマさせるためのインセンティブ的な方式も提案されていた)FalsePositive の割合が多く、現実にはこの手法単体では使えなさそうだが、判断材料の一つとしては面白そう。
言語表現に基づくブックマークコメントの分類とフィルタリング 東京電機大 山田 剛一さん  
  ブックマークのコメントの内容を機械的に「意見」「引用」などに分類する手法の提案。  分類ができることで、ユーザーの嗜好にあったエントリを優先的に表示するといったことができる。 分類手法は、大まかには、元の記事とコメントの類似度を比較し、類似度が高ければ「引用」と判断するというもの。
  コメントの内容まで判断するというアプローチは面白いなあ。
LivedoorClip おもしろ大改造 ライブドア malaさん  
  LivdDoor Clip というライブドアのブックマークサイトで全ユーザがブックマークしているエントリをリアルタイムに検索/表示する手法の紹介。malaさんは、以前はてなにもいて、今はライブドアにいる有名なギークの方だそうだ。
  最近は、WEB界では PUSH型の通信方法が話題だそうだ。手法としては WebHook、 PububHubBub といったものがあるらしい。WEBはブラウザからのアクションでサーバから情報を拾ってくるのが基本だけれど、PUSH型になることで、リアルタイムで情報更新ができるなどのメリットがあるそうだ。 Livedoor Clipに登録されていくエントリから特定のキーワードを持つものを抽出するというデモを見せてもらった。 リアルタイムで毎秒10件ぐらいのあたらしいエントリが増えていく様は刺激的であった。 リアルタイム検索は、Twitterのブームとあわせて、この1年ぐらいの大きなテーマになるだろうな。「WebHook」「PubSubHubBub」というタームを知ったことだけでも意義があった
SocialDict - 英文Webページのスマートな注釈・辞書引きシステム 東大 江原遥さん  
英文WEBの本文でユーザのしらなそうな英単語を類推して、注釈を表示するというWEBサービス。ユーザが知っていそうかどうかを、ユーザのレベルや単語の難易度によって判断するというところが特徴。判断ロジックにはIRT(項目反応理論)を利用。IRTというと、TOEICの採点などで使われている手法ですね。
ブックマークサービス普及のためのユーザーインターフェースヤフー 島津さん  
  同じ「WEBを使う」ということなのに、利用率は、 WEBメールは普及(4割程度)なのに対し、SBMは2%程度。これは、インターフェースが分かりづらいに違いない! という仮説の元、「アフォーダンス」があるインタフェースを作れば、SBMも普及するというロジックで発表された。  アフォーダンスとは、おおざっぱにいえば「マニュアル見なくてもだいたい分かる」感のこと。
  世の中のデザインでアフォーダンスがある例、ない例をいくつも提示し、ではアフォーダンスをもったUIはどうあるべきかを提言していた。
  YahooのUIもよりよくなることを期待
oneclip - Twitterソーシャルブックマーク  大澤昇平さん
  WEBをクリップして、短縮URL,RT、クリック数集計など一連のフローをサポートするツール。 URLを介してアクセスすると、オリジナルのWEBではなくて、上部にoneclip のフレームが表示されていてすぐにRTできるのがポイント。  これは、SBMのサポートツールよりも、RT簡易化によるTwitterでの情報フローの加速をサポートするツールだな。