2ch検索窓

先日書いた「IMEの起動中にテキストボックスの内容を取る」の原理を応用した、サジェスト機能付き検索窓がこちらです。

2ch検索

JavaScriptファイル一枚に収めてありますので、非常に簡単に貼り付けることが出来ます。ブログのサイドバーなどのほか、ローカルのファイルからも利用可能です。
詳しくはこちらをご覧下さい

スレタイ検索、まだ始めたばかりですがいろいろなことが分かって興味深いです。

まず、当初から複数キーワードには対応していて、区切りは半角空白でも全角空白でも良いようにしていたのですが、意外に多くの方が複数の単語を空白を入れずにくっつけて検索しようとして、(おそらく)思ったような検索結果が得られていないことが分かりました。
そこで、クエリを形態素に分解し、部分一致できるようにしました。

また、部分一致するようになると、今度は、敢えてひとかたまりのフレーズとして検索したいときに、一部だけが引っかかってしまう現象が発生するので、引用符で括られたフレーズは分解しないようにしました。Googleなんかと同じです。いや、精度は全然違いますけどね(笑

スレタイ検索は公式も含めて老舗がいくつかあります。ウチは後発ということで、上に述べたように形態素解析やフレーズ検索など、新しい技術を取り入れていきたいと思っていますので、よろしかったらご利用下さい。

Rubyでbit.ly

Twitter などで採用されている bit.ly で API を利用するには、まずユーザー登録をしてアプリケーションキーを取得する必要があります。
その点、Tiny URL はそんなもの必要なく、非常に簡単に使えるのですが、今回は bit.ly の話です。

レスポンスはXML、JSON、テキストの三種類から選べますが、テキストで十分なのではないかと思います。

Rubyだと↓のような感じです。

require 'net/http'

def getBitlyUrl( url, username, appkey, format='txt')
	host = 'api.bit.ly'
	path = '/v3/shorten?login=' + username + '&apiKey=' + appkey +
				 '&uri=' + url + '&format=' + format
	http = Net::HTTP.new( host )
	headers, body = http.get(path)
	if headers.code == '200'
		return body
	else
		return "#{headers.code} #{headers.message}"
	end
end

p getBitlyUrl('http://country-blues.seesaa.net/','ユーザー名',
			  'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx')

xxxxxx…..はアプリケーションキーです。
一応、他人に知られてはいけない、という建前になっているために、JavaScriptなどクライアントサイド・スクリプトで利用しにくくなっています。
まぁ、実際は知られても大して問題ないとは思いますけどね。

ちなみに、登録したユーザー名でサインインすると、リクエストされたURLとそのクリック回数が分かる解析ページが見られます。結構面白いです。

麻雀とサンクトペテルブルグのパラドックスと小泉進次郎

よく漫画やドラマなどで怖い人が高レート麻雀というのをやっています。千点一万円とか、そういうやつです。
しかし、究極の麻雀と言えばいわゆる青天井ということになりましょう。

Yahoo知恵袋で、kimagurel964さんという方が、考え得る最高の飜数は50であると回答されています。

すなわち、

    

で、リーチ(1)、一発(1)、トイトイ(2)、三暗刻(2)、三槓子(2)、混一(2)、混老頭(2)、小三元(2)、白(1)、中(1)、ダブ東(2)、ドラ(32)です。

東場東家のロン和了りで、ドラは、三つ目の槓裏に至るまで全て4枚ずつのっていると仮定した場合です。
符は副底(20)、么九の槓子(32)が三つ、同じく么九の明刻子(4)が一つ、雀頭が役牌(2)、門前ロン(10)なので、合計132、切り上げて140です。

さて、これって青天井だと何点になるのでしょうか。

麻雀の点数は一般に

符 * 2 (飜数+2) * X

です。( X は親の場合 6、子の場合 4 )
つまり、

140 * 2 ^ ( 50 + 2 ) * 6
= 3.78302368699121660000E+018

ですね。……って、よく分かりませんね(笑)

千点百円とすると約37京8302兆円と言えば、少しは分かりやすいでしょうか。

麻雀の青天井はこのように実際には有限ですが、期待値が無限大となってしまうゲームの考察として有名なのが「サンクトペテルブルグのパラドックス」です。
次のようなゲームを考えてみます。

コインを投げて一投目で表が出たら二万円もらえます。
一投目で裏が出て、二投目で表がでたら四万円、
一、二投目で裏が出て、三投目で初めて表が出たら八万円。

つまり、n 投目に初めて表が出たら 2 n 万円もらえるというゲームです。

ただし、このゲームには参加料がかかります。
参加料をいくらまでなら払っても引き合うでしょうか?

n – 1 回まで裏が出る確率が ( 1 / 2 ) n – 1
n 回目に表が出る確率が 1 / 2

ですから、n 回目に初めて表が出る確率は、

( 1 / 2 ) n – 1 ( 1 / 2 ) = ( 1 / 2 ) n

です。このとき得られるリターンは 2 n

従って期待値は、

ですね。

あー、なるほど、期待値は無限大、これは百億円払っても参加する価値ありますね!

……って、なにかおかしいですよね。
これがサンクトペテルブルグのパラドックスです。

サンクトペテルブルグのパラドックスを解決する方法の一つとして提案されているのが、期待効用理論です。

ミクロ経済では限界効用という考え方があります。
ビールを飲むとき、一杯目はすごく美味しい。
二杯目はまぁまぁ美味しい。
三杯目はもういいかな……
という風に、量が増えると感じる美味しさ(限界効用)は減っていきます。これを、限界効用逓減と言います。

上のゲームも同じことで、100億円もらえる嬉しさは10億円もらえる嬉しさの10倍かというとそうでもなく、「多すぎてよーわからん」という状態になるはずです。

従って、金額の期待値が無限大になるからといって、期待効用も無限大になるわけではなく、あるところで頭打ちになるでしょう、というわけです。まぁ、その頭打ちがどのへんで来るのかは人によって違うかも知れませんけどね。

話は、先頃の参議院選挙に飛びます。
この選挙で、自民党の応援演説に各地で引っ張りだこになったのが、小泉進次郎氏です。

小泉氏は、民主党が掲げる「最小不幸社会を目指す」とのスローガンを批判し、「我々は最大幸福を目指す」と述べました。

最大幸福というのはベンサムの古典的な理論で、いわゆる「最大多数の最大幸福」というやつです。

例えば、ここに100人の「飲んべえ」が住む村があるとします。どんな村でしょう(笑
ジョッキ100杯ぶんのビールがあるのですが、強欲な村長が50杯を独り占めし、残りの99人は一人約0.5杯ぶんしか飲めません。
飲んべえがビールを飲んだときの幸福度は、およそ自然対数に比例するとしましょう。
村長がいくら飲んべえだと言っても、50杯も飲めませんから、この人の幸福度はせいぜい、
loge( 1 + 50 ) = 3.932 です。
他の人の幸福度は
loge( 1 + 0.5 ) = 0.405 です。
この村の幸福度の総和は、

3.932 + 0.405 * 99 = 44.027

です。
もし、全員で仲良くジョッキ一杯ずつ飲めば、

loge( 1 + 1 ) * 100 = 69.315

だったはずなのに。

これが、最大多数の最大幸福です。
小泉進次郎氏はこのことを言っているわけですね。

もっとも、民主党の「最小不幸社会」も実はそれなりに合理性のある考え方です。
上記の例えで言えば、ビールを0.5杯どころか一滴も飲めない、ゼロの人が出てこないようにするという考え方ですね。大多数が幸福でもゼロの人が居たらダメじゃないか、と。

私は民主党は大嫌いですが、この考え方は一理あります。

ただ、スローガンとして見たときに「最小不幸」というのはまずい。言葉選びが実に拙劣であると言わざるを得ません。不幸という字面でもう気が滅入ってきます。

その点を鋭く見抜いて批判を展開した小泉氏は、若いのに大変な炯眼ですね。

谷垣さんもまずまずの人物ではありますが、野党の党首としては少し印象が薄いように思われます。

自民党はぜひ、小泉さんを総裁にするべきです。無茶なようでも、その位やらないと政権奪還は覚束ないのではないでしょうか。

ウェブ炎上 ネット群衆の暴走と可能性

荻上チキ氏の『ウェブ炎上 ネット群衆の暴走と可能性』を読みました。

全般的に鋭い洞察に満ちており、心理学の知識と方法論を駆使した考察は瞠目に値します。

が、いくつか引っかかるところもありました。

例えば、「分かりやすさ」へのカスケード(128ページ)。
ここでは、2004年に起きたイラク日本人人質事件に関する大衆のネット上での行動について考察されています。
著者は「日本人はイラクの人たちにそれほど嫌われてないはず」という思い込みが現実の人質事件によって覆されたため、認知的不協和が生まれ、それを解消しようとする心理から、人質バッシングが起きた、と指摘します。
つまり、日本人が狙われたという恐怖に向き合うよりも、あの3人がバカだったから拉致されたのだ、と考えたがる人が多かった、と。(ただし、実際にこのように考えた個人が存在したということではなく、あくまでも大衆の心理を説明するためのモデルとしての話です)

また、非日常的な現実を日常へと組み込んでいくのにもバッシングの方がマジメに考えるよりも簡単だった、「わかりやすかった」とも述べられています。ただ、この非日常云々の部分の歯切れの悪さに特に顕著ですが、この理論には無理があるように思われます。

大衆は身に迫るような恐怖を感じ、それに耐えられずヒステリー的に人質バッシングを起こしたというのなら、一応筋は通ります。

しかし、著者も認めているとおり、私たちはあの人質事件を遠い異国のできごと、現実感に乏しいできごととして受け取っていました。
それゆえに、「三バカ」をバッシングすることで「合理化」する必要はそもそも無かった、あるいは少なかったのではないでしょうか。

「マスゴミだから」「サヨクだから」「朝日新聞の関係者だから」、そして多くの「国民」に迷惑をかけた「非国民だから」救済する必要はなく、殺されて当然。

著者はこのような極端な発言を挙げてバッシングの理不尽さを指弾する一方で、被害者の家族が「(テロリストの要求に応じて)自衛隊をなぜ撤退させないんですか!」と言い放ったことにはまったく触れていません。

また、別の部分では、

それまでは「自由主義史観研究会」(西尾幹二らと共に「新しい歴史教科書をつくる会」を設立した藤岡信勝が設立した団体)や「世界日報」(統一教会系列の新聞)などの、内容的にトンデモなサイトのみが上位に表示されており、

といった記述がありますが、統一教会系はともかく、「自由主義史観研究会」は、仮にその主張に多くの誤りが含まれているとしても「トンデモ」と一言のもとに切って捨てて良いような団体なのでしょうか。

荻上チキ氏はリベラルな考え方の人なのでしょう。この本では思想をあまり表に出さないように気を遣っているように見えますが、それでも、上の「トンデモ」などといった口吻に、その一端が表れているようです。

清水の舞台からまた飛び降りる

また、清水の舞台から飛び降りてみようかと思います。

と言っても、外車でも買って散財しようかという話ではありません。ちょっとした頭の体操です。

以前、清水の舞台から飛び降りたときの致死率は6割程度であり、逆に言えば4割は助かるというようなことを書きました。

そして、二度続けて飛び降りてなお生きている確率は16%だ、というようなことも書いたのですが、あまりにも粗雑な理論でした。
いや、そもそも致死率60%ということ自体、漫画で仕入れた知識なのですが(^^;

で、どう粗雑なのかというと、各飛び降り(というのも変な言い方ですが)は独立試行ではなく、前回の結果の影響を受ける、いわゆるマルコフ試行なわけです。
つまり、飛び降りて死ななかったとしても、怪我は免れないはずであり、後遺症に苦しむ場合が少なくないはずなのに、そのことが考慮に入れてありません。

そこで、飛び降りても生きていた場合をさらに、無傷・または軽症の場合(A)と、重傷により後遺症が残った場合(Aw…wounded)に分けてみましょう。

生き残った場合の半分が後遺症を伴い、後遺症のある状態で飛び降りると、受け身の体勢をとるのが困難なので生存率が20%に低下してしまう、ということにします。

樹形図を書くとこんな感じです。

二度飛び降りてなお生きている確率は、

0.2 * 0.2 + 0.2 * 0.2 + 0.2 * 0.2
=0.12

12%ですね。
樹形図は省略しますが、三度飛び降りてなお生きている確率は、3.2%です。

うーむ、かなり楽観的な設定にもかかわらず、生存率は低いですね、やっぱり。
くわばら、くわばら~

クライズラーのナゾ

最近、アメリカの自動車大手3社が相次いで破綻してしまいましたが、その一つ「クライスラー」でよく思い出すのが、知り合いの外国人がいつも「クライラー」と発音していたことです。

chrysler.jpg

今、気になって辞書を引いてみると、「クライスラー」と「クライズラー」両方載っていました。どっちでも良いみたいです。

どっちでも良いのなら日本では「クライズラー」で商標登録してもよさそうなものですが、「クライスラー」となっているのは偶然ではなく、「語感」でしょうね。

「クライズラー」だとなんかダサい感じしますよね……。

同様の「語感」に基づく命名としては、「マクドナルド」が有名です。

McDonald’s は、英語ではマッダーナーに近い発音ですが、日本マクドナルドを興した藤田田(ふじたでん)という人が、「日本語は、音節が 3、5、7 などの素数になっている方が収まりが良い」として、敢えて原語の発音と似ても似つかない「マクド・ナルド」にしたのだそうです。

語感じゃないけど、発音で面白い話と言えば、ある人が中国語で「打字機(タイプライタ)」と言おうとするとどうしても「打自己」になってしまい、いわゆるマゾヒストと誤解されてみんなに振り向かれた、と聞いたことがあります。

中国語は同音異義語が多く、仮に正しく発音できたとしても文脈によってとんでもない意味になってしまうことがあるのでやっかいです。まぁ、カタコトで喋っている限り、相手も分かってくれるとは思いますけどね。

ほかにも「みんなニュース、ニュースって言ってるけど、本当はニューだ」とか、「アボガドって言ってる人が多いけどアボドなんだ」とか、発音に関するこの手の話は枚挙にいとまがないですね。

ただ、アボカドはともかく、ニュースに関しては、あえて原語に忠実に「ニュー」と発音するのもひどく気障な感じがします。

気障に感じさせる原因が日本人に未だに残っている欧米崇拝、ないしは英語が堪能な人に対する嫉妬であるとしたら、この感情は克服しなければならないのかも知れません。

……が、筆者には人前で「昨日、7時のニューでさ~」などと言う勇気はありません(^^;

みなさんはいかがでしょうか。

「w」を毛嫌いしないで

ネットでよく使われる「w」、否定派が上回るという記事を見掛けました。

ちょっと違うなと思ったのが、ネットでよく使われるのは「w(全角英数)」であって、「w(半角英数)」ではない、ということです。

このことから、このアンケートの実施者(たち)は「w」を使わない人(が多い)と思われ、アンケート自体に「w」の使用に対する否定的なバイアスが掛かっていることは想像に難くありません。

そんなわけで話半分に読まなければならない記事ではありますが、そうですか、「w」に対する反感って意外に根強いんですね。

「w」の使用は、いわゆる「ら抜き言葉」に似ています。
ら抜き言葉を擁護する人たちの口癖は「ら抜き言葉は合理的だ」というものです。

即ち、正しいとされる日本語では受身と可能が同じ助動詞「られる」で表現されるが、可能の場合は「れる」、受身の場合は「られる」を使うことで両者の区別が容易になる、というものです。

これに対して私は若干の異論を持っていて、言語の用法は合理性のみによって決せられるべきではない、と思っています。

例えば、英語。もし、不規則変化は不合理だからと下のような文を綴ると、どう思われるでしょうか。


©MagicTuscan: CC BY-SA

The Badest mans runed away.

おそらく、意味は100%通じるでしょうが、非常に奇妙な印象を与えるのは間違いありません。

ら抜き言葉の合理性なるものも、これと同じで、必ずしも説得力を持つものではないと考えています。

少し脱線しました。

ら抜き言葉には多少抵抗のある私ですが、実は「w」は割と好きでよく使っています。

「w」は「(笑)」が省略されたものであり、タイピングの労力を減らすという意味で合理的な表現方法です。

それに加えて「w」の無視しがたい機能として、「程度の表現」が挙げられます。
ちょっと笑ったなら「w」、大笑いしたなら「www」、抱腹絶倒したなら「wwwwwwwwww」と、「w」の多寡によってどのくらい笑っているのかを表せるわけです。
これは「(笑)」には出来ない芸当です。

この機能は特にチャットにおいて便利で、相手のジョークに対して適切な度合いでウケてみせることは、若い人の間では「ちゃんとあなたの話を聞いてますよ」というアピールにもなっているようです。

ややこしいのは、「w」は嘲笑の意、などと誤って言われ続けていることです。

「(笑)」でも文脈によっては嘲笑の意になるのはご承知の通りで、「w」もそれと何も変わりません。

むしろ、「w」が主に使われている場所で、敢えて「(笑)」を使うと悪い意味に受け取られる可能性が高いのです。

「w」を擁護するもう一つの理由は、それが非音声的記号であるということです。
ら抜き言葉は主に会話で使われるものですから、その違和感は聴覚と結びつけられています。
一方、「w」はただの記号で、日本語を破壊する作用は特にない、と思うわけです。

ら抜きにしろ「w」にしろ、それを使っている人の前で、「正しい日本語」の講釈を始めると、ものすごく嫌われることは請け合います(笑)

郷に入っては郷に従え、と言います。

もし、「w」がよく使われているような場に通りかかったら、あまり頭ごなしにを嫌わずに、あなたも使ってみてはいかがでしょうか。

もちろん、当ブログのコメント欄でも「w」の使用は歓迎です。