2008年09月24日

微々たる変化


また少しだけ、判定精度が上がると思われる改変をしました。例のごとく、リンク面を見ても、おそらくすぐには違いがわからないと思います。でも、pigmizにはしっかり働いてもらうので、じわじわ効いて来る予定です。

正式リリース?をしてから、初めての改変なので、一応バージョンアップということになるのかもしれませんが、そもそもpigmizの正式リリースってなんだ?ということを思っていたり思っていなかったりするので、あまり意味は無い告知かもしれません。でも、一応、飼育記録なので、備忘録的意味合いで書いておきます。
posted by 飼育係A at 20:50| Comment(0) | TrackBack(0) | 飼育記録

被リンク数とのせめぎあい


ブログ界という世界があるのかどうかはしらないですが、pigmizはブログを集めているので、基本的にはブログしか見てないですし、pigmizの飼育者としては、そういう世界の話には自然と興味がわくわけです。

それで、今回、とても興味深かったのが、メディア・パブさんのエントリー、

100以上のブログからリンクを張られているブログ,全体の1%以下

というもの。海外の話がメインですから、pigmizが対象にしている日本のブログと微妙にずれるのですが、傾向をつかむにはかなり参考になります。また、海外のブログ事情と日本との違いを見つけることができました。

pigmizもブログの解析時にリンクを数えています。被リンク数というのも出せてます。そのデータを見ると、100個以上のリンクを貼られているブログがものすごく少ないというのは同様の結果として出ています。ただ、少し違うのが、20個以上の被リンク数のブログはそれなりに見つかっているということです。上記エントリーで紹介されているデータを見ると世界的には、4%以下くらいしかないようですが、pigmizの統計だと確実にそれ以上(6〜8%くらい)あるので、そのあたりが日本の特徴なのだろうと思いました。

日本のブログを見ていると、ブログを通じて友達づきあいというか、何回かコメントをしたら相互リンクという形でつながっていくのを良く見かけるような気がします。mixiのマイミクで軽く100人とか突破しちゃっている人、私の周りにも居ますが、日本のブログってそういうようなSNSでのつながりに近い意味合いが強いのだろうなぁと。知り合った証としてリンクする、それこそ友達の輪を広げるためにリンクするというのが主流なのかもしれません。遊びに行くブログをブックマークするような感覚でのリンクが多いといえるかと思います。ブログの質の良さ、興味や関心、他への紹介的な意味でリンクするかどうかを決めている割合は少ないのかなぁと。

被リンク数というのは、検索エンジンなんかでも表示順を決めるのに用いられているように、ブログの価値(客観的な意味での)を決めるときの大きな要素ですし、他にも多くのところで使われている判断基準のひとつだと思います。pigmizもブログが面白いかどうかを判定して、面白そうなものをなるべく目立つところに置くようにしているので、当然ブログが面白いかどうか?というのを独自に判断してるわけです。そのときに、被リンク数というものにどの程度重きを置くべきか?というのは、pigmizを設計している段階でかなり悩んだ部分でした。また今でも悩んでいます。ただ、現在のpigmizでは被リンク数はあまり重視してはいません。多分、これは現在のネットの流れからすると、多少異端な方法なのだろうとは思いますが…。

理由は二つです。
一つは、埋もれていた面白いブログを発掘してくるというのもpigmizのお仕事だから。被リンク数が多いということは、すでに知られたブログなので、わざわざpigmizが紹介しなくてもいいと思われるわけです。それからもう一つが、日本のブログは上記の傾向がある(と今まで漠然と思っていた)ためです。ブログの管理人さんやそこにコメントしている皆さんにとってはとても便利なリンクですが、その被リンク数を元にして、第3者が見たときのブログの面白さを判定することは、ちょっと根拠が弱いのではないかなぁと思っていました。正直な話、20人の友達からリンクがあるブログよりも、相互リンクはしませんと言う方針で、ひたすら書いているブログの方が、私が見て面白いと思えることなんかもかなりありましたので。そういう私の体験を根拠に、今のpigmizは被リンク数をそれほど重視しない方針になっています。

今回、メディアパブさんのエントリーを拝見し、私の手元にあるデータと比べてみて、やはり日本のブログが張るリンクはそのような傾向があるのだろうなぁと確認できた気がしました。もちろん、それが良い悪いではなく、日本のブログの傾向としてわかったということです。そういう意味で海外のデータはとても参考になりました。

ただ、だからといって、被リンクを全く無視することもできないわけですし、かなりの被リンクがあるブログはやっぱり面白い確率は高いです。なので、それをどのくらい加味するのか?というのは、これからも面白いブログを探し続ける上で、頭を悩ませるところだと思います。

リンク紹介とともに書かれていることの意味をできる限り正確に理解しつつ、お友達としてブックマーク的にリンクしているのか、面白いと思ったから自発的に紹介リンクしているのかを、自動判定するという現在の方針をできるだけ突き詰めたいところです。こうなるとやっぱり、日本語解析の精度の問題に行き着くわけですので今後も精度向上を目指さないといけないのだろうなぁと、なんだか当たり前のことを思った次第です。


※今回、pigmizの解析データの話もしていますが、pigmizは、そんなに大量のブログを見回っているわけではありません。古いデータを使っても意味がないので、それは除くとして、有効なデータとしては、ぜいぜい50〜80万個くらいだと思われます。その程度の数で日本のブログの傾向を語るのもどうかと思いますので、あくまでも参考ということで。

posted by 飼育係A at 20:47| Comment(0) | TrackBack(0) | 飼育用具

2008年09月13日

不具合なし。だといいなぁ…


ちょっと今更のような話題ですが、Google Chromeがダウンロードできるようになりました。

Google Chromeの詳しい話は、こんな記事とか、こんな記事とかを参考にしたりとか、実際使ってみて好きに評価していただければいいと思うわけですので、お任せするとして。

Google Chromeの出来がどうであれ、ユーザーの立場からすると、ブラウザの選択肢が増えて、色々と選べるので良いことだろうとは思うんです。世の中の流れを見ていても、Google Chromeへの期待感があからさまにわかります。また、独占状態は弊害が大きいですから、ある程度のものが並立するのが良いというのは、正しい流れだと思うわけで。私自身もそういう気持ちはあります。

が…。

サイトを作る側からすると、正直なところ、「もう勘弁してくれ」というのが感想です。理由はいわずと知れたこと。動作確認対象が一つ増えることになるから。つまり、今までの、IEと、FireFoxと、Operaと、Safariのチェックですら、つらい感じだったにもかかわらず、Google Chromeまでチェックリストに入ってきたわけで、手間が増えたのです。

もう、いい加減に、ブラウザのちゃんとした規格統一をやって欲しいものです。見た目とかは多少崩れてもまだ許せます。フォントがちょっと違っても、画像の配置が多少ずれても、サイトが使えなくなるわけじゃないから細かいことは言いません。でも、同じスクリプトを実行して違う結果が出てくるのだけは、許しがたいです。

本当は、pigmizにも、もっと実装したいことあったりするんです。でも、クロスブラウザとか考えながらスクリプト作るのはやってらんないというのが正直な感想。そういうライブラリもありますが、サイズが大きいものも多いので、使うのがためらわれるわけです。でも、そのうちやらないとダメなのかもしれませんね…。

Google Chromeの登場に対しては複雑な心境なのでした。


それでも、ちゃんとダウンロードして、インストールして、使ってみたんです。一応、今のpigmizでは、特に大きな不具合はないような気がしますので、ホッとしています。

posted by 飼育係A at 17:32| Comment(0) | TrackBack(0) | 飼育用具

2008年09月12日

飼育用具とは?

飼育用具というカテゴリを作ってみました。

pigmizを飼育するために使ったものという意味でこういうカテゴリ名になっていますが、要するに、技術的なお話を書こうということです。WEBがらみ、プログラミングがらみ、日本語認識がらみ、その他のお話です。

本当はこういう話って書かないつもりだったんです。またそれほどたくさんは書かないとも思います。正直、こういう話ってつまんなそうだと思ってましたし、今でも多少思ってますし、ユーザーは基本的に結果だけスマートに使えればいいというのが、私の思いですから。

検索サイトに行けば検索結果、辞書サイトに行けば言葉の意味、動画サイトに行けば動画の視聴、という感じで、私も他のサイトでは結果だけありがたく使わせていただいています。だから、pigmizとしても結果だけ表示されればそれでよいと。

でも、メールを頂いてしまったのです。技術的な話に興味があるとのことで。ただ、そのときには解説はお断りしたんです。pigmizに使った技術をちゃんと解説するのはかなり大変ですから。

pigmizを作るのに、世の中に出回っているモジュールを組み合わせたんならまだ説明も楽だったんです。今流行りの、なんとかAPIだとか、かんとかモジュールだとか、どんとかライブラリだとか、そういうのを使ってるなら、いくらでも説明のしようがあったんです。でも、そういうのを使いこなす才能に全く恵まれていない私は、独自開発コードで、ほとんどの機能を構築してしまいました。そんな、どこからも孤立した感のある、ちょっと寂しい孤独死寸前のpigmizをどう説明すればいいのか全く見当もつきません。だからといって、私の稚拙なコードをオープンソースなんかにするのは恥ずかしくてとてもやる気にならない。

こういう理由で、技術的な話をするつもりはなく、メールにもそういうお返事をさせていただきました。

でも、メールのお返事をした後で、こうやって、興味を持っていただけるうちが華だよなぁなんて思ったりもしまして。それに、一応これでも、pigmizをもう少しまともに働かせるために、勉強してたりもしますので、それなりにブックマークやメモがたまっていますので、書くネタがないわけではない。

ということで、pigmizをちゃんと解説するつもりはやっぱりないので申し訳ないですが、技術的な小ネタをボチボチ公開する場にして、お茶を濁そうというのが、この”飼育用具”カテゴリです。興味を持ったトピックやニュースとか、ちょっとしたメモ帳くらいのノリで、気づいたときに書いてみようと思います。

posted by 飼育係A at 20:30| Comment(0) | TrackBack(0) | 飼育用具