みっけ!の内側での処理は決まってるんだけれども、それをどう表現するか?というのが、いつも難題になっています。
要するにデザインで悩むということ。
piGmizのデザインは割と簡単に決めたんですけれども。あれはブログへのリンクをとにかくたくさん凝縮して表示させたいということで、あんな感じになっていました。
でも、みっけ!の方は、もう少し緩く表示しようかと思っています。というのも、いきなり大量のブックマークがあるわけではないということもあるし、ブログなどのテキストベースなページはリンクするのでいいとして、画像とか、動画とかなんかは、少なくともサムネイル表示くらいはしたいとなると、小さいエリアに凝縮するというのは、考えにくい。
さらにそれぞれのブックマークに対してコメントを付けられるようにしたい。これもpiGmizには無かった仕様です。コメント欄があれば、おもしろいと思うという意見とか、おもしろくないと思うという意見とか、あると思うのです。それも解析の対象にしたら、おもしろいものを自動判定するときの指針の一つにできると思うので。
どちらかと言うと、あまり一般的じゃないUIというか、サイトデザインを好む私ですけれども、こんな理由で少し普通っぽい感じになりそうな予感がして、自分の中の、「もっと奇抜にしてやりたい」願望と戦う日々なのです。なんとかそういう思いとの折り合いのつくデザインができたらいいなと思う今日この頃。
2011年12月20日
2011年12月19日
piGmiz、止まっています。みっけ!作っています。
piGmizの更新が停止中。
というよりも、完全に再構築中なので、新しくシステムを作り直しているという方が早いかもしれないです。
なので、再開時期は不明。
なぜこうなったのか?というと、これまでのpiGmizシステムに限界を感じたから。ブログの日本語を理解することはそれなりに出来るけれども、それが”おもしろい”のか?という部分を判定するのが、やっぱり困難になっているということです。
それは最初からわかっていたことではあるのですけれども、やっぱりここがネックになってきました。
今の判定基準でもそれなりにおもしろいと思えるブログは探してこれているのですが、その一方で、全くおもしろいと思えないブログもあり、スパムも拾い、ということがあるので、もっと人間の感覚として”おもしろい”ということを研究しないといけないと思いました。
それで、piGmizの更新を停止して、作りなおそうと思ったということです。
そのために、現在別のものを用意しています。とりあえず”みっけ!”という風に名前をつけていますが、仮名です。
これは、簡単にいえば、ソーシャルブックマークシステム。そんなもの、すでにたくさんあるでしょう、と思われると思いますが、その通り。今さら作ってどうする?とも思えるのですが、これを作る理由は、”おもしろいもの”を、ある程度、人間が選んで探してきて、その特徴をpiGmizに学習させて、”おもしろいもの”を探す精度を高めようということのために作るもの。
なので、あえて、人間がある程度介入して、”おもしろい”とはどんなこと?というのを、piGmizに教え込もうという魂胆なのです。
そのために、面白いものをたくさん集めるシステムとして、”みっけ!”を作っています。また、”みっけ!”の中にも、piGmizで培った、自動判定の部分を移植する予定なので、ソーシャルブックマークと言いつつ、piGmizの自動判定システムが解析もしていて、もしも、おもしろくないという事ならば、ブックマークされないということもあるという、なんとも、厄介なブックマークシステムになる予定です。
そういう意味で、選りすぐりのブックマークのみをリンクするというちょっと傲慢なシステムを作っています。ちなみに、今回は実験的に、画像や動画も集めてみる予定なので、それも解析してみたいと思っています。
ということで、現在、みっけ!の開発中。来年初めくらいには、ベータ版でもいいから、リリースしたいところです。
というよりも、完全に再構築中なので、新しくシステムを作り直しているという方が早いかもしれないです。
なので、再開時期は不明。
なぜこうなったのか?というと、これまでのpiGmizシステムに限界を感じたから。ブログの日本語を理解することはそれなりに出来るけれども、それが”おもしろい”のか?という部分を判定するのが、やっぱり困難になっているということです。
それは最初からわかっていたことではあるのですけれども、やっぱりここがネックになってきました。
今の判定基準でもそれなりにおもしろいと思えるブログは探してこれているのですが、その一方で、全くおもしろいと思えないブログもあり、スパムも拾い、ということがあるので、もっと人間の感覚として”おもしろい”ということを研究しないといけないと思いました。
それで、piGmizの更新を停止して、作りなおそうと思ったということです。
そのために、現在別のものを用意しています。とりあえず”みっけ!”という風に名前をつけていますが、仮名です。
これは、簡単にいえば、ソーシャルブックマークシステム。そんなもの、すでにたくさんあるでしょう、と思われると思いますが、その通り。今さら作ってどうする?とも思えるのですが、これを作る理由は、”おもしろいもの”を、ある程度、人間が選んで探してきて、その特徴をpiGmizに学習させて、”おもしろいもの”を探す精度を高めようということのために作るもの。
なので、あえて、人間がある程度介入して、”おもしろい”とはどんなこと?というのを、piGmizに教え込もうという魂胆なのです。
そのために、面白いものをたくさん集めるシステムとして、”みっけ!”を作っています。また、”みっけ!”の中にも、piGmizで培った、自動判定の部分を移植する予定なので、ソーシャルブックマークと言いつつ、piGmizの自動判定システムが解析もしていて、もしも、おもしろくないという事ならば、ブックマークされないということもあるという、なんとも、厄介なブックマークシステムになる予定です。
そういう意味で、選りすぐりのブックマークのみをリンクするというちょっと傲慢なシステムを作っています。ちなみに、今回は実験的に、画像や動画も集めてみる予定なので、それも解析してみたいと思っています。
ということで、現在、みっけ!の開発中。来年初めくらいには、ベータ版でもいいから、リリースしたいところです。
2009年02月18日
近況
近況、といってもpigmizは特に変わりなく、滞りなく、働いております。
今年に入ってからは、完全に全力活動していますが、それでも余裕が出てきた感じです。サーバ増強したのが効果を表したようで、一安心。やっと飼いならせてきた感じでしょうか。
ただ、前と結果がそれほど変わらないのはご愛嬌ですかね…。どうして変わらないのか?という理由はもちろんわかっているのですが、わかるだけにそれを変化させるとなると、また計算量が増えて、サーバがいっぱいいっぱいになって、またpigmizが言うことを聞かなくなって…、という前の状態に戻ることもわかるわけです。
とりあえず、1ヶ月以上、まったく問題ないので安定動作の確認はできたとして、サーバの様子を見ながら徐々に面白い機能の増強もできればいいなぁと思っているところです。
本当は、さっさと新しい機能つけたいんですけどね。一人で仕事の合間にpigmizの飼育しているところなので、なかなかうまくいかないものです。
ぼちぼちやっていきたいと思います。ということで、かなり遅いご挨拶ですが、今年もどうぞよろしくお願いします。
今年に入ってからは、完全に全力活動していますが、それでも余裕が出てきた感じです。サーバ増強したのが効果を表したようで、一安心。やっと飼いならせてきた感じでしょうか。
ただ、前と結果がそれほど変わらないのはご愛嬌ですかね…。どうして変わらないのか?という理由はもちろんわかっているのですが、わかるだけにそれを変化させるとなると、また計算量が増えて、サーバがいっぱいいっぱいになって、またpigmizが言うことを聞かなくなって…、という前の状態に戻ることもわかるわけです。
とりあえず、1ヶ月以上、まったく問題ないので安定動作の確認はできたとして、サーバの様子を見ながら徐々に面白い機能の増強もできればいいなぁと思っているところです。
本当は、さっさと新しい機能つけたいんですけどね。一人で仕事の合間にpigmizの飼育しているところなので、なかなかうまくいかないものです。
ぼちぼちやっていきたいと思います。ということで、かなり遅いご挨拶ですが、今年もどうぞよろしくお願いします。
2008年11月23日
リンクに関して考えたこと
ブログをたくさんリンクしているpigmizの飼育係として、かなり気になる話があったので、思うところを書いてみようと思います。
ホームページを作る人のネタ帳さんの、”一般常識ブログマナーを訴える人と、全く話がかみ合わないたった一つの理由”というエントリーを読んで知って思ったことです。
リンク先を読んでいただければわかると思いますが、ここで話題にされているのは、ネットに公開されているページへのリンクを拒否できるか?ということ。
私は、もしもリンク拒否ができるとしたら?無断リンクが法律的にも禁止になり、リンクするには全てに許可が必要になったとしたら?というようなことを、このエントリーを読みながら想像しました。
もしも、いちいち許可取らないとリンクできないようことにでもなったら、WEBの利便性はガタ落ちだと思います。普段便利に使っている検索サイトだの、ブックマークサイトだの、リンクを整理し、紹介して、WEBでの情報収集を容易にしているサービスが軒並み影響を受けることになります。これはかなりきついことになりそうです。
googleなんかにキーワードを入れて、検索結果が出てこないことというのは、あまりないわけですが、そういう状況が、かなりの頻度で出てきてしまうことになりそうです。また面白いサイトやニュースをリンクとして紹介しているサイトなんかも激減するのが想像できます。それに、何かを説明する文章の中で、リンク先にもっと詳しく書いてありますとか、そういう基本的な紹介の仕方がかなり減ることになるわけで、それだけは許してくれと思いました。
リンクするのに、いちいち全部のサイトの管理者に許可を取らなければいけないということになったら、こういう事態になるのだろうと。ものすごくWEBが不便になるなと思えますので、正直、かなり困ります。
とはいえ、リンクを拒否したいと考えている方の主張も素直な意見ではあると思いました。自分の知らないところで勝手にリンクされて、勝手に批評されたりするのが我慢できないというのも、気持ちとしてはわからなくもないです。でも、その主張を通し、それがネットの規則となった場合に、失うものがかなり大きいと思いますからそれだけは勘弁して欲しいものです。
リンク拒否を主張しているエントリーに寄せられているコメントでは、WEBの理念とか、WEBはもともとそういうものだ、ということからリンク拒否は出来ないという意見が多いですが、私としては現実的に、得るものと失うものを比較すると、リンクを拒否できるという意見には賛成できないなと思いました。
もちろん、こういう問題提起は必要だと思います。悪意を持って、例えば相手のブログを炎上させようという意図などでリンクしまくるような状況があることも問題ですから、それはそれとして議論していく必要があると思います。ネットは善意で成り立ってきたという経緯も持っているわけです。それを踏みにじる者に対して何の制限も無く放置するのは、ネットにコンテンツをアップしようとする人のモチベーションを下げることになりますので、今後のネットの発展を考えると決して良いことではないとも思います。
なので、本当に難しい問題だとは思いましたが、ネットの公開されている領域にアップされたものに対してのリンクを一方的に拒否できるという状況にだけはなって欲しくないと切に願います。
それで、もしも、リンクに許可が要るようになった場合、ブログのリンク集であるpigmizで対応できるのか?と、少し考えてみたんですが、やっぱりかなり難しいだろうなと思いました。
現状、pigmizには2万個くらいのブログへのリンクがありますから、それらに、全ての許可を取り歩くのは無理だと思います。一応、ブログの中の日本語を理解するのがpigmizの能力なので、文書中に、”リンクしていいよ”とか、”リンクしないでくれ”とか、そういうニュアンスが書いてあれば、それに対応するということは出来そうに思うのですが、それもない場合にはどうしようもないと思いました。この話題の発端である、リンク拒否を主張しているブログのように、しっかり書いてあれば自動的にリンクしないようにするということは技術的に可能ですが…。きっとそういう風にリンクに関するポリシーをしっかり表明する人ばかりじゃないだろうと思いますので。
なので、やっぱり、リンク拒否は勘弁して欲しいと、pigmizの飼育係としても思った話題でした。
法律なんかを見ていますと、WEBに対する規制がだんだんと強化される方向に行っていますので、それが行き過ぎないように、私たちもきちんと見守っていかないといけないと思いますし、そういう法律を作って規制しようという声が出る前に、WEBのユーザー皆が、自浄作用をしっかりと働かせていく必要がありそうに思います。
ホームページを作る人のネタ帳さんの、”一般常識ブログマナーを訴える人と、全く話がかみ合わないたった一つの理由”というエントリーを読んで知って思ったことです。
リンク先を読んでいただければわかると思いますが、ここで話題にされているのは、ネットに公開されているページへのリンクを拒否できるか?ということ。
私は、もしもリンク拒否ができるとしたら?無断リンクが法律的にも禁止になり、リンクするには全てに許可が必要になったとしたら?というようなことを、このエントリーを読みながら想像しました。
もしも、いちいち許可取らないとリンクできないようことにでもなったら、WEBの利便性はガタ落ちだと思います。普段便利に使っている検索サイトだの、ブックマークサイトだの、リンクを整理し、紹介して、WEBでの情報収集を容易にしているサービスが軒並み影響を受けることになります。これはかなりきついことになりそうです。
googleなんかにキーワードを入れて、検索結果が出てこないことというのは、あまりないわけですが、そういう状況が、かなりの頻度で出てきてしまうことになりそうです。また面白いサイトやニュースをリンクとして紹介しているサイトなんかも激減するのが想像できます。それに、何かを説明する文章の中で、リンク先にもっと詳しく書いてありますとか、そういう基本的な紹介の仕方がかなり減ることになるわけで、それだけは許してくれと思いました。
リンクするのに、いちいち全部のサイトの管理者に許可を取らなければいけないということになったら、こういう事態になるのだろうと。ものすごくWEBが不便になるなと思えますので、正直、かなり困ります。
とはいえ、リンクを拒否したいと考えている方の主張も素直な意見ではあると思いました。自分の知らないところで勝手にリンクされて、勝手に批評されたりするのが我慢できないというのも、気持ちとしてはわからなくもないです。でも、その主張を通し、それがネットの規則となった場合に、失うものがかなり大きいと思いますからそれだけは勘弁して欲しいものです。
リンク拒否を主張しているエントリーに寄せられているコメントでは、WEBの理念とか、WEBはもともとそういうものだ、ということからリンク拒否は出来ないという意見が多いですが、私としては現実的に、得るものと失うものを比較すると、リンクを拒否できるという意見には賛成できないなと思いました。
もちろん、こういう問題提起は必要だと思います。悪意を持って、例えば相手のブログを炎上させようという意図などでリンクしまくるような状況があることも問題ですから、それはそれとして議論していく必要があると思います。ネットは善意で成り立ってきたという経緯も持っているわけです。それを踏みにじる者に対して何の制限も無く放置するのは、ネットにコンテンツをアップしようとする人のモチベーションを下げることになりますので、今後のネットの発展を考えると決して良いことではないとも思います。
なので、本当に難しい問題だとは思いましたが、ネットの公開されている領域にアップされたものに対してのリンクを一方的に拒否できるという状況にだけはなって欲しくないと切に願います。
それで、もしも、リンクに許可が要るようになった場合、ブログのリンク集であるpigmizで対応できるのか?と、少し考えてみたんですが、やっぱりかなり難しいだろうなと思いました。
現状、pigmizには2万個くらいのブログへのリンクがありますから、それらに、全ての許可を取り歩くのは無理だと思います。一応、ブログの中の日本語を理解するのがpigmizの能力なので、文書中に、”リンクしていいよ”とか、”リンクしないでくれ”とか、そういうニュアンスが書いてあれば、それに対応するということは出来そうに思うのですが、それもない場合にはどうしようもないと思いました。この話題の発端である、リンク拒否を主張しているブログのように、しっかり書いてあれば自動的にリンクしないようにするということは技術的に可能ですが…。きっとそういう風にリンクに関するポリシーをしっかり表明する人ばかりじゃないだろうと思いますので。
なので、やっぱり、リンク拒否は勘弁して欲しいと、pigmizの飼育係としても思った話題でした。
法律なんかを見ていますと、WEBに対する規制がだんだんと強化される方向に行っていますので、それが行き過ぎないように、私たちもきちんと見守っていかないといけないと思いますし、そういう法律を作って規制しようという声が出る前に、WEBのユーザー皆が、自浄作用をしっかりと働かせていく必要がありそうに思います。
2008年11月22日
復帰しています
先月、プログラムの更新をするのでしばらく断続的な運用になるとのことを書きましたが、やっと復帰したので通常更新再開します。
更新結果が現れるまで、数時間かかりますが、それ以後はちゃんと連続更新されるはずです。
今回はブログの選択基準とか特に変わらず、データのやり取りなどの処理系の部分を書き換えたということなので、結果が劇的に変わっているわけではないですが、処理の効率化をしたので、サーバの負担が減って安定感が増したと思います。
pigmizの解析結果を使った新しいサービスを考えているので、その土台作りということになります。土台は出来たけど、上をどうやって作るのか、また悩む日々が続きそうです。
更新結果が現れるまで、数時間かかりますが、それ以後はちゃんと連続更新されるはずです。
今回はブログの選択基準とか特に変わらず、データのやり取りなどの処理系の部分を書き換えたということなので、結果が劇的に変わっているわけではないですが、処理の効率化をしたので、サーバの負担が減って安定感が増したと思います。
pigmizの解析結果を使った新しいサービスを考えているので、その土台作りということになります。土台は出来たけど、上をどうやって作るのか、また悩む日々が続きそうです。
2008年10月23日
更新が途切れます
サーバ側プログラムの更新作業のため、pigmizの更新がこれからしばらくの間、断続的になります。サーバプログラムに機能追加などをしたため、そのもろもろのテストをしているところです。
今まで大体1分〜3時間に一回更新されていたデータが、1日更新されなかったり、連続的に更新されたりということが起こるかもしれないということです。
とはいっても、見た目としてはあまり変わらないような気がしますので、影響はそれほどなさそうです。使っていただく分には全く問題ないです。
今まで大体1分〜3時間に一回更新されていたデータが、1日更新されなかったり、連続的に更新されたりということが起こるかもしれないということです。
とはいっても、見た目としてはあまり変わらないような気がしますので、影響はそれほどなさそうです。使っていただく分には全く問題ないです。
2008年10月10日
pigmizでのスパムブログ対策
今回は、pigmizのようにブログを自動的に集めてきて紹介するタイプのサービスとか、CGMのブックマークサイトなどで心無いユーザーが増えてきたときに出てくる、スパムブログへの対策の話です。
ネットを見ていたら、ライブドアで”スパムブログを排除するフィルターを開発した”というニュースがあったので、それに絡めて書こうかと思います。
スパムブログを完全排除するというのは、正直な話、無理です。紹介した記事の中でも言われていますが、人間が見ても一見、スパムとはわからないものも最近は多いので、それを高い精度で排除するというのは、本当に難しいと思います。
何が難しいのか?というと、スパムブログをスパムブログと判定する難しさと、スパムブログじゃないものをスパムブログであると判定しないようにする難しさの二つがあるということだろうと、私としては思います。
そして、この二つは、トレードオフに近い関係で、スパムブログとする基準をかなり厳しくすると、スパムじゃないブログも引っかかる可能性が高くなるわけです。これが頭の痛い問題です。ここにスパムブログ排除の難しさの大きな部分があると思います。
pigmizを作るうえでもそれにはかなり頭を悩ませました。私もいろいろなフィルタを作ってそれにかけています。フィルタがどういう処理をしているのかというのを書くのはあまり良くないので、書かないですけれども、旧式のスパムサイトに関してはある程度、構造的な傾向がわかるので、それは、それなりに判定してくれるようにはなっています。ただ、最近のスパムブログは上記の記事でも書いていますが、どこかのサイトやブログの記事をそのままコピペして、一見、ちゃんとエントリーを配信をしているブログかのように見えるものとか、自動的にちゃんとした日本語っぽいものを出力しているものも多いです。「人が見てもわからないスパムブログ」というのはまさに一番頭が痛いです。人間が見て誰でもがスパムとわかるようなブログなら、そこにはデータとしてのパターンが出てくるわけですから、まあ救いがあったんですけれども。
ただ、スパムブログの目的というのは、最終的になにかを買わせるとか、なにかを買わせるサイトに誘導するということなので、その目的をブログの中から見つけ出すことでそういうのを防ぐというのが、とりあえずは今のところできることであろうと思います。pigmizは日本語を理解して、その意味を推定するのが一応本業なので、その機能を使ってそういうことをさせているんです。でも、まだまだ及ばず…。やっぱりスパムを拾っていたり、スパムじゃないものを弾いていたりします。このあたりはこれからの課題かなぁと思っています。
普通のフィルタも私は結構作ったのですが、ブラックリスト方式にしても、ブラックリストを作り続けるには限界がありますし、ニュースの配信元を特定してそこと文章を照合するにしても、きちんと引用して、それについて評論しているようなちゃんとしたブログを排除してしまう可能性もありますので、やっぱり一長一短だと感じまして、運用には制限が付いています。また、その他のフィルタも、やっぱりあちらを立てればこちらが立たずという感じの問題を抱えているので、なかなか決定的なフィルタというのはできないなぁと実感しています。
なので、今回のライブドアのシステムとか、前に、ニフティでも似たようなシステムを開発した話が出ていましたが、そういうものが、複数のフィルタを組み合わせているというのは頷ける話でした。
スパム問題がかなり深刻なブログ界ですが、なんとか技術が進歩して、ちゃんと書いているブログがしっかり目立つようになればと思いますし、私もpigmizをそういう方向になんとかもって行きたいと思っています。いたちごっこに近い話なので、なかなか難しいですけれども…。
2008年09月24日
微々たる変化
また少しだけ、判定精度が上がると思われる改変をしました。例のごとく、リンク面を見ても、おそらくすぐには違いがわからないと思います。でも、pigmizにはしっかり働いてもらうので、じわじわ効いて来る予定です。
正式リリース?をしてから、初めての改変なので、一応バージョンアップということになるのかもしれませんが、そもそもpigmizの正式リリースってなんだ?ということを思っていたり思っていなかったりするので、あまり意味は無い告知かもしれません。でも、一応、飼育記録なので、備忘録的意味合いで書いておきます。
被リンク数とのせめぎあい
ブログ界という世界があるのかどうかはしらないですが、pigmizはブログを集めているので、基本的にはブログしか見てないですし、pigmizの飼育者としては、そういう世界の話には自然と興味がわくわけです。
それで、今回、とても興味深かったのが、メディア・パブさんのエントリー、
”100以上のブログからリンクを張られているブログ,全体の1%以下”
というもの。海外の話がメインですから、pigmizが対象にしている日本のブログと微妙にずれるのですが、傾向をつかむにはかなり参考になります。また、海外のブログ事情と日本との違いを見つけることができました。
pigmizもブログの解析時にリンクを数えています。被リンク数というのも出せてます。そのデータを見ると、100個以上のリンクを貼られているブログがものすごく少ないというのは同様の結果として出ています。ただ、少し違うのが、20個以上の被リンク数のブログはそれなりに見つかっているということです。上記エントリーで紹介されているデータを見ると世界的には、4%以下くらいしかないようですが、pigmizの統計だと確実にそれ以上(6〜8%くらい)あるので、そのあたりが日本の特徴なのだろうと思いました。
日本のブログを見ていると、ブログを通じて友達づきあいというか、何回かコメントをしたら相互リンクという形でつながっていくのを良く見かけるような気がします。mixiのマイミクで軽く100人とか突破しちゃっている人、私の周りにも居ますが、日本のブログってそういうようなSNSでのつながりに近い意味合いが強いのだろうなぁと。知り合った証としてリンクする、それこそ友達の輪を広げるためにリンクするというのが主流なのかもしれません。遊びに行くブログをブックマークするような感覚でのリンクが多いといえるかと思います。ブログの質の良さ、興味や関心、他への紹介的な意味でリンクするかどうかを決めている割合は少ないのかなぁと。
被リンク数というのは、検索エンジンなんかでも表示順を決めるのに用いられているように、ブログの価値(客観的な意味での)を決めるときの大きな要素ですし、他にも多くのところで使われている判断基準のひとつだと思います。pigmizもブログが面白いかどうかを判定して、面白そうなものをなるべく目立つところに置くようにしているので、当然ブログが面白いかどうか?というのを独自に判断してるわけです。そのときに、被リンク数というものにどの程度重きを置くべきか?というのは、pigmizを設計している段階でかなり悩んだ部分でした。また今でも悩んでいます。ただ、現在のpigmizでは被リンク数はあまり重視してはいません。多分、これは現在のネットの流れからすると、多少異端な方法なのだろうとは思いますが…。
理由は二つです。
一つは、埋もれていた面白いブログを発掘してくるというのもpigmizのお仕事だから。被リンク数が多いということは、すでに知られたブログなので、わざわざpigmizが紹介しなくてもいいと思われるわけです。それからもう一つが、日本のブログは上記の傾向がある(と今まで漠然と思っていた)ためです。ブログの管理人さんやそこにコメントしている皆さんにとってはとても便利なリンクですが、その被リンク数を元にして、第3者が見たときのブログの面白さを判定することは、ちょっと根拠が弱いのではないかなぁと思っていました。正直な話、20人の友達からリンクがあるブログよりも、相互リンクはしませんと言う方針で、ひたすら書いているブログの方が、私が見て面白いと思えることなんかもかなりありましたので。そういう私の体験を根拠に、今のpigmizは被リンク数をそれほど重視しない方針になっています。
今回、メディアパブさんのエントリーを拝見し、私の手元にあるデータと比べてみて、やはり日本のブログが張るリンクはそのような傾向があるのだろうなぁと確認できた気がしました。もちろん、それが良い悪いではなく、日本のブログの傾向としてわかったということです。そういう意味で海外のデータはとても参考になりました。
ただ、だからといって、被リンクを全く無視することもできないわけですし、かなりの被リンクがあるブログはやっぱり面白い確率は高いです。なので、それをどのくらい加味するのか?というのは、これからも面白いブログを探し続ける上で、頭を悩ませるところだと思います。
リンク紹介とともに書かれていることの意味をできる限り正確に理解しつつ、お友達としてブックマーク的にリンクしているのか、面白いと思ったから自発的に紹介リンクしているのかを、自動判定するという現在の方針をできるだけ突き詰めたいところです。こうなるとやっぱり、日本語解析の精度の問題に行き着くわけですので今後も精度向上を目指さないといけないのだろうなぁと、なんだか当たり前のことを思った次第です。
※今回、pigmizの解析データの話もしていますが、pigmizは、そんなに大量のブログを見回っているわけではありません。古いデータを使っても意味がないので、それは除くとして、有効なデータとしては、ぜいぜい50〜80万個くらいだと思われます。その程度の数で日本のブログの傾向を語るのもどうかと思いますので、あくまでも参考ということで。
2008年09月13日
不具合なし。だといいなぁ…
ちょっと今更のような話題ですが、Google Chromeがダウンロードできるようになりました。
Google Chromeの詳しい話は、こんな記事とか、こんな記事とかを参考にしたりとか、実際使ってみて好きに評価していただければいいと思うわけですので、お任せするとして。
Google Chromeの出来がどうであれ、ユーザーの立場からすると、ブラウザの選択肢が増えて、色々と選べるので良いことだろうとは思うんです。世の中の流れを見ていても、Google Chromeへの期待感があからさまにわかります。また、独占状態は弊害が大きいですから、ある程度のものが並立するのが良いというのは、正しい流れだと思うわけで。私自身もそういう気持ちはあります。
が…。
サイトを作る側からすると、正直なところ、「もう勘弁してくれ」というのが感想です。理由はいわずと知れたこと。動作確認対象が一つ増えることになるから。つまり、今までの、IEと、FireFoxと、Operaと、Safariのチェックですら、つらい感じだったにもかかわらず、Google Chromeまでチェックリストに入ってきたわけで、手間が増えたのです。
もう、いい加減に、ブラウザのちゃんとした規格統一をやって欲しいものです。見た目とかは多少崩れてもまだ許せます。フォントがちょっと違っても、画像の配置が多少ずれても、サイトが使えなくなるわけじゃないから細かいことは言いません。でも、同じスクリプトを実行して違う結果が出てくるのだけは、許しがたいです。
本当は、pigmizにも、もっと実装したいことあったりするんです。でも、クロスブラウザとか考えながらスクリプト作るのはやってらんないというのが正直な感想。そういうライブラリもありますが、サイズが大きいものも多いので、使うのがためらわれるわけです。でも、そのうちやらないとダメなのかもしれませんね…。
Google Chromeの登場に対しては複雑な心境なのでした。
それでも、ちゃんとダウンロードして、インストールして、使ってみたんです。一応、今のpigmizでは、特に大きな不具合はないような気がしますので、ホッとしています。