Archive for April, 2006

IT系ニュース専用検索エンジン:Yahoo! JAPANのSearch APIとはてなブックマークのマッシュアップ

Apr 22 2006 Published by funaki under つくる

» IT系ニュース専用検索エンジン – Web Services by Yahoo! JAPAN, はてブ

Yahoo!ニュースもGoogle Newsも古い記事は検索できないのがちょっと不便だなぁ、と思ってつくってみました。CNETやITmediaなど主要と思われるIT系のニュースサイトだけを検索対象にした検索エンジンです。

はてなブックマーク件数取得APIを一度使ってみたかったので検索結果の各ページの被はてブ数を載せています。

おまけとして、「被はてブ総数が一番多い検索結果は?」と検索結果の最初の10件の被はてブ数の合計のランキングも出しています。今のところ「Web2.0」が1位。

PEAR::Cache_Liteで一応キャッシュも作っていますが、違うユーザで同じ検索を短時間のうちに行うとは思えず、リアルタイムに2つのAPIにアクセスするとレスポンスが少々悪い。そこでAjaxload。Submitした瞬間にJavaScriptでこのNowLoadingのアニメーションを表示させると、次のページを読み込んでいる間、何となく間を持たせてくれるような気がします。最初はAjaxではてブを後から読み込むようにしようかとも思いましたが、このアニメーションで数秒待つのを我慢してもらえるならお手軽かなぁ、と。

また、検索結果の中で同じ内容の記事はひとまとめにしよう、と当初考えていました。

「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌

を参考に、JavaScriptで

var res = str.match(/[一-龠]{2,}|[ァ-ヴー]{2,}|[a-zA-Z\.]{2,}|[a-zA-Z]{2,}/g);

こんな風に書くと記事の中からキーワードっぽいものを拾ってくれます。あとはTF-IDF風にキーワードに重みをつけて(CNETなどは記事のタイトルごとに”CNET Japan”が含まれるのでそういったキーワードの重みが下がるように)、共起率で記事の類似度を計る。許せるレベルの精度は出たのですが、2、3個の記事がグルーピングされてもあまり嬉しくなく、その割に共起の計算がそれなりに重いので一瞬待たされるのがネックでした。Safariで先ほどの正規表現が動かなかったのも難点。

今回はお蔵入りですが、クライアントサイドのCPUを使ってこういった計算をさせるのも面白いはず。

追記:

AjaxLoad、というよりIEの問題でちゃんとアニメーションしないことを教えてもらいました。ホリデープログラミングなので許容範囲?
» Ajaxload – Ceekz Logs

One response so far

かっこいいスクリーンセーバー:Sugar Cube Clock

Apr 20 2006 Published by funaki under 感動する

時計なスクリーンセーバーは見ていて面白いものが多いです。このSugar Cube Clockはスクリーンセーバーなのに画面をクリックしてあれこれいじれます。アリの動きが何やら触覚付のラジコン(あるいは全自動掃除機みたいな感じ)っぽいのがちょっと可笑しい。

ダウンロードは下記のリンクから。無料です。解像度が1024以上でも動きました。ただ、スクリーンセーバーから復帰したときにFirefoxのメニューバーの上に謎の空白が。。

» 日産:キューブ Cube Blog

他にもかっこいいスクリーンセイバーを紹介しています。
zuzara : かっこいいスクリーンセーバー

One response so far

カオスの数学:PHPで複雑系の不思議な模様を描画

Apr 17 2006 Published by funaki under つくる

「カオスの数学」(東京図書 芹沢浩著)なる本を図書館で借りることができ、そこに載っていたC言語によるカオスの描画をPHPに移植してみました。シンプルな数式から不思議な模様が描かれる様は美しいです。PHPのソースは実にシンプルで、GDを使って数式に沿ってXY軸上に点をプロットしていくだけです。ソースは公開しているので自分の環境でパラメーターをあれこれ変化させながら動かしてみると面白いかと思います。

移植したソースの公開を快く許可してくださった著者の芹沢さま、どうもありがとうございます。

まずはこの漸化式。パラメーターを変えると模様が劇的に変化するので欲張って1521種類、描画してみました。

» 1521種類一覧(画像が多いので重いです)

サムネイルから元のサイズの画像を表示するのにLightbox JSを使わせていただきました。
たくさん並べると並べた中にもなにやら模様が浮き上がっているようにも見えて不思議。

続いてこちら。鉤のようなカオス、と題されています。

cが加わっただけですがだいぶ雰囲気が変わります。翼のようなカオス。

以上の3つはXY軸に値をプロットしていくだけなのでソースは100行足らず。» ソース

最後にフラクタル。a1~d1、a2~d2は実数。こちらはパラメーターが8つあったのでさすがに大量に描画するのはやめました。以下のサンプル画像は葉っぱのよう。他にもシダの葉模様や直線的な幾何学模様もありました。

ソースは再帰を使ったものになります。» ソース

著書の中にはもっとたくさんサンプルがあります。ただ93年出版と少々古いので残念ながらAmazonでは購入できませんでした。

4 responses so far

検索エンジン的要チェックワード集:マッシュアップ系

Apr 05 2006 Published by funaki under つくる

追記:深追い.comとしてリニューアルしました
追追記:現在停止中

Yahoo! JAPANのキーワード検索で前日と比較して検索回数が急上昇したキーワードをRSSで取得して、Y!ブログ検索とWikipedia、Amazonの商品検索結果とマッシュアップしています。


» 要チェックワード集

RSSで配信されている情報の中にはアーカイブが残らないものもあるので、有益そうな情報を付け足して保存しておきたいな、と思ってつくってみました。Y!が配信している元の情報が面白いので毎日チェックしても飽きないです。

追記:
RSSのタイトルと概要の内容について、友人からアドバイスもらいました。ありがとうございますー

6 responses so far

エイプリルフール2.0=ェィプリルフール、かもしれない

Apr 02 2006 Published by funaki under 感動する

4月1日のたくさんのウソネタは楽しめたのですが、最も衝撃的だったのが「ェィプリルフール」の存在です。エとイが小さいカタカナになっているだけで意味は同じですが、ブログを書いているティーンエイジャーはそう表記するのが普通らしい。

Yahoo!ブログ検索 – 「ェィプリルフール」の検索結果

ギャル語の存在は以前から知っていましたが、ギャル語ほど読みづらくはなく、男女の区別なく使われているこのひたすら小さい文字を使える時は小さく表記する文化はいったいどこから来たのでしょうか。

カルチャーショックとぃぅかジェネレーションギャップとぃぅか、次世代のブログゎこぅ書くのが普通になるのでしょぅヵ?㊦㊦

No responses yet