リファラのescape文字列への変換に必要な文字コードについて勘違いしていたので日本語文字列をescape文字列を変換するのに手間取る。Googleとかは、utf8からescape文字列へ変換しないといけないし、msnの場合はsjisから変換させないといけない。webサイト上ではeucできちんとキーワードが見られているから、全てeucからescape文字列へ変換すればオーケーだろうと勘違いしていた。
で、必要なスクリプトはかけたけど、なんかあんまり意味無いなぁと思えてきたのでそのままボツ。リファラーやコメントへのSPAMが来た時にでも有効活用してみるか。
っていうか、URLから文字列の抽出って一昨年やったじゃん...(泣。
テスト用のスクリプトをwindows上で作成していたので、cygwin版のrubyを使っていたんですが、Uconvが必要になってインストールを試みたら、普通にcygwin上の環境でインストールできたので少々驚き(失礼)。
研究室のPCに導入したら、psgml-http.elが無かったので、エラーを起こした。CVSにtdiary-mode.elと一緒に置いてあった、http.elを入れたら普通に動いた。
一つ目はデータ中心アプローチについてその概観を説明してくれている記事です。こういった内容ではなく、概観を説明している記事って結構貴重なんじゃないかとよく思います。というのは、結局○○指向とか、△△アプローチってのは、それが絶対なのではなく、立ち位置の問題だからです。だから、内容を説明している記事を読むにしても、その内容がどういう立ち位置で説明しているのかわからないと誤解を招くからです。
二つ目の記事では、さらに過去の手法や経験をベースに今の手法があることの話です。立ち位置が変わるだけなので、結局やっていることはオブジェクト指向だろうと何だろうと変わらないので、なぜ今の手法があるのか理解することが大切だと思います。それが今の手法を学習する上でも効率的に学ぶヒントにもなると思いますし。
っていうか、一つ目の記事の人、「プログラマ主役型プロジェクトのススメ」の著者の人なのね。同じ著者による、「いきいきする仕事とやる気のつくり方」はおもしろそうなので、今度買ってみよう。
最適化をかけるためにリリース版のfirefoxをビルドしようとしてきましたが、途中でどうしてもコケてしまう。そこで、先輩のアドバイスによりCVS版を持ってきてビルドしてみる。参考にしたのは以下のサイト。
二つ目のリンクはwindows用のドキュメントですが、linuxでも手順は同じなので適宜読みかえてくれという事でした。
celeron-M 1.5Gのラックマウントサーバーなんですが、1GBのNICを二個つけてて、メモリを512MB、80GBx2のRAIDにしても10万以内という安さです。構成や値段が超ツボに入りました。欲しぃぃ。