私は別段、ニュースジャンキーではないんですが、ニュースを集めるプログラムを書くとやっぱり詳しくなっちゃいますね。で、本日より、新しいPHPのプログラムに移行しました。PostgreSQLのチューニングもした結果、2桁のオーダーで高速化できたので、表示件数をとりあえず300件にしてあります。ニュース収集、時間順にソート、htmlを吐き出すところまで20秒です。10分ごとに更新されます。
以前のものは、非常に手続き型のプログラム(とりあえず動かすことが目的だったので)だったんですが、メンテナンスしにくくなるのが目に見えていたので、現バージョンはすべてオブジェクト指向で書き直しました。
設計としては5,000件程度を収集できるようになっているので(もっといけるかな?)、集める対象サイトをもっと増やさないと。