2017年6月1日木曜日

ウェブログ170601:常に最新の状態を保った一覧を作るには


ブログって言葉が本来の意味から離れ、今や日記や雑記、なんでもかんでも個人でWebに投稿してたらブログって呼ばれるようになってしまった。
今更ではあるけれど、
ブログ (blog) は、狭義にはWorld Wide Web上のウェブページのURLとともに覚え書きや論評などを加えログ(記録)しているウェブサイトの一種である。「WebをLogする」という意味でウェブログ (weblog) と名付けられ、それが略されてブログ(Blog)と呼ばれるようになった[1]。その執筆者はブロガー (blogger)、個別記事はブログエントリーと呼ばれる。
ブログ - Wikipedia
ってところに立ち戻って、ネットサーフィン(死語)して見つけた面白いものをまとめてみたい。
ラベルには「weblog」って付けて、まとめていくとしよう。

毎回なにか「これやってみたい」「どうやるのかな」って調べたものをまとめるので、テーマはちゃんと一本になるようにする。

テーマ:常に最新の情報を保った一覧ページを作るには

ある特定の科目で、シリーズのものが断続的に供給されていくタイプの商品がある。
本とか、CDとか、ゲームとか、DVDとか。
大抵は公式ページにまとまっていたり、検索でお目当てのものにたどり着けるようになっているが、1ページで一望できるようになっているものは少ない。

そんなわけで、
「常に最新情報を」
「確かな情報ソースをもとにして」
「一望できるように」
するためにはどうしたらいいかを調べてみた。

結論:PHPをcronで定期的に動かして情報更新せよ

PHPについては知ってるので調べない。
情報ソースも潤沢だ。

cronはcrontabの略。
crontab(クロンタブ、あるいはクローンタブ、クーロンタブとも)コマンドはUnix系OSにおいて、コマンドの定時実行のスケジュール管理を行うために用いられるコマンドである。標準入力からコマンド列を読み取り、crontabと呼ばれるファイルにそれを記録する。この記録を元に定時になると、その命令内容を読み取り、実行が行われる。cronという名称はギリシア語のクロノス (χρόνος) に由来するという説がある(Command Run ON の略という説も)。日本語ではクーロンという読みが慣習的に広く用いられているが、英語では通常クロンまたはクローンと発音する[1]。
crontab - Wikipedia
通常はアクセスされない限り動かないPHP。
そこらへんをサーバに細工することで、呼ばれなくても定期的に動かすよーってことみたい。

で、見つけたこの記事がめっさまとまってて嬉しい。
というかここで解決してしまった。

Google検索結果をPHPで取得
http://516.jp/1646

以下、上記の記事で紹介されていたリンクをまとめておく。

サーバ
PHP、MySQL、CRONが使える無料レンタルサーバー「000.webhost.com」
http://kihon-no-ki.com/000webhostcom

Google検索結果取得
Google Custom Search API – 検索・ランキングチェック
http://web-cocoon.jp/P_5170d6749b4d0

データ取り回し
PHPでJSONを取得
http://billboardtop100.net/2011/09/json-php.html

時間取得について
PHP TIPS Vol.1
http://www.spencernetwork.org/memo/tips-1.php

cronの設定
cron(クーロン)の設定 – プログラムを定期的に自動実行 [Fedora, RedHat, CentOS]
http://memorva.jp/memo/linux/cron.php

まとめ

以上、劣化しない一覧を作るための材料でした。
これらの情報を活用すれば、定期的に調査ができる。
たとえば好きな作家に絞って最新情報を得たり、追加された情報があったらメールを寄越すようにしたり。