別途、必要に合わせて例外処理や HTTP ヘッダの設定など追加。
$start = 1; // 取得開始番号
$end = 500; // 取得終了番号
$target_url = 'http://target-server.com/page/'; // この後ろに連番が付く
$delay = 10; // アクセス間隔(秒)
for($i = $start; $i <= $end; $i++) {
$html = file_get_contents($target_url . $i);
file_put_contents('dst/' . $i . '.html', $html);
echo "\r" . '(' . $i . '/' . $end . ') を保存完了 残り' . ceil(($end - $i) * $delay / 60) . '分';
sleep($delay);
}
echo "\n" . '全てのページを取得完了';
0 件のコメント:
コメントを投稿