前回のあらすじ
負けた。
Wayback Machineにアーカイブを取られないように対抗してみるお話
やっぱり魚拓を取られるのは、気分が良いものではないと思う。
つぎは、Wayback Machineからの拒否をしてみる。
.htaccessでブロックする。
robots.txtは無視されているようなので、.htaccessを使ったブロックを試してみる。
ドメイン拒否
とりあえず、Wayback Machineのドメインを拒否に設定してみる。
Archive.today関連もついでに追加しておく。
# Archive Domain Block
deny from archive.fo
deny from archive.is
deny from archive.li
deny from archive.md
deny from archive.ph
deny from archive.today
deny from archive.vn
deny from archive.org
Bot拒否
Wayback MachineのBotをアクセスを拒否する。
# Wayback Machine Bot Block
SetEnvIf User-Agent "archive.org_bot" blockbot
SetEnvIf User-Agent "ia_archiver" blockbot
SetEnvIf User-Agent "ia_archiver-web.archive.org" blockbot
<RequireAll>
Require all Granted
Require not env blockbot
</RequireAll>
おわりってこと…?
アク禁は負けた感じがするが仕方ないだろう。
まだ、策はある。いろいろ試していこう…
COMMENT - コメント