网页存档机器人 https://t.me/Archive_by_2049bbsBot
附带自动检测保存的网页是否仍然有效。
注意:会将提交的网址保存在 archive.csv 文件中,并自动检测网页是否已经404。检测结果保存在 archive2.csv 中。
-
向 http://t.me/BotFather 申请 Token,填入
ArchiveTeleBot.py
中的bot = telebot.TeleBot("TOKEN")
。 -
服务器部署
注意:使用自建存档需要安装 https://github.com/Y2Z/monolith
仅支持 python3。
pip install archivenow slimit pyTelegramBotAPI requests bs4
使用
python Archive_by_2049bbsBot.py
自动检测网址:
R CMD BATCH check_archive.R