Боты используются для выполнения рутинных задач по улучшению Википедии.
Администраторам: если этот бот работает неправильно или каким-либо другим образом наносит вред Википедии, пожалуйста,
заблокируйте его
и
сообщите
владельцу о возникшей проблеме.
Бот архивирует ссылки, оформленные с помощью шаблона
{{
cite web
}}
, используя службу
WebCite
.
На момент обновления статистики (01:27 май, 26) в очереди находилось
34603
страниц и
118629
ссылок. Всего за время работы бот успешно заархивировал
552915
ссылок.
Код бота
Последняя версия исходного текста бота доступна в репозитории
Ссылки, которые не архивируются
Уже указывают на архивную копию
Сайты, которые часто запрещены к показу на WebCite правообладателем
Получается нечитабельный текст
Есть тег «no-cache»
The caching attempt failed for the following reason: The given URL contained a no-cache tag. WebCite respects the author’s request to not have their web page cached.
—
WebCite
folha.uol.com.br
ctv.ca
bluesnews.com
chelseafc.com
dlib.eastview.com
100.empas.com
inishturkisland.com
janes.com
ms-pictures.com
movies.nytimes.com
plastichead.com
secunia.com
sherdog.com
securitylabs.websense.com
whufc.com
worldsnooker.com
x-rates.com
xbiz.com
ifpicr.cz
sportovci.cz
nationalbanken.dk
fff.fr
izrus.co.il
blogs.yahoo.co.jp
groklaw.net
zonakz.net
antiaircraft.org
paclii.org
rfemmr.org
3dnews.ru
art-catalog.ru
cio-world.ru
compulenta.ru
computerra.ru
www.crpg.ru
www.dishmodels.ru
domtest.ru
finam.ru
finmarket.ru
game-ost.ru
gatchina-meria.ru
glossary.ru
infuture.ru
interfax.ru
interfax-russia.ru
vybory.izbirkom.ru
liveinternet.ru
mountain.ru
astro-era.narod.ru
newsmusic.ru
kino.otzyv.ru
oval.ru
redstar.ru
render.ru
rg.ru
ruformator.ru
scrap-info.ru
soccer.ru
systematic.ru
translogist.ru
webapteka.ru
pdc.tv
zakon.rada.gov.ua
zakon1.rada.gov.ua
media.mabila.ua
cajt.pwp.blueyonder.co.uk
nufc.co.uk
Здравый смысл
Технические ограничения
The caching attempt failed for the following reason: No files could be downloaded for the given URL. This is likely because
a) The URL is incorrect,
b) The site in question refuses connections by crawling robots, or
c) The site in question is inaccessible from the WebCite network